百度FM Agent登顶OpenAI MLE-Bench,超越微软和OpenAI竞品

🎯 情报来源:量子位

近日,百度智能云研发的FM Agent在OpenAI主导的机器学习工程权威基准MLE-Bench上取得SOTA成绩,超越微软R&D Agent和OpenAI的AIDE系统。MLE-Bench是目前评估AI Agent实战能力的核心榜单,其测试集包含75个真实的Kaggle竞赛项目,均为全球顶尖数据科学家团队参与解决的真实工程难题。

公开信息显示,百度FM Agent在中等和高难度任务上表现显著领先,具备自主优化能力,能够系统性分析问题并自主优化解决方案。近期百度在AI领域动作频频,其开源的PaddleOCR-VL模型以0.9B参数量在全球权威榜单OmniDocBench v1.0+v1.5双榜夺得综合性能第一。

💡 核心要点

  • 百度FM Agent在OpenAI MLE-Bench上取得SOTA成绩
  • 超越微软R&D Agent和OpenAI AIDE系统
  • 测试集包含75个真实Kaggle竞赛项目
  • 在中等和高难度任务上表现显著领先
  • 具备自主优化能力,可系统性分析问题并优化解决方案

📌 情报分析

技术价值:高 – FM Agent在权威基准上超越微软和OpenAI竞品,显示出百度在AI工程能力上的领先优势。

商业价值:高 – 这一成就将提升百度智能云的市场竞争力,特别是在企业级AI解决方案领域。

趋势预测:高 – 结合百度近期在AI领域的连续突破,预计将在即将召开的百度世界2025大会上发布更多重要成果。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索