🎯 情报来源:量子位
近日,百度智能云研发的FM Agent在OpenAI主导的机器学习工程权威基准MLE-Bench上取得SOTA成绩,超越微软R&D Agent和OpenAI的AIDE系统。MLE-Bench是目前评估AI Agent实战能力的核心榜单,其测试集包含75个真实的Kaggle竞赛项目,均为全球顶尖数据科学家团队参与解决的真实工程难题。
公开信息显示,百度FM Agent在中等和高难度任务上表现显著领先,具备自主优化能力,能够系统性分析问题并自主优化解决方案。近期百度在AI领域动作频频,其开源的PaddleOCR-VL模型以0.9B参数量在全球权威榜单OmniDocBench v1.0+v1.5双榜夺得综合性能第一。
💡 核心要点
- 百度FM Agent在OpenAI MLE-Bench上取得SOTA成绩
- 超越微软R&D Agent和OpenAI AIDE系统
- 测试集包含75个真实Kaggle竞赛项目
- 在中等和高难度任务上表现显著领先
- 具备自主优化能力,可系统性分析问题并优化解决方案
📌 情报分析
技术价值:高 – FM Agent在权威基准上超越微软和OpenAI竞品,显示出百度在AI工程能力上的领先优势。
商业价值:高 – 这一成就将提升百度智能云的市场竞争力,特别是在企业级AI解决方案领域。
趋势预测:高 – 结合百度近期在AI领域的连续突破,预计将在即将召开的百度世界2025大会上发布更多重要成果。
