上海AI Lab推出科研智能体FlowSearch:全面领先三大权威基准,性能提升6%

🎯 情报来源:量子位

上海人工智能实验室近日推出科研智能体FlowSearch,该智能体在GAIA、HLE、GPQA以及TRQA等科研基准上实现了性能全面领先,展示了AI在复杂科研任务中的动态协作与深度推理能力。FlowSearch通过动态结构化知识流构建科研任务的多层依赖图,并在多智能体框架下实现任务的并行探索、知识的递归整合和流程的自适应优化。

研究团队表示,FlowSearch标志着科研智能体从“被动工具”迈向主动探索伙伴的新阶段。在生物领域的专业基准TRQA上,FlowSearch依托通用工具链超越了多个领域专用模型,显示出强大的专业问题解决能力。经过微调的Internplanner-32B相比基础模型Qwen-3-32B在GAIA上提升约6个百分点,表明结构化知识训练能够显著增强模型的规划能力与任务一致性。

💡 核心要点

  • FlowSearch在GAIA、GPQA-diamond、HLE三大权威基准上全面超越现有方法
  • Internplanner-32B相比基础模型Qwen-3-32B在GAIA上提升约6%
  • 采用动态结构化知识流和多智能体框架,实现任务的并行探索和自适应优化
  • 在生物领域专业基准TRQA上超越多个领域专用模型
  • 具备自组织、自纠错、自优化能力,保持全局一致性同时灵活应对局部变化

📌 情报分析

技术价值:极高 – FlowSearch通过动态结构化知识流和多智能体框架,实现了科研任务的并行探索和自适应优化,性能全面领先现有方法,并在专业基准上超越领域专用模型。

商业价值:高 – 对于科研机构和企业研发部门,FlowSearch能够显著提升科研效率,降低新领域学习门槛,具有广泛的应用前景。

趋势预测:极高 – FlowSearch的动态结构化框架为未来可解释科研智能体与自演化科学发现系统奠定了通用基础,推动AI从工具向真正的科研伙伴演进。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索