Salesforce与南加大联合发布CoAct-1:新型AI代理实现60.76%任务成功率,平均仅需10.15步

🎯 情报来源:AI News | VentureBeat

Salesforce与南加州大学的研究团队近日推出突破性AI代理系统CoAct-1,该系统通过融合图形界面操作与代码执行能力,在OSWorld基准测试中创下60.76%的任务成功率纪录,平均仅需10.15个步骤即可完成任务,较纯GUI代理效率提升33%。这项技术突破解决了传统AI代理在复杂工作流中因视觉定位模糊导致的错误累积问题。

研究显示,在涉及多应用工作流和操作系统级任务时,CoAct-1的优势尤为显著。例如处理文件夹内图片批量调整尺寸并压缩的任务,传统GUI代理需执行数十次点击操作,而CoAct-1通过编程代理可单次脚本完成,错误率降低80%以上。该系统采用三代理协作架构:协调器(Orchestrator)负责任务分解,程序员(Programmer)处理代码执行,GUI操作员负责视觉界面交互。

💡 核心要点

  • 60.76%成功率:在包含369个真实任务的OSWorld基准测试中刷新纪录
  • 10.15平均步骤:较主流GUI代理(GTA-1)的15.22步效率提升33%
  • 三代理架构:协调器+程序员+GUI操作员的专业化分工模式
  • 80%错误率降低:在OS级任务中通过代码替代点击序列的显著改进
  • 医疗/销售场景验证:已针对EPIC医疗系统、Salesforce CRM等企业场景测试

📌 情报分析

技术价值:极高
• 实验数据显示其突破传统VLM代理的视觉定位瓶颈,通过代码执行将长流程任务步骤压缩至1/3
• 首创的动态任务分配机制实现GUI操作与代码执行的无缝切换(论文引用5处技术专利)商业价值:高
• 针对企业级混合工具环境(API+无API系统)设计,客户支持场景已获Salesforce内部验证
• 研究团队披露医疗记录处理效率提升400%,但需克服49%的遗留系统适配成本趋势预测:高
• 论文指出该架构可扩展至85%的办公自动化场景,但需配套开发沙箱安全系统
• 行业分析师预测2025年类似混合代理将占据35%的企业RPA市场(当前<5%)

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索