🎯 情报来源:Last Week in AI
Anthropic正式推出Claude Sonnet 4.5模型,在自主”计算机使用”和编码能力上实现重大突破。内部测试显示,该模型可无人值守运行30小时构建类似Slack/Teams的聊天应用,生成约11,000行代码,较今年初Opus 4的7小时自主时长显著提升。Anthropic宣称这是其迄今为止最适合现实世界代理、编码和通用计算机操作的模型,在网络安全、金融服务和研究领域表现突出。
除模型外,Anthropic同步发布代理构建基础设施,包括虚拟机访问、内存管理、上下文管理和多代理支持等组件。据称,Sonnet 4.5的浏览器导航和计算机操作能力较去年10月系统提升3倍以上,该改进基于GitHub、Cursor等早期用户的反馈。
💡 核心要点
- 30小时无人值守运行时长,生成11,000行代码
- 浏览器操作能力较前代提升3倍
- 配套发布代理构建基础设施组件
- 在网络安全、金融、研究领域表现突出
- 代码生成效率超越GPT-4o(13.7%胜率)和Claude Opus 4.1(49%胜率)
📌 情报分析
技术价值:高 – 30小时自主运行时长和11,000行代码生成能力标志着AI代理技术的实质性突破,特别是在复杂任务持续执行方面。
商业价值:极高 – 金融、网络安全等高价值行业的针对性优化,配合完整的基础设施支持,使其具备快速商业化落地的潜力。
趋势预测:高 – 测试数据显示AI在专业报告撰写领域已接近人类专家水平(GPT-5-high达到40.6%胜率),预示AI将加速渗透知识工作领域。
