国产AI路由系统Avengers-Pro开源:以19%成本实现Gemini-2.5-Pro同等性能

🎯 情报来源:量子位

上海人工智能实验室科研团队开源推出Avengers-Pro多模型调度路由方案,该系统集成8个行业领先大模型,在6个挑战性数据集测试中实现性能突破:最高性能超越GPT-5-medium 7%,超越Gemini-2.5-Pro 19%。更值得注意的是其极致性价比——仅需19%成本即可达到Gemini-2.5-Pro同等性能水平,与GPT-5-medium性能持平时可节省27%成本。

该系统通过嵌入-聚类-评分三步骤实现智能路由:将用户请求转换为语义向量并聚类,根据预设的性能-成本参数α动态分配最优模型。实验中使用来自OpenAI、Anthropic、Google和阿里的8个顶尖模型,在GPQA-Diamond等6个数据集上验证了其帕累托最优特性——在任何成本水平下提供最高准确率,或为任何准确率目标实现最低成本。

💡 核心要点

  • 性能突破:最高正确率0.66,超越GPT-5-medium(0.62)7%
  • 成本优势:以19%成本实现Gemini-2.5-Pro同等性能
  • 模型集成:调度8个顶尖模型包括GPT-5/Claude-4/Gemini-2.5/Qwen3
  • 技术机制:基于嵌入-聚类-评分的动态路由,参数α(0-1)调节性能成本比
  • 帕累托最优:所有测试场景下均实现性能-成本最佳平衡

📌 情报分析

技术价值:极高
• 首个实现多模型动态路由的开源方案,在6个高难度基准测试中验证技术可行性
• 创新性嵌入聚类机制+可调节α参数,为后续研究提供新范式

商业价值:高
• 实测27%-81%成本节约空间,直接解决大模型落地最大痛点
• 支持主流商业API(GPT-5/Claude等)与开源模型(Qwen)混合调度

趋势预测:高
• 多模型路由将成为大模型应用标配技术(OpenAI已部署类似机制)
• 开源方案将加速中小厂商进入赛道,可能重构云API定价体系

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索