亚马逊Bedrock推出全球跨区域推理功能,Claude Sonnet 4.5模型吞吐量提升10%

🎯 情报来源:Artificial Intelligence

亚马逊云科技(AWS)近日宣布为其生成式AI平台Amazon Bedrock推出全球跨区域推理(Global CRIS)功能,并率先支持Anthropic公司最新发布的Claude Sonnet 4.5大模型。该功能通过智能路由机制,可将推理请求自动分配至全球20多个AWS商业区域,使模型吞吐量提升10%,同时降低10%的token使用成本。

技术文档显示,全球CRIS功能采用三层IAM策略架构,无需修改现有服务控制策略(SCPs)即可实现跨区域资源调度。系统会实时监控各区域的基础模型(FM)可用性、计算负载和延迟等指标,优先选择最优商业区域处理请求。目前该功能已支持提示缓存、批量推理、知识库等Bedrock核心特性。

💡 核心要点

  • 覆盖全球20+ AWS商业区域,支持突发流量自动分流
  • 相比区域专用推理配置,token成本降低10%
  • Claude Sonnet 4.5作为首款支持模型,具备最优编码和复杂代理能力
  • 服务配额统一通过美东(弗吉尼亚北部)区域管理
  • 保持源区域监控日志集中化,简化运维复杂度

📌 情报分析

技术价值:极高 – 创新性地实现全球资源池化调度,突破单区域算力瓶颈,技术实现包含智能路由算法和三层权限架构

商业价值:高 – 直接降低企业AI推理成本,10%的性价比提升对大规模部署具有显著吸引力,但需评估数据驻留合规要求

趋势预测:高 – 预示云厂商AI基础设施将向”全球资源网格化”方向发展,未来6-12个月内可能看到微软Azure/谷歌云类似功能跟进

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索