百度蒸汽机2.0发布:全球首创多人有声音视频一体化生成,价格低至1.4元/5秒

🎯 情报来源:量子位

2025年8月22日,百度正式发布蒸汽机(MuseSteamer)视频生成大模型2.0版本,实现全球首个多人有声音视频一体化生成能力。该版本在画质、运镜控制和多模态协调方面显著提升,支持端到端电影级内容生产,限时优惠价低至1.4元/5秒(原价2.5元/秒),较行业平均价格低30%。

技术演示显示,新版本可精确实现语音与唇形、表情的毫秒级对齐,中文语音还原度超98%。好莱坞视效指导姚骐现场展示的科幻短片《归途》,验证了其”用AI实现百万预算级影视效果”的能力。目前模型已接入百度智能云千帆平台,在一汽大众、伊利等品牌营销案例中实现商用落地。

💡 核心要点

  • 定价优势:Turbo有声版2.5元/秒,限时优惠1.4元/5秒(较行业均价低70%)
  • 技术突破:全球首个支持多人互动+语音+视频同步生成的大模型
  • 专业认证:获《三体》视效指导姚骐认可,可替代部分好莱坞级制作
  • 中文适配:语音细节与情感表达还原度达98%
  • 商业应用:已落地一汽大众、伊利等品牌营销项目

📌 情报分析

技术价值:极高
首创多模态潜在空间规划技术,实现复杂角色互动逻辑控制,技术壁垒显著。毫秒级音画同步精度达影视工业标准。

商业价值:高
定价策略极具侵略性,配合百度搜索/信息流生态形成闭环。汽车、快消行业案例验证商业化可行性。

趋势预测:高
视频生成正从单模态向多模态协同演进,百度在中文场景的先发优势可能挤压中小玩家生存空间。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索