🎯 情报来源:The Verge
Google DeepMind发布第三代AI世界模型Genie 3,实现三大突破:交互时长从Genie 2的10-20秒提升至”数分钟”,视觉记忆维持约1分钟(可记住物体位置变化),输出分辨率达720p/24fps。该模型通过文本提示即可生成可交互3D环境,并新增”可触发世界事件”功能,支持实时修改天气、添加角色等操作。
目前该技术仅向选定学术机构及创作者开放研究预览,Google称正在评估如何扩大测试范围。相比前代产品,Genie 3在Pixar联合创始人投资的竞品测试中展现出更稳定的环境持续性,解决了物体异常形变等核心痛点。
💡 核心要点
- 交互时长提升6倍:从Genie 2的20秒突破至持续数分钟
- 视觉记忆系统:可维持1分钟物体位置记忆(如墙面涂鸦位置不变)
- 720p/24fps输出:比前代模糊渲染有明显画质提升
- 新增动态事件:通过提示词实时修改天气/添加角色
- 当前限制:仅限学术研究使用,文字生成需依赖输入描述
📌 情报分析
技术价值:高 – 视觉记忆时长和交互持续性突破现有技术瓶颈,但1分钟记忆窗口仍显不足
商业价值:一般 – 当前封闭测试策略限制商业化验证,720p画质离商用级产品仍有差距
趋势预测:极高 – 世界模型赛道获Google持续投入(12月发布Genie 2),交互时长年增长率达300%
