DeepMind发布Genie 3世界模型:交互时长提升6倍,支持720P/24fps实时生成3D环境

🎯 情报来源:The Verge

Google DeepMind发布第三代AI世界模型Genie 3,实现三大突破:交互时长从Genie 2的10-20秒提升至”数分钟”,视觉记忆维持约1分钟(可记住物体位置变化),输出分辨率达720p/24fps。该模型通过文本提示即可生成可交互3D环境,并新增”可触发世界事件”功能,支持实时修改天气、添加角色等操作。

目前该技术仅向选定学术机构及创作者开放研究预览,Google称正在评估如何扩大测试范围。相比前代产品,Genie 3在Pixar联合创始人投资的竞品测试中展现出更稳定的环境持续性,解决了物体异常形变等核心痛点。

💡 核心要点

  • 交互时长提升6倍:从Genie 2的20秒突破至持续数分钟
  • 视觉记忆系统:可维持1分钟物体位置记忆(如墙面涂鸦位置不变)
  • 720p/24fps输出:比前代模糊渲染有明显画质提升
  • 新增动态事件:通过提示词实时修改天气/添加角色
  • 当前限制:仅限学术研究使用,文字生成需依赖输入描述

📌 情报分析

技术价值:高 – 视觉记忆时长和交互持续性突破现有技术瓶颈,但1分钟记忆窗口仍显不足

商业价值:一般 – 当前封闭测试策略限制商业化验证,720p画质离商用级产品仍有差距

趋势预测:极高 – 世界模型赛道获Google持续投入(12月发布Genie 2),交互时长年增长率达300%

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索