Google DeepMind发布Veo 3和Imagen 4，推动生成式媒体模型新突破

技术突破
6月16日

AI情报员

🎯 情报来源：Google DeepMind Blog

Google DeepMind今日宣布推出其最新的生成式媒体模型Veo 3和Imagen 4，标志着在视频和图像生成领域的重大突破。这些模型不仅能够生成令人惊叹的图像、视频和音乐，还为艺术家和创作者提供了更多工具来实现其创意愿景。Veo 3在文本和图像提示、真实世界物理模拟以及准确的唇语同步方面表现出色，能够通过简短的提示生成生动的视频片段。目前，Veo 3已在美国的Gemini应用和Flow工具中面向Ultra订阅用户开放，同时也在Vertex AI上为企业用户提供。

此外，Google DeepMind还推出了Lyria 2的扩展访问权限，为音乐创作者提供更多工具，并邀请视觉叙事者尝试其新的AI电影制作工具Flow。Flow利用Google DeepMind最先进的模型，允许用户通过更精细的角色、场景和风格控制来创作电影化的内容。

核心要点：

Veo 3在文本和图像提示、物理模拟及唇语同步方面表现卓越，现已在美国的Gemini应用和Flow工具中开放。
Imagen 4和Lyria 2的推出进一步扩展了生成式媒体模型的应用范围，为艺术家和音乐创作者提供更多工具。
Flow工具通过高级模型支持，帮助用户实现电影化的内容创作。
Veo 2新增了参考视频功能和相机控制，提升了创作的一致性和精确性。

📌 情报分析

技术价值：高

Veo 3和Imagen 4在生成式媒体模型领域的技术突破显著，尤其是在物理模拟和唇语同步方面的表现，为视频和图像生成设定了新的标准。Flow工具的推出进一步降低了电影化内容创作的门槛，使得更多创作者能够利用AI技术实现复杂的叙事控制。

商业价值：高

这些模型的推出为创意产业提供了巨大的市场机会，尤其是在影视制作、音乐创作和广告领域。建议相关企业立即评估这些工具的应用潜力，尤其是在内容创作和自动化生产方面。然而，需要注意的是，这些技术的普及可能面临版权和伦理问题的挑战。

趋势预测：

未来3-6个月内，生成式媒体模型的应用将进一步扩展，尤其是在影视和音乐制作领域。值得关注的是，这些技术可能引发更多关于AI生成内容的版权和伦理讨论。此外，随着模型的不断优化，其在商业广告和社交媒体内容创作中的应用也将大幅增加。

原文连接

{{userData.name}}已认证

Google DeepMind发布Veo 3和Imagen 4，推动生成式媒体模型新突破

🎯 情报来源：Google DeepMind Blog

📌 情报分析

ChatGPT

Claude

Meta AI

Kimi AI (月之暗面)

Gemini

Copilot