Midjourney进军视频生成:物理真实感惊人,但音频功能缺失

🎯 情报来源:量子位

图像生成领域的领先公司Midjourney近期展示了其在视频生成模型方面的进展。尽管尚未正式发布,但其生成的视频在动作平滑性、细节表现和物理真实感上表现出色,例如跑步动作、挖蛋糕场景中的倒影等都极为逼真。然而,该模型尚不支持音频功能,引发了部分网友质疑其入局时间是否过晚。

除了视频模型,Midjourney V7图像生成模型也在持续更新中,新增了“草稿模式”和“语音生图”功能,并通过优化将渲染速度提升了40%。

核心要点:

  • 视频生成模型效果惊艳,Reddit点赞量达2.5k,但暂无音频功能。
  • Midjourney V7新增“草稿模式”,生成成本减半,渲染速度提升10倍。
  • 快速模式下图像渲染时间从36秒减少到22秒,Turbo模式从13秒减少到9秒。

📌 情报分析

技术价值:高

Midjourney在视频生成中展现了强大的物理真实感和细节处理能力,但在音频支持方面存在明显短板。尽管如此,V7的“草稿模式”和语音生图功能为用户提供了更灵活的创作方式。

商业价值:高

Midjourney不仅提供高质量的生成内容,还通过用户评分和定价建议增强了互动性与市场适应性。这种策略有助于扩大用户基础并提高市场竞争力。

趋势预测:

未来3-6个月内,Midjourney可能会优先完善视频模型的音频功能,并进一步优化V7的性能,以应对日益激烈的市场竞争。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索