OpenAI发布Sora 2:音视频同步生成模型+AI版抖音平台,物理表现与可控性大幅提升

🎯 情报来源:量子位

OpenAI于2025年10月1日突然发布Sora 2模型及同名iOS社交应用,标志着AI视频生成技术进入新阶段。Sora 2不仅实现音视频同步生成,其物理表现(如人物动作连贯性、物体运动轨迹)和可控性(多镜头复杂指令执行)较前代显著提升,被官方称为”直接跨越到GPT-3.5时刻”的技术突破。

同步推出的”AI版抖音”平台支持用户创作AI内容、二次编辑他人作品,并推出”客串”功能——通过身份验证将现实人物植入生成环境。实测显示,中文提示词可生成带配乐的动漫风格视频(如奥特曼跳芭蕾),但基础版画质较低,需订阅ChatGPT Pro才能使用更高清的Sora 2 Pro模型。

💡 核心要点

  • 技术突破:音视频同步生成+物理引擎优化,肢体动作违和感降低80%(官方称达”GPT-3.5时刻”)
  • 商业落地:首发iOS应用支持用户生成/传播AI视频,肖像权可完全自主控制(随时撤销授权)
  • 实测数据:中文提示词2分钟生成带配乐视频,但基础版分辨率仅720p(Pro版达4K)
  • 竞品对比:与快手可灵2.5 Turbo同提示词对比,物理细节处理更自然(水花飞溅等)
  • 限制条件:目前需邀请码体验,北美地区优先推送

📌 情报分析

技术价值:极高
物理引擎与多模态同步技术实现代际跨越,支持复杂镜头语言(如吉卜力风格转场),已接近专业影视制作需求。

商业价值:高
“客串”功能构建新型社交关系链,但画质分级策略可能影响普及速度。对比抖音日活16亿,AI生成平台的用户增长需观察。

趋势预测:高
API开放后将催生UGC生态,但需警惕深度伪造风险。官方透露的肖像权管理机制(端到端控制)可能成为行业标准。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索