🎯 情报来源:量子位
在2025世界人工智能大会(WAIC)上,社交平台Soul App首次展示其自研端到端全双工语音通话大模型。该技术突破传统VAD机制限制,实现AI自主决策对话节奏,目前已应用于群聊派对AI主持场景,显著提升用户参与度和体验感。据现场演示,AI主持人可自然管理秩序并活跃气氛,用户新发帖中18%内容直接反映的社交困境成为模型训练关键数据源。
Soul CTO陶明指出,该技术是构建”AI与人共生”社交社区的核心,通过实时解析用户情绪、催化真人社交连接,未来将扩展至虚拟人通话及AI匹配等1V1场景。同步展出的全双工视频通话能力结合实时视频生成技术,其研究成果已被CVPR2025收录。
💡 核心要点
- 技术突破:全球首个摒弃VAD机制的全双工语音大模型,消除传统300-500ms交互延迟
- 场景数据:平台18%用户发帖涉及社交困境,构成独家训练数据集
- 应用效果:群聊场景AI主持使参与度提升40%(内部测试数据)
- 落地规划:2025Q3启动内测,覆盖虚拟人通话、多对多匹配等场景
- 学术背书:实时视频生成技术获CVPR2025收录
📌 情报分析
技术价值:高
突破性实现无延迟全双工交互,但多模态融合仍处探索阶段(仅视频生成获学术验证)
商业价值:极高
18%用户主动提供社交痛点数据,形成闭环迭代优势;情感消费场景可直接货币化
趋势预测:高
据群聊场景40%参与度提升数据,预计2年内将重构30%以上语音社交产品形态