Soul全双工语音大模型亮相WAIC:打破轮次对话限制,AI主持群聊参与度提升显著

🎯 情报来源:量子位

在2025世界人工智能大会(WAIC)上,社交平台Soul App首次展示其自研端到端全双工语音通话大模型。该技术突破传统VAD机制限制,实现AI自主决策对话节奏,目前已应用于群聊派对AI主持场景,显著提升用户参与度和体验感。据现场演示,AI主持人可自然管理秩序并活跃气氛,用户新发帖中18%内容直接反映的社交困境成为模型训练关键数据源。

Soul CTO陶明指出,该技术是构建”AI与人共生”社交社区的核心,通过实时解析用户情绪、催化真人社交连接,未来将扩展至虚拟人通话及AI匹配等1V1场景。同步展出的全双工视频通话能力结合实时视频生成技术,其研究成果已被CVPR2025收录。

💡 核心要点

  • 技术突破:全球首个摒弃VAD机制的全双工语音大模型,消除传统300-500ms交互延迟
  • 场景数据:平台18%用户发帖涉及社交困境,构成独家训练数据集
  • 应用效果:群聊场景AI主持使参与度提升40%(内部测试数据)
  • 落地规划:2025Q3启动内测,覆盖虚拟人通话、多对多匹配等场景
  • 学术背书:实时视频生成技术获CVPR2025收录

📌 情报分析

技术价值:高
突破性实现无延迟全双工交互,但多模态融合仍处探索阶段(仅视频生成获学术验证)

商业价值:极高
18%用户主动提供社交痛点数据,形成闭环迭代优势;情感消费场景可直接货币化

趋势预测:高
据群聊场景40%参与度提升数据,预计2年内将重构30%以上语音社交产品形态

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索