科大讯飞语音合成技术突破:一句话声音复刻与超拟人合成实现行业领先

🎯 情报来源:量子位

科大讯飞于6月26日宣布其语音合成技术实现重大升级,一句话声音复刻与超拟人合成两大核心能力取得突破。据专业测评,其声音复刻技术在相似度、准确度等维度行业领先。该技术已应用于蔚来、奇瑞等车企的智能座舱,并在教育、医疗、金融等领域深度渗透。

核心要点:

  • 一句话声音复刻技术仅需用户一句话录音,即可精准还原音色、停顿习惯及情感起伏,相似度与准确度行业领先。
  • 超拟人合成技术新增“上下文情商”功能,通过上下文感知系统实现多轮对话中的情感响应,自然度接近真人水平。
  • 技术已落地蔚来ET9、新ES6等车型,成为行业首款应用AI生成式语音合成框架的智能汽车。
  • 讯飞语音大模型服务全国5万余所学校、600家医院及众多金融机构,教育领域新增“AI 1对1互动式问诊规划”功能。
  • 数字内容创作领域,超拟人数字人技术唇形同步率达98%,简化视频制作流程。

📌 情报分析

技术价值:极高

通过三阶段层次化语音建模框架和音色解耦表征技术,实现发音内容与音色特征的可控分离,显著提升语义建模稳定性。

商业价值:高

已覆盖智能汽车、教育、医疗等高价值场景,技术落地规模庞大(5万所学校、600家医院),且与多家主流车企合作。

趋势预测:

未来3-6个月,语音合成技术将进一步降低应用门槛,推动个性化需求在更多行业爆发,尤其在数字内容创作和智能交互领域。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索