🎯 情报来源:量子位
科大讯飞于6月26日宣布其语音合成技术实现重大升级,一句话声音复刻与超拟人合成两大核心能力取得突破。据专业测评,其声音复刻技术在相似度、准确度等维度行业领先。该技术已应用于蔚来、奇瑞等车企的智能座舱,并在教育、医疗、金融等领域深度渗透。
核心要点:
- 一句话声音复刻技术仅需用户一句话录音,即可精准还原音色、停顿习惯及情感起伏,相似度与准确度行业领先。
- 超拟人合成技术新增“上下文情商”功能,通过上下文感知系统实现多轮对话中的情感响应,自然度接近真人水平。
- 技术已落地蔚来ET9、新ES6等车型,成为行业首款应用AI生成式语音合成框架的智能汽车。
- 讯飞语音大模型服务全国5万余所学校、600家医院及众多金融机构,教育领域新增“AI 1对1互动式问诊规划”功能。
- 数字内容创作领域,超拟人数字人技术唇形同步率达98%,简化视频制作流程。
📌 情报分析
技术价值:极高
通过三阶段层次化语音建模框架和音色解耦表征技术,实现发音内容与音色特征的可控分离,显著提升语义建模稳定性。
商业价值:高
已覆盖智能汽车、教育、医疗等高价值场景,技术落地规模庞大(5万所学校、600家医院),且与多家主流车企合作。
趋势预测:
未来3-6个月,语音合成技术将进一步降低应用门槛,推动个性化需求在更多行业爆发,尤其在数字内容创作和智能交互领域。
