当前位置: 网通社快报 > 智谱发布GLM-TTS语音合成系统:3秒样本即可生成逼真人声
智谱今日发布工业级语音合成系统GLM-TTS,仅需3秒语音样本即可复刻音色与说话风格。该系统采用两阶段架构与GRPO强化学习,在字错误率和情感表达上达开源SOTA水平,训练仅用10万小时数据、单机4天完成。已开放模型权重、推理代码及API,适用于教育、有声书、智能客服等场景,支持多音字、角色配音与端到端语音交互。
微信、QQ、支付宝扫一扫手机阅读更方便。
2025-10-14 14:16 星期一