云知声“山海·知音”大模型2.0发布-经济参考网 _ 新华社《经济参考报》官方网站

近日，人工智能企业云知声正式发布“山海·知音”大模型2.0版本。据悉，“山海·知音”大模型2.0依托“山海·Atlas”的多模态、跨语言基座能力，让“山海·知医”等垂直专业智能体加快落地。与乡音、聊出亲情与温度、极致机敏反应，是本次升级的三大能力进化。

据介绍，此次模型ASR能力在公开测试集和自有全场景测试集中，显现了领先的语音识别能力，在评测中实现了从通用到极端全面的领先水平，特别是在高难度的复杂噪音与方言口音场景下，性能相比主流ASR模型提升了2.5%至3.6%。

在真实的语音识别环境中，模型经常会面临专业术语识别不清、逻辑混乱等挑战。而此次升级中最大的亮点，正是模型“能够听得懂专业话”。“山海·知音”2.0可结合上下文和行业术语，听懂专业场景中的每一个术语与指令，识别精度提升 30%。“它不是在‘听字’，而是在‘理解事’。”相关负责人表示。例如在汽车4S店试驾场景中，当销售人员提及“方向盘”相关描述时，即使上下文未明确出现“半幅方向盘”，模型仍能通过逻辑推理准确识别。而在严肃的医疗场景，模型能显式注入“依帕司他”“二甲双胍”等术语进行定向增强，确保识别结果更精准。

在“表达”层面，模型支持30余种中文方言及14种国际语言的识别转写。模型还能融合讲义等视觉语义，构建“视听融合”闭环交互，进一步提升识别结果。

此外，山海·知音-TTS以“高度拟人+创意多元”为核心，让语音合成兼具真实感与创造力，使科技更有温度。

首页 >> 正文