近日,人工智能企业云知声正式发布“山海·知音”大模型2.0版本。据悉,“山海·知音”大模型2.0依托“山海·Atlas”的多模态、跨语言基座能力,让“山海·知医”等垂直专业智能体加快落地。与乡音、聊出亲情与温度、极致机敏反应,是本次升级的三大能力进化。
据介绍,此次模型ASR能力在公开测试集和自有全场景测试集中,显现了领先的语音识别能力,在评测中实现了从通用到极端全面的领先水平,特别是在高难度的复杂噪音与方言口音场景下,性能相比主流ASR模型提升了2.5%至3.6%。
在真实的语音识别环境中,模型经常会面临专业术语识别不清、逻辑混乱等挑战。而此次升级中最大的亮点,正是模型“能够听得懂专业话”。“山海·知音”2.0可结合上下文和行业术语,听懂专业场景中的每一个术语与指令,识别精度提升 30%。“它不是在‘听字’,而是在‘理解事’。”相关负责人表示。例如在汽车4S店试驾场景中,当销售人员提及“方向盘”相关描述时,即使上下文未明确出现“半幅方向盘”,模型仍能通过逻辑推理准确识别。而在严肃的医疗场景,模型能显式注入“依帕司他”“二甲双胍”等术语进行定向增强,确保识别结果更精准。
在“表达”层面,模型支持30余种中文方言及14种国际语言的识别转写。模型还能融合讲义等视觉语义,构建“视听融合”闭环交互,进一步提升识别结果。
此外,山海·知音-TTS以“高度拟人+创意多元”为核心,让语音合成兼具真实感与创造力,使科技更有温度。

