新华通讯社主管

首页 >> 正文

“多语种智能语音关键技术及产业化”项目获国家科技进步奖一等奖
2024-06-25 记者 郭倩 来源: 经济参考网

  6月24日,2023年度国家科学技术奖在京揭晓,共评选出250个项目。其中,由科大讯飞股份有限公司牵头,联合中国科学技术大学、清华大学、华为终端有限公司、中移(杭州)信息技术有限公司等高校及行业领军企业联合完成的“多语种智能语音关键技术及产业化”项目荣获2023年度国家科技进步奖一等奖。

  据了解,多语种智能语音技术对于支撑人机交互、人类语言互通等具有重大战略意义,产业前景广阔。

  为解决语音识别研究中远场、噪声、多人语音混叠等难题,该项目提出了多通道语音信号时空分离建模方法和多维度语音属性解耦表征方法,实现语音信号中内容、噪声等高度耦合的多维属性特征解耦,使得复杂场景下语音识别准确率得到重大突破。

  为应对小语种智能语音系统构建所面临的知识匮乏、训练数据稀缺等难题,科大讯飞设计了全新的多语种通用音素体系和基本语言单元,实现多语种统一音素韵律体系的构建,又通过基于元学习的多语种预训练和基于语族分组的多语种共享建模。通俗地说,就是将不同的小语种进行分类,找到同类语种的共同规律,进行分析建模和训练,最终显著提升了小语种语音系统性能。

  同时,为解决复杂应用场景下语音交互、语音翻译面临着深层次语义理解困难、专业性不足等问题,科大讯飞提出语音语义互增强的鲁棒口语理解技术,有效提升语音交互、语音翻译等复杂场景的语义理解准确率;提出多源知识增强的可信文本生成技术,提升专有词汇及领域知识引用的准确率。

  目前,该技术成果得到广泛应用。以智能手机为例,项目支持各主流手机厂商累计激活设备超10亿台;智能汽车方面,车载智能化产品累计前装超5300万套。此外,该项目还构建了多语种智能语音技术及全球产业生态,2017年开始承建的智能语音国家新一代人工智能开放创新平台,已聚集平台开发者数700.7万,终端设备数40.5亿。

凡标注来源为“经济参考报”或“经济参考网”的所有文字、图片、音视频稿件,及电子杂志等数字媒体产品,版权均属《经济参考报》社有限责任公司,未经书面授权,不得以任何形式刊载、播放。获取授权

买注册量、刷转评赞 层层加码令人忧

买注册量、刷转评赞 层层加码令人忧

对于数据造假,记者采访了解到,一些地方搞异化式“比学赶超”抓增量,让“争上游”变了味。

·第一现场|高端肉牛养殖让牛产业更“牛”

更快!看中国高铁“新动作”

回望中国高铁发展历程,依靠自主创新,中国高铁基础设施和移动装备水平不断提升,一步一个台阶,经历了时速200公里、250公里、300公里、350公里。

·中交集团:擦亮中国基建国家名片

《经济参考报》社有限责任公司版权所有 本站所有新闻内容未经协议授权,禁止转载使用

新闻线索提供热线:010-63074375 63072334 报社地址:北京市宣武门西大街57号

JJCKB.CN 京ICP备18039543号

010140010080000000000000011100001310779533