15个语种22项第一，我国多语种语音技术再获突破

炒股入门 2022-11-15 11:35炒股入门知识www.xyhndec.cn

　　11月18日，科大讯飞-中科大语音及语言信息处理国家工程实验室联合团队（USTC-NELSLIP）在近日举办的OpenASR国际低资源多语种语音识别挑战赛上，参加了所有15个语种受限赛道和7个语种非受限赛道，全部取得第一。

　　这是继前不久荣获多语言理解评测XTREME冠军之后，科大讯飞在多语种领域取得突破，在探索人机交互更自然、人人沟通无障碍的征程中又迈出了坚实的一步，也为中国多语种语音语言技术赶超国际先进水平、助推中国智能制造的全球化奠定了坚实的基础。

　　近年来，随着深度学习技术的进步，汉语、英语等大语种语音识别技术日趋成熟，并获得广泛的应用。相比之下，小语种语音识别因其语音数据资源难以获取、难以标注、难以评估、语言专家稀缺等原因，已经成为世界性的研究难题，距离实用门槛仍有较大差距。

　　据悉，OpenASR挑战赛更加关注小语种语音技术，探索如何使用少量的数据达到较好的效果，考察低资源语音识别基础算法在多个语种上的推广性。自2020年启动以来，吸引了加拿大蒙特利尔信息科技研究中心、新加坡科技研究局、清华大学、腾讯等国内外知名研究机构和企业参与其中。

　　本次比赛共包含15个语种，涵盖受限赛道、受限附加赛道和非受限赛道。据介绍，对于低资源语种而言，除了语音数据量较小外，其发音词典大小、语料丰富性、标注准确度都远不及常规水平。本次比赛中各个语种数据主要来自电话信道，口语化特征十分明显，对话风格非常自由，也使得语音识别难上加难。

　　多语种语音语言技术是万物互联时代实现人机交互的关键技术，也是实现“一带一路”语言大互通的基础技术。据悉，经过多年的技术积累，除了中英以外，科大讯飞还具备了69种语言的语音识别能力（其中35个语种准确率已超过90%），并已在新加坡、俄罗斯、印度、日本等国家部署了海外站点，为各地开发者提供语音识别、语音合成、机器翻译、图文识别等语音语言服务，所有服务均在科大讯飞开放平台开放。

上一篇：天风研究：智能电动正面交锋，传统自主和新势力的突围之道下一篇：钢铁行业碳达峰方案将公布氢能冶金或逐步推广

15个语种22项第一，我国多语种语音技术再获突破

炒股搜索

股市行情

炒股开户

炒股技术

15个语种22项第一，我国多语种语音技术再获突破

新手炒股入门

炒股搜索

股市行情

炒股开户

炒股技术