NCMMSC-CNVSRC 2024视觉语音识别竞赛圆满落幕
- 2024-12-03 11:02:00
- aiadmin 原创
- 585
8月16日上午,NCMMSC-CNVSRC 2024 学术研讨会正在乌鲁木齐召开的第十九届世界人机语音通信学术集会(NCMMSC 2024)上举办。会上通告了本次视觉语音识别竞赛 CNVSRC 2024 的最终结果,并举办了颁奖典礼。
本次竞赛由 NCMMSC 2024 组委会倡导,清华大学、北京邮电大学、海天瑞声和语音之家笼络主办。竞赛旨正在检讨现在视觉语音识别(或称唇语识别)本事正在中文大词外不断识别场景下的体现。
本次竞赛吸引了45支海外里步队参赛,历经近三个月的较量,西北工业大学、内蒙古大学、武汉大学等步队体现超过,首屈一指。
本次研讨会由清华大学王东教诲主办。海天瑞声CMO王潇蔓小姐和语音之家创始人兼CEO卜辉先生为获奖团队颁奖。北京邮电大学刘泽华同砚分享了基线编制与本事告诉,三支卓绝参赛步队代外还受邀分享了他们的本事计划和赛事经历。
视觉语音识别,也称唇语识别,是一项通过口唇作为来臆度发音内容的本事。该本事正在群众和平、助老助残、视频验真等规模具有苛重行使。现在,唇语识其余切磋如日方升,固然正在独立词、短语等识别上获得了长足开展,但正在大词外不断识别方面仍面对远大挑衅。奇特是关于中文而言,因为缺乏相应的数据资源,该规模的切磋开展受到了控制。为此,清华大学正在2023年宣告了 CN-CVS 数据集[1],成为首个大领域的中文视觉语音识别数据库,为进一步促进大词外不断视觉语音识别 (LVCVSR) 供应了能够,并于同年举办了 CNVSRC 2023 竞赛[2],促进了唇语识别正在中文规模的开展。
为了进一步促进这一切磋宗旨,清华大学笼络北京邮电大学、海天瑞声和语音之家正在 NCMMSC 2024 一直举办了中文不断视觉语音识别挑衅赛 (Chinese Continuous Visual Speech Recognition Challenge 2024, CNVSRC 2024)。本次竞赛中,很众参赛步队正在唇语识别职分上实行了编制职能的明显擢升,个中最佳成就相较于基线%。其余,与 CNVSRC 2023 比拟,2024年各赛道的成就均有昭彰先进。各支参赛步队提出了诸众革新计划,为中文大词外不断视觉语音识别切磋供应了新的思绪和手法。
联系人: | 王先生 |
---|---|
电话: | 15640228768 |
微信: | 1735252255 |
地址: | 沈阳市铁西区兴华南街58-6号 |
-
思陌产品
深度学习系统产品介绍 -
使用帮助
使用手册 -
关于我们
公司简介 -
资讯反馈
交流论坛 -
联系我们
Tel 15640228768 QQ/WX技术支持 1735252255