摩尔线程:正式开源音频理解大模型MooER

2024-11-17 10:13:00
aiadmin
原创
596

【全球网科技归纳报道】8月24日动静,邦内GPU与AI估计打算处理计划供给商摩尔线程宣告,正式开源了其音频解析大模子——MooER(摩耳)。

据先容,该模子是业界首个基于邦产全功效GPU举行磨练和推理的大型开源语音模子。MooER大模子的开源,是摩尔线程正在AI语音本领周围的又一紧急里程碑。据摩尔线程先容,MooER依托其自研的夸娥(KUAE)智算平台,连结改进算法和高效估计打算资源,仅用38个小时就已毕了对5000小时音频数据和伪标签的磨练,露出了惊人的估计打算功用和数据措置才具。

行为业界领先的开源语音模子,MooER不单援救中文和英文的语音识别,还具备中译英的语音翻译才具。正在众个语音识别周围的测试召集,MooER露出出了领先或起码持平的优异发挥,更加是正在Covost2 zh2en中译英测试集上,BLEU分数到达了25.2,明显优于其他开源模子,赢得了可与工业秤谌相媲美的成绩。

MooER的模子机闭由Encoder、Adapter、Decoder(LLM)三局限构成,通过高效的音频修模和文本调和机制,杀青了对杂乱语音信号的解析和转换。正在模子磨练阶段,摩尔线程采用了优秀的LoRA本领,仅更新2%的LLM参数,明显晋升了磨练功用和最终成绩。

另外,摩尔线程还安排后续开源磨练代码以及基于8万小时数据磨练的模子,旨正在推进语音大模子的设施演进和本领落地,为社区功勋更众价钱。摩尔线程方面示意,祈望通过MooER的开源,鼓励AI语音本领的普及和成长,助力更众开垦者和企业杀青本领改进和物业升级。

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号