MIT:在无人为干涉的情况下 百度深度语音可在数小时学会说话
- 2025-07-03 20:15:00
- aiadmin 原创
- 12
巨头逐鹿人工智能,胀动深度进修身手正在现实利用界限屡破瓶颈。即日,环球著名科技评论媒体《麻省理工科技评论》发文先容深度进修身手正在语音界限得回的强大冲破,百度深度语音身手可大大节减人类幕后精调的任务量。MIT示意,百度人工智能的深度语音合成身手依然超越谷歌,并正在亚马逊的Mechanical Turk测试中,得回了比“及时”还速的速率成效。
百度行为中邦人工智能界限的先行者,正在人工智能方面参加浩大。早正在2013年便率先创建深度进修咨议院(IDL),深耕深度进修身手界限,与IBM、谷歌、微软一同位列深度进修咨议的第一阵营。现正在百度已正在语音身手方面获得稠密发扬,百度大脑语音合成日央求量2.5亿,语音识别正确率达97%,百度语音身手入选MIT科技评论杂志评出的“2016年环球十大冲破身手”。
百度行使深度进修身手将文天职裂为最小单元,天生被称之为“形象(phenomes)”的声响片断,随后,再行使语音合成收集从新天生这些声响。这种手腕的分歧之处正在于,深度进修可能本人结束操练经过,根基不需求人工实行微调。而百度这一身手依然远远领先与谷歌DeepMind客岁推出的WaveNet——正在培训阶段已经需求微调,并且需求大宗的计划资源,难以正在确切情境中获得利用。
作品通过单词“Hello”来先容百度深度语音合成身手是若何实行的。百度编制会将“Hello”分裂为以下“形象”:(无声, HH)、 (HH, EH)、 (EH, L)、 (L, OW)、 (OW, 无声)。然后再将这些输入到语音合成编制来说出单词。他日百度将正在操纵重音、不断时辰和自然声响频率方面加深咨议,以实行转移输出的语音和词语中所通报的激情的功用。
然而这一编制的实行需求大宗的计划资源。线赫兹,是以电脑天生样本的时辰只要20微秒。不过语音合成经过涉及众个层面,每个层面都要保障正在1.5微秒中结束任务,才华跟上天生速率。对此百度咨议员对MIT示意:“要实行及时对接,咱们必需保障不行反复计划任何结果,将一切管制模子存储正在缓存之中(不是主内存),然后优化愚弄可用的计划单位。”
据悉,百度深度讲话合成编制正在亚马逊的Mechanical Turk长进行了众包领会测试。测试内容囊括让众个试用职员将天生音频与真人原声灌音做比拟,然后对音频质料实行打分。结果显示,通过百度深度进修身手天生的音频质料很高。百度示意,百度深度语音合成到达了等到时还速的速率,不光也许及时天生音频,从而可能普遍利用于直播中。
联系人: | 王先生 |
---|---|
电话: | 15640228768 |
微信: | 1735252255 |
地址: | 沈阳市铁西区兴华南街58-6号 |
-
思陌产品
深度学习系统产品介绍 -
使用帮助
使用手册 -
关于我们
公司简介 -
资讯反馈
交流论坛 -
联系我们
Tel 15640228768 QQ/WX技术支持 1735252255