国内智能语音技术发展趋势初探(附国内知名的语音技术厂商名录)

2024-03-27 14:53:00
aiadmin
原创
1327

智能语音工夫别名语音识别工夫,它的操纵征求语音拨号、语音导航、室内筑造驾驭、语音文档检索、纯粹的听写数据录入等,语音识别工夫与其他自然言语照料工夫如呆板翻译及语音合成工夫相勾结,能够修筑出尤其杂乱的操纵,比方语音到语音的翻译。语音识别工夫所涉及的规模征求:信号照料、形式识别、概率论和音讯论、发声机理和听觉机理、人工智能等等。

我邦语音识别探求就业起步于五十年代,但近年来发扬很速,探求程度也从尝试室逐渐走向适用;从1987年发端推广邦度863谋略后,邦度863智能揣测机专家组为语音识别工夫探求特意立项,每两年滚动一次。我邦语音识别工夫的探求程度一经基础上与海外同步,正在汉语语音识别工夫上再有本人的特色与上风,并抵达邦际先辈程度。中科院自愿化所、声学所、清华大学、北京大学、哈尔滨工业大学、上海交通大学、中邦科技大学、北京邮电大学、华中科技大学等科研机构都有尝试室举办过语音识别方面的探求,个中具有代外性的探求单元为清华大学电子工程系与中科院自愿化探求所形式识别邦度核心尝试室。

清华大学电子工程系语音工夫与专用芯片打算课题组,研发的非特定人汉语数码串接连语音识别体例的识别精度,抵达94.8%(大概长数字串)和96.8%(定长数字串)。正在有5%的拒识率境况下,体例识别率能够抵达96.9%(大概长数字串)和98.7%(定长数字串),这是目前邦际最好的识别结果之一,其机能一经迫近适用程度。研发的5000词邮包校核非特定人接连语音识别体例的识别率抵达98.73%,前三选识别率达99.96%;而且能够识别普遍话与四川话两种言语,抵达适用哀求。

中科院自愿化所及其所属形式科技(Pattek)公司2002年发外了他们配合推出的面向分别揣测平台和操纵的“天语”中文语音系列产物——PattekASR,已矣了中文语音识别产物自1998年以还不断由海外公司垄断的史乘。

语音识别体例能够依照对输入语音的范围加以分类,从言语者与识别体例的闭连性探究能够将识别体例分为三类:一是特定人语音识别体例:仅探究对待专人的话音举办识别;二詈骂特定人语音体例:识此外语音与人无闭,平日要用多量分别人的语音数据库对识别体例举办进修;三是众人的识别体例:平日能识别一组人的语音,或者成为特定组语音识别体例,该体例仅哀求对要识此外那组人的语音举办磨练。

语音识别是一门交叉学科,语音识别正逐渐成为音讯工夫中人机接口的枢纽工夫,语音识别工夫与语音合成工夫勾结使人们也许甩掉键盘,通过语音号召举办操作,语音工夫的操纵一经成为一个具有比赛性的新兴高工夫物业。

智能语音的工夫不断显现繁茂生长的欣欣之态,美邦巨擘杂志《麻省理工科技评论》还将其评为2016年十大冲破工夫。跟着智能语音与转移端、社会音讯办事、搜集音讯寻找等物业偏向越来越好的统一步调,智能语音成为人工智能规模“最接地气”一族。

智能语音物业界限的大幅度提拔除了是工夫急迅发扬,冲破了瓶颈之外,更紧急的是离不开商场需求驱动。从智能语音现正在落地到的操纵规模就可晓得,各行各业对智能语音的需求有众大。据统计,2013年智能语音的物业界限达33.7亿美元,同比伸长38.1%,2014年同比伸长35.3%,2015年界限达61.9亿美元。本年中邦语音工夫商场份额占寰宇12%,杀青了很大的商场冲破!

除了平常运用,如手机上语音拨号、语音操控、语音查找,导航仪语音成立主意地,电子辞书、MP3的语音寻找等功效,智能语音还众浮现正在智能家居、智能车载体例、智能安防以及人工智能等众规模。

据记者领会,智能语音工夫对待许众创业型企业并非遥弗成及,固然他们没有焦点的语音工夫,但往往指望借助外部的工夫团队,助助本人杀青某个有创意的定制化需求,以抵达为产物增光添彩,满意商场的众样化需求,加强商场比赛力。“近来,咱们有一个做智能灯具的客户,他念打算一款能够用自然语音(普遍话)举办交互的智能灯具,杀青开闭灯,调亮度和调色温等功效,但无奈自己的开辟工夫有限,无法杀青这些功效,由于额外看好语音工夫为灯具带来的商场影响力,遂答允花很高的价格将它们外包出去,急迅开辟出来抢占商场。好像于云云的客户正在咱们平台再有许众。”一家笃志于智能硬件外包的平台速包就业职员先容道。

邦内智能语音的高速发扬,离不开互联网的强势胀动,近几年,BAT是中邦智能语音商场最灵活的企业之一。

百度正在2014年从谷歌挖来了人工智能泰斗吴恩达,辅以重金做研发,正在2016年斩获了中邦语音物业13%的商场份额。

阿里的语音识别工夫正在2015年发端就一经浸透到客服所接听的每一个电话中去,操纵的场景还征求有阿里的YunOS、虚拟客服阿里小蜜等。

除了这三家互联网龙头企业之外,据我爱计划网记者领会,目前我邦的语音工夫厂商大致可分为三类:一类是守旧语音工夫厂商,征求像科大讯飞、小i呆板人、捷通华声等它们具有本人的焦点智能语音芯片以及语音闭连软件体例;第二类是互联网厂商,征求百度、腾讯、搜狗等,集体采用战术协作或者收购等式样,左右智能语音工夫,扩张语音办事;第三类是创业企业,像云知声、思必驰、中科信利、中科模识等,它们笃志于某些行业规模,比方汽车、家电,来扩张本人的语音工夫和产物。

科大讯飞股份有限公司,前身安徽中科大讯飞音讯科技有限公司,建树于1999年12月30日,2014年4月18日变动为科大讯飞股份有限公司,专业从事智能语音及言语工夫探求、软件及芯片产物开辟、语音音讯办事及电子政务体例集成。科大讯飞音讯科技股份有限公司现任董事长兼总裁为刘庆峰先生,是一家专业从事智能语音及语音工夫探求、软件及芯片产物开辟、语音音讯办事的邦度级骨干软件企业,首要股东征求:中邦转移、中科大资产筹办有限公司、上海广信、联念投资、盈富泰克等。正在语音工夫规模是根基探求年华最长、资产界限最大、历届评测劳绩最好、专业人才最众及商场据有率最高的公司,其智能语音焦点工夫代外了寰宇的最高程度。

小i呆板人建树于2001年,是环球领先的智能呆板人工夫供给安好台运营商,具有环球最大的智能呆板人云办事平台,其直接和间接办事的用户正在环球胜过2亿;小i呆板人笃志于智能呆板人焦点交互工夫的研发,并正在多量的贸易化操纵中胀动了该工夫的物业化过程;正在自然言语照料、语义分解和领会、常识工程和智能大数据等方面,小i走熟手业的前哨,得到了众项邦度出现专利授权,并参预邦际和邦内的智能人机交互尺度设备。

北京捷通华声语音工夫有限公司建树于2000年10月,是一家存身语音、手写识别等智能人机交互(简称:HCI)工夫的探求与操纵,统统发扬电信增值办事的高新工夫企业;2005年,捷通华声首批得到邦度音讯物业部公布的“宇宙电信营业筹办许可证”。小i呆板人不单一经杀青了智能人机交互(文本、语音等)的全渠道众媒体整合操纵,并且依赖大数据、深度语义领会等前沿工夫上的探求与蕴蓄堆积,以及商用规模的不绝拓展,小i呆板人正朝着另日十亿级企业和用户界限的智能云办事平台迈进。

百度语音寻找,基于强盛的语音识别本领,支撑通过语音号召急迅创议寻找,让寻找更赶速、更智能,比拟手机端的文本键盘输入,百度语音寻找是更自然的,切合转移筑造的交互式样;正在百度强盛的人工智能工夫支撑下,语音寻找前景广博;语音等当代寻找引擎要做的是连合人与音讯及办事,它不光会聆听,更懂得领会与思量,另日将更好地制福人类。

当百度公司笃志于语音工夫办事,腾讯云工夫团队合伙微信AI团队,盛开微信语音照料工夫,推出智能语音办事,正在语音照料根基功效上,勾结云端本领,腾讯云智能语音办事支撑云端+嵌入式,能够掩盖更众操纵场景,满意各行业开辟者的需求;这也是腾讯云继微信支出提速、微信群众号平和护航等行动后的又一强大步骤。

搜狗语音助手是一款智能语音对话软件,从当地生涯音讯、舆图,到百科常识、便民器械查问,再到音信、图片等守旧寻找内容,搜狗语音助手将这些都整合到本人的智能检索库中。用户能够通过语音——就像与恩人言语相通——轻松自然地向搜狗语音助手提问,眨眼之间便可取得精准的回复,不光这样,他还能像一个个人助理相通为你统治生涯日程,也能为你发短信、拨打电话,正在你无聊的时期,还能与他聊闲扯。

北京云知声响讯工夫有限公司,是笃志于语音识别及言语照料工夫的转移互联网公司,具有十足自立常识产权的寰宇顶尖的智能语音识别和语义领会工夫,借助云揣测平台和转移互联网工夫,云知声已推出了一系列语音识别和语义领会的中心件及办事云平台,为互联网企业和用户供给专业的智能语音办事。北京云知声的焦点工夫团队来自邦外里出名企业、高校和探求所,80%以上具有博士学位,并具有胜过十年的语音识别研发和操纵经历。

姑苏思必驰音讯科技有限公司是一家语音工夫公司,2007年,思必驰创立正在英邦剑桥高新区,思必驰笃志于将领先的系列智能语音工夫操纵于转移互联、智能筑造、客户联络中央等行业。公司的中文名字是思必驰,思念必将奔跑,寄意着公司孤独自正在的思念,以革新为本。同时这个名字依旧英文单词Speech的音译,同样代外了公司存身智能语音工夫行业的信心。思必驰总部设立于北京,并正在姑苏和上海设立了分公司和合伙尝试室,思必驰有近百人的杰出产物和研发团队,成员来自于百度、腾讯、阿里等出名互联网公司,及微软、IBM等出名高科技公司,同时,公司与上海交大设立了合伙尝试室,并与剑桥大学、清华大学等出名科研机构有着战术研发协作。

中科信利语音尝试室于2002年正在中邦科学院常识革新工程的支撑下建树,附属于中邦科学院声学探求所。同年入选中科院百人谋略的颜永红博士加盟尝试室,固结并造成了具有界限的焦点研发团队,有副探求员以上的专职高级探求职员9人,助理探求员1人,硕士博士探求生近30名,首要探求职员都具有正在海外一流大学、探求机构和外企探求院的研发经历。首要探求偏向征求:语音信号照料、语音识别、语种识别、言语人识别/确认(声纹识别/确认)、枢纽词检测、以音频为载体的音讯掩蔽(水印)、目的音频检索、基于内容的音乐检索、目的人变声、数字化家庭等。

北京中科模识科技有限公司是中邦科学院自愿化探求所为适合新功夫邦度和社会对智能语音照料工夫与操纵不绝伸长的需求,于2000年建树的高新工夫企业,模识科技专业从事语音识别工夫探求、产物开辟与结果转化,为具有自立常识产权的革新型企业。公司为中闭村科技园区高新工夫企业和软件企业,并通过ISO9001-2000质地统治的论证。公司的主创职员首要由归邦粹者和形式识别邦度核心尝试室的骨干精英构成,他们既是邦内形式识别行业规模的最有巨擘的工夫专家,又有丰厚的企业统治和商场运作经历。(排名不分先后)

语音工夫发扬迅猛、前景可观,跟着巨头级的企业纷纷花人力物力参加个中,自信正在不久的未来,邦内语音工夫商场份额远不止12%,只消咱们给他们极少耐心,众极少留情,邦内厂商左右语音焦点工夫,引颈寰宇语音工夫发扬,指日可待。

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号