歡迎來體驗(yàn)
什么是最懂你的中文語音識別算法
華少的快,矮大緊的京范兒口音,神仙打架的《奇葩說》,這些復(fù)雜場景的語音識別有多難?今天依圖帶你領(lǐng)略新鮮出爐的語音識別算法實(shí)力。
今天開始,依(zei)圖(hao)語音開放平臺上線了!
業(yè)內(nèi)首次
系統(tǒng)測試主流語音識別廠商的技術(shù)性能
(測試完成于2018年11月底)
在全球最大中文普通話數(shù)據(jù)庫AISHELL-2的三個(gè)測試子集、Accent近場口音測試集、Chat近場安靜聊天測試集上,依圖語音識別算法最近測得多項(xiàng)第一。AISHELL-2數(shù)據(jù)規(guī)模達(dá)1000小時(shí),是目前全球最大的中文開源數(shù)據(jù)庫。在AISHELL2-2018A-EVAL數(shù)據(jù)集中,依圖語音識別準(zhǔn)確率達(dá)到96.29%,字錯(cuò)率(CER)為3.71%,領(lǐng)先第二名約17%。
無論是語音助手還是節(jié)目,電話客服或是閑聊,依圖更懂你。
依圖語音識別性能優(yōu)于第二名約17%
語音未來任重道遠(yuǎn)
通過手機(jī)近距離收集聲音,依圖優(yōu)于第二名約17%,字字再現(xiàn)強(qiáng)時(shí)效內(nèi)容
語速超快又有地方口音?依圖和訊飛挺下來了
考驗(yàn)系統(tǒng)是不是夠“皮實(shí)”、夠“穩(wěn)健”的時(shí)候到了!在遠(yuǎn)距離場景,環(huán)境中會存在噪聲、混響和反射,依圖和訊飛聽見優(yōu)勢明顯
從技術(shù)性能來說,字錯(cuò)率曲線抖動越小,算法的場景通用性越好。綜合各場景測試的結(jié)果,業(yè)界主流算法中,依圖和訊飛的算法字錯(cuò)率抖動相對較小。
但是同樣說明了語音識別的發(fā)展既有驚喜也有遺憾。各大廠商的近場場景識別能力讓我們感受到了科技的力量,而加入遠(yuǎn)場演講的高難度場景的識別能力不足,也表明了未來的路還很遠(yuǎn)。
花式挑戰(zhàn)算法性能
依圖表現(xiàn)穩(wěn)定
聽寫大會小程序一經(jīng)發(fā)布,各種評(tiao)測(xi)洶涌而來。依圖語音憑借自身優(yōu)秀的技術(shù),展現(xiàn)了極其穩(wěn)定的語音識別能力。
再熱血的足球解說我們hold住
繞口令?依圖能聽清!
語音識別歌詞,依圖可帶勁啦!
呂昊博士現(xiàn)場演示的這款“聽寫大會”小程序也是業(yè)界第一次基于公開 API 將市場上的主流語音識別技術(shù)性能做比較——?dú)g迎大家去花式調(diào)戲!
此次測試的安靜對話和混響的數(shù)據(jù)集,依圖也將在線公布,敬請期待!
您可以復(fù)制這個(gè)鏈接分享給其他人:http://www.bkfarmrocks.com/node/539