科大訊飛要讓文字速錄員下崗

作者：赵阳

2015-12-21

（趙陽）相信在你能接觸到的智能控制功能中，最常見的無非就是語音和手勢了，而恰恰被廣大用户詬病最多的也是這兩個。但是，與近些年來進步並不是特別明顯的手勢控制相比，語音在智能硬件控制領域中已經先走了一步。

12月21日，科大訊飛發佈了以全新語音交互技術為基礎的人機交互界面AIUI。AIUI集成了包括雙全工技術、麥克風陣列技術、聲紋識別技術、方言識別、語義理解技術和內容服務等科大訊飛一些列科研成果和完善服務。並且，科大訊飛還在此次大會上定義了“萬物互聯”時代的人機語音交互標準，其基本能力應該包括三方面：遠場識別、全雙工、多輪交互。

在發佈會現場，科大訊飛展示了利用叮咚智能音箱直接利用語音購買車票的全過程，其中包括了主動提問、背景知識、被搶插話打斷、上下文理解、基於結果反問、長期記憶、長鬚聆聽等等各種實用語音技術，你完全可以像普通人與人對話一樣來對音箱發出各種語音指令，比我們通常所見的傳統語音控制在實用性方面有了較大的改善。

科大訊飛還在現場展示了大型會場中直接將演講者的語音同步轉換成文字播放在大屏幕中顯示的技術。科大訊飛對此非常有信心，甚至同時還邀請了國內五位專業速記人員與其語音技術進行比賽，獲勝者將獲得高達十萬元的獎金。從現場來看，除了在語速較快時，演講者的個別英文單詞在識別率上會出現少許偏差以外，所有中文語音轉換不論是速度還是準率都能夠達到令人滿意的效果。

除了我們已經熟知的訊飛輸入法、靈犀語音助手、叮咚智能音箱、智學網、E聽説一道等以外，科大訊飛在大會上還面向普通消費者發佈了錄音寶、錄音筆與訊飛聽見網三款產品。