識別準、語種多、支持離線工作 這款語音輸入法“最懂AI”
作者:战钊
既“解放雙手”還能“提升效率”,提起手機輸入法裏大眾最熟悉的AI功能,語音輸入絕對排得上前幾名。而足夠“優秀”的語音輸入功能不僅要識別準,語種多、支持離線工作,還要深挖用户的操作細節,不斷打造更多高效智能的創新功能。在手機輸入法行業,“最懂AI”的百度輸入法正是其中的佼佼者。
優秀的語音輸入,首要任務就是識別準確,在這方面百度輸入法相當有發言權。百度語音技術早在2019年年初便取得了一項對全球學術界和工業界都具備重大意義的突破——流式截斷的多層注意力建模(SMLTA),將在線語音識別精度提升了15%,超越行業最優競品15%,充分保證了用户語音輸入的精準度與識別速度。
其次,優秀的語音輸入還要照顧到不同用户羣體的需求。例如百度輸入法早早洞察到了各地用户的方言輸入需求,以及年輕用户的中英文混合表達方式,在業內最先推出了高精度的“中英自由説”和“方言自由説”功能。無論是“川妹子”、“東北老鐵”還是經常中英文夾雜的外企工作者,打開百度輸入法點擊麥克風,都能用自己最熟悉的表達方式輕鬆輸入、準確識別,極大提升了溝通效率。

當然,只保證聯網狀態下的輸入體驗還不夠,優秀的語音輸入還要“克服”各種環境難題。百度輸入法搭載的SMLTA技術也應用於離線語音識別,將離線語音識別精準度提升至在線語音的水平,保證了用户在電梯、地鐵、隧道等弱網或沒網環境下,依然能夠順暢地使用語音輸入。
不久前,百度輸入法還業內首發了“離線中英自由説”功能,可識別離線狀態下的英文整句、中文整句和中英文夾雜的混合輸入。有AI實力“撐腰”,百度輸入法不僅讓用户能用最熟悉的語言自在表達,還可以突破外部環境限制隨時隨地實現真正的“自由説”。

在滿足日常交流的基礎上,百度輸入法也十分注重挖掘AI技術的創新應用,將AI功能玩出了更多花樣。據艾媒諮詢發佈的《2020中國第三方手機輸入法市場疫期專題報告》(以下簡稱為《報告》)顯示,百度輸入法在AI功能豐富性、創新性上位居業內榜首,語音速記、個性化語音、語音鬥圖等功能深受用户青睞。

以備受白領羣體喜愛的語音速記為例,百度輸入法針對會議、採訪場景下的速記需求推出語音速記功能,該功能既支持單人模式的片段記錄、筆記整理和日常記事,也支持多人模式的會議記錄、採訪等。其中,多人模式通過強大的AI智能聲紋識別技術,可以區分2-3個不同人聲並分別記錄,並擁有業內獨家的長文本語音速記功能,幫助用户實現高效的語音記錄和信息輸出,提升工作效率。
個性化語音功能則注重人性化體驗,在經過用户授權後,百度輸入法可對通訊錄人名精準識別,避免用户用語音輸入聊天時打錯對方人名的尷尬。同時,百度輸入法還可智能學習用户的語音修改習慣,例如用户語音説出“chen xi”後被識別為“陳希”,若用户將“希”字改為“熙”字,百度輸入法會記住這一修改,今後當用户再次語音説出“chen xi”時,輸入法就將準確識別為“陳熙”,不斷完善輸入體驗。
為滿足年輕用户的鬥圖需求,百度輸入法還推出了腦洞十足的語音鬥圖功能。用户聊天時在語音輸入界面點擊“鬥”字圖標即可開啓,將你説的每句話都轉換為對應的表情包,備足“鬥圖彈藥”。

據艾媒諮詢此前發佈的《報告》顯示,在國內三大輸入法語音輸入滿意度評比中,百度輸入法以8.41的評分位列第一。百度輸入法的語音輸入功能在實用性、創新性和豐富性上,均離不開背後強大的AI技術支持。百度輸入法致力於為用户的生活和工作帶來更多便捷的體驗,提升輸入法的交互效率。而事實證明,每一次技術上的突破,也都能為用户帶來新的驚喜。(一鳴)