Google 説:我們已表現得更具人文關懷_風聞
锌刻度-锌刻度官方账号-努力做一个新锐的科技产业原创调查者2019-05-08 19:54
Google I / O大會CEO Sundar Pichai
文|鋅刻度 羅永豪
語音界面在智能手機流行的當下比以往任何時候都更常見,但或許很多人在享受語音界面帶來便利的同時,並沒有想到,在同一片蒼穹下,語音界面並無法得到平等的訪問。也就説很多人是沒有機會或資格享受語音界面帶來的方便的**。**例如,如果您因漸凍症(ALS)或多發性硬化症等神經系統損害導致言語障礙,那麼Google智能助理或亞馬遜的Alexa將禁止您使用。在今天的科技環境中,這將意味着錯過了很多。
對大多數億計的語言障礙的人來説,人工智能驅動的語音識別技術根本不適用於他們。在今年的Google I / O上,Google推出了Project Euphonia,探討人工智能如何更好地幫助那些有語言障礙以及發出不同類型語音的人。
******1/******Project Euphonia:使語言障礙者輕鬆運用語音
語言障礙者嘗試Google AI
“我們也希望幫助那些患有言語障礙或言語受中風或肌萎縮側索硬化影響的人。” 谷歌CEO Sundar Pichai 在I / O大會上宣稱,“Euphonia項目團隊利用AI技術提高電腦理解言語障礙患者話語的能力並且Google AR的研究人員正在探索個性化通信模式的概念,這種模式可以更好地理解不同類型的語音,以及AI如何幫助那些語言障礙的人。”
Euphonia最大的焦點將是從言語障礙者那裏收集更多的語音數據。這旨在解決在有限的訓練數據產生AI識別偏差的問題。因為像Google智能助理這樣的語音軟件是為響應大多數聲音而構建的,所以它並不適用於語言障礙者。目前,谷歌正在與ALS治療發展研究所和ALS Residence Initiative等非營利組織合作,錄製患有神經退行性疾病ALS人的聲音。
“未來這些語音識別模型都將在Google智能助理得到提供,為語言障礙者提供解決方案**。**”Pichai介紹。
此外,為了提高語音識別能力,Google還正在訓練個性化AI智能算法來檢測聲音和手勢,然後執行向Google Home生成語音指令或發送文本信息等。這項研究對嚴重殘疾和語言障礙者人可能也有幫助。
******2/******Live Relay :讓手機代表使用者傾聽和説話
在實際的生活場景應用中,目前的AI技術仍無法滿足所有人的需求,在聽力障礙者面前,AI的便利性並沒有得到更好的體現。世界衞生組織統計4.66億人,患有殘疾性聽力損失(4.32億成人和3400萬兒童),超過人類總人口的5%。據估計,到2050年將有9億多人(或者説十分之一的人)出現殘疾性聽力損失。
我們都知道失聰或有聽力障礙的人經常通過手語或手寫進行交流。但如果和他交流的對象不在他的對面,比如當他們需要與談話的人發短信或通訊工具通話就需要另一個人的輔助才能完成。這樣的便利性與獨立性都無法得到滿足。
在本次I / O大會上,Google推出了一款名為Live Relay的原型應用程序,該應用程序使用設備上的語音識別和文本到語音轉換來幫助任何聽不見或説話的人進行電話交談。
Google CEO Sundar Pichai在舞台上表示,“為身體不便人士提供新產品的基礎人工智能研究是推動我們推進使命的重要途徑。”
Live Relay使用設備上的語音識別和文本到語音轉換,讓手機代表使用者傾聽和説話。該研究項目能完成任何人地可以打電話給聾啞人或有聽力障礙的人。該工具能實時將語音轉換為文本,並將語音信息作為語音發回,如此一來,説話的人可以簡單地通過電話交談,聾啞人和聽力障礙者可以通過電話發短信。
“Live Relay利用了Google的智能撰寫和智能回覆功能,預測性寫作建議和即時響應有助於打字的人跟上語音通話的速度。”谷歌工程師Lorenzo Caggioni解釋,重要的是,Live Relay完全在用户的設備上運行,這意味着用户的私人通話不會發送給Google,該工具不需要數據連接,只依賴於音頻,Live Relay可以與來自任何手機的任何來電語音通話一起使用。
“在幫助聽力障礙者領域,蘋果有iPhone助聽器和聲音處理器,專門為iPhone和iPad設計助聽器和聲音處理器。”相關人士稱,谷歌在這方面的研究更加有成果。
實際上在今年2月份,谷歌就推出 Android手機的兩項新功能:Live Transcribe和Sound Amplifier,它們設計目標都是幫助或聽力障礙的人。
在Live Transcribe更早之前,Google (ASR)自動語音識別技術 為 Youtube 的自動字幕生成、幻燈片演示以及電話通話提供了支持。儘管ASR在過去幾年中進行了多項改進,耳聾和聽障人士仍主要依賴於人工轉錄服務,比如美國的CART,英國的Palantypist或其他國家的STTR,最重要的一點是這些服務的費用十分昂貴。
而Live Transcribe是一款可以近乎實時地自動轉錄語音的應用程序,允許用户在他們可能無法説話的情況下進行通信,這對有聽力障礙的人有幫助。例如,如果在公共場所,只需在手機裏輸入內容,書寫的內容就會變成另一端的語音。更重要的是,這是一項免費的Android服務,由Google雲提供技術支持,支持超過70種語言,能覆蓋全球80%以上的人口。
“這些項目最終將產生更好地為我們所有人服務的產品。通過為每個人構建更有用的Google。”Google CEO Sundar Pichai表示,雖然Live Relay仍處於研究階段,但我們期待有一天它能夠為我們的用户提供更多和更好的溝通方式,特別是對於那些現有選項沒有很好地服務到的人羣。