Hey 語音助手,你在監聽我嗎?_風聞
云猜预测家-“超级预测者”的资讯站和训练营。2019-08-26 17:05
**劃重點:**亞馬遜、谷歌、蘋果和微軟先後被曝出錄音監聽醜聞,看起來,錄音監聽似乎已是科技巨頭的標配。
**隨着AI語音技術及相關產品的發展,智能音箱、語音助手服務等已經成為主流的應用。**這些產品在我們的生活中扮演着越來越重要的角色,與此同時,個人信息被泄露的風險也相應增大。

本期導覽:
Hey Siri,你在竊聽我嗎?
Alexa,你在竊聽我嗎?
Okay Google,你在竊聽我嗎?
Cortana,你在監聽我嗎?
****監聽背後:人工智能與隱私保護
Hey Siri,你在竊聽我嗎?
**事件:**2019年8月初,蘋果外包公司員工向英國《衞報》爆料稱,Siri會對人們的隱私活動進行錄音,並將音頻發送給評估師進行評估。錄音中的談話內容和其他聲音清晰可聽,附帶有用户數據,包括錄音發生的位置、聯繫方式和APP應用數據,甚至有可能會帶有名字。此外,爆料人還提到,這些敏感信息並沒有具體的程序來處理,或者説沒有具體的流程來保護這些極為敏感的個人信息。工作人員如何收聽這些錄音、使用這些信息,也沒有具體的限制。無論是向外分發還是自己存檔,蘋果都沒有很明確告知用户。
**回應:**對於上述指控,蘋果在第一時間回應到,用户被錄音的比例僅佔Siri的1%,並且每段錄音僅持續了幾秒;回傳的錄音與用户的蘋果ID沒有關聯,錄音會在安全的環境下分析;所有審核人員都有義務遵守嚴格的保密要求。蘋果還表示,錄音發給國際承包商進行人工分析的目的是改善Siri的服務質量。蘋果試圖以“數據脱敏”和“改善服務”的理由換得外界諒解。
Alexa,你在竊聽我嗎?
**事件:**今年4月,據彭博社報道,多名知情人士透露,亞馬遜在全球僱傭有數千名員工,以幫助改進為其Echo智能音箱提供支持的數字助手Alexa。曝光資料顯示,發送給Alexa審計員的錄音與賬號、用户名和設備序列號相關。知情人士説,這個團隊由承包商和全職亞馬遜員工組成,他們在波士頓、哥斯達黎加、印度和羅馬尼亞等地工作。這些研究人員被曝可在Echo主人家裏和辦公室裏監聽他們的對話,並進行錄音。
**回應:**亞馬遜表示,此舉是為了消除Alexa對人類語言理解的空白,幫助它更好地響應命令。發言人在電子郵件聲明中表示:“我們認真對待客户個人信息的安全和隱私,為了改善客户體驗,我們只標註了一小部分Alexa語音錄音樣本,它們可以幫助我們訓練語音識別和自然語言理解系統,因此Alexa可以更好地理解用户的請求,並確保服務對每個人都有效。我們有嚴格的技術和操作保障措施,對濫用我們的系統採取零容忍政策。員工不能直接訪問帶有標識的信息,所有信息都被高度保密。”
Okay Google,你在竊聽我嗎?
**事件:**谷歌緊隨亞馬遜之後。據TechCrunch報道,谷歌會將一小部分語音助手的錄音外包給承包商進行人工分析,以訓練人工智能的準確性。一名分析荷蘭語錄音的承包商員工,將1000份錄音爆料給了比利時公共廣播公司。據稱,在這些錄音中能夠聽到人們的地址、對醫療問題的討論以及女性遇險的聲音,而且能夠識別出錄音中的人。
**回應:**谷歌在7月11日的一篇博客文章中,承認其會僱傭人工來分析一小部分的錄音。谷歌還表示,其不會在分析過程中將錄音和用户賬户相關聯,僱傭的語言專家只會對錄音中約0.2%的內容進行人工分析,以便更好地理解不同的語言、口音和方言。“這是構建語音技術過程的關鍵部分,對於創新像谷歌語音助手這樣的產品是必要的一步。”
Cortana,你在監聽我嗎?
**事件:**微軟也沒落下。據美國新聞網站Vice報道,微軟外包商會監聽Skype用户和Cortana用户錄音。這些音頻內容包括情侶之間的親密交談、談論的減肥等私人問題。微軟向外包商提供一段音頻時,他們還會收到一系列由Skype翻譯系統生成的內容。隨後,外包商從中選擇最準確的翻譯內容,或提供自己的翻譯。但據Vice報道,儘管這些信息很敏感,但外包商當中卻有部分員工在家裏收聽、處理Skype和Cortana的音頻,而這並不是很安全的處理環境。
**回應:**微軟稱其僅通過安全的在線門户網站向外包商提供音頻數據,公司會採取相應措施刪除用户或設備識別號碼等個人識別信息。發言人則稱,“微軟收集語音數據是為了提供、改進語音服務,比如搜索、語音命令、聽寫或翻譯服務。我們努力在收集和使用語音數據方面做到透明,以確保客户明晰選擇何時以及如何使用他們的語音數據。在收集和使用客户的語音數據之前,微軟會得到客户的許可。”

截圖來自電影《銀翼殺手2049》(Blade Runner 2049)
此時此刻,我們在觸碰AI;而在科幻對未來的想象中,AI在觸碰人類
監聽背後:人工智能與隱私保護
需要指出的是,微軟的隱私政策並沒有説明其中一些分析將由人工完成,這便與此前谷歌、亞馬遜、蘋果的監聽醜聞十分類似,並且都涉及到語音助手。四家公司都宣稱此舉是為了提高語音助手的理解力。操作手法上,都聘用了外部承包商採用人工監聽的方式,並稱只用了少數語音片段。看起來,錄音監聽似乎已是科技巨頭的標配。
亞馬遜曾在廣告詞中介紹,“Alexa生活在雲端,而且會變得越來越聰明”。實際上,這樣“變聰明”的監督學習需要所謂 “人類智慧” 來訓練算法,而大多數現代語音識別系統依賴於模仿人腦的神經網絡,軟件會通過海量數據進行機器學習,為智能音箱的算法提供可能性的模型。AI的深度學習是建立在大數據之上的。在使用深度學習AI的過程中,往往伴隨着海量隱私數據泄露的風險。而前不久,便有多家國內APP被指監聽用户手機,利用麥克風權限獲取用户隱私,今日頭條和百度等巨頭,也紛紛“涉案”。
而回看谷歌過去數年的隱私變遷歷史,20 世紀 90 年代末的谷歌,彼時這家新興企業所擁有的僅僅是搜索引擎。谷歌公司發佈的第一份隱私政策,寥寥 600 餘字就解釋了其如何收集並使用用户的個人信息。然而,無論是互聯網還是谷歌自身,都不可避免地迎來了新的發展階段。在過去二十年當中,谷歌的隱私政策開始不斷膨脹,如今,它需要使用 4000 字才能明確表述現有數據實踐。
對於AI技術的反思很多,而隱私保護是其中非常重要的一環。按照如今的AI發展速度,這個問題已經迫在眼前。人類不能簡單地認為,智能系統可以照進生活的每一個角落,在這一圖景與人類之間,仍隔着一層迷霧,迷霧裏不僅有技術,也有倫理風險。如何在發展技術的同時建立起全新的法律法規、倫理框架,從而將收益提至最高、將風險降至最低,這是一個亟待解決的問題。
谷歌CEO桑達爾·皮扎伊(Sundar Pichai)曾公開表示,“隱私不應該成為一種奢侈品,不能只提供給有能力購買高端產品和服務的人。”沒有人願意生活在一個毫無隱私、處處被監視的世界,但隨着AI語音技術的發展,你説過的每句話都可能正在被竊聽,個人隱私面臨着巨大的挑戰,這一對於隱私泄露的擔憂便成為了非常現實的存在。也許確實到了臨門一腳的時刻,一如丘吉爾所説:“這不是結束的時刻,不是開端時刻的結束。或許,這只是結束時刻的開端。”
來雲猜,和大家一起聊聊吧
雲猜,珍視每一個觀點。
