Hey 語音助手，你在監聽我嗎？_風聞

云猜预测家-“超级预测者”的资讯站和训练营。2019-08-26 17:05

2019-08-26

**劃重點：**亞馬遜、谷歌、蘋果和微軟先後被曝出錄音監聽醜聞，看起來，錄音監聽似乎已是科技巨頭的標配。

**隨着AI語音技術及相關產品的發展，智能音箱、語音助手服務等已經成為主流的應用。**這些產品在我們的生活中扮演着越來越重要的角色，與此同時，個人信息被泄露的風險也相應增大。

本期導覽：

Hey Siri，你在竊聽我嗎？

Alexa，你在竊聽我嗎？

Okay Google，你在竊聽我嗎？

Cortana，你在監聽我嗎？

****監聽背後：人工智能與隱私保護

Hey Siri，你在竊聽我嗎？

**事件：**2019年8月初，蘋果外包公司員工向英國《衞報》爆料稱，Siri會對人們的隱私活動進行錄音，並將音頻發送給評估師進行評估。錄音中的談話內容和其他聲音清晰可聽，附帶有用户數據，包括錄音發生的位置、聯繫方式和APP應用數據，甚至有可能會帶有名字。此外，爆料人還提到，這些敏感信息並沒有具體的程序來處理，或者説沒有具體的流程來保護這些極為敏感的個人信息。工作人員如何收聽這些錄音、使用這些信息，也沒有具體的限制。無論是向外分發還是自己存檔，蘋果都沒有很明確告知用户。

**回應：**對於上述指控，蘋果在第一時間回應到，用户被錄音的比例僅佔Siri的1%，並且每段錄音僅持續了幾秒；回傳的錄音與用户的蘋果ID沒有關聯，錄音會在安全的環境下分析；所有審核人員都有義務遵守嚴格的保密要求。蘋果還表示，錄音發給國際承包商進行人工分析的目的是改善Siri的服務質量。蘋果試圖以“數據脱敏”和“改善服務”的理由換得外界諒解。

Alexa，你在竊聽我嗎？

**事件：**今年4月，據彭博社報道，多名知情人士透露，亞馬遜在全球僱傭有數千名員工，以幫助改進為其Echo智能音箱提供支持的數字助手Alexa。曝光資料顯示，發送給Alexa審計員的錄音與賬號、用户名和設備序列號相關。知情人士説，這個團隊由承包商和全職亞馬遜員工組成，他們在波士頓、哥斯達黎加、印度和羅馬尼亞等地工作。這些研究人員被曝可在Echo主人家裏和辦公室裏監聽他們的對話，並進行錄音。

**回應：**亞馬遜表示，此舉是為了消除Alexa對人類語言理解的空白，幫助它更好地響應命令。發言人在電子郵件聲明中表示:“我們認真對待客户個人信息的安全和隱私，為了改善客户體驗，我們只標註了一小部分Alexa語音錄音樣本，它們可以幫助我們訓練語音識別和自然語言理解系統，因此Alexa可以更好地理解用户的請求，並確保服務對每個人都有效。我們有嚴格的技術和操作保障措施，對濫用我們的系統採取零容忍政策。員工不能直接訪問帶有標識的信息，所有信息都被高度保密。”

Okay Google，你在竊聽我嗎？

**事件：**谷歌緊隨亞馬遜之後。據TechCrunch報道，谷歌會將一小部分語音助手的錄音外包給承包商進行人工分析，以訓練人工智能的準確性。一名分析荷蘭語錄音的承包商員工，將1000份錄音爆料給了比利時公共廣播公司。據稱，在這些錄音中能夠聽到人們的地址、對醫療問題的討論以及女性遇險的聲音，而且能夠識別出錄音中的人。

**回應：**谷歌在7月11日的一篇博客文章中，承認其會僱傭人工來分析一小部分的錄音。谷歌還表示，其不會在分析過程中將錄音和用户賬户相關聯，僱傭的語言專家只會對錄音中約0.2%的內容進行人工分析，以便更好地理解不同的語言、口音和方言。“這是構建語音技術過程的關鍵部分，對於創新像谷歌語音助手這樣的產品是必要的一步。”

Cortana，你在監聽我嗎？

**事件：**微軟也沒落下。據美國新聞網站Vice報道，微軟外包商會監聽Skype用户和Cortana用户錄音。這些音頻內容包括情侶之間的親密交談、談論的減肥等私人問題。微軟向外包商提供一段音頻時，他們還會收到一系列由Skype翻譯系統生成的內容。隨後，外包商從中選擇最準確的翻譯內容，或提供自己的翻譯。但據Vice報道，儘管這些信息很敏感，但外包商當中卻有部分員工在家裏收聽、處理Skype和Cortana的音頻，而這並不是很安全的處理環境。

**回應：**微軟稱其僅通過安全的在線門户網站向外包商提供音頻數據，公司會採取相應措施刪除用户或設備識別號碼等個人識別信息。發言人則稱，“微軟收集語音數據是為了提供、改進語音服務，比如搜索、語音命令、聽寫或翻譯服務。我們努力在收集和使用語音數據方面做到透明，以確保客户明晰選擇何時以及如何使用他們的語音數據。在收集和使用客户的語音數據之前，微軟會得到客户的許可。”

截圖來自電影《銀翼殺手2049》(Blade Runner 2049)

此時此刻，我們在觸碰AI；而在科幻對未來的想象中，AI在觸碰人類

監聽背後：人工智能與隱私保護

需要指出的是，微軟的隱私政策並沒有説明其中一些分析將由人工完成，這便與此前谷歌、亞馬遜、蘋果的監聽醜聞十分類似，並且都涉及到語音助手。四家公司都宣稱此舉是為了提高語音助手的理解力。操作手法上，都聘用了外部承包商採用人工監聽的方式，並稱只用了少數語音片段。看起來，錄音監聽似乎已是科技巨頭的標配。

亞馬遜曾在廣告詞中介紹，“Alexa生活在雲端，而且會變得越來越聰明”。實際上，這樣“變聰明”的監督學習需要所謂 “人類智慧” 來訓練算法，而大多數現代語音識別系統依賴於模仿人腦的神經網絡，軟件會通過海量數據進行機器學習，為智能音箱的算法提供可能性的模型。AI的深度學習是建立在大數據之上的。在使用深度學習AI的過程中，往往伴隨着海量隱私數據泄露的風險。而前不久，便有多家國內APP被指監聽用户手機，利用麥克風權限獲取用户隱私，今日頭條和百度等巨頭，也紛紛“涉案”。

而回看谷歌過去數年的隱私變遷歷史，20 世紀 90 年代末的谷歌，彼時這家新興企業所擁有的僅僅是搜索引擎。谷歌公司發佈的第一份隱私政策，寥寥 600 餘字就解釋了其如何收集並使用用户的個人信息。然而，無論是互聯網還是谷歌自身，都不可避免地迎來了新的發展階段。在過去二十年當中，谷歌的隱私政策開始不斷膨脹，如今，它需要使用 4000 字才能明確表述現有數據實踐。

對於AI技術的反思很多，而隱私保護是其中非常重要的一環。按照如今的AI發展速度，這個問題已經迫在眼前。人類不能簡單地認為，智能系統可以照進生活的每一個角落，在這一圖景與人類之間，仍隔着一層迷霧，迷霧裏不僅有技術，也有倫理風險。如何在發展技術的同時建立起全新的法律法規、倫理框架，從而將收益提至最高、將風險降至最低，這是一個亟待解決的問題。

谷歌CEO桑達爾·皮扎伊(Sundar Pichai)曾公開表示，“隱私不應該成為一種奢侈品，不能只提供給有能力購買高端產品和服務的人。”沒有人願意生活在一個毫無隱私、處處被監視的世界，但隨着AI語音技術的發展，你説過的每句話都可能正在被竊聽，個人隱私面臨着巨大的挑戰，這一對於隱私泄露的擔憂便成為了非常現實的存在。也許確實到了臨門一腳的時刻，一如丘吉爾所説：“這不是結束的時刻，不是開端時刻的結束。或許，這只是結束時刻的開端。”

來雲猜，和大家一起聊聊吧

雲猜，珍視每一個觀點。