臉書人工智能背後的人工：將用户私人數據標註外包給了印度人_風聞

观察者网用户_534414-2019-05-07 18:14

2019-05-07

來源：澎湃新聞

引領智能科技發展的Facebook（臉書），也有不智能的一面。為了更好地訓練自家的人工智能（AI）系統，Facebook將用户私人社交內容標註工作外包給了印度合同工。這樣的行為也引發了大眾對於Facebook數據安全的討論。

對於數據標註工，許多人或許並不陌生。像許多科技公司一樣，Facebook使用機器學習和AI系統在其平台上對內容進行排序。但為了做到這一點，需要對軟件進行訓練，以識別不同類型的內容。為了訓練這些算法，科技公司必須分析樣本數據，所有這些都需要由人類進行分類和標記。這些人是人工智能背後的人工，也被稱為智能時代背後的隱形者。

據路透社報道，Facebook將部分的數據標註工作外包給了印度公司WiPro。該公司僱用了260多名工人，以五個類別對用户發佈的私人帖子進行標註。例如，帖子的內容（是自拍或食物圖片）、場合（是生日還是婚禮）、作者的意圖（他們是開個玩笑，試圖激勵他人，還是組織一個聚會）。為了保證數據標註的準確性，每條內容由WiPro的兩名工人檢查準確性，每個工人每天註釋大約700條內容。

Facebook確認了WiPro的工作，並表示WiPro工人正在檢查和標註的內容包括選定數量的用户私人共享內容，其中部分數據包含用户姓名和其他敏感信息。同時，Facebook表示，公司在全球範圍裏有200個類似的項目，總共僱傭了數千人。儘管Facebook表示，外包出去的數據標註工作得到了公司法律和隱私團隊的批准，但鑑於Facebook之前在數據安全上的表現，許多用户仍表示擔憂。

在人工智能時代，對於機器學習和深度學習等算法來説，數據量越大、質量越好，算法模型就表現越好。可以説，數據決定着整個人工智能行業的發展態勢。Facebook人工智能產品管理總監Nipun Mathur認為，這類工作是人工智能的核心。

但標註工作本身是一個勞動密集型工種，收入也不高，聽上去有點像呼叫中心的工作。因此，大部分的公司將這類工作外包給了人工較為便宜的國家。在中國，也有大量的“數據標註者”每天對着電腦，標記供自動駕駛汽車學習的圖像，以便訓練他們識別自行車和行人。

為了更好的智能化，數據標註工作是必要的，但當標記的數據涉及到用户個人隱私時，問題就來了。比如前段時間鬧得沸沸揚揚的某購物App竊聽事件，許多用户懷疑該應用程序監控或是竊聽了自己的社交內容，從而生成推薦商品推送給了自己。

當你和你的朋友交談聊天時，你不認為有其他人會聽到你們的談話，但現在這變成了可能。尤其是當大公司將你的數據外包給那些採用更低安全標準和隱私的公司時，問題變得令人更加不安。