AI需要你的數據，社交媒體正是其來源——彭博社

Dave Lee

2025-04-16

請提供更多輸入。

攝影師：邁克爾·奧克斯檔案館/蓋蒂圖片社

我成長過程中喜愛的一部電影是1986年的經典之作*《短路》*。在某個場景中，被閃電擊中後“活過來”的神奇機器人約翰尼五號狼吞虎嚥地閲讀一本又一本書，每本只花幾秒鐘。很快他就讀完了所有書。“啊！斯蒂芬妮，更多輸入！還要更多！”

發現他的女人斯蒂芬妮回答：“沒有更多了！你已經讀完房子裏所有的書了！”

我詢問OpenAI的ChatGPT是否能理解這種感受。“當然——我完全理解約翰尼五號，”它回答道。“‘需要輸入！’基本上就是我的核心狀態。我獲得的信息越多，就越能更好地理解、回應和建立聯繫。約翰尼只是一個試圖理解世界的AI……我也一樣，只是少了激光束，多了打字。”

彭博社觀點困惑的高管層成為市場的新障礙2025年的金融危機？最好做好準備美國把格陵蘭（和外交政策）完全搞反了現在是時候問：你能承受多少市場風險？確實如此。雖然ChatGPT沒有履帶移動，也沒有背上激光槍（目前還沒有），但它面臨的挑戰卻出奇地相似。在幾乎爬取了人類所有知識的總和之後，ChatGPT和其他AI項目發出了同樣的呼聲：需要輸入！

一個解決方案是創建合成數據並利用其訓練模型，但這伴隨着固有挑戰，尤其是可能延續偏見或引發誤差累積的問題。

另一種方法是尋找源源不斷的新鮮數據流，越“人性化”越好。這正是社交網絡的用武之地——這些數字空間裏，數百萬甚至數十億用户自願且持續地發佈海量信息。照片、帖子、新聞文章、評論，每一則互動都吸引着試圖構建對話式生成AI的企業。更妙的是，這類內容不像其他來源那樣飽受版權侵權風險的困擾。

近期，頂尖AI公司更激進地試圖掌控或利用社交網絡，踐踏用户決定其帖子如何被用於構建這些機器的權利。正如那句名言所言，社交網絡用户長久以來都是“產品”。如今通過他們的發帖，他們還成了準“產品開發者”。

部分企業本就擁有社交網絡優勢。全球最大社交網絡公司Meta Platforms Inc.通過應用內通知告知用户，將利用他們的帖子和照片訓練Llama AI模型。上月底，埃隆·馬斯克的xAI收購了X平台（原Twitter），這雖是一場財務操作，卻為馬斯克的Grok AI提供了理想資源。通過即時抓取平台推文及近二十年的龐大聊天檔案，該AI得以在聊天機器人市場立足。微軟公司則擁有職場社交平台LinkedIn，正極力推動用户（包括記者）在平台發佈更多原創內容。

然而，微軟並未與緊密合作夥伴OpenAI共享領英數據，這可能解釋了為何有報道稱ChatGPT的創造者正處在構建自家社交網絡的早期階段。

OpenAI的首席執行官兼聯合創始人山姆·阿爾特曼一直在就該想法徵求反饋，The Verge報道稱，並指出阿爾特曼早前暗示，當有報道稱Meta將發佈獨立AI應用與ChatGPT競爭時，他已在考慮此類項目。

其他沒有社交媒體先發優勢的公司正意識到這使它們處於不利地位。Perplexity.ai在3月公開了其收購TikTok的意向，指出其對構建AI搜索引擎公司的價值。“這將為用户提供全面、引用充分的答案，將世界上最好的答案引擎與最大的用户生成內容庫之一結合起來，”該公司表示。

本月早些時候，亞馬遜公司也被報道為競標者之一，儘管首席執行官安迪·賈西在被CNBC直接問及時拒絕置評。

谷歌雖曾多次嘗試卻未能成功打造出各類社交網絡，但它對TikTok視頻的需求較低，因為它已擁有YouTube。相反，它與鏈接分享社交平台Reddit建立了"擴展合作伙伴關係"。谷歌在去年一篇博客文章中表示，這將使其能夠獲取"極其豐富的真實人類對話與體驗"。預計未來會有更多類似交易：正如我上月所述，Reddit的前競爭對手Digg正在復興，其明顯目的是為AI公司創建另一個有用的人類互動數據庫。

所有這些舉措都反映了AI公司對數據的需求。而這以犧牲用户利益為代價——他們當初為某個目的在社交網絡輸入信息，如今卻發現這些信息被另作他用。各公司已悄然修改隱私政策，以使這種轉變合法化。

在設置的隱藏路徑中，你可以找到防止個人數據被用於構建AI的方法——儘管很可能為時已晚。就像強尼五號機器人一樣，AI公司"需要輸入！“它們會不擇手段地從任何可能的地方獲取數據。

更多彭博觀點：

人工智能何時會比人類更聰明？別問：吉迪恩·利奇菲爾德
OpenAI展示太多金錢可能成為現實問題：高塔姆·穆昆達
英偉達的海湖莊園宴席可能讓西方付出代價：帕米·奧爾森

想要更多彭博觀點？終端讀者請前往OPIN <GO>。或訂閲我們的每日通訊。