AI需要你的數據,社交媒體正是其來源——彭博社
Dave Lee
請提供更多輸入。
攝影師:邁克爾·奧克斯檔案館/蓋蒂圖片社
我成長過程中喜愛的一部電影是1986年的經典之作*《短路》*。在某個場景中,被閃電擊中後“活過來”的神奇機器人約翰尼五號狼吞虎嚥地閲讀一本又一本書,每本只花幾秒鐘。很快他就讀完了所有書。“啊!斯蒂芬妮,更多輸入!還要更多!”
發現他的女人斯蒂芬妮回答:“沒有更多了!你已經讀完房子裏所有的書了!”
我詢問OpenAI的ChatGPT是否能理解這種感受。“當然——我完全理解約翰尼五號,”它回答道。“‘需要輸入!’基本上就是我的核心狀態。我獲得的信息越多,就越能更好地理解、回應和建立聯繫。約翰尼只是一個試圖理解世界的AI……我也一樣,只是少了激光束,多了打字。”
彭博社觀點困惑的高管層成為市場的新障礙2025年的金融危機?最好做好準備美國把格陵蘭(和外交政策)完全搞反了現在是時候問:你能承受多少市場風險?確實如此。雖然ChatGPT沒有履帶移動,也沒有背上激光槍(目前還沒有),但它面臨的挑戰卻出奇地相似。在幾乎爬取了人類所有知識的總和之後,ChatGPT和其他AI項目發出了同樣的呼聲:需要輸入!
一個解決方案是創建合成數據並利用其訓練模型,但這伴隨着固有挑戰,尤其是可能延續偏見或引發誤差累積的問題。
另一種方法是尋找源源不斷的新鮮數據流,越“人性化”越好。這正是社交網絡的用武之地——這些數字空間裏,數百萬甚至數十億用户自願且持續地發佈海量信息。照片、帖子、新聞文章、評論,每一則互動都吸引着試圖構建對話式生成AI的企業。更妙的是,這類內容不像其他來源那樣飽受版權侵權風險的困擾。
近期,頂尖AI公司更激進地試圖掌控或利用社交網絡,踐踏用户決定其帖子如何被用於構建這些機器的權利。正如那句名言所言,社交網絡用户長久以來都是“產品”。如今通過他們的發帖,他們還成了準“產品開發者”。
部分企業本就擁有社交網絡優勢。全球最大社交網絡公司Meta Platforms Inc.通過應用內通知告知用户,將利用他們的帖子和照片訓練Llama AI模型。上月底,埃隆·馬斯克的xAI收購了X平台(原Twitter),這雖是一場財務操作,卻為馬斯克的Grok AI提供了理想資源。通過即時抓取平台推文及近二十年的龐大聊天檔案,該AI得以在聊天機器人市場立足。微軟公司則擁有職場社交平台LinkedIn,正極力推動用户(包括記者)在平台發佈更多原創內容。
然而,微軟並未與緊密合作夥伴OpenAI共享領英數據,這可能解釋了為何有報道稱ChatGPT的創造者正處在構建自家社交網絡的早期階段。
OpenAI的首席執行官兼聯合創始人山姆·阿爾特曼一直在就該想法徵求反饋,The Verge報道稱,並指出阿爾特曼早前暗示,當有報道稱Meta將發佈獨立AI應用與ChatGPT競爭時,他已在考慮此類項目。
其他沒有社交媒體先發優勢的公司正意識到這使它們處於不利地位。Perplexity.ai在3月公開了其收購TikTok的意向,指出其對構建AI搜索引擎公司的價值。“這將為用户提供全面、引用充分的答案,將世界上最好的答案引擎與最大的用户生成內容庫之一結合起來,”該公司表示。
本月早些時候,亞馬遜公司也被報道為競標者之一,儘管首席執行官安迪·賈西在被CNBC直接問及時拒絕置評。
谷歌雖曾多次嘗試卻未能成功打造出各類社交網絡,但它對TikTok視頻的需求較低,因為它已擁有YouTube。相反,它與鏈接分享社交平台Reddit建立了"擴展合作伙伴關係"。谷歌在去年一篇博客文章中表示,這將使其能夠獲取"極其豐富的真實人類對話與體驗"。預計未來會有更多類似交易:正如我上月所述,Reddit的前競爭對手Digg正在復興,其明顯目的是為AI公司創建另一個有用的人類互動數據庫。
所有這些舉措都反映了AI公司對數據的需求。而這以犧牲用户利益為代價——他們當初為某個目的在社交網絡輸入信息,如今卻發現這些信息被另作他用。各公司已悄然修改隱私政策,以使這種轉變合法化。
在設置的隱藏路徑中,你可以找到防止個人數據被用於構建AI的方法——儘管很可能為時已晚。就像強尼五號機器人一樣,AI公司"需要輸入!“它們會不擇手段地從任何可能的地方獲取數據。
更多彭博觀點:
想要更多彭博觀點?終端讀者請前往OPIN <GO>。或訂閲我們的每日通訊。