扎克伯格的人工智能計劃依賴於你的Facebook和Instagram數據 - 彭博社
Parmy Olson
馬克·扎克伯格上週在參議院司法委員會聽證會上宣誓,題為“大型科技公司和在線兒童性剝削危機”。
攝影師:湯姆·威廉姆斯/CQ-Roll Call, Inc.
然後就剩下了六位偉大的人?
攝影師:內森·萊恩/彭博社
對許多人來説,Facebook 就是 互聯網,其用户數量仍在增長,根據Meta Platforms Inc.的最新財務結果。但馬克·扎克伯格並不只是為持續增長而慶祝。他希望利用Facebook和Instagram的數據來創建強大的通用人工智能。聽起來很棒,而Meta已經做好了準備,但他數十億的用户最終可能會以犧牲隱私等代價。
以下是扎克伯格在週四透露的他在人工智能領域的下一步計劃:
“我們計劃書的下一個關鍵部分是從我們產品中獨特的數據和反饋循環中學習…… 在Facebook和Instagram上,有數千億的公開共享圖像和數百億的公開視頻,我們估計這比Common Crawl數據集還要大,人們在我們的服務中分享了大量的公開文本帖子和評論。”
扎克在這裏提到的“Common Crawl”之處 使科技界觀察者感到震驚,因為該存檔已經非常龐大: 2500億個網頁 跨越17年。它是當今用於訓練人工智能系統的最大和最受歡迎的公共互聯網存儲庫之一。當OpenAI於2020年推出其GPT-3語言模型時,接近60%的文本來自Common Crawl。
但是Meta的數據量甚至更大,這意味着理論上它可以構建“更智能”的人工智能。這是因為研究表明,用更多的數據訓練人工智能模型往往會使它們更有能力和更準確。這個公式對OpenAI來説效果非常好,多年來它增加了用於創建ChatGPT等模型的數據量。
如果扎克伯格想要製作一個更強大的聊天機器人,他所擁有的數據堆對他來説尤其有價值,因為其中很多數據來自評論串。任何代表人類對話的文本對於訓練所謂的對話代理非常重要,這就是為什麼OpenAI 大量挖掘互聯網論壇Reddit Inc.來構建自己的熱門聊天機器人。
每當扎克伯格談論新的抱負時,人們很容易嘲笑--無論是機器人、加密貨幣還是元宇宙。他最新的不切實際的願景尤其宏大:構建“通用智能”,或者説能夠達到或超越人類智能的軟件系統。但是有了那麼多數據,扎克伯格的追求看起來是可行的。問題在於對我們其他人可能會產生什麼後果。
奇怪的是,在同一條消息中,扎克伯格説他的人工智能團隊已經致力於構建通用智能“超過十年”,他還説Facebook現在才會利用用户的數據來構建模型作為“我們接下來策略的關鍵部分”。Meta為什麼還沒有這樣做呢?也許是因為使用所有這些數據並不那麼簡單。首先,這將代表對Facebook的30億用户和Instagram的15億用户隱私的又一侵犯。就像OpenAI因為蒐集藝術家和作家的受版權保護的數據來訓練其模型而受到指責一樣,Facebook也將因再次利用人們的數據而面臨聲譽上的打擊。這不僅引發了棘手的倫理問題,而且可能需要嚴格的數據處理做法和遵守全球數據保護法律,這可能會激怒歐洲監管機構。
另一個問題是數據中存在的偏見和毒性。根據蒙特利爾大學的一項2021年研究,OpenAI不得不處理Common Crawl中包含諸如adultmovietop100.com和adelaide-femaleescorts.webcam等網頁的問題。同一研究稱,Common Crawl中有4%至6%的網站包含種族歧視言論、仇恨言論或種族上帶有陰謀論。
雖然Facebook的內容審查軟件在阻止仇恨言論和陰謀論方面已經變得更加完善,但仍然存在不足之處,並且在美國以外的國家往往更糟。Facebook上一些被標記為有毒的內容不再接受人工審核,而是被留在網站上。更糟糕的是:當扎克伯格表示Meta的數據比Common Crawl的數據更龐大時,他很可能將公司的歷史存檔一起計算在內,其中可能包括扎克伯格在清理網站之前存在的所有誇張的政治內容和假新聞。
所有必須進行謹慎數據處理和檢查的工作可能解釋了為什麼扎克伯格現在才談論利用他所掌握的數據寶庫。如果他不做好這件事,他就有可能再次面臨公眾對Facebook處理假新聞和有害內容的批評噩夢。
不過,如果有一件事我們對扎克伯格很瞭解,那就是他像凱撒一樣痴迷於勝利和統治。上週,在他面對華盛頓特區的家長約24小時後,這些家長指責他導致他們的孩子自殘甚至自殺,他就宣佈Meta有史以來最成功的財季,並暗示他將如何利用人們的數據來創建強大的人工智能。
這些事件的接近應該提醒我們:Facebook通往財富的道路傷害了許多人。它建立強大人工智能的道路也可能如此。
更多來自彭博觀點:
- 一家復興的Meta購買繼續支出的許可:戴夫·李
- 埃隆,請不要讓互聯網進入我們的大腦:帕米·奧爾森
- 山姆·奧爾特曼的Open AI領導力過於人性化:蒂姆·奧布萊恩
想要更多彭博觀點?OPIN <GO>。或者您可以訂閲我們的每日新聞簡報。
要直接將約翰·奧瑟斯的新聞簡報發送到您的收件箱,請在此處註冊。
用一個恰當的類比來説,大科技股票就像埃隆·馬斯克的火箭。它們似乎超出了地球的引力範圍,現在正在測試物理定律(特斯拉公司除外,它突然受到了重力的影響)。用借鑑科幻小説的語言來説,一些成熟的市場關係正在發生變化。週五,債券收益率因就業報告強勁(稍後詳述)而大幅上漲。它們對股市產生了什麼影響?科技股有一個很好的一天。請記住,流行的論點是,較高的長期收益率對“長期持有”公司特別有害,比如大型科技集團。它們大部分價值在於未來收益,必須以更高的利率貼現。因此,隨着收益率上升,2022年大科技股表現不佳,而隨着其得到控制,2023年表現良好。到目前為止,今年收益率上升了,這些股票也上漲了。這張巧妙的圖表來自美國銀行證券的邁克爾·哈特內特: