沒有事實核查員的Facebook將對真相進行考驗 - 彭博社
bloomberg
插圖:Sebastian König 為彭博社創作
沒有事實核查員的Facebook將考驗真相(音頻)
11:05
在2021年8月4日,Instagram的事實核查員刪除了一條關於藥物伊維菌素的帖子。該帖子來自 考克倫圖書館,這是一個高度受尊敬的國際組織,負責整理和總結醫學研究。在徹底審查可用數據後,考克倫告訴他們的追隨者,他們沒有發現支持伊維菌素作為Covid-19治療方法的證據。
難道Instagram的事實核查員犯了錯誤?考克倫對此決定提出了上訴;幾乎一年後,他們終於收到了通知,稱該帖子“違反了社區準則”。與此同時,考克倫注意到用户無法在帖子中提及他們,這表明該賬户被“影子禁言”。
在疫情期間,社交媒體平台刪除的許多Covid-19帖子確實是虛假信息,從薄弱的陰謀論到與所有科學證據相悖的危險主張。然而,也有像考克倫帖子這樣的事件,真正正確和有用的信息被事實核查員刪除,可信的賬户受到懲罰。
近年來,社交媒體上的事實核查干預措施有所加強,受到Covid-19威脅的推動。但這種情況不會持續太久。馬克·扎克伯格最近 宣佈 Meta Platforms Inc. — Facebook、Instagram和WhatsApp的擁有者 — 將結束對第三方事實核查員的依賴,以標記虛假內容。相反,公司將讓用户為潛在誤導性帖子添加上下文,借鑑X平台上使用的社區筆記方法。在這些新規則下,考克倫的帖子將被保留,用户可以自由評估其可靠性。這一轉變引發了一個問題:這樣的措施能減少社交媒體上的虛假信息嗎?準確性能否通過眾包實現?
社區筆記
作為倫敦衞生與熱帶醫學學院的一名教授,我專注於傳染病疫情的研究,我花了很多時間在線上研究和反駁錯誤信息。因此,當社區筆記在2022年底在X平台廣泛推出時,我對此充滿了興趣。
基本想法很簡單:一部分用户對一條帖子寫筆記,然後其他用户可以將這些筆記評為“有幫助”或“無幫助”。最有幫助的筆記會與原始帖子一起顯著展示。但這不僅僅是收集最多的投票。X的指南指出“筆記需要在過去有時存在分歧的貢獻者之間達成一致。”
我不僅僅是告訴我的追隨者為什麼錯誤的説法是錯誤的,我也開始對社區筆記進行評分。最終,我獲得了足夠的信譽積分,開始撰寫自己的筆記。在X上,用户如果將一條筆記評為有幫助或無幫助,並且最終大眾給予相同的狀態,就會獲得一個積分。如果他們將一條筆記評為無幫助,而它最終獲得了有幫助的狀態,他們會失去一個積分。如果他們認為一條筆記有幫助,但最終卻獲得了無幫助的狀態,他們會失去兩個積分。
儘管依賴普通用户而非專業事實核查員,社區筆記通常會得出正確的結論。一項2024年的研究要求專業疾病研究人員評估205條隨機選擇的關於Covid疫苗的社區筆記。他們發現97%的筆記是準確的,約一半引用了高質量的來源,如原始科學論文。
這樣的成功並非單純的運氣。我們有百年統計學的理由來期待社區筆記表現良好。1907年,統計學家弗朗西斯·高爾頓分析了來自英國普利茅斯的一場猜測牛重比賽的數據。儘管個人估計差異很大,但他注意到所有猜測的平均值與真實重量相符。這催生了“羣體智慧”的概念——一個羣體的平均評估可能比其任何一個成員的評估更準確。
多樣化的視角
要使一個羣體變得聰明,必須滿足兩個關鍵標準。首先,估計必須獨立進行,以便貢獻者不受彼此的影響。其次,貢獻者必須擁有多樣化的視角或知識,以便在我們取平均值時,個體猜測中的任何偏見都能相互抵消。
社區筆記在很大程度上滿足這些標準。用户在評分之前無法看到筆記是否有用,而來自不同用户的共識需求減少了系統性偏見的可能性。即便如此,X上的羣體並不保證是聰明的。用户可能會受到該主題其他帖子影響,某些主題即使用户在其他事情上有多樣化的觀點,也可能會收到偏頗的評分。實現97%的準確率對於眾包疫苗筆記來説似乎很高,但當數百萬用户可能接觸到危險信息時,這是否足夠好?
如果我們想區分真相與虛構,我們理想中希望避免兩種潛在錯誤。我們不想在某事為假時暗示它為真,也不想在某事為真時暗示它為假。但這可能存在權衡:如果平台對刪除或標記內容設定了高標準,雖然可以減少審查準確帖子的風險,但也可能讓虛假內容漏網。而相反,低標準會捕捉到更多錯誤信息,但也有可能刪除有效的帖子。
儘管依賴於普通用户而非專業事實核查員,社區筆記通常會得出正確的結論。
扎克伯格的公告 表明Meta特別關注事實核查員在後者錯誤方面的表現。“即使他們意外地審查了僅1%的帖子,那也是數百萬人,”他説。社區筆記評分系統表明X對干擾無害內容也有類似的擔憂。請記住,如果評估者建議在帖子中添加筆記,而更廣泛的羣體認為這沒有幫助,他們會受到雙重懲罰。
規模的好處
社交媒體並不是我們必須平衡懲罰無辜和釋放有罪的雙重錯誤的唯一領域。在英國刑法中,“布萊克斯通的比例”表明讓10個有罪的人自由比定罪一個無辜的人更好。並非所有司法體系都達成了這一比例:在1930年代的共產中國,被認為“殺死100個無辜的人總比讓一個真正有罪的人自由更好。”同樣,在線平台在理論上可能具有相同的檢測真相的能力,但在實踐中對哪種錯誤更糟糕的態度卻存在分歧。
插圖:Sebastian König為彭博社提供首先還有一個問題,那就是誰有責任決定什麼是真實的。例如,許多歐洲法院依賴法官在情況下作出裁決,而英美法院則常常使用陪審團。從本質上講,歐洲傾向於信任專業知識來確定真相,而英語國家則將這項工作委託給公眾的一個橫截面。
與勞動密集型的陪審團服務不同,在線眾包評估的一個優勢是它具有可擴展性。以維基百科為例,這是一個訪問量最大的在線信息資源之一。它利用社區貢獻,支持嚴格的編輯指南,生成了近700萬篇文章僅在英語中。研究估計在醫學主題如藥理學和解剖學方面,維基百科的準確性可以達到99%與黃金標準教科書相當。
維基百科的一個優勢是編輯可以隨着時間的推移對文章進行迭代以提高準確性。不幸的是,當面對虛假社交媒體內容的緊迫性時,我們並沒有同樣的奢侈。當我開始在X上撰寫社區筆記時,我很快感到沮喪。即使我在虛假帖子出現後幾個小時內添加了註釋,興趣往往已經消退。因此,沒有足夠多的人對我的註釋或其他人的註釋進行評分,帖子也沒有得到糾正。
減緩虛假信息的傳播不僅僅是關於事實核查;它還與速度有關。在2014年,Facebook的研究人員發現如果另一位用户評論並提供鏈接到事實核查網站,刪除誤導性帖子的機會大約為20%。但採取行動的窗口非常短,即使在糾正之後,流行的虛假內容仍然可以被廣泛分享。正如他們所説,“高傳播性可以克服暫時的挫折。”
事實與虛構
即使平台採取更大膽的措施試圖徹底消除虛假信息,正如他們近年來所做的那樣,並非所有內容都可以簡單地劃分為真/假二分法。麻省理工學院在2024年的一項研究發現,Facebook上那些最能降低對疫苗信任的帖子在技術上是準確的,但給人一種誤導性的風險印象。
例如,以下標題在2021年被廣泛分享:“一位健康的醫生在接種新冠疫苗兩週後去世;CDC正在調查原因。”這個陳述在事實上的確是正確的,但並沒有提供關於疫苗安全性的完整信息。
研究人員估計,這些準確但誤導性的帖子並未被Facebook的事實檢查員標記,整體上對疫苗態度的影響是明顯虛假帖子數量的50倍。扎克伯格最近告訴喬·羅根,他的公司與拜登政府在如何劃定新冠病毒的界限上發生了衝突。“他們強烈要求我們刪除那些實際上是正確的內容,”他説。可以説,這些正是那種會從及時的社區註釋中受益以增加背景信息的帖子。
如果反應性的更正或刪除並不完美,還有哪些其他選項可以減少在線虛假信息?一種替代方案是主動展示來自可信來源的內容。例如,2020年,英國用户在Facebook或Instagram上搜索“新冠”時看到了國家健康服務資源的顯著鏈接。還有證據表明,促使用户思考準確性可以減少大約10%的虛假信息後續分享。
一個更戲劇性——也是更有效——的干預措施是改變社交網絡本身的結構。在2017年和2018年,印度發生與WhatsApp上的虛假謠言相關的攻擊後,該公司限制了消息轉發 至五個人。次年,Pinterest 更改了其搜索功能以阻止反疫苗內容。這些措施可以減少虛假信息的傳播,但不足為奇的是,社交媒體公司通常不願意讓他們的平台變得不那麼社交。
在大流行期間,關於伊維菌素的虛假聲明傳播如此廣泛的原因之一是,它們承諾了一種簡單、低成本的解決方案,可以在不引發廣泛社會動盪的情況下減少傷害。看起來像Meta這樣的公司現在對社區筆記的承諾寄予了非常相似的希望。
亞當·庫查斯基是倫敦衞生與熱帶醫學學院的教授,也是幾本關於數學和科學的書籍的作者。他的最新書籍, 《證明:不確定性的科學》 (Profile) 預計將在2025年3月出版。