埃隆·馬斯克獲得推特數據轉儲,接下來是困難部分 - 《華爾街日報》
Sarah E. Needleman
埃隆·馬斯克已獲得推特公司的數據訪問權限,他此前聲稱需要這些數據來完成440億美元的收購交易。但數據科學家和專家們懷疑,這些海量信息能否為他提供關於平台虛假賬户數量的決定性答案。
知情人士透露,經過雙方几輪法律交鋒後,推特近幾周向馬斯克提供了歷史推文數據及所謂"消防水管"級即時推文流訪問權限。據該公司稱,該數據流近乎即時地呈現所有推文——平台上每日發佈量高達數億條。
馬斯克獲取這些數據可能為完成收購掃清道路。他此前表示,除非能通過此類數據驗證推特關於垃圾郵件/虛假賬户佔比的聲明,否則交易不會繼續推進。推特長期估計其可貨幣化日活用户中虛假賬户佔比不足5%(最近統計為2.29億用户),而馬斯克認為該比例可能接近20%。
埃隆·馬斯克表示,除非能獲取評估推特虛假賬户聲明的必要數據,否則收購交易不會推進。圖片來源:Susan Walsh/美聯社數據分析師和社交媒體專家表示,推特數據流的本質——無論是其體量還是侷限性——都使得馬斯克或任何人在短期內難以得出明確結論,以證明推特自身關於虛假和垃圾賬號的評估是否準確。他們指出,任何估算數據都很難與推特公開的數據直接對比,因為推特在判定這類賬號時採用了一套獨特算法。
曾任職於YouTube和Snap Inc.的社交媒體信任與安全事務顧問米卡·謝弗表示,推特數據流作為公開推文的海量數據集,其有限的數據特性使得針對垃圾賬號進行分析並不現實。
他表示,向馬斯克開放數據流"更像是息事寧人的權宜之計,而非重大讓步"。據知情人士透露,推特已向馬斯克詳細説明了其計算每日可貨幣化用户數的內部流程。
馬斯克上月(即同意收購推特數週後)宣稱交易"暫緩",原因是對虛假賬號的擔憂——此舉引發外界猜測其試圖重新談判或終止交易。
本月早些時候,這位特斯拉公司首席執行官威脅稱,若推特不提供其要求的全部數據將終止交易。推特隨後回應稱"將繼續與馬斯克保持合作,共享相關信息"。
數據專家表示,分析推特的海量推文需要包括計算能力、基礎設施和專業知識在內的資源。圖片來源:Jeff Chiu/Associated Press研究過推特數據的人士表示,由於接收到的數據量巨大且分析所需資源(即計算能力、基礎設施和專業知識)龐大,及時消化這些數據具有挑戰性。一位知情人士稱,多年來約有十幾家公司付費獲取了推特的數據流。
卡內基梅隆大學海因茨學院信息系統教授拉胡爾·泰朗表示:“普通公司會被這些數據中淹沒。”馬斯克尚未透露他將如何進行這項分析,不過泰朗指出,作為世界首富,馬斯克有資源僱傭足夠的數據分析師在大約一個月內完成這項工作。
專注於防範機器人攻擊和網絡欺詐的Human Security公司首席執行官塔默·哈桑表示,通過推特的數據流,馬斯克可能會發現一些指向虛假或垃圾賬户的行為實例,例如某個賬户在短時間內發佈的推文數量超出人類可能達到的範圍。但他補充説,這類發現也可能包括傳播有用或娛樂信息的自動化推文,比如天氣警報或可愛動物的照片。他還表示,這種方法也可能漏掉那些高度擬人化的複雜機器人行為。
圖片集:埃隆·馬斯克如何積累收購推特所需的財富
查看圖片
圖片來源:Paul Sakuma/美聯社與此同時,推特的數據流並未包含能驗證特定賬號是否為真人的關鍵信息——例如IP地址、電話號碼等隱私數據。
若馬斯克自行估算垃圾賬號比例,很可能與推特官方數據缺乏可比性。推特表示其數據基於對數千個隨機抽樣賬號的人工複核,並結合未公開的用户數據。
社交媒體顧問謝弗指出:“馬斯克必須復現推特的審核流程,才能對其數據提出可信質疑。”
數據流的侷限性將顯著影響用户比例計算。Graphika公司CEO約翰·凱利表示,該數據不包含僅瀏覽不發言的"沉默用户"(可能佔很大比例),因此無法作為計算虛假賬號佔比的分母基準。
“這套數據不足以評估非人類用户佔平台可貨幣化日活用户的比例。“他補充道。
康奈爾大學研究社交媒體的助理教授內森·馬蒂亞斯指出,雙方還需就"虛假賬號"的定義達成一致。由於缺乏行業標準且企業通常保密判定標準(以防被鑽空子),這將成為另一重障礙。
“如果馬斯克及其團隊決定要得出與推特不同的結果,他們很容易就能做到,”馬蒂亞斯先生説,“但其他人也可能對馬斯克及其團隊的定義提出異議,因為沒有統一標準。”
數據專家表示,由於數據量龐大且分析方式多樣,馬斯克與推特在機器人數量上的分歧並不罕見或令人驚訝,但這可能不足以改變交易進程或條款。
“要獲得足夠的確定性讓馬斯克先生建立可辯護的立場以採取不同行動,將非常困難,”身份驗證公司Au10Tix Ltd.的首席執行官凱里·奧康納·科拉亞説。
卡拉·隆巴多對本文有貢獻。
致信 薩拉·E·尼德爾曼,郵箱:[email protected]
刊登於2022年6月29日印刷版,標題為《馬斯克訪問推特數據倉庫》。