推特分享其運作背後的部分秘密配方 - 《華爾街日報》

Sarah E. Needleman and Alexa Corse

2023-04-01

推特公司公開了其大部分源代碼，這對大型社交媒體企業來説實屬罕見之舉，其所有者埃隆·馬斯克表示這將提升平台可信度。

這些於週五發佈在代碼共享網站GitHub的代碼，揭示了推特如何推薦帖文及識別仇恨言論等問題。該代碼不包含用户隱私數據，也未提供複製該平台的路線圖。有專家將此策略比作廚師公開獨家配方。

“我們正努力成為互聯網上最值得信賴的平台，“馬斯克在代碼發佈後不久通過Twitter Spaces討論時表示，“這可能會暴露許多令人尷尬的錯誤。”

科羅拉多大學博爾德分校信息科學教授羅賓·伯克指出，雖然普通人難以理解這些代碼，但程序員可以藉此分析推特是否如指控所言區別對待特定用户羣體。

“他們可以聲稱’我們並未實施被指控的歧視行為’，“他談及推特時表示，“但另一方面，歧視性操作仍可能無意間發生。”

前推特總監魯曼·喬杜裏表示，這些代碼可能被利用來操縱推特的推文系統、識別違規者等。她曾負責機器學習倫理與透明度團隊，去年11月被裁。她舉例説，雖然推特設有仇恨言論規則，但此前外界並不清楚其如何主動識別這類推文。

“你可以閲讀這些代碼，從中提取出支配決策制定的規則，”喬杜裏女士説。“現在，惡意行為者可能有辦法繞過推特建立的各種防護措施。”

她表示，反過來看，這些泄露的代碼也展示了平台的複雜性。“人們以為複製一家社交媒體公司的功能非常簡單，其實並非如此，”喬杜裏女士説道。她補充稱，研究人員和學者現在也能審核推特的推薦算法了。“有整個學術會議專門研究推薦系統及其影響，”她説。

根據加州大學伯克利分校人類兼容人工智能中心的高級科學家喬納森·斯特雷的説法，代碼顯示推特的推文推薦流程建立在標準架構之上。“這裏沒有意外發現，”他説。

但他指出，代碼確實展示了該公司對推文進行排序的公式，並表示其中最大的影響因素是預測一個人是否會回覆某條推文。

“他們試圖促成的是來回對話，但這也會激勵人們發佈煽動性或分裂性內容，”斯特雷先生説。

推特所有者表示，公司將根據用户建議每24至48小時更新一次推薦算法。圖片來源：Jeff Chiu/Associated Press針對置評請求，推特新聞郵箱回覆了一個大便表情符號——馬斯克近期發推文稱，該表情將是公司對媒體問詢的自動回覆。

週五的Twitter Spaces討論中，有人向馬斯克先生詢問了一段似乎用於追蹤他本人發推時間的代碼。根據週五公佈的材料，Twitter表示該代碼用於收集數據指標。

他回應道：“我覺得這很奇怪。這是我第一次聽説這件事。”

馬斯克隨後發推表示，Twitter將根據用户建議每24至48小時更新一次推薦算法。

近年來，社交媒體公司因其通過推薦算法影響用户所見內容的能力而受到審查。去年馬斯克收購Twitter時，曾承諾公開平台用於決定是否推廣特定推文的代碼。

在收購Twitter前，馬斯克曾指控該公司在內容審核上存在"強烈左翼偏見”。而Twitter研究人員在2021年報告中指出，其算法在美國等多個國家放大了政治右翼賬號的聲量，程度超過左翼。

儘管馬斯克承諾提高Twitter透明度，但自他接管以來，公司在某些方面減少了運營信息的披露。作為私有企業，Twitter不再公開財務報告。馬斯克經常通過個人推特賬號發佈公司動態。

另外，根據上週提交給加州北部聯邦地區法院的訴訟文件，推特公司近期表示其部分源代碼被不明身份的個人或團體泄露至網絡。與馬斯克支持下週五公開的代碼不同，此次泄露顯然未經授權。

儘管公司在法庭文件中將泄露內容描述為"推特平台及內部工具的專有源代碼”，但具體哪些代碼遭泄露尚不明確。

應推特要求，法院本週已向GitHub發出傳票，要求查明信息泄露者及下載者身份。

聯繫記者莎拉·E·尼德爾曼，郵箱：[email protected]

本文發表於2023年4月1日印刷版，標題為《推特公開平台大部分源代碼》。