中國試圖掌控互聯網算法可能是在追逐一個不可能實現的夢想——《華爾街日報》
Karen Hao
中國強大的網絡監管機構邁出了政府管控塑造互聯網的自動化系統的開創性且充滿不確定性的第一步。
本月早些時候,國家互聯網信息辦公室公佈了國內二十多家最具影響力的互聯網企業的30項核心算法概要,包括TikTok所有者字節跳動有限公司、電子商務巨頭阿里巴巴集團控股有限公司以及中國無處不在的微信超級應用所有者騰訊控股有限公司。
這一里程碑事件標誌着監管機構首次系統性要求互聯網企業披露支撐其平台的技術信息,這些技術已展現出從流行文化到政治等全方位變革的能力。這也使北京走上了一條技術專家認為幾乎沒有政府(如果有的話)能駕馭的道路。
國家互聯網信息辦公室近期公佈了部分中國最具影響力互聯網企業的核心算法概要。圖片來源:THOMAS PETER/REUTERS公開版本的申報文件用通俗語言解釋了特定算法使用的數據類型及其數據處理方式。在許多情況下,這些披露的細節比Facebook自願向用户提供的新聞推送內容排序機制更為簡略。
知情人士表示,未公開的完整申報文件包含對數據和算法更詳盡的描述,其中部分被視為商業機密信息。根據監管部門要求企業提供的公開文件説明,申報材料還包含對潛在安全風險的自我評估。
企業提交信息是為了響應今年三月生效的新規,該法規賦予監管部門整治算法負面影響的職責,包括有害信息擴散、侵犯用户隱私和零工勞動者權益等問題。新規還要求算法必須用於弘揚"正能量"——這個習近平時代的術語特指有利於輿論引導和展現共產黨正面形象的內容。
在約束互聯網基礎算法權力方面,北京並非孤例。美國和歐盟監管機構同樣在應對類似挑戰,例如如何保護青少年心理健康及消除病毒式傳播的虛假信息。
TikTok母公司是提交數據算法信息的互聯網企業之一。圖片來源:VCG/Getty Images然而中國這項法規標誌着對算法實施直接監管的最強硬嘗試。最終,該國所有使用算法技術的服務都將受其約束。
“他們正在嘗試無人涉足之事,全球皆可從其成敗中汲取經驗,”斯坦福大學“數字中國項目”負責人格雷厄姆·韋伯斯特表示。該項目專門追蹤中國數字政策發展動態。
北京某菜市場,顧客正通過微信——這款中國全能型應用——掃描二維碼付款。圖片來源:格雷格·貝克/法新社/蓋蒂圖片社算法專家指出,這項舉措引發的核心問題在於:政府對算法實施直接監管是否具有現實可行性。
當前主流互聯網平台算法均基於機器學習技術,該技術通過海量數據預測用户行為,從而實現廣告定向投放等決策自動化。與傳統由明確編碼規則構成的算法不同,多數機器學習系統如同黑箱,其運行邏輯與使用後果難以解析預判。
據知情人士透露,北京對算法監管的關注始於2020年TikTok為避免在美遭禁而尋求美國買家之際。當中國監管部門宣佈對信息推薦技術實施新出口管制後,多家競購方退出短視頻平台收購,這使中國政府意識到算法技術的重要性。
知情人士透露,中國國家互聯網信息辦公室迅速起草了一項關於算法推薦系統的新規,尤其旨在瞭解國內科技公司如何塑造網絡輿論以及如何遏制這種影響。
韋伯斯特表示,到2022年1月,該規定已準備就緒,並於兩個月後生效——對於一個有時會將立法草案擱置數年的政府來説,這一速度令人印象深刻。
網絡安全監管部門未回應置評請求。
布朗大學計算機科學教授、本月剛卸任白宮科技政策辦公室助理主任的蘇雷什·文卡塔蘇布拉馬尼安表示,中國這一法規的覆蓋範圍和激進程度令美國科技政策界人士震驚。
文卡塔蘇布拉馬尼安稱,去年秋天當Facebook舉報人弗朗西斯·豪根在國會主張對這家公司的算法進行限制時,美國政府內部有些人對此產生了興趣。但監管機構擔心,這將為國家控制信息流動開創先例。
他表示:“一旦走上這條路,就很難回頭。”
面對同樣問題的歐盟監管機構採取了更強勢的立場,但仍避免由政府直接審查算法。
今年7月,歐洲議會通過立法,要求谷歌和Facebook等大型平台定期評估其系統性風險,比如是否在傳播非法內容。這些公司可以自行選擇如何應對這些風險,包括調整算法,但必須接受獨立審計以證明其解決方案確實有效。
新規要求算法傳播"正能量",這一表述特指能夠提振輿論氛圍、對中國共產黨持積極態度的內容。圖片來源:謝爾頓·庫珀/ZUMA Press政策專家表示,歐盟法律的實施細則和執行細節仍不明確。柏林非營利研究與倡導組織AlgorithmWatch執行董事馬蒂亞斯·施皮爾坎普指出:“可能需要經過多年博弈甚至訴訟才能釐清法律內涵。”
中國監管措施同樣存在模糊地帶。理論上,新規可能讓政府完全掌控主導網絡空間乃至日益滲透線下生活的關鍵算法機制。但科技專家認為,北京當局的雄心很可能反成絆腳石。
社交媒體推薦引擎堪稱最複雜的算法系統之一,Facebook和TikTok等應用使用數百甚至數千種算法來決定用户的信息獲取。
曾為美國政府機構審查企業算法的審計師凱西·奧尼爾表示,即便掌握這些系統的詳細文檔甚至源代碼,也不足以理解其對網絡輿論等宏觀層面的影響。“真正關鍵的是算法處理的數據流。“她強調。
奧尼爾指出,即便擁有隨用户動態即時變化的全量數據,科技公司的工程師仍難精準調控系統行為。雖然定向調整(如增加宣傳內容比重)可行,但根本不可能完全控制推薦引擎的整體運作。
科技分析師和業內專家也質疑,最初作為宣傳部門成立的網信辦是否具備執行其規則的技術專長。
知情人士透露,在中國新規生效後不久,字節跳動的政府關係經理和算法工程師就與網信辦官員會面,解釋他們提交的文件。其中一位人士表示,在一次會議中,該機構官員對技術細節理解有限,公司代表不得不借助比喻和簡化語言來解釋推薦算法的工作原理。
知情人士稱,企業並未被要求提交代碼或用户數據。
中國政府去年發佈的指導意見要求多個機構擴充人員以監管算法。
“他們正在努力構建工具、招聘人員並獲取技術專長來處理這類問題,“北京戰略諮詢公司Trivium China的科技政策研究主管Kendra Schaefer表示。“因此,未來五到十年內,執法力度將逐步加強。”
Raffaele Huang對本文亦有貢獻。
聯繫作者 Karen Hao,郵箱:[email protected]
更正與補充
中國針對互聯網公司算法出台了新規。本文早期版本錯誤地稱其為新法律。(已於8月31日更正)
出現在2022年8月31日的印刷版中,標題為《中國公佈互聯網算法》。