抖音首度披露算法機制:利用神經網絡預估用户行為,不依賴打標籤,“機器+人工”雙重審核
guancha
當算法已經深刻融入日常生活中,平台應當如何管理算法,才能避免其無序發展、走向失控?
4月16日,澎湃新聞記者獲悉,近期抖音在北京舉辦“安全與信任中心開放日”活動,首次對平台算法原理、平台治理體系以及社會關切的問題進行較為詳細的披露。
抖音曾經多次因為算法,陷入輿論爭議。去年農夫山泉董事長鍾睒睒曾經喊話字節跳動創始人張一鳴,請求頭條和抖音停止對一箇中國公民的侵害,“今日頭條你是實際控制人,同樣你是盈利性企業。你是一個有足夠量掌控輿論的平台企業,因為這樣的背景,所以請你承擔企業文明的規則。”
面對此前吳柳芳案件等帶來的算法和流量質疑,抖音副總裁李亮曾經多次在公開平台回應,但始終未正面披露其背後的算法機制。
在此次發佈會上,抖音算法工程師劉暢介紹,抖音推薦算法作為人工智能機器學習技術的重要應用場景,本質上是一套高效的信息過濾系統。
在抖音的實際應用中,平台推薦系統採取“人工+機器”協同的方式進行風險治理:由人工運營和治理體系為算法導航;同時多目標體系算法主動打破 “信息繭房”,為用户帶來更豐富的推薦結果。

從推薦算法來看,抖音與國內外大部分內容推薦平台相似,包含召回、過濾、排序等環節,重點是學習用户行為。抖音基於用户行為的推薦方法包含多種技術模型,如協同過濾、雙塔召回、Wide&Deep模型(均為推薦系統中常用模型)等。算法可以在完全“不理解內容”的情況下,找到興趣相似的用户,把其他人感興趣的內容推薦給該用户。
目前,抖音算法已幾乎不依賴對內容和用户打標籤,而是通過神經網絡計算,預估用户行為,計算用户觀看這條內容獲得的價值總和,把排名靠前的內容推給用户。
談到外界擔憂的“信息繭房”問題,劉暢介紹,抖音算法在多目標建模體系下,設置專門的探索維度:一是對用户在平台上已經表現出的興趣,儘可能推薦更多樣的內容,通過多樣性打散、多興趣召回、扶持小眾(長尾)興趣等方法控制相似內容出現的頻次。
二是幫助用户探索更多新興趣,採用隨機推薦、基於用户社交關係拓展興趣、搜索推薦聯動、“不感興趣”不再展現等多種方式,讓用户的主動行為影響推薦系統,使推薦更加個性化和多樣化。
算法能學習、預估用户行為,但因其無法理解內容語義,對內容的理解存在不足,可能導致違法違規、不良內容被推薦傳播。因此,算法在真實使用場景中,必須由平台治理對其進行約束和規範。
在內容治理方面,據抖音生態運營經理陳丹丹介紹,抖音的體系是“人工參與+機器學習”相結合的模式,並組建專門的平台治理團隊為算法設置“護欄”,具體治理體系包括異常感知、標準定義、機器識別、人工研判、風險處置等過程。
治理流程秉持兩大準則:第一:所有在平台發佈的內容都會經過評估,流量越高的內容評估次數越多,標準也越嚴格。
第二:抖音內容審核採用“人工+機器”相互配合的模式,“機器”負責“寬度”評估所有投稿,“人工”負責“深度”,確保專業、敏感或疑難等問題儘可能精準研判。
創作者將內容上傳至抖音後,首先進入機器識別環節。如果內容被識別出含有高危特徵,將被直接攔截;若未命中高危特徵但模型判斷有問題,則會送至人工審核,若問題概率較低,則獲得基礎流量進入下一環節。
視頻被舉報、評論區出現集中質疑、流量激增等情況出現,均可能觸發“人工+機器”審核。一旦內容在任一環節被處置,系統會立即停止進一步推薦和分發。
針對社會普遍關心的、對用户造成較多困擾的焦點問題,抖音成立數個專項治理團隊,針對詐騙、網暴、虛假擺拍、未成年人保護、網絡水軍、AIGC技術濫用等一系列重大專項風險進行治理。例如,在不實信息治理方面,抖音於近日上線了闢謠卡,遏制不實信息的傳播。
此外,抖音安全與信任中心網站已經處於試運行階段,正廣泛向用户、創作者、社會各界徵集意見。
算法治理已成為當今平台面臨的共同問題。此前中央網信辦副主任、國家網信辦副主任牛一兵在“堅持主流價值導向 推動算法向上向善”主題分享會上致辭時強調,中央網信辦聚焦黨中央關心、人民羣眾關切的算法問題,以壓實網站平台主體責任為抓手,出台系列政策法規,構建算法備案、安全評估、監測檢查、執法處罰等全流程監管體系,算法應用生態持續向好。
加強算法治理,是維護網絡安全和意識形態安全的關鍵環節,是推動平台經濟健康可持續發展的有力保障,是維護人民羣眾利益的具體行動。要內化導向要求,把准算法治理“定盤星”,堅持黨管互聯網原則,把主流價值導向貫穿算法設計、開發、應用全過程。要淨化內容生態,守好算法應用“責任田”,加強網上正能量推送,嚴禁算法助推低俗信息傳播,提高算法設計的透明度和算法運行的可解釋性。
去年11月,中央網信辦等部門聯合發佈的《關於開展“清朗·網絡平台算法典型問題治理”專項行動的通知》提出,優化檢索、排序、推送等規則的透明度和可解釋性,預防和減少爭議糾紛。以適當方式公示算法推薦服務的基本原理、目的意圖、主要運行機制等,確保簡單、清晰、可理解。
(澎湃新聞記者 範佳來)