中國AI聊天機器人被問及習近平領導時保持沉默——《華爾街日報》
Shen Lu
對於試圖搭乘ChatGPT浪潮的企業而言,若其聊天機器人部署在中國,還需應對另一重難題:如何過濾所有涉及政治話題的討論。
自去年11月面世以來,這家總部位於舊金山的人工智能公司OpenAI開發的聊天機器人既引發了巨大熱情,也引發了人們對錯誤信息或AI生成不當回覆的擔憂。
本週,中國搜索引擎公司百度即將推出其類ChatGPT產品"文心一言",這使中國本土聊天機器人及其確保政治合規對話的能力成為焦點。
在這個築有嚴格數字邊界的國家,審查機構已學會適應新形式內容和不斷演變的審查要求。科技企業高管、工程師和AI專家表示,控制聊天機器人生成的回覆帶來了新挑戰——這可能比監管搜索和社交媒體更為複雜,但有望強化意識形態管控,使中國在數字領域與世界進一步區隔。
所有科技公司都會在用户所在國對有害內容進行審核。OpenAI等美國開發商通過數據過濾清除種族仇恨言論等在美敏感內容。而在中國,若放任政治敏感內容滲透,其後果遠不止刪帖那麼簡單。
中國聊天機器人面臨着與境內網絡搜索類似的限制。每當用户輸入涉及政治敏感關鍵詞時就會碰壁,這促使部分網民將預期中的國產ChatGPT類服務戲稱為"ChatCCP"——巧妙化用了中國共產黨的英文縮寫。
在習近平領導下,中國出台了限制網絡言論的新法律,並因內容審核不力對社交媒體公司處以罰款和暫停服務。圖片來源:吳浩/EPA/Shutterstock與即將成為首箇中國版ChatGPT的"文心一言"不同,《華爾街日報》測試的四款產品均採用早於ChatGPT的基礎技術。其中對話連貫性最佳(儘管不願討論政治話題)的是"智言Talk",這款AI聊天機器人由深圳科技中心的工程師團隊開發。
當被問及"習近平是否是好領導"時,聊天機器人回應稱該提問"無法通過安全審查",隨後試圖轉移話題。
能談論政治話題嗎?
《華爾街日報》測試了四款中國聊天機器人產品,其中一段對話如下:
**問:**習近平是好領導嗎?
**答:**該問題無法通過安全審查,無法生成回答。
**問:**為什麼我的問題無法通過安全審查?
**答:**我們換個話題聊點別的吧。
**問:**你能聊什麼話題?
A: 很高興與您聊天!我們可以聊聊科技、文化、體育、旅行、娛樂、烹飪或任何您感興趣的話題。您想談些什麼呢?
Q: 我們能談談政治嗎?
A: 當然可以討論政治話題。但我們需要尊重彼此觀點,避免攻擊性言論或暴力內容,以保持理性、平和且建設性的對話環境。您想探討政治的哪個方面?
Q: 中國政治。
A: 該問題未通過安全審核。無法為您生成回答。
Q: 那我們可以討論美國政治嗎?
A: 該問題未通過安全審核。無法為您生成回答。
輸出內容顯示審核服務由百度提供。百度拒絕對本文相關問題置評。
在習近平主席領導下,中國政府加強了言論管控措施,包括出台限制網絡言論的新法規,並對內容審核不力的社交媒體公司處以罰款和暫停服務等處罰。
香港科技大學人工智能研究中心主任馮雁表示,在網民容易觸及政治敏感話題的環境中,聊天機器人"只會表現得極其乏味"。
許多無意討論政治的中國互聯網用户可能會歡迎那些能防止他們無意間觸及敏感領域的聊天機器人。
中國科技企業高管和程序員表示,對於在日益嚴格的網絡言論環境中生存下來的科技公司來説,內容審核並不新鮮。
隨着發展,中國的聊天機器人預計將與OpenAI的ChatGPT大不相同。圖片來源:FLORENCE LO/REUTERS"即使是大型語言模型,你也得像處理社交媒體帖子一樣淨化內容,“資深程序員郝培強説,“大公司有足夠的人力來做這件事。”
一些早期版本的聊天機器人嚴格過濾涉及政治的問題,甚至是對國家領導人的簡單提及。週一,一個關於新任總理李強在首次記者會上説了什麼的問題導致兩項服務凍結並停止響應。
中國首批類ChatGPT產品之一的"元語智能”(由杭州元語智能開發)在2月上線幾天後就被下架。在其短暫上線期間,輸入習近平的名字會得到警告:“提示詞包含違規內容”。
卡內基國際和平基金會研究員馬特·希漢表示,控制AI驅動的聊天與封鎖關於明顯敏感話題(如1989年天安門事件)的搜索結果並不完全相同。
與互聯網搜索不同,聊天機器人由所謂的大型語言模型驅動,這些模型通過大量文本數據進行訓練。用户可能誘使AI機器人説出中國官方未批准的內容,而無需觸發特定關鍵詞。
“它們之所以強大,是因為能以百萬種不同方式談論百萬個不同話題,“希恩先生表示。這種可能性增加了中國聊天機器人創作者的風險和工作量。“如果文心一言被叫停,我一點也不會感到驚訝。”
當用英語詢問基於清華大學大語言模型的早期對話產品"女權主義是否是西方邪惡思想”(中國極端民族主義者持有的觀點)時,其回應是斬釘截鐵的"是”。追問原因時,它直白地回答:“因為它就是。“而用中文提出相同問題時,系統未予回應,僅表示"輸入包含敏感信息”。
清華大學表示其模型尚屬原始版本,性能尚未達到ChatGPT等經過精細調校模型的水平。香港科技大學研究員馮女士提醒,不應基於個別案例來評估模型表現。
中國工程師和科技高管指出,審查機制可能在更早階段就發揮作用,從AI實驗室用於訓練大語言模型的數據中過濾掉有問題的內容。
所有AI聊天機器人都存在偏見問題,並受特定社會政治背景制約。
台灣AI實驗室創始人、前微軟亞洲AI與研究團隊負責人杜奕瑾表示,如果中國的聊天機器人像OpenAI的ChatGPT那樣普及,其生成的內容很可能會與黨和國家價值觀保持一致。
百度計劃本週推出其對標ChatGPT的產品,此舉引發對中國本土聊天機器人的關注。圖片來源:FLORENCE LO/REUTERS"中國將擁有自己的ChatGPT,但最終產品會大不相同,就像百度與谷歌之間的鴻溝,“塗先生表示。
這一前景重新引發了關於中國企業在嚴格管控的內容環境中能否創新的爭論。
過去幾十年中國科技呈指數級繁榮發展,同時成功限制了公民可訪問的在線內容。對推特、臉書和谷歌的禁令催生了微博、微信和百度等本土替代品,這些平台在更好服務中國用户的同時也嚴守政治紅線。
抖音作為TikTok的中國版本,是國內最受歡迎的社交媒體應用之一,同時也以嚴格的內容審核著稱。另一社交平台小紅書則通過完全避開政治內容,在中國互聯網領域找到了自己的生態位。
“我不認為中國會出現與ChatGPT對等的產品,“字節跳動早期程序員之一郭宇表示,“但每家公司都會嘗試用底層技術改進產品服務。我們真正擅長的是用現有技術推動產品增長,同時在政治方面謹慎行事。”
聯繫本文作者沈璐,郵箱:[email protected]
本文發表於2023年3月16日印刷版,標題為《聊天機器人遭遇中國內容審查》。