介紹下ChatGPT的“政治正確模塊”和數學引擎_風聞
陈经-亚洲视觉科技研发总监-02-10 10:34
1. 有些朋友問,為什麼ChatGPT不給特朗普寫讚歌,卻給拜登寫讚美詩?是不是聊天機器人也有政治偏向?是的,真的有的。
2. ChatGPT的主體,是一個大型語言模型,把整個互聯網的海量素材都拿來訓練。它就是一個詞一個詞地吐,訓練目標是預測最合適吐的詞,我想叫它“吐詞機”。詞吐完了,一個對話或者文章就生成了。吐什麼詞不是説存了很多“正確”資料,真不是,而是由上千億個神經網絡權重決定的。
3. 一個大麻煩就是這個吐詞不好控制。模型算出什麼是什麼,不是抄標準答案,而是訓練的結果。我們可以很容易明白,這個語言模塊不可能懂數學,只是預測詞不可能學會精妙的數學邏輯,文科生不上數學課不可能會數學。倒是有專門搞數學的AI,很厲害,所以可以當數學引擎,配合聊天機器人,避免出醜。
4. 其實一般也不用配,研究語言模型的人看到機器聊天很像回事,就大喜研發成功,不會去計較數學能力。但是公眾不知道,就仗着自己的小學數學水平,調戲機器人。其實和數學引擎比起來,絕大多數人的數學能力都是渣!有本事不要和文科的聊天機器人鬥,來和數學AI比比。
5. 還有政治正確問題,機器人其實是你讓它幹啥它就幹,給希特勒寫讚歌也傻傻地幹。這不能夠,會引發輿論的大麻煩。用訓練來解決不好辦,所以語言模型放出來都要加政治正確模塊,保護機器人,不要惹事。特朗普就是上了模塊黑名單,科技公司不喜歡他。這倒是和中國的關鍵詞差不多,希望能智能一些。
6. 政治正確模塊這個得不停加,其實很麻煩。還得在素材準備階段就花錢,例如黃色的、暴恐的、罵髒話的(有機器人是學得滿嘴髒話了),這些內容都要人工去剔除,外包給發展中國家幹。

