微博大V:文心一言可能是個“貼牌貨”_風聞
首席合规观察-03-23 14:17
百度人工智能文心一言最近飽受質疑。不少用户在使用中發現,文心一言對很多漢語完全是按照字面意思理解,完全牛頭不對馬嘴。3月22日,微博大V劉大可直接發文表示,經過反覆驗證,百度文心一言只是把中文句子翻譯成英文,再拿到國外開源的人工智能上畫圖,然後再將圖片返還給用户,完全就是個“套殼、畫皮、造假”的人工智能。隨後,百度回應稱“完全自研”。
去年11月30日,美國OpenAI公司研發的聊天機器人程序ChatGPT發佈。一經問世就引發現象級討論,在短短一個月的時間,月活用户就突破1億,成為史上增長最快的消費者應用,打破了抖音6個月用户破億的神話。這是一款通過人工智能技術驅動的自然語言處理工具,它能夠通過學習和理解人類的語言來進行對話,能像人一樣聊天交流,也可以完成寫作、視頻腳本、翻譯、代碼等各種任務,被認為是顛覆性的科技創造。
ChatGPT大火以後,今年3月,百度也發佈了類似的人工智能機器人文心一言。根據百度的説法,文心一言具備跨模態、跨語言的深度語義理解與生成能力。文心一言有一個AI藝術創意輔助平台文心一格。在好奇心的驅使下,網友們在文心一格上玩嗨了。
但玩着玩着,網友們對文心一言的質疑越來越多。起初,不少用户質疑文心一言不能準確理解很多中文詞語的含義,尤其是一些成語。
比如,有網友讓文心一言畫個魚香肉絲,結果畫出來的作品就是字面理解意思。説明文心一言缺乏對美食的訓練。
還有網友讓文心一言畫的唐伯虎點秋香、胸有成竹、車水馬龍等成語或者典故,畫出來的作品都是字面意思,與實際意思毫不沾邊。

不少用户因此質疑文心一言“段位不高”。
但是,3月22日,微博用户“@劉大可先生”發文質疑,文心一言之所以常常只能根據字面意思給出答案,是因為這個人工智能只是“套殼”的機器人。劉大可還列出了幾個正向和反向實驗的例子。
比如,讓文心一言畫“鼠標和總線”,他卻給出了“老鼠和公共汽車”的圖片,因為老鼠和總線的英文單詞分別為“mouse”和“bus”。
再比如,讓他畫起重機,結果他卻給出了一個鶴的畫,因為起重機這個詞的英文是“crne”,其另一個常用語義就是鶴。説明文心一言就是直接將中文翻譯成英文之後,再按照英文給出答案。
讓文心一言畫一個“土耳其張開翅膀”,結果他畫了一個火雞。
畫“水瓜”,他畫了個西瓜。
讓他畫“中國論文”,他畫了一個山水畫。因為論文的英文是“paper”,但“Chinese paper”是宣紙的意思,所以他畫了個山水畫來象徵宣紙。
此外,還有就是系統默認的問題。如果讓畫一個人,他會畫出白種人,畫國旗,如果不加國別,就會畫出來星條旗。
劉大可認為,百度的這個人工智能就是把中文句子翻譯成英文,然後使用國外開源的人工智能“stable diffusion”生成圖畫,然後再反還給國內用户。他認為這不是文心一言的儲備和訓練不夠,而是完全使用的國外開源程序改頭換面,換殼而已,只是在漢譯英過程中出現問題,導致露餡。
也有網友支持文心一言,認為在圖庫方面,中文資源較少,英文資源較多,而英文圖庫的標籤都是使用英文,百度只是用了國外的開源圖庫,素材引用而已,並不是代碼。
爭議面前,觀察君也十分好奇,於是親測了一下。不得不説,百度改進的速度還是非常快的。
起重機、鼠標和總線之類的翻譯問題出現的錯誤,不少已經更改。比如,起重機已經換成了真實的起重機,而不是鶴。
但是關於成語典故等漢語理解問題,錯誤依然非常多。魚香肉絲依然還是肉絲的魚,唐伯虎點秋香還是老虎在燒香。
百度潛心研究人工智能十多年,好不容易做出來一個文心一言,卻這樣飽受質疑,百度是不能忍的。
面對質疑,百度很快發聲。3月23日,百度公開回應稱,文心一言完全是自研的語言模型,模型訓練素材使用的是互聯網公開數據,符合行業慣例。希望大家給自研技術一點時間和信心。
百度這個公開回應,似乎並未正面回應網友質疑,概括成一句話就是,我沒有“套殼”。能否解答廣大用户心中的疑惑和質疑,那就看大家的理解了。