“智慧”與“智障”?熱門AI大模型親測_風聞
百年津渡-百年津渡官方账号- 困难时这是树洞,有了炬火和太阳,就风乎舞雩吧!1小时前
從ChatGPT到DeepSeek,大模型越來越成為生活中的明星,今天抽了點時間做了一下測試,發現各種大模型就像精神病人,時而智慧滿滿,時而智障連連……廢話少説,直接上圖片!我找了一本清華大學裘宗滬教授著的《趣味數學300題》,拿第61頁第3章的25題進行測試。

裘宗滬教授撰寫的《趣味數學300題》先用DeepSeek來做這道題的第一問,結果如下:




很明顯,DeepSeek用了65秒完成了第一問的解答,答案是完全正確的!接下來上第二問,看看其數理邏輯推理能力到底怎麼樣?



第二問的答案如下
前兩次測試都因為系統繁忙,沒有能測出結果,第三次測試用時266秒,得到了上面的錯誤結果。接下來用同樣的題目,換大模型再接着測,就有了一般“智慧”一半“智障”的同樣結果:

ChatGPT給的答案也是錯的
根據裘宗滬教授給出的答案,這兩個大模型給出的答案完全是一樣的:都是第一問做對了,第二問因為中間要轉換思維,所以都做錯了。這是裘宗滬教授給出的問題正確答案:

裘宗滬教授在書中給出的答案
數理邏輯推理能力只是半吊子,那麼語言文字水平怎麼樣呢?我接着測試。

下面是DeepSeek寫的賀詩的最後一段:
今夜 你的白髮
和我的白髮
在酒杯裏輕輕碰響
我們説起童年
我年輕的時候寫寫新詩,如今年紀大了,平時偶爾寫點古體詩詞賦,所以再試DeepSeek的文言詩詞能力:

不得不説,大模型DeepSeek在語言文字排列組合方面還有點東西,速度極快而且文從字順。
但是這裏面也有一個明顯錯誤和一些問題,先説裏面的明顯錯誤。

我們來看看關於標點符號的運用,國家所制定的標準是如何規定的。
標點符號從種類上分,可以分為“點號”和“標號”。
點號的作用是點斷,主要表示停頓和語氣。分為句末點號和句內點號。用於句末的點號,表示句末停頓和句子的語氣。包括句號、問號、歎號。用於句內的點號,表示句內各種不同性質的停頓。包括逗號、頓號、分號、冒號。
標號的作用是標明,主要標示某些成分(主要是詞語)的特定性質和作用。包括引號、括號、破折號、省略號、着重號、連接號、間隔號、書名號、專名號、分隔號。
對於書名號,這個標準中這樣是這樣寫的:標號的一種,標示語段中出現的各種作品的名稱。
一般來説,直接出現在作品開頭的題目,因為不是出現在語段中,所以不需要加書名號進行標明。
典型的如語文課本的標題:

人教社語文課本(必修下冊)
而在DeepSeek所寫的新詩和文言詩中,題目上都加了書名號,這是典型的標點符號錯用。
另外大模型為個人所寫的詩,明顯存在以下幾個問題:
其一,與提問者的生活環境不契合。春節親人團聚,行色匆匆各地走親訪友,親人生日之時哪裏有什麼點蠟燭、母親揉麪、共同守歲之類。大模型把一堆萬金油式的套路言語組合起來,就成了眼下的新詩和文言詩。
其二,與筆者的生活經歷不合拍。人在社會上生活,誰不是滄桑歷盡冷暖飽嘗,社會上很難找出兩個人生經歷完全雷同的人。而語言大模型,無非就是經語言“蒸餾”,得出來的一堆萬用模版,沒有知曉個人經歷的能力。
其三,與提問者的情緒相去甚遠。人與“人工智能”最大的不同,就是人有血有肉,特別是有各自變動不居的情感狀態。其實每年的生日,我自己的心態大致是下面這首詩描述的樣子:
漏 歲
(適逢誕辰嘆華年漸逝)
黃漸碧葉霜,鋪地滿離殤。
萬古長如是,何由人斷腸?
雖然問題多多,但人工智能技術一日千里,對於人類來説真的是件好事。
希望我們的各種大模型繼續好好打磨,爭取為人類發展作出更多貢獻!