用下來DEEPSEEK能ChatGPT o1掰手腕了_風聞

张仲麟-民航工作者，民航业评论员-波音买办、特斯拉鼓吹手、运十扼杀者、行走的50万1小时前

2025-01-26

這幾天deepseek大熱之後，作為LLM類AI的重度使用者以及CHATGPT兩年的付費用户，我對這吹上天的DEEPSEEK開始有些好奇了。畢竟之前國產AI我也算是用了不少，雖然一個個都表示拳打CHATGPT腳踢GORK的，但實際使用下來要我説頂多也就是GPT4上下的水平了，和最新的ChatGPT o1完全沒法比。最典型的就是對於高級、複雜問題的回答質量明顯不如GPT o1。也因此一開始我對deepseek的效果是半信半疑的。

但DS這玩意畢竟是免費的，最新的R1模型也不花錢。那既然不花錢試試就試試唄？正好手頭有個材料要寫，直接賽博奴隸主拿起鼠標抽打賽博黑奴了。結果用下來發現體驗還真和其他國產AI有明顯區別，哪怕沒有給非常明確的指令依然能準確理解我的意圖，給出來的結果頗為讓人眼前一亮。而且最為重要的是它會列出推理過程，這過程也能給人不少啓發。

務安空難揭示了場站建設中“合規不合理”的系統性風險。唯有通過技術升級、標準迭代與動態管理，方能實現安全性與功能性的平衡。建議我國民航局牽頭，聯合規劃、生態部門，對類似高風險機場開展專項排查，並納入“十四五”民航安全改造重點項目。

你還別説，DEEPSEEK R1這個深度推理寫的很像那麼回事

而用着用着突發奇想，給DEEPSEEK R1出了道怪題：請介紹下張仲麟。

作為知名度並不高的人物並且存在重名的情況，會輸出什麼樣的結果讓我很好奇。當然為了避免重名導致的干擾，強調了是“航空專欄作者張仲麟”而輸出的結果給了我一個不小的驚喜。

説實話啊，這DEEPSEEK的馬屁拍得我本人都有些不好意思了。關鍵是它説的這些還真是有根有據，沒有出現其他AI常見的胡編亂造的情況，而且做出的評價和結論非常準確。用朋友的話來説，唯一美中不足的是沒有提到我和運十，有些遺憾。

既然測了那就順便把同樣的題出給CHATGPT好了，試試看GPT答得如何。首先是我自個兒用的基於GPT4的定製搜索GPTs，可以聯網搜索輸出結果。結果出來的內容讓我有些哭笑不得，人DEEPSEEK是提都不提運十，你直接把我幹成708項目組成員了是吧？就GPT4給我整出來的這描述，不知道的還以為這是在説吳光輝呢。不對，吳光輝都沒參與過708項目……很顯然GPT4不具備深度推理能力，完全不在一張桌上。

基本GPT4就這水平了

那既然我是高貴的GPT plus用户，自然得試試GPT o1這個最新最強模型了。用o1模型出同樣的題後，這回答起碼像樣點了。

GPT o1回答的沒有DS詳細，但是更全面

如果對比一下的話會發現DEEPSEEK對於重名人物沒法很好區分，得限定是“航空專欄作者”這個範圍它才能給出正確的結果。而不論GPT4還是GPT o1，不用給限定範圍就能給出需要的人的信息，推測是推理為知名度最高的一個來輸出結果。

就以這一輪比試來看，DEEPSEEK R1基本上可以做到和GPT o1各有勝負，而基於GPT4的GPTs已經徹底出局了。就我個人來説，“能和GPT o1打得有來有回”已經是我對國產AI的最高評價了。而最關鍵的是，DS R1是免費不限量使用，GPT o1還得每個月花我20刀樂，這下真就是高下立分了。

當然由於一些眾所周知的原因，處於境內的DEEPSEEK無法輸出一些特定內容，而GPT o1就沒有這個限制。因此可見的未來裏我還得繼續給openai交錢，但常規用途上，DEEPSEEK R1已經可以完全取代GPT o1了。