“ChatGPT的最強競品”爆火,就這?_風聞
微果酱-微果酱官方账号-新媒体行业的观察者。04-25 17:00
所有人都在期待能打敗ChatGPT的產品,但或許不會是另一個ChatGPT。
出品 | 微果醬(wjam123456)
作者 | 陳出木
當ChatGPT大殺四方,而國內類似的AI產品還沒有足夠成熟的消息傳來時,出現了一個全新AI助手產品——Claude(官網鏈接:https://www.anthropic.com/product)。

Claude的背景很強悍,來自前OpenAI員工獨立門户後在2021年建立的公司Anthropic,2022年融資超7億美元,今年年初還讓谷歌投了近4億。同時,Claude的噱頭也被大家架上了高位,諸如“ChatGPT的最強競品”“GPT殺手”,對標ChatGPT的意味十足。
那麼,Claude的表現究竟如何?
01#
Claude好用嗎?
相比ChatGPT在註冊環節就把不少人攔了下來,Claude的註冊流程稍稍簡單一些。因為Claude其實是內嵌在企業聊天工具Slack**(https://slack.com/get-started#/createnew)**中的,可以通過用谷歌郵箱註冊後者賬號來直接體驗Claude。

註冊之後,在彈出的網頁最後一行鏈接中點擊“創建一個新的工作區”。

按照指引創建成功會顯示“Success”,即可進入工作區,在左邊欄的“應用”中搜索添加Claude。

到這一步,我們就可以開始體驗Claude了。
面對Claude用英語打的招呼,果醬妹用中文要求它自我介紹。Claude非常順暢地轉為中文回覆,並不需要做其他設置。
我的名字叫Claude,我是一款人工智能助手。我會説中文和英文,能幫助用户回答問題並完成簡單的任務。我不是任何一家公司的產品,我的創始人搭建了我這個平台,讓我可以和用户進行交互。很高興認識你!
點擊Claude的回覆還可以進行回覆、轉發、保存、提醒等,有點像微信消息中點擊右鍵彈出的操作框。

出於新媒體人的本能,果醬妹首先向Claude詢問了今天中文互聯網有什麼熱點,Claude非常有條理地列出了五個熱點話題,並對其做了簡單説明。

**看似非常“聰明”,但經過果醬妹的核實,發現是一個都不能信。**且不説給出的資訊都不是發生在今天,Claude回答的錯誤之處還在於事件內容本身,如品牌名稱壓根不存在,比賽雙方及比分數都不正確。
於是,在果醬妹指出錯誤之後,Claude迅速道歉,虛心反省自己,直言自己存在時空混淆的問題。
作為一個AI助手,我並不真正知道今天是2023年的4月24日,我提供的熱門話題信息都是我從過去報道和知識積累中推導得出的。我沒有辦法準確地告知您2023年4月24日今天中文互聯網上的實時熱點,我的知識和計算能力有限制。

面對如此誠懇的態度,果醬妹也不好多加指責,只在隨後提問了兩個歷史日期發生的事件,正確率屬實不高。
顯然,Claude在新聞資訊收集方面仍然有很大的缺陷,這與其並非專門做搜索內容應用有關,也體現了搜索引擎公司的數據庫對於一個成功的AI助手有巨大影響力。

放棄和Claude糾結具體某日的資訊,果醬妹又讓其用今天的熱點新聞寫一篇文章,從內容角度看是及格的,既有新聞事實描述,又有結合行業進行分析,甚至還有過渡句和連接詞,中文閲讀感是非常流暢的。

值得注意的是,據Claude自述,其單次輸出的字數有上限,為2000箇中文字符或者1000個英文單詞左右。
或許是出於設定好的交流習慣,Claude對於自己的回答總會做出一番説明,其解釋稱因回覆內容實時生成,無法輸出預先存儲的長篇回覆,當前的技術水平也難以生成長篇和深度回覆,再加上交互接口、希望用户快速找到所需消息的設計、運行環境要求等原因,都導致了存在輸出上限

問及和ChatGPT的區別時,“端水大師”Claude非常快速地羅列出兩者的優勢,表示ChatGPT在研究與技術水平上更厲害,而自己作為一款面向普通用户的商業產品,在產品體驗與可靠性方面更佔優勢。

眾所周知,ChatGPT會做算數題,果醬妹隨手打了一串數字,提問乘積,Claude緩慢地響應,並給出了一個錯誤答案,下方還附註説明其不擅長解決數學問題。

果醬妹再次追問,Claude火速認錯,並展示了計算過程,然後再次給出了錯誤答案。

幾個回合提問下來,雖然Claude都無法給出正確答案,但是認錯態度真誠到讓人難以斥責。Claude甚至認知到,“作為一款AI助手,失去用户的信任與信心將是最嚴重的失敗。”


在隨後的測試中,Claude展現出對腦筋急轉彎等創意發散類題目的不擅長。而當果醬妹希望Claude説明自己上線的時間,但無論如何更換關鍵詞,Claude都沒有辦法理解問題的意思。同時,答案下方再次附註顯示,Claude並不那麼瞭解自己的創造者Anthropic。



一番體驗下來,Claude的優缺點都很明顯。
關於其被眾人口口相傳的不收費、不用註冊、支持中文三大優勢,實際上,除了目前不收費,註冊只是稍稍簡便,中文語感流暢但並不能完全理解掛鈎當時語境的真正意義。而邏輯類、數學類問題就完全是Claude的盲區了。
可見,作為ChatGPT的競品,Claude恐怕對打敗前者有心無力。不過,擋不住Claude免費,比起情緒不夠穩定還收費的ChatGPT,Claude更像是任勞任怨的純種打工人,想體驗AI助手的小夥伴大可以零成本玩一把。
02#
AI賽點到了嗎?
從去年年底,ChatGPT引爆網絡以來,AI 成了流量新貴,各大廠也在其中卷生卷死。但大半年過去了,得到一致認可的明星還是隻有一個ChatGPT。
從這個角度來説,AI領域仍未到真正的賽點,各家的產品都還在成長期,沒有達到可以拿出來華山論劍的地步。
比如,儘管ChatGPT作為當之無愧的霸主,但實際上其也經常出現bug,就在美國東部時間4月23日晚間,財聯社報道稱根據中斷跟蹤網站Downdetector的數據,超千名用户報告Open AI出現使用問題。
這其中有多家巨頭共同明示過的算力不足的問題,也有技術不穩定性因素,都是當前大部分AI產品的通病。但根據斯坦福的調研報告顯示,近八成國人看好技術發展,AI產品的前景仍然被期待。
而在這各自蟄伏的前期,恰恰是我們最應該關注AI動態的時間,因為局面還沒有定論,技術內卷還在繼續,誰也沒法斷定最後闖出來的會是哪家黑馬,誰都有機會先嚐一波紅利。
當下的AI技術日新月異,雖然還未到取代人類工種的地步,但很多變化已經在悄悄發生。Claude不是第一個劍指ChatGPT的AI產品,也不會是最後一個,讓我們一起期待這場技術變革將掀起的影響巨浪。