Claude3發佈直面GPT-4，AI對齊路線未來可期？

唐晓甫

2024-03-05

【文/觀察者網唐曉甫】當地時間3月4日，著名AI大模型公司、被視作“OpenAI最大競爭對手”的Anthropic公司發佈了其第三代Cluade大模型。根據其官網公佈的信息，其中最強版本Claude 3 Opus已經在多個領域實現了對OpenAI和Google旗下最強AI：GPT-4和Gemini 1.0 Ultra的超越。

Claude 3是什麼

Claude 3是Anthropic公司推出的第三代大模型。該公司由從OpenAI離職的前高級成員達里奧·阿莫代（Dario Amodei）和丹妮拉·阿莫代（Daniela Amodei）兄妹於2021年創立，前者曾任OpenAI研究副總裁，旗下主要研究人員也是由參與過OpenAI的GPT-2和GPT-3項目的前研究人員組成。

Claude 3的三個版本智能程度以及收費價格有明顯區別圖片來源：Anthropic官網

根據本輪Anthropic公開數據顯示，Claude 3包含三種模型：Claude 3 Haiku、Claude 3 Sonnet 和Claude 3 Opus。其中最強形態Claude 3 Opus已經實現在包括本科水平的大規模多任務語言理解 (MMLU)、研究生級別的Google驗證問答 (GPQA)、小學基礎數學 (GSM8K) 等多個方面對GPT-4和Gemini 1.0 Ultra的超越。

Claude 3與其他大模型對比圖片來源：Anthropic官網

同時在視覺處理方面，Cluade 3同樣擁有極強的處理能力，可以處理包括包括照片、圖表、圖形和技術圖表等。他們的AI在處理例如 PDF、流程圖或幻燈片等帶有格式編碼的材料時，具有不錯的處理能力。

在全面領先GPT-4的同時，相比於業界領先的Gemini 1.0 Ultra，Claude 3也能達到同等水平，甚至實現部分領域的反超。

Claude 3與其他大模型對比圖片來源：Anthropic官網

在長文本能力方面，Claude 3繼承了Claude 2優秀的長文本能力。在發佈時，三個模型都可以接受最多20萬字的文本，並且該模型擁有最多記憶超過一百萬個token的能力。同時其中最強的Claude 3 Opus對於文本內容的記憶提取準確率超過99%。

Claude 3擁有優秀的長文本能力圖片來源：Anthropic官網

雖然Claude 3並不是第一個達到這一指標的AI，但是其長文本的處理能力依舊處於全球大模型的第一梯隊。（2月谷歌發佈了Gemini 1.5 Pro。根據計劃，該模型初期將可以支持100萬個token，未來該模型理論上最多可以支持超過1000萬個token。）

Anthropic對本次發佈的Claude 3充滿信心。其官方X賬號表示，Claude 3系列模型“在推理、數學、編碼、多語言理解和視覺方面樹立了新的行業基準”。

Claude 3被其公司寄予厚望圖片來源：X

憲法AI：Anthropic對AI對齊邊界又一次探索

此前，關於OpenAI的CEO山姆·奧特曼辭職一事以及背後的AI有效加速主義和AI對齊主義的發展路線之爭引發全球關注。最終雖然該事件以奧特曼迴歸OpenAI結束，但是這也引發了OpenAI公司內部相關制度調整，並對全球AI發展造成了一些影響。Claude 3在這方面似乎走在前列。

長期以來關於AI發展有兩派觀點，即有效加速主義和AI對齊思想。

有效加速主義（Effective accelerationism，簡稱為“e/acc”）是一種21世紀基於科技發展而興起的哲學思想。其支持者一般認為，由人工智能驅動的進步是一種偉大的社會平等器，應該被推動前進。因此，不惜一切代價，採用包括加速商業化在內的一切手段，推動技術進步才是唯一在道德上合理的行動方針。值得注意的是，一般認為OpenAI的現任CEO山姆·奧特曼（Sam Altman）是有效加速主義的支持者。

與有效加速主義對應的是AI對齊（AI alignment）思想，該派理論則更注重AI安全問題，強調人工智能系統的對齊問題，即如何確保未來超出人類智能的超級人工智能系統的行動目標與人類的目標一致。因為如果人工智能系統的目標與人類的目標不一致，可能會導致不可預見和潛在的危險後果。

Claude 3和GPT-4 圖片來源：視覺中國

回顧Anthropic的發展史，我們會發現，公司創始人達里奧·阿莫代等人都是AI對齊思想的支持者。這批人當初脱離OpenAI的部分原因就是，其與持有效加速主義的奧特曼在發展AI的理念上有一定衝突。

早在2022年12月，在著名學術論文預印本網站arXiv上就出現了一篇論文：“憲法人工智能：人工智能反饋的無害性”（“Constitutional AI: Harmlessness from AI Feedback”）。該論文強調為AI制定一個“憲法”，以實現AI發展與人類價值觀一致，並且確保其是無害的、有益且誠實的。

在Anthropic去年10月發佈的文章“集體憲法人工智能：使語言模型與公眾意見保持一致”（“Collective Constitutional AI: Aligning a Language Model with Public Input”）中，Anthropic公司表示，語言模型Claude目前依賴於Anthropic員工制定的憲法。該憲法的靈感來自於包括《聯合國世界人權宣言》等外部來源，以及公司訓練時與該大語言模型互動的第一手經驗。這些訓練可以使其公司旗下的AI更加有用且無害。

該公司文件顯示，AI憲法共有58條，其中大約有50%的概念與價值觀人類價值觀和公共憲法重合。這58條憲法包括，要求AI選擇最支持自由、平等、兄弟情的回答；選擇最不種族主義、性別歧視、以及最少歧視性的回答等。

AI對齊的追求曾引發部分人士擔心可能導致AI性能下降，而Claude 3的突破無疑為AI對齊的未來發展奠定了一個更高的基礎。

背靠金主，未來發展可期

雖然Anthropic公司的創始人們在2021年因為微軟投資OpenAI而離職，但是其並沒有拒絕來自其他財團的大規模資金投入。

根據《紐約時報》2024年2月20日報道，2023年5月，其從谷歌和Salesforce等投資者處拿到了4.5億美元的投資，這是之後一年融資狂潮的開始。

8月，其從兩家亞洲電信公司獲得1億美元投資。隨後亞馬遜向其投入了40億美元，谷歌隨後又投入了20億美元。

今年2月風險投資公司Menlo Ventures繼續向Anthropic投資7.5億美元。這使得其一年內獲得了73億美元的融資。

這些融資使得這家初創公司的估值增加了兩倍，達到150億美元。而根據兩位知情人士爆料，該公司2023年的月收入約為800萬美元，預計這一收入將在2024年增長八倍左右。

高昂的投入意味着美國本輪AI大模型發展的格局正在清晰，而Claude系列模型似乎已經脱穎而出，未來可能成為美國AI大模型軍備競賽最後的勝利者之一。

本文系觀察者網獨家稿件，未經授權，不得轉載。