OpenAI重磅發佈全新AI模型o1,開啓AI“慢推理”時代_風聞
guan_17261977021874-1小时前
大模型之家訊 9月13日,經過長達半年的研發,OpenAI正式發佈了其全新AI模型o1,標誌着人工智能領域邁入一個全新的時代。這一新模型的代號為“草莓”,但在正式亮相時,它被命名為“OpenAI o1”。OpenAI對此解釋道:“在複雜推理任務中,這是一項重大突破,代表了人工智能能力的新高度。因此,我們將計數器重置為1,並將這一系列命名為OpenAI o1。”

此次發佈的o1模型在推理能力和邏輯處理方面取得了顯著進展,以至於OpenAI決定摒棄沿用已久的GPT系列命名,開創了一個全新的“o系列”。業內人士紛紛感嘆,這一舉動不僅震撼了AI領域,更預示着AI行業正式進入了新的發展階段。

在各種高難度的測試中,o1的表現堪稱驚豔。在AIME 2024數學競賽中,o1預覽版的準確率高達56.7%,而正式版更是達到了83.3%,相比之下,GPT-4o的準確率僅為13.4%。此外,在代碼競賽中,o1正式版的準確率達到89%,遠超GPT-4o的11%。尤其是在博士級科學問題(GPQA Diamond)測試中,o1的表現達到了78%,不僅超過了GPT-4o的56.1%,還超越了人類專家水平的69.7%。

o1模型之所以能取得如此成就,核心在於其採用了Self-play RL(自我博弈強化學習)技術。這一技術使得o1能夠自我學習、反思並糾正錯誤,同時能夠將複雜問題分解為更易處理的步驟。當某個方法無法奏效時,o1還能夠嘗試不同的解決方案。這種能力類似於人類“慢思考”的思維模式,正如諾貝爾經濟學獎得主丹尼爾·卡尼曼在其著作《思考,快與慢》中所描述的那樣:慢思考是一種更為緩慢、邏輯性強且需要更高認知能力的思維方式,而這正是AI未來邁向AGI(通用人工智能)的關鍵一步。

藉助這些突破性的推理能力,o1在處理科學研究、代碼編寫、數學推導等複雜任務時展現出巨大的潛力。例如,o1可以為醫學研究人員註釋細胞測序數據,幫助物理學家生成複雜的量子光學公式,並輔助開發者構建多步驟工作流程。o1還具備數據飛輪效應,每個正確答案都可以形成一個包含正負獎勵的小型數據集,進一步加速模型的自我優化。
目前,OpenAI已開始逐步向ChatGPT Plus和Team用户開放o1模型,並提供了兩個版本:o1預覽版和o1-mini。o1-mini是一個更加輕便、速度更快且更具經濟效益的版本,特別適合處理數學和代碼等需要推理但不依賴廣泛世界知識的場景。
對於開發者而言,o1的API服務現階段僅向已支付超過1000美元的開發者開放,且每分鐘最多調用20次,顯示出這一新模型的高昂成本。API的定價為o1預覽版每百萬輸入15美元,輸出60美元,o1-mini的價格則相對便宜,輸入3美元,輸出12美元。不過,相較於GPT-4o,o1的推理能力和精度的飛躍,已經讓眾多開發者對未來的降價充滿期待。
o1的推出,不僅將推理能力提升到了新的高度,也預示着AI未來發展中,人類與智能機器之間的界限將越來越模糊。
首先,o1的推理能力大幅超越以往的模型,為解決複雜的科學研究、數學推導和代碼編寫等領域中的棘手問題提供了更強大的工具。
其次,o1通過引入類似人類“慢思考”的思維方式,顯著提升了AI在處理多步驟、邏輯性任務時的表現,這將推動AI應用從簡單的自動化處理擴展到高層次的認知推理。
在大模型之家看來,o1的成功標誌着人工智能正在邁向AGI的關鍵節點,意味着未來AI將能夠在更多專業領域中扮演重要角色,徹底改變傳統行業的工作流程與生產力。AI技術的不斷進化不僅將賦能各類產業,還可能引發新一輪的行業創新,促使更多企業加速擁抱智能化的未來。