OpenAI重磅發佈全新AI模型o1，開啓AI“慢推理”時代_風聞

guan_17261977021874-1小时前

2024-09-13

大模型之家訊 9月13日，經過長達半年的研發，OpenAI正式發佈了其全新AI模型o1，標誌着人工智能領域邁入一個全新的時代。這一新模型的代號為“草莓”，但在正式亮相時，它被命名為“OpenAI o1”。OpenAI對此解釋道：“在複雜推理任務中，這是一項重大突破，代表了人工智能能力的新高度。因此，我們將計數器重置為1，並將這一系列命名為OpenAI o1。”

此次發佈的o1模型在推理能力和邏輯處理方面取得了顯著進展，以至於OpenAI決定摒棄沿用已久的GPT系列命名，開創了一個全新的“o系列”。業內人士紛紛感嘆，這一舉動不僅震撼了AI領域，更預示着AI行業正式進入了新的發展階段。

在各種高難度的測試中，o1的表現堪稱驚豔。在AIME 2024數學競賽中，o1預覽版的準確率高達56.7%，而正式版更是達到了83.3%，相比之下，GPT-4o的準確率僅為13.4%。此外，在代碼競賽中，o1正式版的準確率達到89%，遠超GPT-4o的11%。尤其是在博士級科學問題（GPQA Diamond）測試中，o1的表現達到了78%，不僅超過了GPT-4o的56.1%，還超越了人類專家水平的69.7%。

o1模型之所以能取得如此成就，核心在於其採用了Self-play RL（自我博弈強化學習）技術。這一技術使得o1能夠自我學習、反思並糾正錯誤，同時能夠將複雜問題分解為更易處理的步驟。當某個方法無法奏效時，o1還能夠嘗試不同的解決方案。這種能力類似於人類“慢思考”的思維模式，正如諾貝爾經濟學獎得主丹尼爾·卡尼曼在其著作《思考，快與慢》中所描述的那樣：慢思考是一種更為緩慢、邏輯性強且需要更高認知能力的思維方式，而這正是AI未來邁向AGI（通用人工智能）的關鍵一步。

藉助這些突破性的推理能力，o1在處理科學研究、代碼編寫、數學推導等複雜任務時展現出巨大的潛力。例如，o1可以為醫學研究人員註釋細胞測序數據，幫助物理學家生成複雜的量子光學公式，並輔助開發者構建多步驟工作流程。o1還具備數據飛輪效應，每個正確答案都可以形成一個包含正負獎勵的小型數據集，進一步加速模型的自我優化。

目前，OpenAI已開始逐步向ChatGPT Plus和Team用户開放o1模型，並提供了兩個版本：o1預覽版和o1-mini。o1-mini是一個更加輕便、速度更快且更具經濟效益的版本，特別適合處理數學和代碼等需要推理但不依賴廣泛世界知識的場景。

對於開發者而言，o1的API服務現階段僅向已支付超過1000美元的開發者開放，且每分鐘最多調用20次，顯示出這一新模型的高昂成本。API的定價為o1預覽版每百萬輸入15美元，輸出60美元，o1-mini的價格則相對便宜，輸入3美元，輸出12美元。不過，相較於GPT-4o，o1的推理能力和精度的飛躍，已經讓眾多開發者對未來的降價充滿期待。

o1的推出，不僅將推理能力提升到了新的高度，也預示着AI未來發展中，人類與智能機器之間的界限將越來越模糊。

首先，o1的推理能力大幅超越以往的模型，為解決複雜的科學研究、數學推導和代碼編寫等領域中的棘手問題提供了更強大的工具。

其次，o1通過引入類似人類“慢思考”的思維方式，顯著提升了AI在處理多步驟、邏輯性任務時的表現，這將推動AI應用從簡單的自動化處理擴展到高層次的認知推理。

在大模型之家看來，o1的成功標誌着人工智能正在邁向AGI的關鍵節點，意味着未來AI將能夠在更多專業領域中扮演重要角色，徹底改變傳統行業的工作流程與生產力。AI技術的不斷進化不僅將賦能各類產業，還可能引發新一輪的行業創新，促使更多企業加速擁抱智能化的未來。