OpenAI發佈針對編程與視覺任務的新推理模型 - 彭博社

Rachel Metz

2025-04-17

OpenAI於2022年底推出ChatGPT引發生成式AI熱潮，該產品最初由GPT-3.5模型驅動。

攝影師：安德烈·魯達科夫/彭博社OpenAI正在推出兩款新型人工智能模型，通過模擬人類推理過程來處理更復雜的編程問題與視覺任務，這是該公司為抵禦中美市場新競爭而密集發佈的最新成果。

週三公司宣佈，首個名為o3的模型會在響應用户指令前進行更長時間的計算，旨在解決涉及科學、數學和編程的複雜多步驟問題。同期發佈的o4-mini模型在同類任務中表現優異，但設計更為輕量化。兩款模型現已面向付費用户開放。

OpenAI表示o3和o4-mini是其首批能調用ChatGPT全系列工具（包括網頁瀏覽、圖像生成與分析）的推理模型，也是首個將視覺信息整合到推理流程的系統，可處理模糊圖像並在執行任務時實現照片旋轉與縮放。

自2022年底以GPT-3.5驅動的ChatGPT引爆生成式AI狂潮以來，OpenAI已陸續發佈包括多款推理模型在內的進階系統。但該公司正面臨來自中國新鋭DeepSeek、Anthropic及馬斯克旗下xAI的持續壓力，這些競爭者接連推出具備同類尖端能力的AI模型。

編程，尤其是生成式AI快速崛起的應用領域——也成為了OpenAI的關鍵戰場。Anthropic和Alphabet旗下的谷歌都大力宣傳了其新一代AI系統的編程能力。其他初創公司，如Cursor製造商Anysphere，也憑藉面向程序員的AI工具獲得了關注。

為了在這個競爭激烈的市場中更好地競爭，OpenAI宣佈發佈Codex CLI，這是一款旨在與o3等模型配合使用、幫助人們完成編碼任務的AI代理。該產品是開源的，意味着用户可以免費使用。它還能直接在用户電腦上運行，通過設備的終端軟件進行操作。

OpenAI首席執行官薩姆·奧爾特曼此前表示，在DeepSeek的開源系統R1取得病毒式成功後，公司正在開發一款開源推理模型，將在未來幾個月內發佈。奧爾特曼還提到，OpenAI將在"幾個月內"發佈備受期待的GPT-5新模型。