OpenAI發佈針對編程與視覺任務的新推理模型 - 彭博社
Rachel Metz
OpenAI於2022年底推出ChatGPT引發生成式AI熱潮,該產品最初由GPT-3.5模型驅動。
攝影師:安德烈·魯達科夫/彭博社OpenAI正在推出兩款新型人工智能模型,通過模擬人類推理過程來處理更復雜的編程問題與視覺任務,這是該公司為抵禦中美市場新競爭而密集發佈的最新成果。
週三公司宣佈,首個名為o3的模型會在響應用户指令前進行更長時間的計算,旨在解決涉及科學、數學和編程的複雜多步驟問題。同期發佈的o4-mini模型在同類任務中表現優異,但設計更為輕量化。兩款模型現已面向付費用户開放。
OpenAI表示o3和o4-mini是其首批能調用ChatGPT全系列工具(包括網頁瀏覽、圖像生成與分析)的推理模型,也是首個將視覺信息整合到推理流程的系統,可處理模糊圖像並在執行任務時實現照片旋轉與縮放。
自2022年底以GPT-3.5驅動的ChatGPT引爆生成式AI狂潮以來,OpenAI已陸續發佈包括多款推理模型在內的進階系統。但該公司正面臨來自中國新鋭DeepSeek、Anthropic及馬斯克旗下xAI的持續壓力,這些競爭者接連推出具備同類尖端能力的AI模型。
編程,尤其是生成式AI快速崛起的應用領域——也成為了OpenAI的關鍵戰場。Anthropic和Alphabet旗下的谷歌都大力宣傳了其新一代AI系統的編程能力。其他初創公司,如Cursor製造商Anysphere,也憑藉面向程序員的AI工具獲得了關注。
為了在這個競爭激烈的市場中更好地競爭,OpenAI宣佈發佈Codex CLI,這是一款旨在與o3等模型配合使用、幫助人們完成編碼任務的AI代理。該產品是開源的,意味着用户可以免費使用。它還能直接在用户電腦上運行,通過設備的終端軟件進行操作。
OpenAI首席執行官薩姆·奧爾特曼此前表示,在DeepSeek的開源系統R1取得病毒式成功後,公司正在開發一款開源推理模型,將在未來幾個月內發佈。奧爾特曼還提到,OpenAI將在"幾個月內"發佈備受期待的GPT-5新模型。