OpenAI推出新系列具備“推理”能力的AI模型 | 路透社
Katie Paul,Anna Tong
OpenAI 標誌在2024年5月20日的插圖中可見。路透社/Dado Ruvic/插圖/檔案照片9月12日(路透社) - 微軟支持的(MSFT.O) OpenAI 週四表示,它正在推出其“草莓”系列 AI 模型,旨在花更多時間處理查詢的答案,以解決難題。這些模型,首次由路透社報道,能夠推理複雜任務,並且能夠解決比以前的科學、編碼和數學模型更具挑戰性的問題,該 AI 公司在一篇博客文章中表示。OpenAI 在內部將代號“草莓”用於該項目,同時將週四宣佈的模型命名為 o1 和 o1-mini。該公司表示,o1 將從週四開始在 ChatGPT 及其 API 中提供。
OpenAI 的研究員 Noam Brown 專注於提高公司模型的推理能力,他在社交媒體平台 X 上的帖子中確認,這些模型與草莓項目是相同的。
“我很高興與大家分享我們在 OpenAI 的努力成果,創造出能夠進行真正一般推理的 AI 模型,”Brown 寫道。
在其博客文章中,OpenAI 表示,o1 模型在國際數學奧林匹克的資格考試中得分為 83%,而其之前的模型 GPT-4o 的得分為 13%。
該模型在競爭編程問題上的表現也有所提高,並在科學問題的基準測試中超越了人類博士級別的準確性,該公司表示。
布朗表示,這些模型能夠通過採用一種被稱為“鏈式思維”的推理技術來實現這些分數,該技術涉及將複雜問題分解為更小的邏輯步驟。
研究人員注意到,當這種方法作為提示技術使用時,AI模型在複雜問題上的表現往往會有所改善。OpenAI現在已經自動化了這一能力,使得模型能夠自主分解問題,而無需用户提示。
“我們訓練這些模型在回應之前花更多時間思考問題,類似於人類的思考方式。通過訓練,它們學會了完善自己的思維過程,嘗試不同的策略,並識別自己的錯誤,”OpenAI表示。
路透社是第一個報道OpenAI在推理項目上工作的媒體,當時稱為Q*,在2023年11月。它在7月報道該項目已被稱為草莓。通過“競選之路”通訊,獲取關於美國選舉的每週新聞和分析,以及這些對世界的影響。請在這裏註冊。