OpenAI推出新系列具備“推理”能力的AI模型 | 路透社

Katie Paul,Anna Tong

2024-09-13

OpenAI 標誌在2024年5月20日的插圖中可見。路透社/Dado Ruvic/插圖/檔案照片9月12日（路透社） - 微軟支持的(MSFT.O) OpenAI 週四表示，它正在推出其“草莓”系列 AI 模型，旨在花更多時間處理查詢的答案，以解決難題。這些模型，首次由路透社報道，能夠推理複雜任務，並且能夠解決比以前的科學、編碼和數學模型更具挑戰性的問題，該 AI 公司在一篇博客文章中表示。OpenAI 在內部將代號“草莓”用於該項目，同時將週四宣佈的模型命名為 o1 和 o1-mini。該公司表示，o1 將從週四開始在 ChatGPT 及其 API 中提供。

OpenAI 的研究員 Noam Brown 專注於提高公司模型的推理能力，他在社交媒體平台 X 上的帖子中確認，這些模型與草莓項目是相同的。

“我很高興與大家分享我們在 OpenAI 的努力成果，創造出能夠進行真正一般推理的 AI 模型，”Brown 寫道。

在其博客文章中，OpenAI 表示，o1 模型在國際數學奧林匹克的資格考試中得分為 83%，而其之前的模型 GPT-4o 的得分為 13%。

該模型在競爭編程問題上的表現也有所提高，並在科學問題的基準測試中超越了人類博士級別的準確性，該公司表示。

布朗表示，這些模型能夠通過採用一種被稱為“鏈式思維”的推理技術來實現這些分數，該技術涉及將複雜問題分解為更小的邏輯步驟。

研究人員注意到，當這種方法作為提示技術使用時，AI模型在複雜問題上的表現往往會有所改善。OpenAI現在已經自動化了這一能力，使得模型能夠自主分解問題，而無需用户提示。

“我們訓練這些模型在回應之前花更多時間思考問題，類似於人類的思考方式。通過訓練，它們學會了完善自己的思維過程，嘗試不同的策略，並識別自己的錯誤，”OpenAI表示。

路透社是第一個報道OpenAI在推理項目上工作的媒體，當時稱為Q*，在2023年11月。它在7月報道該項目已被稱為草莓。通過“競選之路”通訊，獲取關於美國選舉的每週新聞和分析，以及這些對世界的影響。請在這裏註冊。