OpenAI發佈o1模型，具備推理能力 - 彭博社

Rachel Metz

2024-09-13

在智能手機上代表OpenAI的一個符號。

攝影師：安德烈·魯達科夫/彭博社OpenAI正在發佈一個新的人工智能模型，內部稱為“草莓”，它可以執行一些類人推理任務，因為它希望在競爭激烈的市場中保持領先。新模型名為o1，旨在在回應用户查詢之前花更多時間計算答案，該公司在一篇博客文章中表示。通過該模型，OpenAI的工具應該能夠解決多步驟問題，包括複雜的數學和編碼問題。“作為一個早期模型，它還沒有許多使ChatGPT有用的功能，比如瀏覽網絡獲取信息和上傳文件和圖像，”該公司表示。“但對於複雜的推理任務，這是一個重要的進步，代表了人工智能能力的新水平。鑑於此，我們將計數器重置為1，並將這一系列命名為OpenAI o1。”該模型的預覽版本將於週四通過OpenAI的熱門聊天機器人ChatGPT向付費Plus和Team用户提供。彭博社此前報道，該公司可能會在本週儘快發佈新模型。該模型的發佈恰逢總部位於舊金山的OpenAI正在尋求數十億美元的資金，並面臨在開發越來越複雜的人工智能系統的競爭中加劇的競爭。OpenAI並不是唯一一家致力於此類能力的公司；競爭對手Anthropic和谷歌也宣傳其先進AI模型的“推理”技能。在其博客文章中，OpenAI給出了AI模型對包括編碼、英語和數學等主題問題的回答示例，並要求它解決一個簡單的填字遊戲。在一系列X上的帖子中，OpenAI的研究科學家諾亞·布朗表示，該公司現在發佈該模型的預覽部分是為了瞭解人們如何使用它，以及需要改進的地方。

使用OpenAI更新的AI系統的體驗將與人們對該公司的聊天機器人ChatGPT的期望有所不同。在回應用户的提示之前，新軟件會暫停幾秒鐘，同時在後台（用户看不見的地方）考慮多個相關提示，然後總結出看似最佳的回應。這種技術有時被稱為“思維鏈”提示。OpenAI一直在努力讓計算機執行多步驟的操作。例如，在2023年5月，該公司發佈了一篇博客文章及其附帶的研究論文，介紹其改善AI系統解決數學問題能力的努力。根據論文，該公司通過獎勵模型在解決問題過程中每一步的正確性來訓練模型，而不僅僅是通過獎勵生成準確答案來進行訓練。