OpenAI發佈o1模型,具備推理能力 - 彭博社
Rachel Metz
在智能手機上代表OpenAI的一個符號。
攝影師:安德烈·魯達科夫/彭博社OpenAI正在發佈一個新的人工智能模型,內部稱為“草莓”,它可以執行一些類人推理任務,因為它希望在競爭激烈的市場中保持領先。新模型名為o1,旨在在回應用户查詢之前花更多時間計算答案,該公司在一篇博客文章中表示。通過該模型,OpenAI的工具應該能夠解決多步驟問題,包括複雜的數學和編碼問題。“作為一個早期模型,它還沒有許多使ChatGPT有用的功能,比如瀏覽網絡獲取信息和上傳文件和圖像,”該公司表示。“但對於複雜的推理任務,這是一個重要的進步,代表了人工智能能力的新水平。鑑於此,我們將計數器重置為1,並將這一系列命名為OpenAI o1。”該模型的預覽版本將於週四通過OpenAI的熱門聊天機器人ChatGPT向付費Plus和Team用户提供。彭博社此前報道,該公司可能會在本週儘快發佈新模型。該模型的發佈恰逢總部位於舊金山的OpenAI正在尋求數十億美元的資金,並面臨在開發越來越複雜的人工智能系統的競爭中加劇的競爭。OpenAI並不是唯一一家致力於此類能力的公司;競爭對手Anthropic和谷歌也宣傳其先進AI模型的“推理”技能。在其博客文章中,OpenAI給出了AI模型對包括編碼、英語和數學等主題問題的回答示例,並要求它解決一個簡單的填字遊戲。在一系列X上的帖子中,OpenAI的研究科學家諾亞·布朗表示,該公司現在發佈該模型的預覽部分是為了瞭解人們如何使用它,以及需要改進的地方。
使用OpenAI更新的AI系統的體驗將與人們對該公司的聊天機器人ChatGPT的期望有所不同。在回應用户的提示之前,新軟件會暫停幾秒鐘,同時在後台(用户看不見的地方)考慮多個相關提示,然後總結出看似最佳的回應。這種技術有時被稱為“思維鏈”提示。OpenAI一直在努力讓計算機執行多步驟的操作。例如,在2023年5月,該公司發佈了一篇 博客文章及其附帶的 研究論文,介紹其改善AI系統解決數學問題能力的努力。根據論文,該公司通過獎勵模型在解決問題過程中每一步的正確性來訓練模型,而不僅僅是通過獎勵生成準確答案來進行訓練。