OpenAI開放滿血版o1：推理成本暴降60%

连政脑子比手慢系列

2024-12-18

當地時間12月18日，OpenAI 開啓了第9天技術分享直播，正式宣佈將o1模型引入其API。雖然目前只面向部分開發者，但仍被稱為OpenAI連續直播這麼久以來“最有用的一天”。

面向開發者，已大幅降低思考成本

據悉，本次發佈的OpenAI模型o1取代了9月份發佈的預覽版o1-preview，它相對於此前模型，大大增強推理和糾錯功能。而完全版o1還支持函數調用、開發人員消息、結構化輸出和視覺功能。

12月18日，OpenAI在直播中演示o1模型對錶格中的錯誤進行糾正。

具體而言，o1相對於o1-preview，開發者們現在可以將其無縫連接到外部數據和API；同時，o1還能夠生成可靠遵守自定義JSON構架的響應；並可以指定模型要遵循的説明或上下文，如定義語氣、樣式和其他行為指導。此外，o1還可以對圖象進行推理，解鎖尤其是製造業、科學和編碼領域的應用前景。

由於擁有在輸出內容前自我核實糾錯的功能，推理模型一般都會需要更長的思考時間，因此價格也非常昂貴。然而相對於o1-preview，本次發佈的o1完整版，其思考成本大幅降低了60%。並且，新增的API參數“reasoning_effort”允許用户控制模型在回答問題前的思考時間。

不過，o1模型目前只面向API使用權限5級的開發者，這意味着想率先體驗o1，必須要滿足“在OpenAI的產品上花費至少1000美元”、“且付費後使用30天”等要求。

專業領域超越人類博士，已被專家警告

早在今年9月底，OpenAI發佈o1-preview和o1-mini時，就曾評估稱，o1在編程問題中能拿到89%百分位的成績，在美國數學奧林匹克資格賽中躋身前500名。而風險處理前的o1原始模型組在涉化學、生物、放射以及核（CBRN）武器等生物威脅上同樣表現“優秀”，達到了“中等”（medium）風險水平，全面超過了人類博士專家，準確率達到72%，而人類專家的得分僅為69.5%。

OpenAI還透露，他們要求6名生物威脅領域的專家通過一週時間中多輪對話體驗o1-preview涉化生放核風險內容，專家們都表示，o1在回答互聯網之外的問題時非常有用；甚至還有2人表示，o1可以幫助其獲取互聯網中找不到的信息。

OpenAI稱，安全風險評級一共分為“低、中、高和嚴重”四檔，模型經處理後評級在“中等”或以下才可以部署。

對此，人工神經網絡和深度學習專家約書亞·本吉奧（Yoshua Bengio）就表示，如果o1真的如同OpenAI所言達到了化生放核的“中等”風險水平，那麼進一步加強了全面出台“SB-1047法案”的重要性。該法案是此前加州為增強大模型安全、透明性、使用規範而擬定的條例，但因實施上存在一些問題（如犯罪分子利用大模型犯罪，開發商也會被處罰）最終被否決。

隨着人工智能推理能力的提升，就會出現被惡意濫用的風險，本吉奧警告稱“這尤其危險”。

本文系觀察者網獨家稿件，未經授權，不得轉載。