OpenAI開放滿血版o1:推理成本暴降60%
连政脑子比手慢系列

當地時間12月18日,OpenAI 開啓了第9天技術分享直播,正式宣佈將o1模型引入其API。雖然目前只面向部分開發者,但仍被稱為OpenAI連續直播這麼久以來“最有用的一天”。
面向開發者,已大幅降低思考成本
據悉,本次發佈的OpenAI模型o1取代了9月份發佈的預覽版o1-preview,它相對於此前模型,大大增強推理和糾錯功能。而完全版o1還支持函數調用、開發人員消息、結構化輸出和視覺功能。

12月18日,OpenAI在直播中演示o1模型對錶格中的錯誤進行糾正。
具體而言,o1相對於o1-preview,開發者們現在可以將其無縫連接到外部數據和API;同時,o1還能夠生成可靠遵守自定義JSON構架的響應;並可以指定模型要遵循的説明或上下文,如定義語氣、樣式和其他行為指導。此外,o1還可以對圖象進行推理,解鎖尤其是製造業、科學和編碼領域的應用前景。
由於擁有在輸出內容前自我核實糾錯的功能,推理模型一般都會需要更長的思考時間,因此價格也非常昂貴。然而相對於o1-preview,本次發佈的o1完整版,其思考成本大幅降低了60%。並且,新增的API參數“reasoning_effort”允許用户控制模型在回答問題前的思考時間。
不過,o1模型目前只面向API使用權限5級的開發者,這意味着想率先體驗o1,必須要滿足“在OpenAI的產品上花費至少1000美元”、“且付費後使用30天”等要求。
專業領域超越人類博士,已被專家警告
早在今年9月底,OpenAI發佈o1-preview和o1-mini時,就曾評估稱,o1在編程問題中能拿到89%百分位的成績,在美國數學奧林匹克資格賽中躋身前500名。而風險處理前的o1原始模型組在涉化學、生物、放射以及核(CBRN)武器等生物威脅上同樣表現“優秀”,達到了“中等”(medium)風險水平,全面超過了人類博士專家,準確率達到72%,而人類專家的得分僅為69.5%。
OpenAI還透露,他們要求6名生物威脅領域的專家通過一週時間中多輪對話體驗o1-preview涉化生放核風險內容,專家們都表示,o1在回答互聯網之外的問題時非常有用;甚至還有2人表示,o1可以幫助其獲取互聯網中找不到的信息。

OpenAI稱,安全風險評級一共分為“低、中、高和嚴重”四檔,模型經處理後評級在“中等”或以下才可以部署。
對此,人工神經網絡和深度學習專家約書亞·本吉奧(Yoshua Bengio)就表示,如果o1真的如同OpenAI所言達到了化生放核的“中等”風險水平,那麼進一步加強了全面出台“SB-1047法案”的重要性。該法案是此前加州為增強大模型安全、透明性、使用規範而擬定的條例,但因實施上存在一些問題(如犯罪分子利用大模型犯罪,開發商也會被處罰)最終被否決。
隨着人工智能推理能力的提升,就會出現被惡意濫用的風險,本吉奧警告稱“這尤其危險”。
本文系觀察者網獨家稿件,未經授權,不得轉載。