OpenAI推出GPT-4o mini,號稱“最具成本效益的小模型”
李亚丽

美東時間7月18日,OpenAI推出GPT-4o mini,並聲稱這是“最具成本效益的小型模型”。GPT-4o mini預計將通過讓智能變得更加實惠,顯著擴大使用AI構建的應用程序範圍。
據OpenAI發佈的消息,GPT-4o mini在MMLU(大規模多任務語言理解,衡量模型廣泛的世界知識和解決問題的能力)上的得分為82%,比另外兩款低成本競品更高——Google的Gemini Flash得分為77.9%,Anthropic的Claude Haiku得分為73.8%。目前,GPT-4o mini在LMSYS排行榜上的聊天偏好方面優於GPT-4.
GPT-4o mini已經在幾個關鍵基準上進行了評估,涉及文本和視覺的推理任務、數學推理和編碼任務、多模態推理,結果均優於其他小型模型。

各種評估基準下的模型評估分數OpenAI官方網站
GPT-4o mini還在API中支持文本和視覺功能,未來還將支持文本、圖像、視頻和音頻的輸入和輸出,並且擁有截至2023年10月的知識。得益於與GPT-4o共享的改進的tokenizer(編譯器),GPT-4o mini處理非英語文本方面也更具成本效益。
GPT-4o mini成本更低、延遲更低,能夠完成更多的任務,例如調用多個API(應用程序編程接口)、傳遞和記錄大量完整的代碼庫或對話記錄、更快速、實時地與使用者聊天等。
作為模型開發過程的一部分,OpenAI 已經與一些值得信賴的合作伙伴合作,以更好地瞭解GPT-4o mini的使用場景和侷限性。目前已與Ramp和超人等公司進行了合作,反饋發現在執行從收據文件中提取結構化數據或在提供線程歷史記錄時生成高質量電子郵件響應等任務時,GPT-4o mini的表現明顯優於GPT-3.5 Turbo。
考慮到價格因素,輕量化且廉價的“小而精”AI模型可能更受企業歡迎,小模型的相關開發競爭激烈。談及為何沒有更早地推出“小而精”的模型時,OpenAI的API產品負責人Olivier Godement説,“我們的使命是使用最前沿技術,構建最強大、最有用的應用程序,我們當然希望繼續做前沿模型,推動技術進步……但我們也希望擁有最好的小模型,我認為它會非常受歡迎。”
OpenAI稱,開發過程中的每一步都考慮了安全性。開發時會過濾掉仇恨言論、色情信息、個人隱私信息等不宜模型學習和輸出的內容,並採用自動和人工(超過70位來自社會心理學和錯誤信息等領域的外部專家)對模型進行了評估,以識別潛在風險。GPT-4o mini是第一個應用指令層次結構的模型,有助於提高模型抵抗越獄、即時注入和系統即時提取的能力,這使得模型的響應更加可靠,並有助於使其在大規模應用中更安全地使用。
自2022年推出功能較弱的模型text-davinci-003以來,GPT-4o mini的每token成本已下降99%。GPT-4o mini定價比之前的Frontier型號便宜一個數量級,比GPT-3.5Turbo便宜60%以上。在ChatGPT中,免費版、Plus版和團隊版用户已經能夠使用GPT-4o mini替代GPT-3.5,企業用户也將從下週開始使用。
本文系觀察者網獨家稿件,未經授權,不得轉載。