OpenAI的新推理模型令學術界和高管們感到興奮 - 彭博社
Shirin Ghaffary
智能手機上的ChatGPT標誌。
攝影師:安德烈·魯達科夫/彭博社OpenAI最新的模型以其解決更復雜問題的能力給學術界和商業領袖留下了深刻印象,儘管它仍然存在一些顯著的侷限性。但首先……
三件事需要知道:
• OpenAI聘請前Coursera高管來擴展AI在學校的使用• 紐瑟姆表示他對AI法案的“寒蟬效應”感到擔憂• 新的聊天機器人ETF承諾模仿沃倫·巴菲特,大衞·泰珀
使用AI的新理由
Derya Unutmaz最近與一個聊天機器人有了情感時刻。Unutmaz是一名免疫學家,自稱是AI的重度用户,他請OpenAI新發布的模型建議一種他長期以來一直在追求的關於T細胞療法治療腫瘤的研究方法。令他驚訝的是,AI系統提出了一種他之前沒有想到的新方法。
“你看到自己工作多年的東西,它提出了一些相對明顯的東西,”傑克遜實驗室的Unutmaz博士説。“我在想,‘好吧,我為什麼沒想到這一點?’”
上週,OpenAI開始推出一個名為o1的AI模型,旨在花更多時間計算答案——公司稱之為“思考”——然後再回應用户查詢。通過這種方法,OpenAI表示其工具應該能夠解決更復雜的多步驟問題,包括科學、數學和編碼方面的問題。
對於習慣於向ChatGPT詢問食譜或旅行信息的普通用户來説,這些差異可能並不立即顯現。但對於像Unutmaz這樣的學者來説,這些進展提供了一個承諾,可以在口袋裏擁有一個學術同行,幫助他們頭腦風暴解決方案。相比之下,他表示,GPT-4o,OpenAI的前一個模型,更像是“一個超級聰明的記憶者”。
著名數學家Terence Tao寫道他曾嘗試過o1,並發現它的反應水平相當於“一個平庸但並非完全無能”的研究生。這聽起來可能不是很高的讚譽,但Tao表示,經過幾次迭代,這個工具可能接近一個能夠在研究中“顯著有用”的合格研究生的水平。
OpenAI是包括谷歌和Anthropic在內的幾家AI公司之一,正在努力開發推理能力。目前,仍然存在明顯的限制。OpenAI的o1模型仍處於“預覽”模式,無法查找實時信息。(該模型的升級版本即將推出。)OpenAI還表示它“收到了軼事反饋”,稱o1的預覽版本比之前的模型更容易產生幻覺——或編造信息,儘管它自己的評估顯示出相反的趨勢。**另請閲讀:**OpenAI的新產品得到了前NSA首席的輸入還有延遲時間的問題。o1返回答案所需的時間明顯更長——在我的實驗中,通常多出幾秒——因為AI系統正在分步驟進行推理,有時還會找到多個問題的答案。這對於習慣於從聊天機器人獲得即時響應的用户來説,是一個顯著的延遲。
對於OpenAI及其競爭對手來説,賭注在於這些先進的AI系統最終將通過能夠處理更復雜的任務來引發顯著的商業需求。
Box的首席執行官Aaron Levie。攝影師:Michael Short/BloombergBox首席執行官Aaron Levie表示,他的雲存儲公司已經開始內部測試o1的性能。他看到它在處理更復雜的數學計算和文字問題方面具有巨大的潛在價值。
Levie表示,該軟件可能對使用AI來理解複雜商業文件的Box客户有所幫助。例如,Levie説,o1可能幫助客户確定一個有效的合同結束日期,該日期根據文件上最近簽名的日期而變化,而現有模型可能在這方面面臨困難。
“當我們回顧一年半前的AI與今天的AI時,我從未預測到這種變化的速度。這超出了我們最狂野的期望,”Levie説。“我認為這些模型將繼續變得更好、更便宜和更快。”
對AI有問題嗎? 給我發郵件, Shirin Ghaffary,我會在未來的新聞通訊中嘗試回答你的問題。
本週人類名言
“保護選舉的完整性對民主至關重要,我們必須確保AI不會被用於通過虛假信息破壞公眾的信任——尤其是在今天這個緊張的政治氣候中。”
加文·紐瑟姆
加利福尼亞州州長
紐瑟姆簽署了多項法案,限制本週早些時候使用人工智能進行政治深度偽造和重建表演者的數字形象。州長尚未對有爭議的人工智能安全法案SB 1047做出決定,該法案旨在限制先進人工智能系統的災難性風險。紐瑟姆表示,他仍在聽取雙方的論點。### 值得關注
凱瑟琳·科斯特列娃是Creatio的首席執行官,這是一種無代碼平台,利用人工智能的力量實現工作流和客户關係管理的自動化。該公司在夏季宣佈獲得2億美元的新融資,估值為12億美元。科斯特列娃將與卡羅琳·海德和埃德·盧德洛一起出現在“彭博科技”節目中。### 深度學習
- 薩姆·阿爾特曼離開了OpenAI董事會的安全與保障委員會
- 一位前谷歌高管的初創公司正在使用人工智能預測天氣
- 藉助人工智能,已故名人正在重新工作——並賺取數百萬
- 《華盛頓郵報》關注使用人工智能聊天機器人的隱藏環境成本
來自彭博社的更多信息
獲取每日科技以及更多彭博科技週刊到您的郵箱:
- 網絡簡報涵蓋黑客和網絡間諜活動的陰暗世界
- 遊戲進行中報道視頻遊戲行業
- 電力開啓獲取蘋果新聞、消費科技新聞等
- 屏幕時間前排觀看好萊塢與硅谷的碰撞
- 聲音片段報道播客、音樂產業和音頻趨勢