人工智能:為何AI在數學金牌上的勝利至關重要 | 路透社
Krystal Hu
2017年6月7日,瑞士日內瓦國際電信聯盟(ITU)舉辦的"AI向善"全球峯會上,屏幕投影的插圖顯示一隻機械手與人類的手正相互靠近。路透社/Denis Balibouse7月24日(路透社) - 本文原載於每週三發佈的《人工智能通訊》。點擊此處註冊瞭解AI與科技領域最新突破。在路透社Momentum人工智能大會(新窗口打開)上,上週硅谷的《財富》500強高管們反覆提及兩個短語:“人在迴路"和"扁平即新增長”。通過路透社《人工智能通訊》瞭解AI與科技領域最新突破。立即註冊
這反映出謹慎而雄心勃勃的戰略:儘管幾乎所有企業仍讓人工與AI協同工作,但早期成效已表明企業正在不增加人力的情況下實現收入增長。
廣告·繼續滾動變化何在?企業內部的勞動本質。首輪裁員已衝擊外包勞動力。員工正轉向更高價值的工作,例如處理複雜任務和審核AI輸出。人均收入正在上升,或如某些人所説:“人員編制持平即是新增長”。
儘管有觀點認為2025年將成為AI智能體元年,但真正自主的工作流在複雜應用場景中似乎仍遙不可及。事實上,部分高管仍將AI模型視為模式匹配工具而非真正的推理引擎。
在與谷歌和OpenAI研究人員交流後(這兩家實驗室剛在今年國際數學奧林匹克競賽中斬獲金牌),我發現他們的看法截然不同。相信這是AI模型正在推進的推理範式發展中一個激動人心的里程碑。向下滾動了解其重要意義。
廣告·繼續閲讀歡迎通過郵件[email protected](新標籤頁打開)或領英(新標籤頁打開)聯繫我分享反饋意見,以及您想了解的AI領域下期選題。科技與AI領域最新報道
獨家-黑石集團退出TikTok美國業務競購白宮將公佈推動美國AI出海計劃,收緊本土AI監管特朗普政府尋求美國企業出口AI芯片的合規路徑英偉達CEO中國魅力攻勢凸顯其關鍵市場巨星地位歐盟AI監管新規為存在系統性風險的AI模型提供合規指引台積電受益AI需求創季度利潤紀錄,但對關税政策保持警惕AI如何贏得數學金牌
AI跨越了一個連頂尖研究者都感到驚訝的門檻。谷歌DeepMind的AI首次在國際數學奧林匹克競賽——全球最頂尖的高中數學競賽中斬獲金牌。
未正式參加今年IMO的OpenAI表示,根據外部專家按照IMO標準評分的解題結果,其模型同樣達到了金牌水平。
雖然人們很容易將此視為AI高歌猛進中的又一則新聞,但我深入採訪了這些模型背後的智囊團——其中不少人本身就是前IMO獎牌得主——試圖理解這一突破的歷程,以及這些勝利揭示了AI前沿發展哪些奧秘。
關鍵啓示是什麼?DeepMind的Gemini Pro和OpenAI的o1系列模型展現的推理能力具有無限可能。這次勝利也印證了模型提升的經典配方:高質量數據與海量算力。
儘管兩家實驗室都未完全公開方法細節,但它們都展示了"延長思考時間"的威力。自去年起,頂級AI實驗室已從擴大預訓練規模轉向利用測試階段算力為模型提供更多"思考時間"。OpenAI闡釋了其模型如何同時嘗試數十次每個題目,通過共識機制與多智能體策略整合最佳解法。而DeepMind則運用"深度思考"技術,使Gemini能並行探索多條解題路徑,綜合思路後生成嚴謹且人類可讀的證明過程。
研究人員稱之為“範式轉變”的是,DeepMind的AI從一年前還需要專家人工翻譯,到本週已能用自然語言解決六道國際數學奧林匹克(IMO)問題中的五道。
這一突破直接挑戰了長期以來的懷疑論,即AI模型只是預測下一個詞的巧妙模仿者。需要多步驟創造性證明的數學已成為真正推理能力的終極試金石,而AI剛剛通過了這項測試。
我們尚不清楚解決每道題目具體消耗了多少並行計算資源,但OpenAI表示這“極其昂貴”。畢竟,這些模型和人類選手一樣被給予約4.5小時來完成每組題目。
這凸顯了當今最智能的AI模型需要巨大的計算資源,也解釋了為何AI實驗室對英偉達GPU等芯片有着永不滿足的需求。隨着這些方法擴展到編碼、科學、創意寫作等其他領域,計算需求將持續增長。兩家實驗室都將突破歸功於高質量數據:逐步標註的證明過程,而非最終答案。DeepMind特別指出,其新型強化學習技術不僅獎勵正確性,還注重證明過程的優雅與清晰。
這對未來意味着什麼?“AI能否推理?”的爭論或許已有定論——至少在奧林匹克數學這樣高難度的領域。隨着研究人員破解數學密碼並轉向新前沿,AI模型中不斷湧現的真正思維能力或將改變多個領域。
DeepMind正致力於將其系統推廣給數學家使用,並很快將面向更廣泛的公眾。OpenAI表示正利用從該模型中學到的經驗訓練其他系統,但這一特定功能不會包含在今年夏季即將發佈的GPT-5中。
本週圖表
您閲讀這份AI簡報很可能已是AI使用者,這意味着您屬於61%將AI融入生活的美國人羣。根據門羅風投報告(新標籤頁打開),其餘39%人羣仍持懷疑態度。最大阻力?傳統的人際互動需求。約80%非使用者表示更傾向與人而非機器打交道,尤其在重要決策時。事實上,53%受訪者要求由人類進行責任監督,而非僅依賴即時響應的數字助手。
其他主要障礙包括數據隱私擔憂(71%)、對AI實用性的懷疑(63%),以及對AI提供信息保持合理不信任(58%)。可見當技術準備就緒時,人們仍在期待更多信任、透明度,以及更關鍵的一點——人性化元素。
消費者拒絕使用AI原因的條形圖
- 推薦主題:
- 科技