谷歌在全球數學競賽中斬獲里程碑式金牌,OpenAI亦宣佈獲勝 | 路透社
Kenrick Cai,Jaspreet Singh
2025年5月13日,美國加州山景城某公司研究設施內拍攝到的谷歌標誌。路透社/Carlos Barria/檔案照片購買授權許可,打開新標籤頁7月21日(路透社)——Alphabet旗下(GOOGL.O),打開新標籤頁谷歌與OpenAI宣佈,其人工智能模型在全球數學競賽中獲得金牌,標誌着在構建媲美人類智能系統的競賽中,數學能力取得重大突破。這一成果意味着AI系統首次在國際中學生數學奧林匹克競賽(IMO)中突破金牌分數線。
路透每日簡報為您提供開啓一天所需的全部新聞。立即註冊。
廣告·繼續閲讀兩家公司的模型成功解答了六道題目中的五道,通過通用型"推理“模型(該模型使用自然語言處理數學概念)實現這一成績,與AI公司此前採用的技術路徑形成鮮明對比。雖然谷歌DeepMind與國際數學奧林匹克委員會合作,讓其模型接受該委員會的評分和認證,但OpenAI並未正式參賽。這家初創公司週六透露,根據三位外部IMO獎牌得主的評分,他們的模型在今年試題上取得了金牌級別的成績。
布朗大學數學教授、谷歌DeepMind人工智能部門訪問研究員Junehyuk Jung表示,這一成就表明人工智能距離被數學家用於破解該領域前沿未解研究問題已不足一年時間。
廣告·繼續滾動"我認為當我們能夠用自然語言解決複雜推理問題時,就將開啓AI與數學家合作的潛力,“Jung對路透社表示。
OpenAI的突破是通過一個以大規模擴展"測試時計算"為核心的新實驗模型實現的。OpenAI研究員Noam Brown表示,這既通過讓模型"思考"更長時間,也通過部署並行計算能力同時運行大量推理線來實現。Brown拒絕透露OpenAI為此投入了多少計算資源,但稱其"非常昂貴”。
對OpenAI研究人員而言,這再次明確表明AI模型可以掌握廣泛的推理能力,這些能力可能擴展到數學以外的其他領域。
谷歌研究人員也持同樣樂觀態度,曾於2003年以學生身份獲得IMO金牌的Jung表示,他們相信AI模型的能力可以應用於物理等其他領域的研究難題。
在澳大利亞昆士蘭州陽光海岸舉行的第66屆國際數學奧林匹克競賽(IMO)中,630名參賽學生中有67人(約11%)獲得了金牌分數。
谷歌旗下DeepMind人工智能部門去年使用專門針對數學的AI系統獲得了銀牌分數。今年穀歌採用了名為Gemini Deep Think的通用模型,其早期版本已於5月在年度開發者大會上首次亮相。該公司在博客中表示,與以往依賴形式化語言和冗長計算的AI嘗試不同,谷歌今年的方法完全採用自然語言處理,並在官方規定的4.5小時時限內完成了試題解答。
據研究員Alexander Wei在社交平台X上發文,擁有自主推理模型體系的OpenAI同樣為本次競賽構建了實驗版本。他指出公司未來數月內暫不計劃發佈具備此等數學能力的成果。今年是該競賽首次與部分AI開發商開展官方合作。多年來,開發者們一直以IMO等頂尖數學賽事作為模型能力測試平台。IMO評委對包括谷歌在內的企業成果進行了認證,並要求它們於7月28日公佈結果。
“我們尊重IMO組委會最初的要求——所有AI實驗室需在獨立專家驗證官方成績,且參賽學生獲得應得榮譽後,方可分享其成果。“DeepMind首席執行官Demis Hassabis週一在X平台表示。
OpenAI於週六公佈了其成果並首次宣稱獲得金牌地位,該公司在一次採訪中表示,已獲得國際數學奧林匹克(IMO)董事會成員許可,在週六閉幕式後發佈這一消息。
IMO董事會主席Gregor Dolinar向路透社表示,週一的比賽允許合作企業公佈結果。
- 推薦主題:
- 中斷