xAI發佈Grok 3模型,全球最大十萬卡集羣再現“力大磚飛”_風聞
大模型之家-带您探索人工智能领域的重磅资讯、解码热点话题44分钟前

大模型之家訊 北京時間 2 月 13 日中午 12 點(太平洋時間 2 月 12 日晚上 8 點),馬斯克旗下的人工智能公司xAI正式發佈了最新一代大模型——Grok 3,並進行了現場演示。馬斯克曾稱GroK 3為“地球上最聰明的人工智能”,而此次發佈會展示了其在推理能力、代碼生成以及多項基準測試中的卓越表現。這次發佈會不僅吸引了大量的關注,直播觀看人數迅速突破百萬,反映出市場對Grok 3的巨大期待。


Grok 3 在多個關鍵測試中展現出顯著優勢:
AIME'24 數學能力測試:Grok 3 取得 52 分,遠超 DeepSeek-V3 的 39 分。GPQA 科學知識評估:Grok 3 以 75 分 領先 DeepSeek-V3 的 65 分。LCB Oct-Feb 編程能力測試:Grok 3 獲得 57 分,大幅超越 DeepSeek-V3 的 36 分。MMLU 評測:Grok 3 在多領域知識測試中的得分正快速追趕 ChatGPT 等主要競爭對手。
發佈會現場,xAI的工程師團隊展示了Grok 3和其輕量版Grok-3 Mini的強大功能,表明其在多方面的能力已超越或接近了Gemini、DeepSeek和ChatGPT等競爭產品。在即時演示中,Grok 3表現出了驚人的代碼生成和推理能力。當團隊要求Grok 3生成一段太空發射的3D動畫代碼時,它迅速完成了任務,並呈現出飛船往返地球與火星的動畫,這不僅展現了其在複雜代碼生成方面的能力,還證明了它對物理原理的理解。

在接下來的任務中,Grok 3又被要求設計一個類似俄羅斯方塊的遊戲,並在短時間內提供了切實可行的解決方案,進一步驗證了其在遊戲開發領域的潛力。
Grok 3核心技術突破之一是“思維鏈”(Chain of Thought)推理機制,使得GroK 3能夠像人類一樣分步驟處理複雜問題,大幅提升了邏輯推理和連貫性。馬斯克表示,Grok 3在邏輯推理測試中的表現已經優於ChatGPT-5和谷歌的Gemini Ultra,並且它具備更強的創造性思維和問題解決能力。
Grok 3的成功不僅得益於全新技術架構的加持,更離不開強大的算力支持。通過在訓練過程中使用10萬塊Nvidia H100 GPU,相較於前代1.5萬塊GPU,實現了算力的跨越式提升。這種規模化的計算能力證明,即便是像DeepSeek這樣的現有大模型,藉助大規模強化學習技術,只需少量標註數據便能顯著提升模型性能。這一進步不僅降低了對海量標註數據的依賴,也大幅提高了訓練效率和降低了訓練及推理成本,為業界帶來了一種更高性價比的解決方案。
**同時,Grok 3的表現也驗證了全球最大的GPU計算集羣在訓練模型時仍然能帶來卓越的性能,這説明Scaling Law尺度法則依然成立,儘管適用場景更為限定。**10萬塊H100的算力優勢依舊不容小覷,充分展示了在大模型時代,強大算力依然是實現突破性進展的關鍵因素。這一現象無疑將推動整個行業在AI研發上的進一步探索和投資。
x.AI稱,Grok 3已經接入馬斯克旗下的社交平台X,用户可以在該平台體驗到這一最新AI技術。然而大模型之家注意到,截至發稿,X平台尚未正式Grok 3大模型。