xAI發佈Grok 3模型，全球最大十萬卡集羣再現“力大磚飛”_風聞

大模型之家-带您探索人工智能领域的重磅资讯、解码热点话题44分钟前

2025-02-18

大模型之家訊北京時間 2 月 13 日中午 12 點（太平洋時間 2 月 12 日晚上 8 點），馬斯克旗下的人工智能公司xAI正式發佈了最新一代大模型——Grok 3，並進行了現場演示。馬斯克曾稱GroK 3為“地球上最聰明的人工智能”，而此次發佈會展示了其在推理能力、代碼生成以及多項基準測試中的卓越表現。這次發佈會不僅吸引了大量的關注，直播觀看人數迅速突破百萬，反映出市場對Grok 3的巨大期待。

Grok 3 在多個關鍵測試中展現出顯著優勢：

AIME'24 數學能力測試：Grok 3 取得 52 分，遠超 DeepSeek-V3 的 39 分。GPQA 科學知識評估：Grok 3 以 75 分 領先 DeepSeek-V3 的 65 分。LCB Oct-Feb 編程能力測試：Grok 3 獲得 57 分，大幅超越 DeepSeek-V3 的 36 分。MMLU 評測：Grok 3 在多領域知識測試中的得分正快速追趕 ChatGPT 等主要競爭對手。

發佈會現場，xAI的工程師團隊展示了Grok 3和其輕量版Grok-3 Mini的強大功能，表明其在多方面的能力已超越或接近了Gemini、DeepSeek和ChatGPT等競爭產品。在即時演示中，Grok 3表現出了驚人的代碼生成和推理能力。當團隊要求Grok 3生成一段太空發射的3D動畫代碼時，它迅速完成了任務，並呈現出飛船往返地球與火星的動畫，這不僅展現了其在複雜代碼生成方面的能力，還證明了它對物理原理的理解。

在接下來的任務中，Grok 3又被要求設計一個類似俄羅斯方塊的遊戲，並在短時間內提供了切實可行的解決方案，進一步驗證了其在遊戲開發領域的潛力。

Grok 3核心技術突破之一是“思維鏈”（Chain of Thought）推理機制，使得GroK 3能夠像人類一樣分步驟處理複雜問題，大幅提升了邏輯推理和連貫性。馬斯克表示，Grok 3在邏輯推理測試中的表現已經優於ChatGPT-5和谷歌的Gemini Ultra，並且它具備更強的創造性思維和問題解決能力。

Grok 3的成功不僅得益於全新技術架構的加持，更離不開強大的算力支持。通過在訓練過程中使用10萬塊Nvidia H100 GPU，相較於前代1.5萬塊GPU，實現了算力的跨越式提升。這種規模化的計算能力證明，即便是像DeepSeek這樣的現有大模型，藉助大規模強化學習技術，只需少量標註數據便能顯著提升模型性能。這一進步不僅降低了對海量標註數據的依賴，也大幅提高了訓練效率和降低了訓練及推理成本，為業界帶來了一種更高性價比的解決方案。

**同時，Grok 3的表現也驗證了全球最大的GPU計算集羣在訓練模型時仍然能帶來卓越的性能，這説明Scaling Law尺度法則依然成立，儘管適用場景更為限定。**10萬塊H100的算力優勢依舊不容小覷，充分展示了在大模型時代，強大算力依然是實現突破性進展的關鍵因素。這一現象無疑將推動整個行業在AI研發上的進一步探索和投資。

x.AI稱，Grok 3已經接入馬斯克旗下的社交平台X，用户可以在該平台體驗到這一最新AI技術。然而大模型之家注意到，截至發稿，X平台尚未正式Grok 3大模型。