小米首個推理大模型開源

杨依婷

2025-05-02

4月30日，小米在微信公眾號發佈，小米開源首個為推理而生的大模型——Xiaomi MiMo。

據小米公開的數據顯示，在數學推理（AIME 24-25）和代碼競賽（LiveCodeBench v5）公開測評集上，MiMo僅用7B的參數規模，超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規模的開源推理模型QwQ-32B-Preview。

在相同RL訓練數據情況下，MiMo-7B的數學&代碼領域的強化學習潛力顯著領先，分數超過DeepSeek-R1-Distill和Qwen2.5-32B。

同時，預訓練和後訓練階段中數據和算法等多層面的創新聯動驅動，推動MiMo推理能力提升。其預訓練的核心是讓模型見過更多推理模式，後訓練的核心是高效穩定的強化學習算法和框架。

目前，MiMo-7B已開源4個模型至HuggingFace。

小米介紹，MiMo是公司新成立的“小米大模型Core團隊”的初步嘗試，並稱“2025年雖看似是大模型逐夢的後半程，但我們堅信AGI的征途仍漫長。”

去年4月，小米宣佈組建AI實驗室大模型團隊，AI領域相關研發人員超1200人。去年12月，有消息稱小米正在着手搭建自己的GPU萬卡集羣，將對AI大模型大力投入。傳言稱，小米大模型團隊在成立時已有6500張GPU資源。

受此消息提振，截至午間休市，小米集團當天股價上漲4.74%，總市值1.29萬億港元（約合人民幣1.21萬億元）。

前天，阿里發佈了新一代通義千問模型Qwen3（千問3）並進行開源，登頂全球最強開源模型。騰訊在同日宣佈將對其混元大模型研發體系進行重組，加碼研發投入。

本文系觀察者網獨家稿件，未經授權，不得轉載。