小米首個推理大模型開源
杨依婷

4月30日,小米在微信公眾號發佈,小米開源首個為推理而生的大模型——Xiaomi MiMo。
據小米公開的數據顯示,在數學推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)公開測評集上,MiMo僅用7B的參數規模,超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規模的開源推理模型QwQ-32B-Preview。

在相同RL訓練數據情況下,MiMo-7B的數學&代碼領域的強化學習潛力顯著領先,分數超過DeepSeek-R1-Distill和Qwen2.5-32B。

同時,預訓練和後訓練階段中數據和算法等多層面的創新聯動驅動,推動MiMo推理能力提升。其預訓練的核心是讓模型見過更多推理模式,後訓練的核心是高效穩定的強化學習算法和框架。
目前,MiMo-7B已開源4個模型至HuggingFace。
小米介紹,MiMo是公司新成立的“小米大模型Core團隊”的初步嘗試,並稱“2025年雖看似是大模型逐夢的後半程,但我們堅信AGI的征途仍漫長。”
去年4月,小米宣佈組建AI實驗室大模型團隊,AI領域相關研發人員超1200人。去年12月,有消息稱小米正在着手搭建自己的GPU萬卡集羣,將對AI大模型大力投入。傳言稱,小米大模型團隊在成立時已有6500張GPU資源。
受此消息提振,截至午間休市,小米集團當天股價上漲4.74%,總市值1.29萬億港元(約合人民幣1.21萬億元)。
前天,阿里發佈了新一代通義千問模型Qwen3(千問3)並進行開源,登頂全球最強開源模型。騰訊在同日宣佈將對其混元大模型研發體系進行重組,加碼研發投入。
本文系觀察者網獨家稿件,未經授權,不得轉載。