雷軍“千萬年薪”挖角傳聞落地!前DeepSeek“天才少女”官宣加盟小米
陈济深

2025年11月12日,前DeepSeek研究員羅福莉通過朋友圈正式確認已加入小米。對於一直堅持“輕量化”、不走“大參數”競賽路線的小米AI戰略而言,羅福莉的加盟可謂是關鍵一子,她在DeepSeek時期積累的MoE(混合專家)架構等大模型訓練經驗,正是小米“端側AI”與“人車家全生態”所急需的人才。而從羅福莉自己的文案來看,她在小米的工作領域應該不只是大模型開發,可能涉及大模型在手機、汽車等終端產品的落地。
羅福莉在朋友圈發文:“智能終將從語言邁向物理世界。我正在Xiaomi MiMo,和一羣富有創造力、才華橫溢且真誠熱愛的研究員,致力於構建這樣的未來,全力奔赴我們心目中的 AGl。”

今年年初,隨着Deepseek的爆火,羅福莉作為前DeepSeek研究員爆火,被稱為“AI天才少女”,隨即又傳言稱其將加入小米,業內不乏“雷軍千萬年薪挖角”的傳聞,但無論小米還是羅福莉都選擇了沉默。
2月,有羅福莉親屬就曾表示其已到新崗位上班,但並未透露其新的去向,今日本人官宣小米也為這場關於其職業去向的討論暫時畫下了休止符。
而在一個月前,小米發佈的AI論文中就出現了羅福莉的名字,這也代表羅福莉在今日官宣之前就已經和小米AI團隊進行了合作,而她本次加盟也將為小米在大模型領域按下加速鍵。
95後“天才少女”
羅福莉1995年出生於四川宜賓。據羅福莉此前在阿里達摩院的採訪視頻介紹,從小她就喜歡在村裏的免費書屋讀書,那裏是她的“第二課堂”。她説:“小時候以為世界只有村子大,直到書帶我去了更遠的地方。”
2013年,羅福莉考上北京師範大學。在進入北京師範大學之前,羅福莉幾乎沒有接觸過計算機領域,卻“誤打誤撞”地進入了計算機專業。
其高中班主任、數學老師李波曾表示“大學期間,羅福莉就在規劃自己未來的發展方向了。”最終她以優異的成績被成功保研至北京大學計算語言學研究所。
真正讓她聲名鵲起的是2019年讀研二期間,在人工智能領域頂級國際會議ACL上一次性發表8篇論文,其中2篇為第一作者。
研究生畢業後,羅福莉選擇進入阿里達摩院做人工智能研究,從事預訓練語言模型相關的研究。
在阿里達摩院,羅福莉主導開發了多語言預訓練模型VECO(Versatile Encoder-Decoder for Cross-lingual Understanding and Generation),該模型同時支持多語言理解和生成,被納入阿里達摩院深度語言模型體系AliceMind,並推動了該項目的開源工作。這段經歷讓她在跨語言大模型領域積累了深厚的技術功底和工程經驗。
2022年,羅福莉離開阿里加入量化私募幻方量化,隨後進入其研究部門DeepSeek擔任深度學習研究員。在這裏,她參與了MoE(混合專家)大模型DeepSeek-V2的研發工作,該模型以"性價比之王"著稱,其中文水平被業界認為處於國內外閉源模型第一梯隊,而價格僅為GPT-4的1/100。
在DeepSeek期間,羅福莉不僅在技術上持續深耕,更展現出對開源社區的深刻理解——她曾在知乎親自撰寫DeepSeek-V2的技術解讀,以"接地氣"的方式闡述模型優勢。

隨着今年年初DeepSeek的橫空出世,羅福莉被挖掘出DeepSeek員工的身份並被冠以“天才少女”的稱號,不過值得注意的是,羅福莉並沒有參與今年年初讓DeepSeek爆火的V3和R1模型的研發工作,並在今年被證實已經離開DeepSeek。
而在羅福莉進入大眾視野之前,就已經有傳聞説小米正在挖角羅福莉。
2024年12月,有傳聞稱小米創始人雷軍親自下場,以千萬年薪級別力邀羅福莉,希望其領導小米AI實驗室的大模型團隊,儘管雙方當事人均對此保持沉默,但是其高中班主任曾經透露,羅福莉“還沒決定去小米,還在考慮”。
2月17日,有羅福莉親屬表示她已經到新崗位上班,但是沒有透露具體去向。當時有小米員工證實,小米員工系統並沒有羅福莉的相關信息,無法證實其是否在小米工作。而羅福莉本人則發佈朋友圈駁斥“天才少女”論,但是並未透露工作去向。

而在沉寂了大半年後,羅福莉的去向終於逐漸清晰。
10月14日,小米與北京大學聯合署名的論文發表於arXiv,羅福莉位列通訊作者。儘管論文沒有標明她是否屬於小米大模型團隊,但是作為論文的主要負責人,小米和羅福莉顯然已經進行了深度的合作。

而巧合的是,她於今年9月在知乎點讚了小米語音大模型Xiaomi-MiMo-Audio的開源帖子。隨着她今日官宣在XiaoMi MiMo團隊工作,也正式確認了她的去向揭曉了這一年的懸念。
小米的AI野心
羅福莉的加盟,是小米野心勃勃AI戰略的最新落子。
小米AI實驗室成立於2016年初,設立初期主要為小愛音箱等IoT產品服務,研究方向涵蓋視覺、聲學、語音、自然語言處理、知識圖譜、機器學習和大模型等全棧技術領域。
隨着2022年底ChatGPT等大語言模型引發AI熱潮,2023年4月,小米AI實驗室下設專門的大模型團隊,由曾任東芝(中國)研究院研究員、微軟小冰首席語音科學家的欒劍擔任負責人,向小米技術委員會副主席、AI實驗室主任王斌彙報。
儘管小米對於AI相當重視,但是其對於AI的思路則與當時的主流觀點不同。
2023年11月,小米AI實驗室主任曾表示:“小米不會做ChatGPT,不搞AI的軍備競賽。”
他同時還表達了對於預訓練模型的謹慎:“內部認為,輕量級模型存在其市場空間,且在某些特定任務上對比千億參數大模型有一定的優勢。”
順着這個發展思路來看,羅福莉在DeepSeek V2時期累積的自然語言處理、多模態理解、MoE架構等領域的複合經驗,將為小米汽車在端側AI、多傳感器融合、擬人化交互等方面提供關鍵技術支持。
本次羅福莉加入的MiMo團隊是小米的推理大模型團隊。
今年4月,小米開源首個“為推理而生”的大模型 Xiaomi MiMo,聯動預訓練到後訓練,全面提升推理能力。據介紹,MiMo 是來自全新成立的“小米大模型 Core 團隊”的初步嘗試。
Xiaomi MiMo在數學推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)測評中,僅用70億參數就超越了OpenAI的閉源模型o1-mini和阿里Qwen的320億參數開源模型QwQ-32B-Preview。這一成績驗證了小米"小參數大能量"的技術路徑。
而除了大模型領域,小米對於AI的重視程度也相當之高。
早在2023年8月,雷軍在年度演講中提出小米的AI戰略是輕量化+本地部署的思路,讓用户在數據安全的前提下實現大模型的先進生產力,並在現場展示了MiLM-1.3B模型的性能表現,相比起當時大模型幾十B起步的參數量,小米的模型可謂是相當的輕量化,這顯然就和羅福莉在DeepSeek的工作非常契合。


2024年,雷軍親自推動小米 GPU 萬卡集羣建設,年中雷軍曾透露大模型團隊已經擁有6500張GPU,並表示後續將擴容至萬卡規模,這也給小米訓練大模型提供了必要的條件。
2025年2月,雷軍宣佈小米2025年研發費用將超300億元,其中1/4(約75億元)用於AI領域,重點投向GPU集羣、大模型開發及場景落地。並表示未來五年(2026-2030年),研發投入預計超2000億元,聚焦 AI、OS、芯片三大底層技術。而這三塊的技術累計正是小米“人車家”生態的技術底座。
從行業角度看,頂尖AI研究員從DeepSeek等新鋭公司流向小米等傳統硬件巨頭,也暗示着AI大模型競爭進入"應用深化期"。
當基礎模型能力逐漸收斂,如何將AGI理想轉化為手機、汽車、智能家居中的真實體驗,成為新的賽點。羅福莉在聲明中提到的"從語言邁向物理世界",正是這一趨勢的最佳註腳。