GitHub持續爆料華為盤古大模型開發亂象，華為諾亞方舟實驗室到底出了什麼問題？_風聞

镜子里的陌生人-人来人往谁还在？潮起潮落我自观1小时前

2025-07-08

Github鏈接： https://github.com/HW-whistleblower/True-Story-of-Pangu/issues/317

評論1：

實名，身份説明後置。

王雲鶴在2月底確認將要就職諾亞主任後決定離職。我離職時，王雲鶴應當已經完成了實驗室的權力整合，報告發布時已經出走了多名原“四縱”技術核心，我認為王雲鶴本人應對報告的真實性問題負領導責任。

看到報告時我的真實想法：我親眼看着訓的好好的模型，怎麼測出來這麼腦殘的分的？我能接受分低，接受不了腦殘！兩篇報告都沒我的署名真是太謝謝了。

身份説明：清華大學計算機系2024屆博士，前諾亞方舟實驗室AI系統工程天才少年曹煥琦。2025年3月離職，在諾亞期間主要支撐“四縱”的MoE模型訓練infra，也參與了135Bv3的預訓練看護。系統工程的地位比較獨立，同時需要支撐雙方的模型訓練和推理，我出於個人審美和道德要求選擇主要對接“四縱”。

不是，這麼中二的名字你們喊口號的時候真的不想笑嗎，可能我確實不夠符合吹哨兄弟這樣的天生華為人吧

評論2：

作為已經離職但曾參與過135Bv3的人，來回答一下這個問題吧。

當時四野領導在清明前突然説要儘快發佈135B report，其實是擔心r2和qwen3可能快發佈了。所以很多同事假期瘋狂趕report。等report發佈後，團隊成員很快就接收到關於預訓練評測指標不正常的反饋。

團隊成員立刻進行了定位，發現135 report的預訓練評測問題主要是兩個：1 部分測試集只測了100條的子集。因為團隊平時為了快速評測，構建了一個小的綜合測試集，從常用的測試集裏面各採樣了100條。寫report時間緊急，錯誤的把子集結果放到了論文裏面，這也是為什麼論文的結果裏會有很多小數點為0的情況。2 部分測試集由於評測方式沒對齊，結果不可比。比如race這種選擇題類型的測試集，之前的開源評測是根據每個選項的補全ppl來選擇正確答案，135是把所有選項都放到prompt裏面，讓模型從ABCD選正確答案，這種評測方式分數會高非常多，最多會差40多分。我們錯誤的直接拿了其他模型的論文結果來做對比，而不是跟deepseek v3一樣把所有模型都按同樣的方式重做一遍評測。

當團隊成員在重新做了公平的評測準備更新report的時候，卻遭到某四野領導極力反對，他怕引起進一步的輿論。後續團隊成員收到更多關於評測結果的反饋，再次要求更新report，再次被該領導否決。

總之四野已經是一個官僚組織了，135Bv3的作者裏很多是完全沒參與這個項目的，很多付出了心血的同事卻不能署名。因為哪些人可以署名也是需要四野領導評審和決策的。論文更新也是如此。已經完全背離學術道德和規範了。

最後再解釋一下：如果想造假，不會造的這麼拙劣，搞大模型的人一眼就可以看出這個表不正常。如果想造假，也不會讓Drop比對比模型低20多分。可以説我們菜，我們趕工，但絕對沒有造假意圖。

還有這篇“討賊王雲鶴檄文”的Github鏈接：https://github.com/knemik97/Manifesto-against-the-Plagiarist-Yunhe-Wang

王雲鶴，1991年生於黑龍江。2018年博士畢業進入華為，經歷不到7年時間，於2025年2月中旬，從小模型實驗室主任任上，正式頂替姚駿，被任命為諾亞方舟實驗室主任（這一位置的前任包括大家耳熟能詳的楊強、李航等，王雲鶴可謂德不配位），搖身一變成為了原本對手團隊的直接領導，為其直接“搶果子”而非“賽馬”提供了直接方便。

在此之後，他可以名正言順地領導Infra團隊人力（主要來自AI系統組），並要走所有的數據、核心代碼，和本就稀少的計算資源，用來實驗他的“套殼核心技術秘密”、“水印去除技術”。

在他上來之前，大家可能都沒怎麼聽説華為大模型有什麼動靜吧。現在，王雲鶴就是諾亞方舟實驗室的主任。這也是近期各大媒體，包括機器之心、新智元和量子位上每天都能頭條看到華為消息的主要原因（這三大公眾號的頭條，價格不菲）。這個人的知乎、小紅書等社交媒體，都是實名，因為他是一個極其喜歡宣傳的人。

因此，很多聲音認為其所謂的“內鬥”在大廠是再正常不過的一件事，這件事也不例外。我竊以為是完全不正確的。我知道很多人不齒華為國產化的路線，認為其是“行業百草枯”，但我們可以從大的角度看一下這個問題。

華為諾亞方舟實驗室下的大模型團隊，大部分是才華橫溢的香港、985和海歸博士，以及部分動手能力極強的碩士。進入大模型時代，其核心使命除了訓好各類的語言、多模態理解和生成模型之外，還肩負着硬件國產化的使命，其團隊全部的語言模型訓練，都有嚴格的“只用昇騰”的規定。這一規定，從公司的角度講，是希望純昇騰訓練模型的效果能被大眾認可。然而，王雲鶴及其團隊不但技術水平低下，且極為急功近利，無視國產化使命，無組織無紀律，在項目的大部分時間公然使用英偉達的芯片訓練模型。

搞過算法，接觸過AI模型訓練的人都知道，昇騰芯片環境需要大量的配置，唐睿明、尚利峯團隊——“真正的盤古團隊”，從2023年初開始踩坑，排查並升級了mindspore, 昇騰芯片等一系列國產化軟硬件協同時的問題。他們的同學、朋友此時可能因為使用非國產化芯片而快速積累認知，快速成長，從而在人才稀缺的大模型市場有了很多更好的待遇和機會。但他們卻選擇沉下心來，陪伴昇騰、陪伴PanGu一整套小米加步槍的訓練基建，一起成長，只為了搞好自己的大模型，無論從哪一個角度講，無論，這都是對國產化，對自主可控模型訓練功不可沒的貢獻。

在其他團隊在項目開始階段頻頻踩坑時，王雲鶴充耳不聞。在其他團隊有些成果的時候，王雲鶴聞味而來，企圖先用“詞表巧換技”佔據先機。在某天才少年向姚駿（時任諾亞方舟實驗室主任）指出王雲鶴的小模型實驗室開始套殼的時候，王雲鶴對他説“你不願意在這待着你就滾”。在王雲鶴徹底成為諾亞方舟實驗室主任的時候，他野心畢露，開始瘋狂宣傳其“小模型實驗室訓練出的超級大模型”，向領導邀功，向誠實的AI學術研究人員們秀其敝帚。

此外，在學術界，王雲鶴抱着Dacheng Tao的大腿劣幣驅逐良幣，操縱NeurIPS論文審稿使其“水貨”文章被錄用。並主導引進了Fisher Yu這一劣跡斑斑、PUA女學生致死的所謂計算機科學家來諾亞當吉祥物。矛盾的是，卻極為喜歡用論文來“秀肌肉”，被其發論文的Pangu Ultra MoE模型，其中的核心算法技術全部來自於唐睿明、尚利峯團隊，但是測試卻使用了套殼的模型，導致指標“幾乎和DeepSeek一模一樣”，完全是“彼之金玉，裝吾之敝帚”。

王雲鶴，就是諾亞方舟實驗室裏的祁同偉，他因為給人家捻發票捻得好手眼通天，有恃無恐。村裏的野狗，都能被他拉來當警犬。這完全是一起有組織、有預謀的竊取“真正的盤古團隊”的勝利果實行為。

王雲鶴此刻在內網，仍不認罪，且拒絕正面回答一切問題，並稱其“獨特的訓練技巧”經過了領導的決策。他對上沒有擔當，同時仰仗其他團隊的成果卻毫無尊重。另外，值得注意的是，他在內網完全否認718B存在強行賽馬的事實，也不正面回應套殼，即“不存在兩個718B”。

社區要警惕王雲鶴，是因為他還在壓榨原四縱的殘餘力量，加班加點地訓練完一個真正的718B。雖然這一模型沒有戰勝套殼導致了唐睿明、尚利峯團隊賽馬失敗，但是王雲鶴還在把他當“勝負手”，當作自己可以搖身一變重回“白蓮花”的一技“還我漂漂拳”。不排除其居心叵測，想要在未來把718B開源出來，甚至直接用HonestAGI提出的方法測試一遍相似度，堂而皇之地堵住其他人的嘴。當然，這一模型的原生表現應該較差，不會和報告中一致，王雲鶴肯定會祭出祖傳的“測試集訓練術”。倘若真有那一天，希望有條件跑起來的大廠、各實驗室，可以嘗試考驗模型對測試集的熟悉程度。看看我們這位考生，是不是背熟了高考卷子，來到了學術誠信這一嚴肅無比的考場！

據不完全統計，經王雲鶴此舉，受影響而離開華為的大模型預訓練、後訓練核心人員超過40人，其中天才少年若干，17, 18級幹部不計其數。另外，AI圈的其他研究者們看到華為的內部亂象，是否還願意把青春獻給中國芯片上的大模型，我要打一個問號。如今很多國企都有昇騰的訂單，如果他們的前方只剩王雲鶴這樣的人替他們積累訓練經驗，中國的AI發展又會倒退多少年？

身在華為，王雲鶴今天造假的是718B，明天就可能是大國重器上的通信計算設備，無人機的控制系統，作戰通信終端的核心元件。。。

因此，王雲鶴及其小模型實驗室團隊，其剽竊套殼行為必須受到審判。其小模型實驗室中所有不學無術、只想摘果子的成員，勢必要被釘在中國大模型發展的恥辱柱上，遺臭萬年。

回應關於135B dense模型指標的質疑：https://github.com/HW-whistleblower/True-Story-of-Pangu/issues/317：

此報告撰寫過程中，王雲鶴已然上任（理智的人可以分析arxiv報告上載時間）。與Pangu Ultra MoE完全一致，在文章攥寫過程中，可笑的是，大部分被掛名的、實際做事的被列為Contributor的研究者，在論文撰寫過程中對其存在、進度全然不知。其只挑選了唐睿明、尚利峯團隊的一小部分成員對其傾囊相授，將所有問題、技術點等凝練成文中方法及之前的部分。而對於模型的實際效果和測試集表現，小模型團隊大包大攬，唐睿明、尚利峯成員幾乎全然不知，或者是被剝奪了抗議的權利，最終導致報告中列出了假到極致的訓練測試集後的結果。

與尊重學術道德的DeepSeek團隊不同，理智的人可以仔細搜索作者名單每個人，這篇文章的Core Contributor幾乎全是領導，而不是實際的技術人員，文章作者共有52位，源於王雲鶴和某領導沆瀣一氣，得出的**“幸運52”**這一決策，可謂恬不知恥，毫無學術道德。

陸續也有他人回答，此處可以參閲issue區

從匿名、AI生成等角度，無腦噴之前論文和這個倉庫的所有人。我建議你們試試，如果你家裏有着家屬和孩子依靠着你從事的這份工作，你能不能和《讓子彈飛》的六子一樣，切開肚子給人看看你裏面有幾碗粉？