GitHub持續爆料華為盤古大模型開發亂象,華為諾亞方舟實驗室到底出了什麼問題?_風聞
镜子里的陌生人-人来人往谁还在?潮起潮落我自观1小时前
Github鏈接: https://github.com/HW-whistleblower/True-Story-of-Pangu/issues/317
評論1:
實名,身份説明後置。
王雲鶴在2月底確認將要就職諾亞主任後決定離職。我離職時,王雲鶴應當已經完成了實驗室的權力整合,報告發布時已經出走了多名原“四縱”技術核心,我認為王雲鶴本人應對報告的真實性問題負領導責任。
看到報告時我的真實想法:我親眼看着訓的好好的模型,怎麼測出來這麼腦殘的分的?我能接受分低,接受不了腦殘!兩篇報告都沒我的署名真是太謝謝了。
身份説明:清華大學計算機系2024屆博士,前諾亞方舟實驗室AI系統工程天才少年曹煥琦。2025年3月離職,在諾亞期間主要支撐“四縱”的MoE模型訓練infra,也參與了135Bv3的預訓練看護。系統工程的地位比較獨立,同時需要支撐雙方的模型訓練和推理,我出於個人審美和道德要求選擇主要對接“四縱”。
不是,這麼中二的名字你們喊口號的時候真的不想笑嗎,可能我確實不夠符合吹哨兄弟這樣的天生華為人吧
評論2:
作為已經離職但曾參與過135Bv3的人,來回答一下這個問題吧。
當時四野領導在清明前突然説要儘快發佈135B report,其實是擔心r2和qwen3可能快發佈了。所以很多同事假期瘋狂趕report。等report發佈後,團隊成員很快就接收到關於預訓練評測指標不正常的反饋。
團隊成員立刻進行了定位,發現135 report的預訓練評測問題主要是兩個:1 部分測試集只測了100條的子集。因為團隊平時為了快速評測,構建了一個小的綜合測試集,從常用的測試集裏面各採樣了100條。寫report時間緊急,錯誤的把子集結果放到了論文裏面,這也是為什麼論文的結果裏會有很多小數點為0的情況。2 部分測試集由於評測方式沒對齊,結果不可比。比如race這種選擇題類型的測試集,之前的開源評測是根據每個選項的補全ppl來選擇正確答案,135是把所有選項都放到prompt裏面,讓模型從ABCD選正確答案,這種評測方式分數會高非常多,最多會差40多分。我們錯誤的直接拿了其他模型的論文結果來做對比,而不是跟deepseek v3一樣把所有模型都按同樣的方式重做一遍評測。
當團隊成員在重新做了公平的評測準備更新report的時候,卻遭到某四野領導極力反對,他怕引起進一步的輿論。後續團隊成員收到更多關於評測結果的反饋,再次要求更新report,再次被該領導否決。
總之四野已經是一個官僚組織了,135Bv3的作者裏很多是完全沒參與這個項目的,很多付出了心血的同事卻不能署名。因為哪些人可以署名也是需要四野領導評審和決策的。論文更新也是如此。已經完全背離學術道德和規範了。
最後再解釋一下:如果想造假,不會造的這麼拙劣,搞大模型的人一眼就可以看出這個表不正常。如果想造假,也不會讓Drop比對比模型低20多分。可以説我們菜,我們趕工,但絕對沒有造假意圖。
還有這篇“討賊王雲鶴檄文”的Github鏈接:https://github.com/knemik97/Manifesto-against-the-Plagiarist-Yunhe-Wang
王雲鶴,1991年生於黑龍江。2018年博士畢業進入華為,經歷不到7年時間,於2025年2月中旬,從小模型實驗室主任任上,正式頂替姚駿,被任命為諾亞方舟實驗室主任(這一位置的前任包括大家耳熟能詳的楊強、李航等,王雲鶴可謂德不配位),搖身一變成為了原本對手團隊的直接領導,為其直接“搶果子”而非“賽馬”提供了直接方便。
在此之後,他可以名正言順地領導Infra團隊人力(主要來自AI系統組),並要走所有的數據、核心代碼,和本就稀少的計算資源,用來實驗他的“套殼核心技術秘密”、“水印去除技術”。
在他上來之前,大家可能都沒怎麼聽説華為大模型有什麼動靜吧。現在,王雲鶴就是諾亞方舟實驗室的主任。這也是近期各大媒體,包括 機器之心、新智元和量子位上每天都能頭條看到華為消息的主要原因(這三大公眾號的頭條,價格不菲)。這個人的知乎、小紅書等社交媒體,都是實名,因為他是一個極其喜歡宣傳的人。
因此,很多聲音認為其所謂的“內鬥”在大廠是再正常不過的一件事,這件事也不例外。我竊以為是完全不正確的。我知道很多人不齒華為國產化的路線,認為其是“行業百草枯”,但我們可以從大的角度看一下這個問題。
華為諾亞方舟實驗室下的大模型團隊,大部分是才華橫溢的香港、985和海歸博士,以及部分動手能力極強的碩士。進入大模型時代,其核心使命除了訓好各類的語言、多模態理解和生成模型之外,還肩負着硬件國產化的使命,其團隊全部的語言模型訓練,都有嚴格的“只用昇騰”的規定。這一規定,從公司的角度講,是希望純昇騰訓練模型的效果能被大眾認可。然而,王雲鶴及其團隊不但技術水平低下,且極為急功近利,無視國產化使命,無組織無紀律,在項目的大部分時間公然使用英偉達的芯片訓練模型。
搞過算法,接觸過AI模型訓練的人都知道,昇騰芯片環境需要大量的配置,唐睿明、尚利峯團隊——“真正的盤古團隊”,從2023年初開始踩坑,排查並升級了mindspore, 昇騰芯片等一系列國產化軟硬件協同時的問題。他們的同學、朋友此時可能因為使用非國產化芯片而快速積累認知,快速成長,從而在人才稀缺的大模型市場有了很多更好的待遇和機會。但他們卻選擇沉下心來,陪伴昇騰、陪伴PanGu一整套小米加步槍的訓練基建,一起成長,只為了搞好自己的大模型,無論從哪一個角度講,無論,這都是對國產化,對自主可控模型訓練功不可沒的貢獻。
在其他團隊在項目開始階段頻頻踩坑時,王雲鶴充耳不聞。在其他團隊有些成果的時候,王雲鶴聞味而來,企圖先用“詞表巧換技”佔據先機。在某天才少年向姚駿(時任諾亞方舟實驗室主任)指出王雲鶴的小模型實驗室開始套殼的時候,王雲鶴對他説“你不願意在這待着你就滾”。在王雲鶴徹底成為諾亞方舟實驗室主任的時候,他野心畢露,開始瘋狂宣傳其“小模型實驗室訓練出的超級大模型”,向領導邀功,向誠實的AI學術研究人員們秀其敝帚。
此外,在學術界,王雲鶴抱着Dacheng Tao的大腿劣幣驅逐良幣,操縱NeurIPS論文審稿使其“水貨”文章被錄用。並主導引進了Fisher Yu這一劣跡斑斑、PUA女學生致死的所謂計算機科學家來諾亞當吉祥物。矛盾的是,卻極為喜歡用論文來“秀肌肉”,被其發論文的Pangu Ultra MoE模型,其中的核心算法技術全部來自於唐睿明、尚利峯團隊,但是測試卻使用了套殼的模型,導致指標“幾乎和DeepSeek一模一樣”,完全是“彼之金玉,裝吾之敝帚”。
王雲鶴,就是諾亞方舟實驗室裏的祁同偉,他因為給人家捻發票捻得好手眼通天,有恃無恐。村裏的野狗,都能被他拉來當警犬。這完全是一起有組織、有預謀的竊取“真正的盤古團隊”的勝利果實行為。
王雲鶴此刻在內網,仍不認罪,且拒絕正面回答一切問題,並稱其“獨特的訓練技巧”經過了領導的決策。他對上沒有擔當,同時仰仗其他團隊的成果卻毫無尊重。另外,值得注意的是,他在內網完全否認718B存在強行賽馬的事實,也不正面回應套殼,即“不存在兩個718B”。
社區要警惕王雲鶴,是因為他還在壓榨原四縱的殘餘力量,加班加點地訓練完一個真正的718B。雖然這一模型沒有戰勝套殼導致了唐睿明、尚利峯團隊賽馬失敗,但是王雲鶴還在把他當“勝負手”,當作自己可以搖身一變重回“白蓮花”的一技“還我漂漂拳”。不排除其居心叵測,想要在未來把718B開源出來,甚至直接用HonestAGI提出的方法測試一遍相似度,堂而皇之地堵住其他人的嘴。當然,這一模型的原生表現應該較差,不會和報告中一致,王雲鶴肯定會祭出祖傳的“測試集訓練術”。倘若真有那一天,希望有條件跑起來的大廠、各實驗室,可以嘗試考驗模型對測試集的熟悉程度。看看我們這位考生,是不是背熟了高考卷子,來到了學術誠信這一嚴肅無比的考場!
據不完全統計,經王雲鶴此舉,受影響而離開華為的大模型預訓練、後訓練核心人員超過40人,其中天才少年若干,17, 18級幹部不計其數。另外,AI圈的其他研究者們看到華為的內部亂象,是否還願意把青春獻給中國芯片上的大模型,我要打一個問號。如今很多國企都有昇騰的訂單,如果他們的前方只剩王雲鶴這樣的人替他們積累訓練經驗,中國的AI發展又會倒退多少年?
身在華為,王雲鶴今天造假的是718B,明天就可能是大國重器上的通信計算設備,無人機的控制系統,作戰通信終端的核心元件。。。
因此,王雲鶴及其小模型實驗室團隊,其剽竊套殼行為必須受到審判。其小模型實驗室中所有不學無術、只想摘果子的成員,勢必要被釘在中國大模型發展的恥辱柱上,遺臭萬年。
回應關於135B dense模型指標的質疑:https://github.com/HW-whistleblower/True-Story-of-Pangu/issues/317:
此報告撰寫過程中,王雲鶴已然上任(理智的人可以分析arxiv報告上載時間)。與Pangu Ultra MoE完全一致,在文章攥寫過程中,可笑的是,大部分被掛名的、實際做事的被列為Contributor的研究者,在論文撰寫過程中對其存在、進度全然不知。其只挑選了唐睿明、尚利峯團隊的一小部分成員對其傾囊相授,將所有問題、技術點等凝練成文中方法及之前的部分。而對於模型的實際效果和測試集表現,小模型團隊大包大攬,唐睿明、尚利峯成員幾乎全然不知,或者是被剝奪了抗議的權利,最終導致報告中列出了假到極致的訓練測試集後的結果。
與尊重學術道德的DeepSeek團隊不同,理智的人可以仔細搜索作者名單每個人,這篇文章的Core Contributor幾乎全是領導,而不是實際的技術人員,文章作者共有52位,源於王雲鶴和某領導沆瀣一氣,得出的**“幸運52”**這一決策,可謂恬不知恥,毫無學術道德。
陸續也有他人回答,此處可以參閲issue區
從匿名、AI生成等角度,無腦噴之前論文和這個倉庫的所有人。我建議你們試試,如果你家裏有着家屬和孩子依靠着你從事的這份工作,你能不能和《讓子彈飛》的六子一樣,切開肚子給人看看你裏面有幾碗粉?