估值高達10億美元的獨角獸：李開復旗下"零一萬物"大模型被指抄襲_風聞

原子力-5小时前

2023-11-19

11月14日，網絡上流傳着一張圖，阿里前AI科學家賈揚清指稱，某國產大模型實際上是抄襲的LLaMA，然後更換了幾個變量名就宣稱是自己研發。雖然他沒有明確指出該模型的名字，但有國外開發者直接點名，這個抄襲的模型就是李開復旗下的“零一萬物（Yi-34B）”，在零一萬物的Hugging Face開源主頁上，開發者ehartford質疑稱該模型使用了Meta LLaMA的架構，只修改了兩個tensor（張量）。

李開復創辦的AI公司零一萬物（01.AI）前幾天發佈了它的開源大模型Yi-34B，公佈的基準測試結果顯示，雖然模型參數少於其它大模型，但性能更出色。

李開復表示：“零一萬物堅定進軍全球第一梯隊目標，從招的第一個人，寫的第一行代碼，設計的第一個模型開始，就一直抱着成為世界第一的初衷和決心。我們組成了一支有潛力對標 OpenAI、Google等一線大廠的團隊，經歷了近半年的厚積薄發，交出了第一張極具全球競爭力的耀眼成績單。Yi-34B可以説不負眾望，一鳴驚人。”

在Hugging Face的討論區，開發者很快指出Yi-34B其實是對Meta開源大模型LlaMa的重構，最明顯的變化是改了幾個名字，分別為 input_layernorm 和 post_attention_layernorm。它的開源許可證也沒有提及LlaMa。它也沒有公佈調試數據，讓其他人能復現其基準測試結果。

對此，零一萬物表示：GPT是一個業內公認的成熟架構，Llama在GPT上做了總結。零一萬物研發大模型的結構設計基於GPT成熟結構，借鑑了行業頂尖水平的公開成果，由於大模型技術發展還在非常初期，與行業主流保持一致的結構，更有利於整體的適配與未來的迭代。同時零一萬物團隊對模型和訓練的理解做了大量工作，也在持續探索模型結構層面本質上的突破。

據悉，零一萬物的估值高達10億美元，已躋身獨角獸行列。