估值高達10億美元的獨角獸:李開復旗下"零一萬物"大模型被指抄襲_風聞
原子力-5小时前
11月14日,網絡上流傳着一張圖,阿里前AI科學家賈揚清指稱,某國產大模型實際上是抄襲的LLaMA,然後更換了幾個變量名就宣稱是自己研發。雖然他沒有明確指出該模型的名字,但有國外開發者直接點名,這個抄襲的模型就是李開復旗下的“零一萬物(Yi-34B)”,在零一萬物的Hugging Face開源主頁上,開發者ehartford質疑稱該模型使用了Meta LLaMA的架構,只修改了兩個tensor(張量)。
李開復創辦的AI公司零一萬物(01.AI)前幾天發佈了它的開源大模型Yi-34B,公佈的基準測試結果顯示,雖然模型參數少於其它大模型,但性能更出色。
李開復表示:“零一萬物堅定進軍全球第一梯隊目標,從招的第一個人,寫的第一行代碼,設計的第一個模型開始,就一直抱着成為世界第一的初衷和決心。我們組成了一支有潛力對標 OpenAI、Google等一線大廠的團隊,經歷了近半年的厚積薄發,交出了第一張極具全球競爭力的耀眼成績單。Yi-34B可以説不負眾望,一鳴驚人。”
在Hugging Face的討論區,開發者很快指出Yi-34B其實是對Meta開源大模型LlaMa的重構,最明顯的變化是改了幾個名字,分別為 input_layernorm 和 post_attention_layernorm。它的開源許可證也沒有提及LlaMa。它也沒有公佈調試數據,讓其他人能復現其基準測試結果。
對此,零一萬物表示:GPT是一個業內公認的成熟架構,Llama在GPT上做了總結。零一萬物研發大模型的結構設計基於GPT成熟結構,借鑑了行業頂尖水平的公開成果,由於大模型技術發展還在非常初期,與行業主流保持一致的結構,更有利於整體的適配與未來的迭代。同時零一萬物團隊對模型和訓練的理解做了大量工作,也在持續探索模型結構層面本質上的突破。
據悉,零一萬物的估值高達10億美元,已躋身獨角獸行列。