科工力量：斯坦福AI團隊抄襲中國大模型？背後還有更值得關注的信息

guancha

2024-06-04

【文/觀察者網專欄作者科工力量】

斯坦福團隊抄襲中國開源大模型，事件曝光後連夜刪庫跑路。

對這條新聞，恐怕不少人第一反應和科工力量一樣，有種一吐胸中鬱悶的感受。此前很長一段時間，從美國朝野鎖死中國AI研究能力的叫囂，到中文網絡上對國產大模型怪話連篇的調侃，讓很多人對中國AI產業的發展倍感焦慮，而通過這次事件，這樣的焦慮恐怕可以得到相當程度的紓解。

經過近兩天的發酵，這起事件本身毫無疑問已經“實錘”，不僅Llama3-V團隊發佈道歉聲明，作為被抄襲方的面壁智能，也由CEO李大海透露了核查結果，Llama3-V和MiniCPM-Llama3-V-2.5這兩個模型即便在高斯擾動驗證後，在正確和錯誤表現方面都高度相似。

兩個模型的代碼對比

不過繼續挖掘信息的話可以發現，其實所謂的斯坦福團隊只是兩個印度裔本科生自己攢的局，闖禍後，他們還第一時間把鍋甩給了實際幹活的槍手，聲稱自己是被阿拉伯裔碼農描繪的多模態架構忽悠了，他們實際只是在社交媒體平台幫着後者宣傳推廣。

而扛下了所有的碼農“槍手”Mustafa Aljadery，也是個妙人，根據其網上簡歷，目前同時寫了三份全職工作，除了兩個自己註冊的小微企業，還包括量化投資大廠Citadel“即將入職的暑期實習生”。

總之，這個“斯坦福團隊”裏的卧龍鳳雛，倒是讓人見識到了美國科技產業最底層的一個微觀切片，相互忽悠攢項目、海投注水論文“抽獎”、絞勁腦汁包裝履歷，灣區大學生的求職“內卷”也着實不容易。

斯坦福的作者在中午做出了最新回應，但現在這條回應已刪除圖源：網友截圖

Aljadery之所以抄上MiniCPM-Llama3-V-2.5，很可能是因為這個模型前一段時間在HuggingFace趨勢榜上連續霸榜，性能表現非常亮眼，OpenCompass性能基準榜單上平均得分65.1，甚至超過了GPT-4V、Gemini Pro 這些主流商用模型，而開發者在美國似乎又沒有什麼關注度，所以他們認為抄過來交差應該沒什麼風險。但這次東窗事發之後，幾個年輕人恐怕都會面臨“偷雞不成蝕把米”的後果。

斯坦福人工智能實驗室主任Christopher Manning發文譴責抄襲行為，他認為團隊在事發後避重就輕，並對MiniCPM 這一中國開源模型表示讚揚。

在科工力量看來，這次事件背後，還有着更值得關注和探討的信息。

自從ChatGPT亮相以來，有關國內AI產業發展的討論中，已逐漸形成了所謂的技術派和市場派分野，前者以入局企業為代表，往往用“相當於GPT-x.x”來衡量技術能力，力求追上乃至反超美國巨頭，而後一派則以PE/VC投資人為代表，認為OpenAI等企業連續不斷的突破已經説明，國內沒有可能也沒有必要繼續在基礎大模型上苦苦追趕，應該利用開源大模型成果，聚焦於挖掘場景應用價值。基於這樣的認識，甚至有人喊出了“不會投場上任何一家中國大模型公司”。

在過去一兩年內，這樣的爭論或許是各有理據的，不過今天的中國畢竟不同於技工貿和貿工技只能二選一的年代了，我們所擁有的基礎和資源，已經足以支撐“成年人不做選擇”。

所以我們會看到，一方面，技術派的突破在2024年已經有加速態勢，像月之暗面Kimi、幻方DeepSeek這些產品，近期在美國業界引發廣泛關注；而另一方面，就像這次事件所展現的，國內基於開源大模型的派生模型開發水平也越來越高，像MiniCPM-Llama3-V 2.5是基於SigLip-400M和Llama3–8B-Instruct構建，而開發者面壁智能最新發布的開源大模型Eurux-8x22B，則是基於Mixtral-8x22B，號稱早於Llama3、比肩Llama3、推理超越Llama3，刷新開源大模型推理性能SOTA。

月之暗面Kimi與幻方DeepSeek的平台界面

這些進展當然令人欣喜，不過無論技術派還是市場派，未來要走的路還很長。比如，國內基礎大模型開發者在實現GPT-4o乃至未來GPT-5的技術能力後，如何培育開發工具鏈和應用生態，仍將是一大挑戰；而對於聚焦場景與領域應用落地的企業，則有必要回答這樣一個追問：開源大模型是否永遠是免費的午餐？

誠然，目前開源大模型社區，尚未受到地緣因素的明顯干擾，但即便沒有人興風作浪“拖後腿”，長期安於使用別人的基礎模型成果，也意味着將制高點拱手讓給他人。

更值得注意的是，在開源大模型原始創新上，歐洲、特別是法國正佔據不容忽視的地位，AI大模型的美中法“三國殺”格局已隱約可見。

具體來看，上文提到的Mixtral-8x22B，就來自於法國初創企業Mistral AI；至於Llama系列，儘管名義上是美國巨頭Meta的產品，但其開發團隊則主要位於法國，相關人才和知識自然也主要在法國流動。

在斯坦福大學編制的《AI指數報告2024》中，主要機器學習模型的“原產地”排名上，美、中、歐盟已分別佔據前三排名

可資參照的是，在斯坦福大學編制的《AI指數報告2024》中，主要機器學習模型的“原產地”排名上，美、中、法已分別佔據前三排名；歐盟加英國合計，更是已超越中國。

這樣的格局中，藴含着不言自明的威脅性，如果國內AI產業界繼續對開源基礎模型秉持“拿來主義”，長此以往則可能進一步增強歐洲在產業競爭中的主動性，畢竟在基礎模型之外，歐洲獲得高端算力的便利性也遠強於國內。

總體而言，以這一事件為標誌，隨着中國AI大模型產業的迅速成長，其對美國產業生態的“反作用力”也會越來越頻繁而顯著，能否在多邊博弈中穩中求進，離不開每一個產業人的共同努力。

本文系觀察者網獨家稿件，文章內容純屬作者個人觀點，不代表平台觀點，未經授權，不得轉載，否則將追究法律責任。關注觀察者網微信guanchacn，每日閲讀趣味文章。