科工力量:斯坦福AI團隊抄襲中國大模型?背後還有更值得關注的信息
guancha
【文/觀察者網專欄作者 科工力量】
斯坦福團隊抄襲中國開源大模型,事件曝光後連夜刪庫跑路。
對這條新聞,恐怕不少人第一反應和科工力量一樣,有種一吐胸中鬱悶的感受。此前很長一段時間,從美國朝野鎖死中國AI研究能力的叫囂,到中文網絡上對國產大模型怪話連篇的調侃,讓很多人對中國AI產業的發展倍感焦慮,而通過這次事件,這樣的焦慮恐怕可以得到相當程度的紓解。
經過近兩天的發酵,這起事件本身毫無疑問已經“實錘”,不僅Llama3-V團隊發佈道歉聲明,作為被抄襲方的面壁智能,也由CEO李大海透露了核查結果,Llama3-V和MiniCPM-Llama3-V-2.5這兩個模型即便在高斯擾動驗證後,在正確和錯誤表現方面都高度相似。

兩個模型的代碼對比
不過繼續挖掘信息的話可以發現,其實所謂的斯坦福團隊只是兩個印度裔本科生自己攢的局,闖禍後,他們還第一時間把鍋甩給了實際幹活的槍手,聲稱自己是被阿拉伯裔碼農描繪的多模態架構忽悠了,他們實際只是在社交媒體平台幫着後者宣傳推廣。
而扛下了所有的碼農“槍手”Mustafa Aljadery,也是個妙人,根據其網上簡歷,目前同時寫了三份全職工作,除了兩個自己註冊的小微企業,還包括量化投資大廠Citadel“即將入職的暑期實習生”。
總之,這個“斯坦福團隊”裏的卧龍鳳雛,倒是讓人見識到了美國科技產業最底層的一個微觀切片,相互忽悠攢項目、海投注水論文“抽獎”、絞勁腦汁包裝履歷,灣區大學生的求職“內卷”也着實不容易。

斯坦福的作者在中午做出了最新回應,但現在這條回應已刪除 圖源:網友截圖
Aljadery之所以抄上MiniCPM-Llama3-V-2.5,很可能是因為這個模型前一段時間在HuggingFace趨勢榜上連續霸榜,性能表現非常亮眼,OpenCompass性能基準榜單上平均得分65.1,甚至超過了GPT-4V、Gemini Pro 這些主流商用模型,而開發者在美國似乎又沒有什麼關注度,所以他們認為抄過來交差應該沒什麼風險。但這次東窗事發之後,幾個年輕人恐怕都會面臨“偷雞不成蝕把米”的後果。

斯坦福人工智能實驗室主任Christopher Manning發文譴責抄襲行為,他認為團隊在事發後避重就輕,並對MiniCPM 這一中國開源模型表示讚揚。
在科工力量看來,這次事件背後,還有着更值得關注和探討的信息。
自從ChatGPT亮相以來,有關國內AI產業發展的討論中,已逐漸形成了所謂的技術派和市場派分野,前者以入局企業為代表,往往用“相當於GPT-x.x”來衡量技術能力,力求追上乃至反超美國巨頭,而後一派則以PE/VC投資人為代表,認為OpenAI等企業連續不斷的突破已經説明,國內沒有可能也沒有必要繼續在基礎大模型上苦苦追趕,應該利用開源大模型成果,聚焦於挖掘場景應用價值。基於這樣的認識,甚至有人喊出了“不會投場上任何一家中國大模型公司”。
在過去一兩年內,這樣的爭論或許是各有理據的,不過今天的中國畢竟不同於技工貿和貿工技只能二選一的年代了,我們所擁有的基礎和資源,已經足以支撐“成年人不做選擇”。
所以我們會看到,一方面,技術派的突破在2024年已經有加速態勢,像月之暗面Kimi、幻方DeepSeek這些產品,近期在美國業界引發廣泛關注;而另一方面,就像這次事件所展現的,國內基於開源大模型的派生模型開發水平也越來越高,像MiniCPM-Llama3-V 2.5是基於SigLip-400M和Llama3–8B-Instruct構建,而開發者面壁智能最新發布的開源大模型Eurux-8x22B,則是基於Mixtral-8x22B,號稱早於Llama3、比肩Llama3、推理超越Llama3,刷新開源大模型推理性能SOTA。


月之暗面Kimi與幻方DeepSeek的平台界面
這些進展當然令人欣喜,不過無論技術派還是市場派,未來要走的路還很長。比如,國內基礎大模型開發者在實現GPT-4o乃至未來GPT-5的技術能力後,如何培育開發工具鏈和應用生態,仍將是一大挑戰;而對於聚焦場景與領域應用落地的企業,則有必要回答這樣一個追問:開源大模型是否永遠是免費的午餐?
誠然,目前開源大模型社區,尚未受到地緣因素的明顯干擾,但即便沒有人興風作浪“拖後腿”,長期安於使用別人的基礎模型成果,也意味着將制高點拱手讓給他人。
更值得注意的是,在開源大模型原始創新上,歐洲、特別是法國正佔據不容忽視的地位,AI大模型的美中法“三國殺”格局已隱約可見。
具體來看,上文提到的Mixtral-8x22B,就來自於法國初創企業Mistral AI;至於Llama系列,儘管名義上是美國巨頭Meta的產品,但其開發團隊則主要位於法國,相關人才和知識自然也主要在法國流動。

在斯坦福大學編制的《AI指數報告2024》中,主要機器學習模型的“原產地”排名上,美、中、歐盟已分別佔據前三排名
可資參照的是,在斯坦福大學編制的《AI指數報告2024》中,主要機器學習模型的“原產地”排名上,美、中、法已分別佔據前三排名;歐盟加英國合計,更是已超越中國。
這樣的格局中,藴含着不言自明的威脅性,如果國內AI產業界繼續對開源基礎模型秉持“拿來主義”,長此以往則可能進一步增強歐洲在產業競爭中的主動性,畢竟在基礎模型之外,歐洲獲得高端算力的便利性也遠強於國內。
總體而言,以這一事件為標誌,隨着中國AI大模型產業的迅速成長,其對美國產業生態的“反作用力”也會越來越頻繁而顯著,能否在多邊博弈中穩中求進,離不開每一個產業人的共同努力。
本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平台觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閲讀趣味文章。
