國產開源大模型,起風了_風聞
蓝洞商业-将价值写作进行到底12-01 20:41

大模型從來不是越大越好,而是越合適越好,正如周靖人所説,「未來,一定不是one size fits all」。
撰文|藍洞商業 於瑋琳
科技的浪潮幾十年一個輪迴,不同的劇本卻總是響起相似的鼓點。
如果説,一年前ChatGPT的驚豔現身,是屬於大模型時代的「iPhone時刻」;那麼,7月間Meta將Llama2開源,則被認為是拉開了大模型時代的IOS與安卓之爭。
但區別於移動互聯網時代,大模型的起跑線上,不是寡頭的一枝獨秀,而是各國廠商的百家爭鳴。在Open AI上演「奧特曼去哪兒」的大戲時,越來越多國產廠商磨刀霍霍,醖釀着一場開源大模型時代的颶風。
正如今年9月百川智能宣佈開源大模型Baichuan2-7B等版本時,創始人王小川的自信發言:「從今天開始,當我發佈Baichuan2之後,再用LLaMA2作為一個開源模型的時代已經過去了。」
加速奔跑的遠不止百川一家,如阿里雲、智譜AI和清華EKG都選擇了開源路線。就在12月的第一天,作為國內首家開源的科技大廠,阿里雲再次向行業投出了一枚「重磅炸彈」,其宣佈開源通義千問720億參數模型Qwen-72B、18億參數模型Qwen-1.8B和音頻大模型Qwen-Audio。
這意味着,通義千問的開源大模型矩陣再次擴容,真正實現了「全尺寸、全模態」開源。
不難看出,「開源、開放」是近期阿里雲頻頻強調的關鍵詞。就在一個月前的雲棲大會上,阿里巴巴集團董事會主席蔡崇信曾強調,「隨着大模型技術的迅速發展,智能化時代正在開啓,阿里雲要打造AI時代一朵最開放的雲。」
全尺寸參數大模型的開源印證了這一決心,這對於創業者和開發者而言帶來的影響是巨大的。性價比、性能、生態繁榮,已經依稀讓他們看到了屬於自己行業的「奇點」一角。
正如業內人士普遍認同的,未來90%的企業會傾向基於開源大模型發展。從科研到創業再到千行百業的開發者,依託於開源生態,迎來屬於這個時代的「智能湧現」。
開源閉源,誰是終局?
「想努力學習,又控制不住想玩遊戲」。
「看起來你對學習有熱情,但也有些迷茫,有沒有制定一個學習計劃呢?」
以上酷似心理諮詢的對話,發生在一款心理健康大模型「MindChat漫談」上,其研發團隊為華東理工大學·X-D Lab(心動實驗室)。
「孤獨是一種普遍的社會情緒」,團隊成員顏鑫説,「心理服務在整個社會有很大的需求空間,但供給匱乏」。
而依託大模型應用的落地,科研工作者正在把心理諮詢變得普惠,從奢侈品變成常用品。其驅動力,按照顏鑫的話説,是「為場景找技術」,而非「為技術找場景」。
無論開源還是閉源,大模型技術路徑的選擇如何,都離不開場景落地的終局挑戰。正如阿里雲CTO周靖人所言「今天閉源、開源都是一種手段,關鍵是今天怎麼能夠讓這些模型,快速應用在各種各樣的場景裏面。」
不可否認的是,雖然開源閉源並非單選題,但對於開發者和行業創業者等B端用户來説,開源的優勢顯而易見。
從顏鑫團隊的應用來看,在注重隱私的醫療、心理場景,開源大模型更符合私有化部署的需求,而對於有鹿科技所在的具身機器人領域來説,開源意味着可以隨着行業發展、需求變化而靈活調整的可能性。
作為專注於大模型+具身智能領域的科技創新企業,有鹿當前的客户主要集中在清潔領域和新能源領域。
拿清潔機器人來説,市面上絕大多數的相關機器人只能進行機械化的全覆蓋清掃。但搭載了大語言模型的機器人,則可以對物理世界有着更清晰的理解,這帶來的是真正的「智能」響應。
舉個例子,當物業經理説:「一號樓門前有個可樂瓶,你來掃一掃。」看似簡單的指令需要機器人理解什麼是「門前」,能夠區分「水瓶」、「礦泉水瓶」和「可樂瓶」,最後在精準作業目標的指引下,規劃出清晰的作業軌跡。
「當機器人沒有辦法理解人類這一串描述代表什麼時,它就沒有辦法實現我們所希望它在物理世界達到的智能性水平,這是有鹿機器人和通義的最大結合點。」有鹿創始人陳俊波説,「我們需要的不是一個一成不變的、智能性水平的大語言模型,而是隨着數據的積累,能變得越來越聰明的大語言模型。閉源大模型顯然做不到這一點。在我們的業態裏面,終局一定是開源模型。」
從PC時代的Windows和Linux,到移動互聯網的安卓和IOS,再到SaaS發展史上的開源閉源之爭,歷史總是反覆上演。
閉源的陣營高舉着「簡單易用」的旗幟,ChatGPT挺身站在陣前,成為「大眾知名度」的代表。而在開源的陣營裏,是無可否認的開放性生態優勢,以及更低的使用成本,成為各行各業觸摸時代脈搏的捷徑所在。

最直觀的例子是OpenAI,業內人士透露,大模型訓練和運行耗費巨大的算力資源和數據,僅在2022年,OpenAI 總計花費就達到了5.4億美元,而其產生的收入只有2800萬美元——這是行業應用者無法接受的投入產出比。
鮮明的對比是,在12月1號的通義千問發佈會上,一位個人開發者土土表示,他在用一種很省錢的方式玩開源模型。「在家裏買個服務器、扔三四塊顯卡上去,下載Qwen、讓它在服務器上運行,再搞個FRP反向代理,從阿里雲上買最便宜的30多塊錢一個多月的服務就行,這樣就能通過外網訪問家裏的服務器,在單位裏也能用通義千問做實驗。」
開源,不是一味求大
7月19日,Meta的Llama2宣佈開源,「可商用」三個字引爆了大模型創業圈,開源漸成主流趨勢,獵豹移動CEO傅盛甚至感嘆,「有的人哭暈在廁所,而有的人在夢中也能笑醒」。
大模型加速商業化時代到來,海內外風雲攪動,但勝負遠未揭曉。
據「深網騰訊新聞」報道,越來越多創業者認為,相比Llama2尤其是Llama2的漢化版本,國內開源大模型的水平和能力其實不相上下。而雖然Llama2的預訓練數據相比第一代擴大了一倍,但中文預訓練數據的比例依然少的可憐,僅為0.13%。
中文能力之外,另一個現實是,訓練Llama2並不便宜,HuggingFace機器學習科學家內森·蘭伯特估算,Llama 2的訓練成本可能超過2500萬美元,不比OpenAI三年前訓練GPT-3的花費少。
以上種種,都給國產廠商的開源大模型留下了機會窗口。性能參數、性價比、可靠性,正成為搶佔先機的關鍵詞。
僅僅在過去的一個月內,國內最大開源模型的參數紀錄就被刷新了N次。
從元象XVERSE開源650億參數高性能通用大模型XVERSE-65B;到浪潮信息發佈完全開源且可免費商用的源2.0基礎大模型,包含1026億、518億、21億不同參數規模;再到阿里雲正式開源了通義千問720億參數的大模型Qwen-72B。
其中,Qwen-72B延續通義千問預訓練模型一貫以來的強勢表現,在10個權威測評集奪得開源模型最優成績,在部分測評中超越閉源的GPT-3.5和GPT-4。

國產大模型廠商瘋狂向上摸高,但參數尺寸遠不是開源大模型的最關鍵指標。對於行業客户而言,他們要考慮的更多。
以顏鑫所在的心理學科研團隊來説,在做模型選型時,至少要考慮三個問題:是否可持續?是否有生態?以及是否滿足場景需求?
科研團隊沒有資源從頭訓練基礎模型,但科研需要持續投入,為跟風、吃紅利而生的大模型不可持續。而主流的、穩定的模型架構,能最大限度發揮生態的力量,匹配上下游的環境。而從這兩點出發,背靠阿里生態的通義千問成為了高分候選者。
此外,心理領域需要温柔、知性、能共情的大模型;教育大模型要有豐富的知識、優秀的計算能力和調用外部工具的能力。顏鑫告訴我們一個有趣的現象,作為人工智能的代表,不同廠家的模型性格各異,從知識結構來説,有的模型像文科生,而通義千問更像理科生。這也成為他們最終建立合作的關鍵因素。
事實上,大模型從來不是越大越好,而是越合適越好,正如周靖人此前所説,「未來,一定不是one size fits all」,不同的場景適配不同的參數,不同的形式,屆時大模型將走過野蠻生長階段,來到精耕細作。
「開源模型有各種尺寸,總有一款適合你,如果試過以後發現所有的模型都不行,那可能這個需求本來就不成立。」未來速度創始人秦續業的創業方向是分佈式推理框架。
在服務客户的過程中,他發現,目前用户大部分都是用13B以下較小尺寸的模型。如外接知識庫做問答應用等,完全夠用;如果需要具備一定的邏輯推理能力的模型,20-30B的中等尺寸模型是比較好的選擇。在Agent或者需要強大推理能力的場景中,70B+大模型更有優勢。
大模型百花齊放,而創業者各取所需。這一定程度上解釋了為什麼通義千問發佈會強調的是「全尺寸」、「全模態」,Qwen-72B「向上摸高」,Qwen-1.8B則「向下探底」,成為市面上尺寸最小的中國開源大模型,這意味着其推理所需的最小顯存不到1.5GB,實現了在手機等消費級終端部署。
另一個維度則是在感官上實現「能看」也「能聽」。
繼今年8月,通義千問開源了視覺理解大模型Qwen-VL之後,本次除LLM之外,通義千問團隊首次開源了音頻理解大模型Qwen-Audio。不同於僅能處理人聲信號的傳統語音模型,也能夠感知和理解人聲、自然聲、動物聲、音樂聲等各類語音信號。
成就最開放的一朵雲?
被譽為開源運動的聖經,埃裏克·斯蒂芬·雷蒙所撰寫的《大教堂與集市》中有這樣一段表述:
Linux具有顛覆性。五年前(1991年),誰曾想過一款世界級操作系統會以如此神奇的方式誕生,它由遍佈全球、僅通過脆弱的互聯網紐帶連接的數千名兼職開發人員的努力構建而成。這完全出乎我的意料。
而這「出乎意料」的故事,在每一個科技浪潮中都反覆上演。
此前在一份被認為是意外泄露的文件中,一位谷歌的內部研究人員表示「我們沒有護城河,OpenAI也沒有。」
而之所以會有這樣的「覺悟」,就在於一股不可小覷的第三方力量「開源社區」,以其中的頂流Hugging Face為例,其提供的高質量開源模型與工具,最大限度地普惠了開發者,降低了大模型的技術門檻。
開放生態是不可逆的潮流趨勢,典型的印證是,今年8月,Hugging Face獲得了2.35億美元的新一輪融資,其背後的投資者是谷歌、亞馬遜、英偉達、Salesforce、AMD、英特爾、IBM 和高通。

而在國內,阿里雲是將開源生態進行的最為徹底的大模型廠商。
事實上,本次已經是阿里雲第四次推出免費的開源模型。而在9月份,阿里雲在開源通義千問140億參數模型 Qwen-14B以及其對話模型Qwen-14B-Chat的同時,一併開放了相關的數據報告,包括與預訓練、對齊等一系列模型訓練過程有關的數據、方法都在報告中得以詳細呈現。
「不單單開源我們的模型,把報告也分享給大家,能夠讓大家體驗到模型各式各樣的表現,更有效地幫助大家進行模型的應用。」周靖人表示。
早在去年11月,阿里雲首次在業界提出「Model as a Service」理念,並推出國內首個AI模型社區「魔搭」,開發者可以在社區上下載開源AI模型,並直接調用阿里雲的算力和一站式的AI大模型訓練及推理平台。
僅僅在一年後,雲棲大會上阿里雲給出的數據顯示:魔搭社區已有超過2300個模型,開發者超過280萬,模型下載次數也超過了1億多次。
在阿里雲的願景中,魔搭社區應是一個「自由市場」,模型生產者可以在這裏上傳模型、驗證技術能力,探索應用場景和商業化模式。
而這樣的模式下,國產模型廠商之間不再是彼此競爭的「孤島」,據瞭解,百川智能的第一款 70 億參數規模的中英文語言模型 Baichuan-7B,和130億參數通用大語言模型Baichuan-13B-base和對話模型Baichuan-13B-Chat,均在發佈當天上架了魔搭社區,屬於國內首發。
合抱之木,生於毫末,九層之台,起於壘土。
高質量開源的基礎大模型,在開放生態的推動下不斷迭代優化,進而推動AI應用的創新湧現,這一整條清晰的商業路徑正悄然形成增長飛輪,讓AI普惠不再是一句虛言。