國產AI大模型猛打價格戰,但從業者表示沒什麼用,純噱頭_風聞
知危-知危官方账号-42分钟前
這個 5 月,國內大廠的大模型也開始爭 “ 地板價 ” 了。
5 月 15 日,字節跳動的豆包大模型發佈,定價 0.0008 元/千Tokens。21 日,阿里通義千問 GPT-4 級主力模型 Qween-Long 降價 97%,API 輸入價格從 0.02 元/千Tokens 降至 0.0005 元/千Tokens,每千 Tokens 比豆包便宜 0.3 釐。同天,百度的文心大模型中的兩大主力模型 ERNIE Speed 和 ERNIE Lite 直接宣佈免費。22 日,騰訊也跟進了降價風潮,旗下數款大模型降價 50%-87.5% 不等,有三款大模型直接免費。
似乎,中文互聯網世界的任何事物都要經歷一波價格主導的 “ 百團大戰 ”。
國產大模型價格普降,理論上並不意外,畢竟要全面鋪開市場,利用冗餘產能,低價和免費是最直接有效的方式。但同時,在行業人士看來,降價這件事經不起細琢磨,無論是長遠效益,還是眼下國產大模型的技術水平,這場價格戰來得都比較急,而且有點不痛不癢。
AI 世界瞬息萬變,或許再過一段時間,這場價格風波會迭代成新的戰鬥方式,幾分幾釐的爭執並不重要。不過,在這個也許會轉瞬而逝的風波面前,我們試圖稍作停頓,找尋國產大模型降價背後的原因,以及這場風波有可能的後續。

截至目前,參與到 “ 價格戰 ” 中的大廠有字節跳動、阿里、百度、騰訊。
5 月 15 日,字節跳動正式發佈旗下豆包大模型,在發佈會上重點強調了豆包的價格優勢。那天,豆包在這幾家大廠裏還是最便宜的,在國內整體大模型廠商中也幾乎是最低價,豆包主力模型在企業市場的定價只有 0.0008元/千Tokens,比行業便宜 99.3% 。
一週後,阿里和百度在同天跟進降價。通義千問 GPT-4 級主力模型降價 97%,差不多打了一折,API 輸入價格從 0.02 元/千Tokens 降至 0.0005元/千Tokens,**比豆包還便宜 0.3 釐。**另一邊,百度文心大模型的兩大主力模型 ERNIE Speed 和 ERNIE Lite 乾脆直接宣佈免費。
次日,騰訊混元大模型也來了一波價格普降,除混元-pro 的輸出價格仍保持在 0.1 元/千Tokens 之外,其他大模型的價格都**降了 50%-87.5% 不等。**調價前,最貴的是 0.12 元/千Tokens 的混元-standard-256k 大模型,而這次降價最多的也是它,輸入價格調至 0.015元/千Ttokens,輸出價格 0.06 元/千Tokens,降幅分別為 87.5% 和 50% 。在騰訊雲降價的同一天,科大訊飛旗下大模型訊飛星火 API 能力也正式免費開放。
如今,國產大模型已經進入了以毫釐論價甚至免費的時代。客觀來説,大模型降價是一直以來的趨勢,去年以來,OpenAI 就進行了多次降價,5 月 13 日新發布的 GPT-4o,面向 ChatGPT 的所有付費和免費用户發佈,取消其他所有限制,API 價格從 0.1 元/千Tokens 降至 0.035 元/千Tokens( 價格單位經過換算以便與國產廠商對齊 )。
幾位行業人士對知危表示,降價這件事不算大,也不算稀奇。“ 現在價格被打下來的主要是文字生成這塊的大模型,行業其實還沒有做到把別的模態也打下來。而經歷過去一年多的技術迭代,文字生成效果比較好的模型現階段已經可以跑到端側了,端測運行客觀來講就是免費的。” 心光 App 聯合開發者王禹效對知危説。
他補充,降價這件事本身可能也有很多沒直接説的東西。“ 比如 OpenAI 有兩種報價,一種報價對應的服務響應比較快,另一種報價響應慢一些,也就是他們把服務器的剩餘資源拿來給你用。一般來説,大模型廠商不太可能把最好的模型拿來做免費,你會發現真正的好東西還是很貴,因為好的模型的算力成本也確實高。”
國產大模型在這個 5 月紛紛拿出價格誠意,一方面是大勢所趨,連技術水平更高的大模型都沒那麼貴,上述企業自然也希望通過降價獲得更多市場。
另一方面,來自於大模型自身的迭代。王禹效説,從技術角度來看,最開始大模型需要瘋狂堆料,但後來再做優化的時候會發現,其實不用堆太大的參數,可以通過知識蒸餾降低計算資源和模型大小,那之前的模型成本就能降到之前的十分之一**,**還能保證差不多的效果,降價也就順理成章了。

在豆包大模型發佈會上,火山引擎負責人譚待表示,大的使用量,才能打磨出好模型,也能大幅降低模型推理的單位成本。而且,如今基座大模型已經進入了穩定迭代的階段,在模型訓練和推理使用上,都還有長足的優化空間,成本下降得很快。
字節的解釋,透露出兩個信息。一是模型結構完成了優化調整,算力效率提升了,這是降價的底氣。二是通過降價拉高市場使用量,反過來對大模型的繼續迭代也是好事。
理論上講,這是一個完美的答案。不過,如果再仔細推敲起這個邏輯,很多現實結果還有待驗證。
首先,從商業模式上説根基不穩。AI 應用創業者谷林( 化名 )對知危表示,以價換量佔領市場,這個邏輯看起來是對的也是常見做法,但這一策略需依賴於能夠實現規模效應的商業模式,大模型 API 卻並不是:
“ 大模型面向 B 端用户,也就是開發者,要切換 API 的話,不存在切換門檻和壁壘。”
大模型的成本分有模型訓練、商業服務、API 服務這三類。單説訓練成本,就需要昂貴的投入,包括優質工程師、標註過的高質量數據以及各領域科學家對模型進行調優,這些成本都十分高昂。此外,API 使用模型進行推理的運算成本,涉及顯著的電力和硬件消耗。谷林表示,“ 正常的商業模式,就算沒有利潤,也要考慮到卡的成本和電力成本的,如果 toB 要持續提供好的服務,一定是要有利潤的。現在廠商給出每百萬 Tokens 幾塊錢幾毛錢的價格,電價可能都不夠,更別提卡了,那肯定要靠企業從其他業務的利潤上拿來做補貼。”
就像消費互聯網常見的 “ 百團大戰 ” 一樣,在 AI 大模型領域,先挑起價格敏感的,也是大廠。無論算力效率如何提升,成本如何比以前降低,AI 大模型畢竟沒有到一個全行業形成價格標準的時代,現在去無限壓低價格,還是比較具有煽動性的事情。
不過,如此降價能不能長期持續也不好定論。如果是傳統的 “ 價格戰 ”,賣的是一次性或標準化的服務,那確實誰便宜誰佔領市場。但 AI 大模型不一樣,畢竟 toB 的技術企業還是要不斷做研發創新的,現在的低價買到現在的技術,日後開發者必然也需要更好更與時俱進的技術支持,到那時還可以用現在的價格去買嗎?
還有一個值得注意的點,大廠尚有充裕的算力資源可以拿出來做低價,“ 反而是現在正在燒錢跑的模型側的一些公司,包括跑開源的公司,他們壓力比較大,因為模型研發還是挺貴的,是一個比較重資產的遊戲。” 王禹效表示。
在行業人士看來,國內這批大模型理論上是要比 OpenAI 等海外廠商的大模型差上 2-3 代,要補齊差距可能也要半年到一年的時間。也就是説,現在這撥低價,是用舊的模型去促銷,搶存量市場,壓力還在後頭。
所以,這可能不是一場 “ 價格戰 ”,而是賠本賺吆喝。

價格降了,無疑會帶來不少正向的影響。能幫助到現有應用的開發團隊,為其提供很多選擇,可以把免費或超低價的模型都拿來試試。同時也能帶來新的創業機會,在幾乎不需要考慮這方面成本的情況下,一些好的想法更容易落地。無論如何,大模型通過低價一定會收穫使用量上的暴增。
因為大模型便宜了,所以選擇用用看,這個邏輯是成立的。但是,要不要繼續用下去,或者長期選擇哪個大模型,卻不是以價格為導向的。
王禹效解釋,在國內這批大模型宣佈降價之前,一個創業者如果真想做點什麼,那幾乎每家大模型廠商都會給出很高的免費額度。“ 比如 GPT 一開始給的是將近 2 萬人民幣的免費額度,大家都可以申請。”
對於真的有想法想做 AI 創業的人來説,價格不是最核心的痛點,只能説低價或 0 元購吸引他們過來創業了,但繼續做下去的話,不會有人因為這款模型便宜就一直用,還是要篩選技術更好,更符合自己應用開發需求的模型。
“ 對開發者而言,免費可以毫無顧忌地使用到更多場景下進行推理,使用更長的 Context 提升推理的精確度和內容的多樣性。但在認真做產品的團隊,在技術選型上,還是首先考慮多模態的支持和內容質量,而不僅僅是基於成本考慮。****最終一定是迴歸到大模型廠商的技術和服務上來,這才是壁壘,價格不是壁壘。” 谷林坦言。
**不僅是開發,在應用運營的實際情況中,價格也不敏感。**王禹效舉例,“ 前兩天我們 App 的技術同事還問我,要不要搭一套新架構,這樣隨時可以在後台切換任何模型,都可以試試,還不會影響到業務。我覺得這個事情不着急,因為在應用側的實際情況中,用户是不在乎你用了什麼模型的,用户只在乎你的場景。****所以,****對於開發者來説,今天這個模型好,明天那個模型差,誰便宜了幾毫釐,誰免費了,都沒太大意義,你只要把用户最關心的某個場景的問題解決了就好。”
更何況,一款 AI 產品會用到不止一個模型,價格高的模型、價格低的模型、免費的模型,開發者都可以用,免費的模型可以用在邊角料上,做點簡單的處理。當一個開發者同時是所有價位的模型的客户,似乎也不存在用價格搶客户的事情了,只能説大家都有飯吃。
説白了,眼下國產大模型的 “ 價格戰 ” 更像是營銷手段,為廠商帶來短期的獲客,而真正決定留客率的還是模型本身的技術水平。
這也是從業者們對大模型 “ 價格戰 ” 並不興奮的原因。不會因為便宜而一直選擇,更不會因為貴就放棄好的模型。他們只覺得,在 AI 大模型還處於沒有確立標準的野蠻時代,**廠商用價格作為營銷策略也是能理解的,就像字節在着重強調豆包的價格優勢一樣。“ 字節銷售也是總來找我們,和其他廠商比,感覺字節大模型在營銷上確實算最賣力的。”**王禹效説。
歸根結底,開發者和大模型是雙向選擇的過程。篩選客户的核心不是誰家便宜,這跟消費互聯網的價格戰不一樣。谷林解釋,“ **ToC 的產品用户切換的壁壘,有用户心智,有市場佔有。**假如説廠商是 toC 之後積累了規模效應後,競爭優勢很難打破,**但現在大模型廠商提供的就是 API,不存在規模效應,B 端用户的切換成本也不高。**實施免費和補貼市場策略是否真的有助於商業增長,能形成商業壁壘嗎?這個策略是幫助行業發展,還是進入劣幣驅逐良幣的內卷?”
搞促銷,是互聯網博弈局的常見套路。只是,對於正在探索的應用層開發者和躍躍欲試的新創業者來説,這次不一樣,價格沒那麼重要。
王禹效坦言,“ 機會真是滿天飛,你快點開始做就行了。現在立刻開始做,遠比你去選哪個模型,哪個廠商,哪個更便宜,來得更實際一些。”