國產AI大模型猛打價格戰，但從業者表示沒什麼用，純噱頭_風聞

知危-知危官方账号-42分钟前

2024-05-27

這個 5 月，國內大廠的大模型也開始爭 “ 地板價 ” 了。

5 月 15 日，字節跳動的豆包大模型發佈，定價 0.0008 元/千Tokens。21 日，阿里通義千問 GPT-4 級主力模型 Qween-Long 降價 97%，API 輸入價格從 0.02 元/千Tokens 降至 0.0005 元/千Tokens，每千 Tokens 比豆包便宜 0.3 釐。同天，百度的文心大模型中的兩大主力模型 ERNIE Speed 和 ERNIE Lite 直接宣佈免費。22 日，騰訊也跟進了降價風潮，旗下數款大模型降價 50%-87.5% 不等，有三款大模型直接免費。

似乎，中文互聯網世界的任何事物都要經歷一波價格主導的 “ 百團大戰 ”。

國產大模型價格普降，理論上並不意外，畢竟要全面鋪開市場，利用冗餘產能，低價和免費是最直接有效的方式。但同時，在行業人士看來，降價這件事經不起細琢磨，無論是長遠效益，還是眼下國產大模型的技術水平，這場價格戰來得都比較急，而且有點不痛不癢。

AI 世界瞬息萬變，或許再過一段時間，這場價格風波會迭代成新的戰鬥方式，幾分幾釐的爭執並不重要。不過，在這個也許會轉瞬而逝的風波面前，我們試圖稍作停頓，找尋國產大模型降價背後的原因，以及這場風波有可能的後續。

截至目前，參與到 “ 價格戰 ” 中的大廠有字節跳動、阿里、百度、騰訊。

5 月 15 日，字節跳動正式發佈旗下豆包大模型，在發佈會上重點強調了豆包的價格優勢。那天，豆包在這幾家大廠裏還是最便宜的，在國內整體大模型廠商中也幾乎是最低價，豆包主力模型在企業市場的定價只有 0.0008元/千Tokens，比行業便宜 99.3% 。

一週後，阿里和百度在同天跟進降價。通義千問 GPT-4 級主力模型降價 97%，差不多打了一折，API 輸入價格從 0.02 元/千Tokens 降至 0.0005元/千Tokens，**比豆包還便宜 0.3 釐。**另一邊，百度文心大模型的兩大主力模型 ERNIE Speed 和 ERNIE Lite 乾脆直接宣佈免費。

次日，騰訊混元大模型也來了一波價格普降，除混元-pro 的輸出價格仍保持在 0.1 元/千Tokens 之外，其他大模型的價格都**降了 50%-87.5% 不等。**調價前，最貴的是 0.12 元/千Tokens 的混元-standard-256k 大模型，而這次降價最多的也是它，輸入價格調至 0.015元/千Ttokens，輸出價格 0.06 元/千Tokens，降幅分別為 87.5% 和 50% 。在騰訊雲降價的同一天，科大訊飛旗下大模型訊飛星火 API 能力也正式免費開放。

如今，國產大模型已經進入了以毫釐論價甚至免費的時代。客觀來説，大模型降價是一直以來的趨勢，去年以來，OpenAI 就進行了多次降價，5 月 13 日新發布的 GPT-4o，面向 ChatGPT 的所有付費和免費用户發佈，取消其他所有限制，API 價格從 0.1 元/千Tokens 降至 0.035 元/千Tokens（價格單位經過換算以便與國產廠商對齊）。

幾位行業人士對知危表示，降價這件事不算大，也不算稀奇。“ 現在價格被打下來的主要是文字生成這塊的大模型，行業其實還沒有做到把別的模態也打下來。而經歷過去一年多的技術迭代，文字生成效果比較好的模型現階段已經可以跑到端側了，端測運行客觀來講就是免費的。” 心光 App 聯合開發者王禹效對知危説。

他補充，降價這件事本身可能也有很多沒直接説的東西。“ 比如 OpenAI 有兩種報價，一種報價對應的服務響應比較快，另一種報價響應慢一些，也就是他們把服務器的剩餘資源拿來給你用。一般來説，大模型廠商不太可能把最好的模型拿來做免費，你會發現真正的好東西還是很貴，因為好的模型的算力成本也確實高。”

國產大模型在這個 5 月紛紛拿出價格誠意，一方面是大勢所趨，連技術水平更高的大模型都沒那麼貴，上述企業自然也希望通過降價獲得更多市場。

另一方面，來自於大模型自身的迭代。王禹效説，從技術角度來看，最開始大模型需要瘋狂堆料，但後來再做優化的時候會發現，其實不用堆太大的參數，可以通過知識蒸餾降低計算資源和模型大小，那之前的模型成本就能降到之前的十分之一**，**還能保證差不多的效果，降價也就順理成章了。

在豆包大模型發佈會上，火山引擎負責人譚待表示，大的使用量，才能打磨出好模型，也能大幅降低模型推理的單位成本。而且，如今基座大模型已經進入了穩定迭代的階段，在模型訓練和推理使用上，都還有長足的優化空間，成本下降得很快。

字節的解釋，透露出兩個信息。一是模型結構完成了優化調整，算力效率提升了，這是降價的底氣。二是通過降價拉高市場使用量，反過來對大模型的繼續迭代也是好事。

理論上講，這是一個完美的答案。不過，如果再仔細推敲起這個邏輯，很多現實結果還有待驗證。

首先，從商業模式上説根基不穩。AI 應用創業者谷林（化名）對知危表示，以價換量佔領市場，這個邏輯看起來是對的也是常見做法，但這一策略需依賴於能夠實現規模效應的商業模式，大模型 API 卻並不是：

“ 大模型面向 B 端用户，也就是開發者，要切換 API 的話，不存在切換門檻和壁壘。”

大模型的成本分有模型訓練、商業服務、API 服務這三類。單説訓練成本，就需要昂貴的投入，包括優質工程師、標註過的高質量數據以及各領域科學家對模型進行調優，這些成本都十分高昂。此外，API 使用模型進行推理的運算成本，涉及顯著的電力和硬件消耗。谷林表示，“ 正常的商業模式，就算沒有利潤，也要考慮到卡的成本和電力成本的，如果 toB 要持續提供好的服務，一定是要有利潤的。現在廠商給出每百萬 Tokens 幾塊錢幾毛錢的價格，電價可能都不夠，更別提卡了，那肯定要靠企業從其他業務的利潤上拿來做補貼。”

就像消費互聯網常見的 “ 百團大戰 ” 一樣，在 AI 大模型領域，先挑起價格敏感的，也是大廠。無論算力效率如何提升，成本如何比以前降低，AI 大模型畢竟沒有到一個全行業形成價格標準的時代，現在去無限壓低價格，還是比較具有煽動性的事情。

不過，如此降價能不能長期持續也不好定論。如果是傳統的 “ 價格戰 ”，賣的是一次性或標準化的服務，那確實誰便宜誰佔領市場。但 AI 大模型不一樣，畢竟 toB 的技術企業還是要不斷做研發創新的，現在的低價買到現在的技術，日後開發者必然也需要更好更與時俱進的技術支持，到那時還可以用現在的價格去買嗎？

還有一個值得注意的點，大廠尚有充裕的算力資源可以拿出來做低價，“ 反而是現在正在燒錢跑的模型側的一些公司，包括跑開源的公司，他們壓力比較大，因為模型研發還是挺貴的，是一個比較重資產的遊戲。” 王禹效表示。

在行業人士看來，國內這批大模型理論上是要比 OpenAI 等海外廠商的大模型差上 2-3 代，要補齊差距可能也要半年到一年的時間。也就是説，現在這撥低價，是用舊的模型去促銷，搶存量市場，壓力還在後頭。

所以，這可能不是一場 “ 價格戰 ”，而是賠本賺吆喝。

價格降了，無疑會帶來不少正向的影響。能幫助到現有應用的開發團隊，為其提供很多選擇，可以把免費或超低價的模型都拿來試試。同時也能帶來新的創業機會，在幾乎不需要考慮這方面成本的情況下，一些好的想法更容易落地。無論如何，大模型通過低價一定會收穫使用量上的暴增。

因為大模型便宜了，所以選擇用用看，這個邏輯是成立的。但是，要不要繼續用下去，或者長期選擇哪個大模型，卻不是以價格為導向的。

王禹效解釋，在國內這批大模型宣佈降價之前，一個創業者如果真想做點什麼，那幾乎每家大模型廠商都會給出很高的免費額度。“ 比如 GPT 一開始給的是將近 2 萬人民幣的免費額度，大家都可以申請。”

對於真的有想法想做 AI 創業的人來説，價格不是最核心的痛點，只能説低價或 0 元購吸引他們過來創業了，但繼續做下去的話，不會有人因為這款模型便宜就一直用，還是要篩選技術更好，更符合自己應用開發需求的模型。

“ 對開發者而言，免費可以毫無顧忌地使用到更多場景下進行推理，使用更長的 Context 提升推理的精確度和內容的多樣性。但在認真做產品的團隊，在技術選型上，還是首先考慮多模態的支持和內容質量，而不僅僅是基於成本考慮。****最終一定是迴歸到大模型廠商的技術和服務上來，這才是壁壘，價格不是壁壘。” 谷林坦言。

**不僅是開發，在應用運營的實際情況中，價格也不敏感。**王禹效舉例，“ 前兩天我們 App 的技術同事還問我，要不要搭一套新架構，這樣隨時可以在後台切換任何模型，都可以試試，還不會影響到業務。我覺得這個事情不着急，因為在應用側的實際情況中，用户是不在乎你用了什麼模型的，用户只在乎你的場景。****所以，****對於開發者來説，今天這個模型好，明天那個模型差，誰便宜了幾毫釐，誰免費了，都沒太大意義，你只要把用户最關心的某個場景的問題解決了就好。”

更何況，一款 AI 產品會用到不止一個模型，價格高的模型、價格低的模型、免費的模型，開發者都可以用，免費的模型可以用在邊角料上，做點簡單的處理。當一個開發者同時是所有價位的模型的客户，似乎也不存在用價格搶客户的事情了，只能説大家都有飯吃。

説白了，眼下國產大模型的 “ 價格戰 ” 更像是營銷手段，為廠商帶來短期的獲客，而真正決定留客率的還是模型本身的技術水平。

這也是從業者們對大模型 “ 價格戰 ” 並不興奮的原因。不會因為便宜而一直選擇，更不會因為貴就放棄好的模型。他們只覺得，在 AI 大模型還處於沒有確立標準的野蠻時代，**廠商用價格作為營銷策略也是能理解的，就像字節在着重強調豆包的價格優勢一樣。“ 字節銷售也是總來找我們，和其他廠商比，感覺字節大模型在營銷上確實算最賣力的。”**王禹效説。

歸根結底，開發者和大模型是雙向選擇的過程。篩選客户的核心不是誰家便宜，這跟消費互聯網的價格戰不一樣。谷林解釋，“ **ToC 的產品用户切換的壁壘，有用户心智，有市場佔有。**假如説廠商是 toC 之後積累了規模效應後，競爭優勢很難打破，**但現在大模型廠商提供的就是 API，不存在規模效應，B 端用户的切換成本也不高。**實施免費和補貼市場策略是否真的有助於商業增長，能形成商業壁壘嗎？這個策略是幫助行業發展，還是進入劣幣驅逐良幣的內卷？”

搞促銷，是互聯網博弈局的常見套路。只是，對於正在探索的應用層開發者和躍躍欲試的新創業者來説，這次不一樣，價格沒那麼重要。

王禹效坦言，“ 機會真是滿天飛，你快點開始做就行了。現在立刻開始做，遠比你去選哪個模型，哪個廠商，哪個更便宜，來得更實際一些。”