DeepSeek官方測算模型成本利潤率為545%
guancha
3月1日,DeepSeek官方通過社交媒體賬號公佈了其線上系統的實際統計數據,稱如果所有tokens全部按照DeepSeek R1的定價計算,理論上成本利潤率為545%。

DeepSeek官方公佈,DeepSeek V3和R1的所有服務均使用H800 GPU,使用和訓練一致的精度,即矩陣計算和dispatch傳輸採用和訓練一致的FP8格式,core-attention計算和combine傳輸採用和訓練一致的BF16,最大程度保證了服務效果。
另外,由於白天的服務負荷高,晚上的服務負荷低,因此DeepSeek實現了一套機制,在白天負荷高的時候,用所有節點部署推理服務。晚上負荷低的時候,減少推理節點,以用來做研究和訓練。在最近的24小時裏(北京時間 2025/02/27 12:00 至 2025/02/28 12:00),DeepSeek V3和R1推理服務佔用節點總和,峯值佔用為278個節點,平均佔用226.75個節點(每個節點為 8 個 H800 GPU)。假定GPU租賃成本為2美金/小時,總成本為$87,072/天。

在24小時統計時段內,DeepSeek V3和R1:
輸入token總數為608B,其中342B tokens(56.3%)命中KVCache硬盤緩存。
輸出token總數為168B。平均輸出速率為20~22 tps,平均每輸出一個token的KVCache長度是4989。
平均每台H800的吞吐量為:對於prefill任務,輸入吞吐約73.7k tokens/s(含緩存命中);對於decode任務,輸出吞吐約14.8k tokens/s。
以上統計包括了網頁、APP和API的所有負載。如果所有tokens全部按照DeepSeek R1的定價計算,理論上一天的總收入為$562,027,成本利潤率545%。
DeepSeek官方表示,實際上沒有這麼多收入,因為V3的定價更低,同時收費服務只佔了一部分,另外夜間還會有折扣。

本文系觀察者網獨家稿件,未經授權,不得轉載。