DeepSeek官方測算模型成本利潤率為545%

guancha

2025-03-01

3月1日，DeepSeek官方通過社交媒體賬號公佈了其線上系統的實際統計數據，稱如果所有tokens全部按照DeepSeek R1的定價計算，理論上成本利潤率為545%。

DeepSeek官方公佈，DeepSeek V3和R1的所有服務均使用H800 GPU，使用和訓練一致的精度，即矩陣計算和dispatch傳輸採用和訓練一致的FP8格式，core-attention計算和combine傳輸採用和訓練一致的BF16，最大程度保證了服務效果。

另外，由於白天的服務負荷高，晚上的服務負荷低，因此DeepSeek實現了一套機制，在白天負荷高的時候，用所有節點部署推理服務。晚上負荷低的時候，減少推理節點，以用來做研究和訓練。在最近的24小時裏（北京時間 2025/02/27 12:00 至 2025/02/28 12:00），DeepSeek V3和R1推理服務佔用節點總和，峯值佔用為278個節點，平均佔用226.75個節點（每個節點為 8 個 H800 GPU）。假定GPU租賃成本為2美金/小時，總成本為$87,072/天。

在24小時統計時段內，DeepSeek V3和R1：

輸入token總數為608B，其中342B tokens（56.3%）命中KVCache硬盤緩存。

輸出token總數為168B。平均輸出速率為20~22 tps，平均每輸出一個token的KVCache長度是4989。

平均每台H800的吞吐量為：對於prefill任務，輸入吞吐約73.7k tokens/s（含緩存命中）；對於decode任務，輸出吞吐約14.8k tokens/s。

以上統計包括了網頁、APP和API的所有負載。如果所有tokens全部按照DeepSeek R1的定價計算，理論上一天的總收入為$562,027，成本利潤率545%。

DeepSeek官方表示，實際上沒有這麼多收入，因為V3的定價更低，同時收費服務只佔了一部分，另外夜間還會有折扣。

本文系觀察者網獨家稿件，未經授權，不得轉載。