傳DeepSeek正準備適配中國國產GPU | 聯合早報

zaobao

2025-02-03

中國初創企業深度求索（DeepSeek）研發大語言模型時據報繞過了美國人工智能巨頭英偉達的CUDA框架，為DeepSeek在未來適配中國國產晶片做好準備。

由英偉達開發的軟硬體整合技術“統一計算架構”（Compute Unified Device Architecture，CUDA）是一種通用編程框架，允許開發者利用英偉達的圖形處理器（GPU）進行計算。

由於CUDA大大降低了研發大模型的難度，因此全球大模型開發商都傾向選擇使用英偉達的CUDA技術，助力英偉達佔據全球人工智能領域的壟斷地位。

然而，據美國科技網站Tom’s Hardware報道，韓國未來資產證券在對DeepSeek技術論文進行分析時發現，該模型的硬件效率之所以能比Meta等高出10倍，因為“他們從頭開始重建了一切”。

分析指出，DeepSeek在使用英偉達的H800晶片進行訓練時，使用了英偉達的底層硬件指令PTX（Parallel Thread Execution）語言，而不是高級編程語言CUDA。

延伸閲讀

於澤遠：DeepSeek衝擊波英偉達開發者平台上線DeepSeek-R1模型由於CUDA是通用型編程框架，會導致訓練模型時損失一些靈活性。中國網媒“快科技”分析，DeepSeek的做法相當於繞過了硬件對訓練速度的限制，意味着其他模型需要訓練10天，而DeepSeek只需要五天。

然而，這種編程非常複雜且難以維護，行業通用的做法是使用CUDA這類高級編程語言。

快科技和騰訊網引述的消息人士指出，DeepSeek內部擁有一些擅長寫PTX語言的內部開發者，假如DeepSeek未來有意改適配中國國產的GPU，在硬體適配方面將會更得心應手。