DeepSeek“引爆”國產芯片,崑崙芯單機部署滿血版,價格最低_風聞
半导体行业观察-半导体行业观察官方账号-专注观察全球半导体最新资讯、技术前沿、发展趋势。1小时前
過去兩個月,國產大模型DeepSeek席捲全球。
之所以能夠在全球引起如此廣泛的討論,首先因為它擁有了媲美全球領先的OpenAI-o1模型的效果;其次,該模型將推理成本壓縮到極致。就連OpenAI 首席執行官Sam Altman在談到DeepSeek的時候也直言:“DeepSeek R1 是一款令人印象深刻的模型,尤其是考慮到它們的價格。”其他如英偉達CEO黃仁勳、圖靈獎得主Yann LeCun和AI科學家吳恩達也對DeepSeek不吝讚美。
在自身實力的加持和這些行業領先專家的背書下,DeepSeek的訪問量暴漲。現如今,DeepSeek訪問使用量急速上升,已經成為目前最快突破3000萬日活躍用户量的應用程序。又因為這是一個開源模型,進而催生了很多本地部署的需求。
有見及此,各大雲廠商和包括芯片公司在內的AI硬件廠商,都開始打造相應的解決方案,為DeepSeek的落地做好充分的準備。
DeepSeek落地,三種方式
因為本身的特點,市場上的用户使用DeepSeek主要有三種路徑:
一是使用DeepSeek官方的提供的服務,即是通過其官網或者APP訪問。但正如前文所説,因為其訪問流量大增,該公司的算力配置目前似乎並不能滿足當前的需求,導致頻頻出現“服務器繁忙,請稍後再試”這樣的提示,大大降低了使用體驗;
二是使用雲供應商提供的服務,例如百度雲、AWS、阿里巴巴、騰訊雲以及華為雲等國內外知名的雲廠商都提供了DeepSeek V3/R1服務,這些公司甚至還將DeepSeek植入到自己的產品矩陣中;
以百度為例,早在2月3號,百度智能雲千帆平台就已正式上線滿血版本的DeepSeek-R1和DeepSeek-V3模型,提供超低調用價格以及限時免費體驗。“百度搜索”在2月16日進一步披露,百度搜索和文心智能體平台宣佈將全面接入DeepSeek和文心大模型最新的深度搜索功能。搜索用户可免費使用DeepSeek和文心大模型深度搜索功能,文心智能體平台的開發者也將能隨時調用DeepSeek模型創建並調優智能體。
三是本地部署DeepSeek。和以上兩種通過網絡訪問DeepSeek的方式不一樣,在本地部署DeepSeek不但在隱私上得到了最高維度的保障。在性能表現方面,本地部署可實現微秒級響應,也優於很多網絡訪問的服務。其他諸如使用的便捷性、控制權,甚至整個系統使用週期的成本,也都是優於前兩種。這也正是各地企業、政府甚至私人都在紛紛部署本地DeepSeeK的原因之一。
於是,對於想要部署本地DeepSeek的開發者來説,如何選擇相應的硬件,就成為了他們頭疼的問題。因為如上所述,包括芯片廠商在內的AI硬件供應商都在紛紛切入這個賽道,併發布了其產品。尤其是本土的芯片公司,更是紛紛切入這個賽道,爭先恐後地推出支持DeepSeek的設備。
值得一提的是,當前推出的機器五花八門,當中有不少受限於本身的實力,只推出僅支持參數量較少的“蒸餾”模型的單機設備,或者是通過多機協同部署“滿血版”的DeepSeek R1,這時候,能夠支持滿血版DeepSeek R1的單機設備顯得尤為可貴。因為相較於多機部署,單機部署成本更低、數據更安全、部署更快。不過,因為滿血版的DeepSeek R1需要處理大量數據,而芯片的算力和顯存直接影響模型的運行效率。因此要想單機部署滿血版DeepSeek R1,就需要能提供高顯存和算力的芯片。
其中,崑崙芯正是國內少有的,能支持單機部署滿血版DeepSeek R1的芯片。
崑崙芯全方位支持DeepSeek
據瞭解,崑崙芯(北京)科技有限公司前身為百度智能芯片及架構部,於2021年4月完成獨立融資。公司團隊在國內最早佈局AI加速領域,深耕十餘年,是一家在體系結構、芯片實現、軟件系統和場景應用均有深厚積累的AI芯片企業。
2025年2月20日,崑崙芯科技正式宣佈,崑崙芯P800成為首款支持單機部署DeepSeekV3/R1671B滿血版大模型的國產AI芯片,標誌着國產AI芯片領域的一次重要突破。
作為國產高性能AI芯片的代表之一,崑崙芯P800是本土率先支持單機部署滿血版DeepSeek R1的國產芯,單機部署就能發揮DeepSeek R1全部性能。崑崙芯P800還率先支持 8bit 推理,可提供精度無損的推理服務,在保證計算精度的同時,用更低的計算量完成任務,效率更高。
根據崑崙芯官方信息,P800在配置上提供了8卡與16卡兩種選擇。其中,單機8卡配置便可實現 2437 tokens/s 吞吐(處理數據快),在性能、功耗和部署靈活性上達到行業領先水平,滿足輕量化與極致效價比需求。如果使用16卡版本,則最高能夠實現每秒處理4825個token的吞吐量。
基於這些表現,對比市面上業已公開數據的廠商,崑崙芯的表現也是國內領先的。如上所述,這主要得益於其大顯存的設計。
也正是在這個領先芯片支持下,早在2月初,百度智能雲就成功點亮了崑崙芯三代萬卡集羣,該集羣突破了硬件擴展性瓶頸,採用了創新的散熱方案,並對模型進行了分佈式訓練優化。其實為了提升企業部署、管理大規模計算集羣的效率,百度智能雲早在2021年就推出了百舸異構計算平台,目前百舸平台已升級到4.0,百舸4.0提供了為崑崙芯萬卡集羣提供了容錯和穩定性機制,以確保有效訓練率達到98%。針對機間通信帶寬需求,百舸還建設了一套超大規模HPN高性能網絡來優化拓撲結構,從而降低通信瓶頸並提高帶寬有效性。
面對DeepSeek R1/V3需求的崛起,在公有云服務方面,百度智能雲千帆大模型平台為客户提供了極高性價比的API調用服務,價格低至DeepSeek官方刊例價的3折,創下全網最低價。
針對本地部署需求,百度智能雲也為企業使用DeepSeek提供最具效價比的解決方案。據瞭解,百度智能雲已經推出搭載崑崙芯 P800的百舸、千帆一體機產品,可支持在單機環境下一鍵部署DeepSeek R1/V3 全系列模型,提供開箱即用的便捷體驗。其中,百舸DeepSeek一體機更是憑藉其領先的配置,能滿足高性能訓練與推理需求。
據介紹,該機單機高吞吐,數據處理速度快,可支持500人團隊併發使用,推理延遲低,響應速度快,平均50毫秒以內,運維成本低,最高可降低80%,這使其價格成為了國內最低的方案,省錢又省心;從開箱到上電到服務上線最快僅需0.5天,省時省力。
回看DeepSeek這一個多月來的夢幻經歷,離不開性能與成本的極致平衡和開源生態的繁榮。作為國內唯一支持單機部署滿血版DeepSeek R1的AI芯片,崑崙芯不僅以高算力、高顯存和低成本的解決方案刷新行業標準,更通過百舸、千帆一體機為企業和開發者提供了即開即用的便捷體驗。
從另一個角度看,也正是因為DeepSeek的異軍突起,給崑崙芯等國產芯片創造了更多可能。展望未來,本土硬件和軟件的緊密結合,將為本土大模型的發展提供一條更可控的成長路線,這一切都值得期待。