英特爾也加入了：針對DeepSeek進行深度優化

2025-02-01

美國科技巨頭正積極擁抱DeepSeek。

2月1日，美國芯片巨頭英特爾表示，近日中國AI公司DeepSeek發佈Janus Pro模型，其超強性能和高精度引起業界關注，英特爾Gaudi 2D AI加速器現已針對該模型進行深度優化，這使得AI開發者能夠以更低成本、更高效率實現複雜任務的部署與優化。

作為一款創新性的AIGC模型，DeepSeek Janus模型集成了多模態理解和生成功能。該模型首次採用統一的Transformer架構，突破了傳統AIGC模型依賴多路徑視覺編碼的限制，實現了理解與生成任務的一體化支持。在此基礎上，Janus Pro通過優化訓練策略和擴展模型規模，顯著提升了文生圖等功能的性能與穩定性，並提供了10億參數和70億參數兩個版本，在性能與精度上展現了較強的競爭力。

圖源：github.com

在Janus Pro統一的Transformer架構下，文生圖模型的吞吐量高低已經從依賴加速器的高算力，向充分利用HBM內存高帶寬和大容量轉換。

英特爾表示，Gaudi 2D憑藉2.45TB/秒的高帶寬和96GB HBM大容量內存，為Janus Pro模型提供了強大的計算支持，使其在生圖批處理任務中，隨着批量大小（Batch Size）的增加，吞吐性能得到顯著提升，大幅縮短任務處理時間。

與此同時，結合英特爾Optimum-Habana框架的優化，英特爾Gaudi 2D顯著提升了文生圖任務的吞吐性能和推理效率，僅需約10秒即可生成16張高質量的圖片。而且，開發者僅需調整數行代碼，即可實現這一結果，極大降低了開發門檻和遷移成本。此外，DeepSeek的蒸餾模型在至強和Gaudi平台上也得到了支持。

這家美國芯片巨頭還提到，DeepSeek-R1讓輕量化模型本地部署更為簡單，DeepSeek目前能夠在英特爾產品上運行，更可以在AI PC上實現離線使用。

不止英特爾，一開始便對DeepSeek讚賞有加的英偉達，也在昨天（1月31日）宣佈推理模型DeepSeek-R1正式登陸NVIDIA NIM微服務。據介紹，在單個NVIDIA HGX H200系統上，完整版DeepSeek-R1 671B的處理速度可達3872 Token/秒。

與此同時，亞馬遜也在Amazon Bedrock和SageMaker AI中，上線了DeepSeek-R1模型。

曾經衝出來和OpenAI一起高調質疑DeepSeek“偷竊”數據的微軟，甚至在前一天就把DeepSeek-R1搶先部署在了自家的雲服務Azure上。

圖源：微軟社交媒體

英特爾的老對手AMD，也早在一週前就宣佈，已將新的DeepSeek-V3模型集成到Instinct MI300X GPU上，該模型經過SGLang強化，針對Al推理進行了優化。

在人工智能專家吳恩達看來，本週圍繞DeepSeek的熱議，讓許多人清晰地看到了幾個一直存在的重要趨勢：美國在生成式AI領域的領先地位正在被中國迎頭趕上，AI供應鏈格局將被重塑；開放權重模型正在推動基礎模型層商品化，為應用開發者帶來新機遇；擴大規模並非通往AI進步的唯一途徑，儘管算力備受追捧，但算法創新正在快速降低訓練成本。

他在社交媒體上寫道，當ChatGPT在2022年11月發佈時，美國在生成式AI領域明顯領先於中國。人們的印象轉變是緩慢的，因此即使在最近，我仍然聽到美國和中國的朋友都認為中國落後。但實際上，過去兩年裏，這種差距正在迅速縮小。憑藉Qwen、Kimi、InternVL和DeepSeek等來自中國的模型，中國顯然一直在縮小差距，並且在視頻生成等領域，中國似乎已經處於領先地位。

“我很高興DeepSeek-R1以開源權重模型發佈，並附帶技術報告，分享了許多細節。與此形成鮮明對比的是，一些美國公司為了扼殺開源，大肆炒作諸如人類滅絕等假設性的AI危險，推動監管。現在，開源/開源權重模型顯然是AI供應鏈的關鍵組成部分：許多公司都將使用它們。如果美國繼續阻礙開源，中國將主導AI供應鏈的這一環節，許多企業最終將使用更多反映中國價值觀而非美國價值觀的模型。”他表示。

本文系觀察者網獨家稿件，未經授權，不得轉載。