英特爾也加入了:針對DeepSeek進行深度優化

美國科技巨頭正積極擁抱DeepSeek。
2月1日,美國芯片巨頭英特爾表示,近日中國AI公司DeepSeek發佈Janus Pro模型,其超強性能和高精度引起業界關注,英特爾Gaudi 2D AI加速器現已針對該模型進行深度優化,這使得AI開發者能夠以更低成本、更高效率實現複雜任務的部署與優化。
作為一款創新性的AIGC模型,DeepSeek Janus模型集成了多模態理解和生成功能。該模型首次採用統一的Transformer架構,突破了傳統AIGC模型依賴多路徑視覺編碼的限制,實現了理解與生成任務的一體化支持。在此基礎上,Janus Pro通過優化訓練策略和擴展模型規模,顯著提升了文生圖等功能的性能與穩定性,並提供了10億參數和70億參數兩個版本,在性能與精度上展現了較強的競爭力。

圖源:github.com
在Janus Pro統一的Transformer架構下,文生圖模型的吞吐量高低已經從依賴加速器的高算力,向充分利用HBM內存高帶寬和大容量轉換。
英特爾表示,Gaudi 2D憑藉2.45TB/秒的高帶寬和96GB HBM大容量內存,為Janus Pro模型提供了強大的計算支持,使其在生圖批處理任務中,隨着批量大小(Batch Size)的增加,吞吐性能得到顯著提升,大幅縮短任務處理時間。
與此同時,結合英特爾Optimum-Habana框架的優化,英特爾Gaudi 2D顯著提升了文生圖任務的吞吐性能和推理效率,僅需約10秒即可生成16張高質量的圖片。而且,開發者僅需調整數行代碼,即可實現這一結果,極大降低了開發門檻和遷移成本。此外,DeepSeek的蒸餾模型在至強和Gaudi平台上也得到了支持。
這家美國芯片巨頭還提到,DeepSeek-R1讓輕量化模型本地部署更為簡單,DeepSeek目前能夠在英特爾產品上運行,更可以在AI PC上實現離線使用。
不止英特爾,一開始便對DeepSeek讚賞有加的英偉達,也在昨天(1月31日)宣佈推理模型DeepSeek-R1正式登陸NVIDIA NIM微服務。據介紹,在單個NVIDIA HGX H200系統上,完整版DeepSeek-R1 671B的處理速度可達3872 Token/秒。
與此同時,亞馬遜也在Amazon Bedrock和SageMaker AI中,上線了DeepSeek-R1模型。
曾經衝出來和OpenAI一起高調質疑DeepSeek“偷竊”數據的微軟,甚至在前一天就把DeepSeek-R1搶先部署在了自家的雲服務Azure上。

圖源:微軟社交媒體
英特爾的老對手AMD,也早在一週前就宣佈,已將新的DeepSeek-V3模型集成到Instinct MI300X GPU上,該模型經過SGLang強化,針對Al推理進行了優化。
在人工智能專家吳恩達看來,本週圍繞DeepSeek的熱議,讓許多人清晰地看到了幾個一直存在的重要趨勢:美國在生成式AI領域的領先地位正在被中國迎頭趕上,AI供應鏈格局將被重塑;開放權重模型正在推動基礎模型層商品化,為應用開發者帶來新機遇;擴大規模並非通往AI進步的唯一途徑,儘管算力備受追捧,但算法創新正在快速降低訓練成本。
他在社交媒體上寫道,當ChatGPT在2022年11月發佈時,美國在生成式AI領域明顯領先於中國。人們的印象轉變是緩慢的,因此即使在最近,我仍然聽到美國和中國的朋友都認為中國落後。但實際上,過去兩年裏,這種差距正在迅速縮小。憑藉Qwen、Kimi、InternVL和DeepSeek等來自中國的模型,中國顯然一直在縮小差距,並且在視頻生成等領域,中國似乎已經處於領先地位。
“我很高興DeepSeek-R1以開源權重模型發佈,並附帶技術報告,分享了許多細節。與此形成鮮明對比的是,一些美國公司為了扼殺開源,大肆炒作諸如人類滅絕等假設性的AI危險,推動監管。現在,開源/開源權重模型顯然是AI供應鏈的關鍵組成部分:許多公司都將使用它們。如果美國繼續阻礙開源,中國將主導AI供應鏈的這一環節,許多企業最終將使用更多反映中國價值觀而非美國價值觀的模型。”他表示。
本文系觀察者網獨家稿件,未經授權,不得轉載。