歷史性一刻!DeepSeek超越ChatGPT,登頂美區蘋果應用榜
连政guanchazhewanxgun

DeepSeek-V3模型發佈後,在美國熱度持續飆升。截至北京時間今早,DeepSeek在美區蘋果App Store免費榜上已經排在第一位,力壓此前霸榜的ChatGPT,而排在第三的則是Meta旗下的Threads。

而就在昨天早上,DeepSeek還沒有擠進榜單前五,顯示出過去24小時發酵速度之快。
對於一款中國大模型來説,能夠在美國力壓ChatGPT,也是歷史性一刻。
除了C端用户的喜愛,DeepSeek也持續引發行業內的高度重視。
1月25日,超微半導體(AMD)在其X賬號上宣佈,已將中國人工智能公司深度求索的DeepSeek-V3模型集成到AMD Instinct MI300X GPU上,以在SGLang技術支持下,實現極致性能。選擇將DeepSeek大模型集成至自家AI芯片產品上,AMD或重塑全球AI芯片競爭格局。

AMD表示,DeepSeek-V3作為強大的混合專家(MoE)語言模型。為實現高效推理與經濟性訓練,該模型延續了前代產品DeepSeek-V2的核心架構——多頭潛在注意力機制(MLA)和DeepSeekMoE架構。在多數基準測試中,特別是數學與代碼任務領域,DeepSeek-V3均展現出業界領先性能。
那麼在通常情況下,像DeepSeek-V3這種語言大模型推理過程中,普遍都需要大量的計算資源和內存帶寬來處理文本和視覺數據,AMD則認為自家Instinct GPU系列AI芯片可以為運行此類大模型,提供出色性能。
公開信息顯示,MI300X是 AMD於2023 年底推出的旗艦級AI芯片,專為大語言模型和高性能計算設計,旨在挑戰競爭對手英偉達(Nvidia)在AI計算領域的主導地位。其基於CDNA 3架構,採用混合5nm和6nm製程工藝,集成1530億晶體管,配備192GB 內存,擁有5300GB/s的帶寬。在不考慮軟件層面問題,僅從硬件規格上看,MI300X遠超英偉達的H100甚至H200。

2023年12月,AMD CEO蘇姿豐展示MI300X平台,該GPU峯值理論性能號稱吊打英偉達H100。@AMD官方
AMD稱,深度求索團隊在DeepSeek-V3的開發過程的關鍵階段,採用了AMD ROCm 軟件和AMD Instinct GPU加速器。ROCm對FP8格式的廣泛支持,能顯著提升AI模型的運行效率,特別是在推理環節。該技術可以解決內存瓶頸及高讀寫格式相關的高延遲問題,而FP8低精度計算還能減少數據傳輸與計算過程中的延遲。因此,通過與深度求索的合作,AMD也為用户提供了更豐富的GPU硬件選擇。
另一方面,隨着AI浪潮對高算力芯片的需求,英偉達的股價水漲船高,如今已超越蘋果公司登頂全球市值最高寶座,而同期的AMD不論市場份額和產品性能,相對於英偉達都全面處於明顯劣勢。受此影響,雖然AMD也享受了AI爆發帶來的紅利,但股價自去年10月的172.8美元以來已下跌近30%,與同年3月創下的211.38美元最高點相比更是跌幅超40%。

過去一年裏,AMD股價持續下跌。CNBC
不過,轉機或已出現。2024年底,深度求索發佈DeepSeek-v3時,技術報告中稱正式訓練成本僅為550萬美元成本,使用的也是英偉達H800芯片(美出口管制”下,針對中國市場特供版H100),這和美國OpenAI以及Meta公司動輒上億美元的大模型相比,便宜到令美國人自我懷疑。前幾天,深度求索又發佈了DeepSeek-R1模型,作為開源軟件直接比肩閉源的OpenAI的o1大模型,一度引發市場關注。
越來越多的投資者開始反思,AI計算對英偉達GPU的需求是否被資本人為誇大了?因為深度求索團隊已經展示瞭如何通過超低成本,以及使用“不那麼先進的芯片”,構建出了高質量AI模型。倘若如此,這意味着訓練大模型也不用一味去追求英偉達那“一卡難求”的旗艦芯片,這時“不那麼能打”但在硬件方面性價比更高的AMD產品,則看上去更“Yes”了。
目前,華爾街分析師普遍看好AMD。包括花旗集團、路通資本等近30名分析師都給出了“買入”意見,這些預測將AMD未來一年平均目標價推上了182.7美元,出現了48.73%的上漲空間。還有更激進的預測認為,若AMD的PEG比率迴歸行業中樞(科技行業在3倍上下),其估值可能進一步提升130%以上,達到265美元。

華爾街分析師對AMD未來股價保持樂觀。StockAnanlysis
與此同時,英偉達股價則出現下跌。1月24日,英偉達收報142.62點,跌幅3.12%,盤後又下跌0.42%,反映出投資者對其市場主導地位的擔憂。
本文系觀察者網獨家稿件,未經授權,不得轉載。