NAND,也要迎來HBM時刻?_風聞
半导体行业观察-半导体行业观察官方账号-专注观察全球半导体最新资讯、技术前沿、发展趋势。1小时前
NAND廠商可能是AI熱潮裏最被忽視的角色之一。
不同於DRAM廠商有HBM這柄大殺器,NAND在AI方面的增長其實非常有限。
首先是AI計算對於對DRAM需求遠大於NAND,AI大模型訓練(如GPT-4、Gemini)需要巨量的參數和中間計算數據,需要超高帶寬和低延遲的存儲。DRAM(特別是HBM)可以提供高達1TB/s以上的帶寬,而NAND(即使是PCIe 5.0 SSD)帶寬只有7~14GB/s,延遲高達幾十微秒,完全無法滿足AI計算核心需求。
而且AI芯片通常會直接封裝HBM,而NAND只是AI服務器的二級存儲,並非AI計算核心組件,這使得DRAM(尤其是HBM)成為AI計算的剛需,而NAND僅是數據存儲的附屬需求,導致前者利潤遠大於後者。
其次,在訓練端,NAND主要用於存儲數據,而不是計算加速。AI數據中心使用的 SSD主要是存儲AI訓練數據集(如LLM訓練的語料、圖片、視頻),但訓練本身並不需要高頻訪問這些數據,一旦數據加載到GPU DRAM(HBM或GDDR),NAND的作用就大幅降低,不像DRAM那樣被不斷訪問。
至於推理端,對NAND需求就更小了,推理階段的大部分模型參數早已存入HBM或DRAM,NAND只存放預處理數據,需求遠不如訓練階段,即便推理規模擴大,NAND的增量需求仍然相當有限。
以上還只是在AI應用端的挫折,當我們放眼整個NAND市場時,廠商所面臨的窘境就更加突出了:NAND更容易擴產,主要競爭對手數量也比DRAM更豐富,這也導致了更容易出現一榮俱榮,一損俱損的局面,而且許多AI數據中心仍採用HDD+SSD混合存儲架構,並未完全轉向SSD,儘管有增量,但幅度並不大。
這也讓NAND春天來的格外的晚。
悲喜交加的NAND
去年的NAND市場,就像是坐了一場過山車,廠商們還沒開心幾天,又過起了苦日子。
在經歷2023年庫存高企的至暗時刻後,NAND在2024年開年就迎來了需求端的雙重利好。第一季度全球智能手機出貨量同比增長8.2%,中國市場的"以舊換新"政策刺激效果超預期,帶動256GB以上大容量機型佔比提升至67%。
與此同時,AI服務器建設熱潮推動企業級SSD需求激增,單季度採購量環比增長32%,其中北美三大雲服務商的訂單佔據全球總量58%。
除此之外,NAND主要廠商的戰略性減產開始奏效,三星將西安工廠產能轉向232層3D NAND,美光則對消費級產品線實施20%的產能縮減。這種結構性調整使NAND Flash合約價在Q1實現17%的環比漲幅,其中1TB TLC SSD批發價突破45美元關鍵位,較2023年Q4低谷回升23%。
2024年8月,TrendForce發佈了最新enterprise SSD研究報告,其指出,由於AI需求大幅升温,AI server相關客户向供應商進一步要求加單enterprise SSD。上游供應商為了滿足SSD在AI應用上的供給,加速製程升級,開始規劃2YY產品,預期2025年量產。
TrendForce表示,AI server客户對供應商加單的情況,導致enterprise SSD合約價於2023年第四季度至2024年第三季度間的累積漲幅超過80%。
TrendForce指出,2024年AI server SSD需求市場除了16TB以上產品需求自第2季大幅上升,隨着NVIDIA H100、H20和H200等系列產品到貨,相關客户開始進一步加大TLC 4、8TB enterprise SSD訂單動能。
TrendForce預估,2024年AI相關SSD採購容量將超過45EB,未來幾年AI server可望推動SSD需求年增率平均超過60%,而AI SSD需求在全部NAND Flash的佔比有機會自2024年的5%,上升至2025年的9%。
在供給市場面,由於inference server採用大容量SSD產品的趨勢不變,供應商已開始着手加速升級製程,規劃從2025年第1季起開始量產2YY/3XX層,進而量產120TB enterprise SSD產品。
而在9月,TrendForce又發佈了2024年第二季度的NAND報告,全球NAND閃存出貨量增長有所放緩,但受AI SSD需求推動,銷售額增長了14.2%,達到167.97億美元。
TrendForce指出,由於個人電腦和智能手機買家的庫存水平高,NAND 出貨量較上一季度下降了 1%。然而,AI對大容量存儲產品的需求推動平均銷售價格(ASP)上漲約15%。其表示,“所有NAND供應商自第二季度起均已恢復盈利能力,並正在擴大產能以滿足第三季度AI和服務器市場的需求。”
不難看出,NAND好消息基本都來自於企業的AI數據中心,而壞消息都來自於消費端,這種涇渭分明的問題,第一季度還不是很明顯,在第二季度結束時愈發突出。
這一點也在廠商的財報中可以看出來,儘管頭部廠商持續減產,但渠道庫存仍高達6-8周(較健康水平高出40%)。美光Q2財報顯示,企業庫存週轉天數仍維持在98天高位。消費電子市場出現"旺季不旺"現象,618大促期間SSD零售量同比下滑12%,引發渠道商恐慌性拋售,512GB TLC SSD現貨價單週暴跌9%。
除此之外,NAND廠商也正面臨着技術迭代的陣痛期。三星的321層NAND量產進度延遲,導致原本計劃的成本下降紅利未能兑現。同時長江存儲的232層產品良率爬升至85%,加劇中低端市場競爭。價格戰在QLC產品線尤為激烈,1TB QLC SSD OEM價格跌破35美元,迫使鎧俠暫停日本四日市工廠兩條舊產線。
到了2024年第三和第四季度,NAND市場徹底步入冰火兩重天的局面,智能手機存儲容量升級進入平台期,主流機型定格在512GB配置,致使需求增速放緩至個位數。PC OEM廠商轉向"性能優先"策略,需求放緩,兩方面共同導致NAND Flash四季度市場規模環比下降8.5%,ASP與出貨量雙雙出現大降。
與之形成鮮明對比的是AI數據中心市場。微軟Azure部署的30TB QLC SSD集羣實現4倍存儲密度提升,超大規模數據中心加速淘汰15K RPM HDD,企業級SSD採購量同比增長41%,其中30TB以上產品佔比首次突破25%。值得注意的是,QLC在企業級應用的擦寫次數突破5000次,可靠性疑慮基本消除,迅速帶動了NAND在企業端的出貨量。
對於NAND廠商來説,市場在2024年恢復了一部分元氣,甚至由於AI的存儲需求而迎來難得的大幅度增長,正所謂久旱逢甘霖,微微上揚的箭頭讓它們終於鬆了一口氣。
但與此同時,消費電子市場長期的疲軟還是讓NAND廠商揹負了非常大的壓力,兼做DRAM的三星、海力士和美光尚且還能過得去,像鎧俠和西部數據這樣只做NAND的廠商,就顯得非常吃力了。
也正是如此,大家加快了尋找新出路的步伐。
NAND,迎來HBM時刻?
NAND新出路是什麼?相信所有的NAND廠商都會不約而同地把目光放在隔壁的HBM上,作為AI芯片必不可少的產品之一,它為DRAM廠商掙取了幾十億乃至幾百億美元的營收,短期內的需求也完全沒有下降的跡象,甚至出現了定製HBM這樣的風潮,當然會讓沉寂已久的NAND行業心生豔羨。
那麼NAND行業是否也可以打造一個類似於HBM的產品呢?答案並不是完全否定的。
SanDisk在2月的投資者日活動上,發佈了全新的存儲技術高帶寬閃存 (HBF) ,其允許並行訪問多個高容量 3D NAND 陣列,從而提供充足的帶寬與存儲能力。
該公司將 HBF 定位為 AI 推理應用的理想存儲解決方案,兼顧高帶寬、高容量以及低功耗需求。首代 HBF 技術可為 GPU 提供高達 4TB 的 VRAM 容量,並在未來版本中進一步提升,此外,SanDisk 還計劃將該技術擴展至手機及其他設備,但未公佈具體上市時間。
SanDisk 存儲技術主管 Alper Ilkbahar 表示:“我們將其稱為 HBF 技術,旨在增強 HBM 存儲器以支持 AI 推理工作負載。我們的目標是匹配 HBM 存儲器的帶寬,同時在相似成本下提供 8 至 16 倍的容量。”
從概念上看,HBF 與 HBM 類似,它堆疊了多個高容量、高性能的閃存核心芯片,並通過硅通孔 (TSV) 互連,再疊加一個邏輯芯片,使其能夠並行訪問多個閃存陣列(或子陣列)。HBF 的底層架構基於 SanDisk 的 BICS 3D NAND,並採用 CMOS 直接鍵合到陣列 (CBA) 設計,將 3D NAND 存儲陣列堆疊在基於邏輯工藝的 I/O 芯片之上。這種邏輯芯片可能正是 HBF 能夠實現高帶寬的關鍵。
Ilkbahar 進一步解釋道:“我們向工程師提出挑戰,問他們還能如何利用 NAND 存儲的擴展能力。他們的答案是——將龐大的存儲陣列拆分成多個獨立的小陣列,並並行訪問這些陣列。這種方法極大提升了帶寬,使我們能夠構建高帶寬閃存。”
傳統 NAND 設計將核心存儲陣列劃分為平面 (plane)、頁 (page) 和塊 (block),其中塊是最小的可擦除單元,頁是最小的可寫單元。而 HBF 似乎打破了這種傳統架構,將 NAND 芯片劃分為“多個小陣列”,每個子陣列(擁有獨立的頁和塊)可能配備專屬的讀寫通道。雖然這種方法與多平面 NAND 技術相似,但 HBF 似乎遠遠超越了傳統方案。
目前,SanDisk 表示其首代 HBF 技術採用 16 顆 HBF 核心芯片,並研發了一種專有的堆疊技術,以確保 16 層 HBF 核心芯片在堆疊時具有最小的翹曲度。此外,其邏輯芯片能夠同時訪問多個 HBF 核心芯片的數據。考慮到 HBF 需要同時處理數百甚至數千個併發數據流,其邏輯處理能力遠超典型 SSD 控制器。
SanDisk 尚未公開 HBF 的具體性能指標,因此目前尚不清楚 HBF 是否能夠匹敵原始 HBM(約 128GB/s 的帶寬)或最新的 HBM3E(例如英偉達 B200 提供 1TB/s 帶寬)。不過,SanDisk 透露的一個數據是,八個 HBF 堆疊單元共提供 4TB 的 NAND 存儲容量,即每個 HBF 堆疊單元可存儲 512GB(約為 8-Hi HBM3E 24GB 容量的 21 倍)。
如果一個 16 層 HBF 堆疊單元存儲 512GB,這意味着每個 HBF 核心芯片相當於 256Gb 3D NAND 設備,並配備了複雜的邏輯電路以實現芯片級並行訪問。在 16 顆 3D NAND 芯片之間每秒傳輸數百 GB 的數據,仍然是一個巨大的技術挑戰,讓人不禁好奇 SanDisk 是如何實現這一目標的。
可以確定的是,HBF 的單比特訪問延遲仍無法與 DRAM 相比,因此 SanDisk 強調其產品主要面向高吞吐量、讀取密集型的 AI 推理任務。對於許多 AI 推理應用而言,核心需求是以合理成本實現高吞吐量,而非 HBM(或其他 DRAM 類型)所具備的超低延遲。因此,儘管 HBF 短期內不會取代 HBM,但它可能會佔據市場中那些需要大容量、高帶寬且成本接近 NAND,而無需超低延遲的應用場景。
此外,為了簡化從 HBM 遷移至 HBF 的過程,HBF 採用了與 HBM 類似的電氣接口,並進行了部分協議調整,但並非完全兼容 HBM。
Ilkbahar 解釋道:“我們儘可能讓 HBF 在機械和電氣特性上與 HBM 接近,但仍然需要主機設備進行一些協議調整才能支持 HBF。”
SanDisk 並未提及 HBF 的寫入壽命。眾所周知,NAND 閃存的壽命有限,只能承受一定次數的寫入。儘管 SLC 和 pSLC 技術相較於消費級 SSD 採用的 TLC 和 QLC 具備更高的耐久性,但這會降低容量並增加成本。此外,NAND 典型的寫入單位是塊級,而內存通常按緩存行級尋址(即 NAND 的典型寫入單位為 128KB,而 DRAM 的緩存行通常為 32 字節),這也是 HBF 需要克服的關鍵挑戰之一。
SanDisk 計劃將 HBF 技術發展為一個開放標準,並建立開放生態系統。為此,該公司正在組建一個技術顧問委員會,成員包括“業內知名人士和合作夥伴”。
Ilkbahar 在最後表示:“我們正在讓 SanDisk 重返市場,並真正在邊緣實現令人驚歎的 AI 體驗,他正迫不及待地想要顛覆存儲行業。”
不得不説,SanDisk推出的HBF的概念對於任何NAND廠商都非常有吸引力,我們也絲毫不懷疑一旦行業將其轉化為真正標準,它就有希望在未來創造比普通NAND更高的利潤,可以説,HBF就是許多NAND廠商夢寐以求的HBM時刻。
有意思的是,SanDisk 的存儲技術主管Ilkbahar並不是什麼初出茅廬的新人,他曾擔任過英特爾 Optane 集團副總裁兼總經理,儘管 Optane 技術並未取得成功,但它的精神繼承者似乎已經準備就緒。
努力向AI靠攏
對於NAND廠商來説,HBF能爭取AI市場,但出路並不只有一條。
首先就是進一步提升存儲密度,QLC(四層單元)技術憑藉比TLC高33%的存儲密度,成為降低AI設備單位容量成本的關鍵突破點。2024年,三星推出的UFS 4.1 NAND產品,通過優化讀寫性能(順序讀取速度達2100MB/s)成功適配旗艦AI手機,使終端設備能流暢運行數十億參數的大模型。
而在企業級市場,AI訓練集羣對數據吞吐的苛刻需求推動NVMe SSD向超大容量演進。三星推出的PM9C3a企業級SSD容量突破30TB,採用176層堆疊工藝和PCIe 5.0接口,實現14GB/s的持續讀取帶寬,可滿足千卡GPU集羣的併發數據訪問需求。2024年Q2數據顯示,企業級SSD價格溢價效應顯著,三星該品類營收環比增長14.8%,平均售價漲幅達20%,側面印證了高密度存儲的需求依舊旺盛。
其次就是產能的動態調控,面對2023年因消費電子需求疲軟導致的庫存積壓,全球NAND原廠在2025年初啓動“精準減產”策略:美光推遲232層QLC產線擴產計劃,鎧俠將晶圓投入量削減15%,西部數據則將產線稼動率降至70%。這種結構性調整使2025年全球NAND晶圓投產規模縮減10%-15%,推動供需關係從過剩向緊平衡過渡。TrendForce預測,2025年下半年NAND合約價有望回升15%-20%,部分緊缺規格漲幅或超30%。
調控成效已在2024年顯現:當季全球NAND出貨量雖環比微降1%,但受益於15%的均價上漲,行業總營收逆勢增長14.2%至167.96億美元,六大原廠集體扭虧為盈。其中,SK海力士憑藉176層QLC產品在數據中心市場的滲透,營業利潤率回升至8.3%,驗證了“以價換量”策略的有效性。
類似定製HBM的生態,同樣也是一部分廠商的選擇。SK海力士通過“存儲-算力協同”策略,將企業級SSD出貨佔比提升至40%,其與AWS合作開發的智能分層存儲系統,可使AI訓練數據集加載效率提升70%。
這種生態協同效應在財報中得到驗證:鎧俠通過優化數據中心產品組合,2024年Q2企業級SSD營收環比激增27.7%;三星憑藉存儲-芯片組協同優勢,在AI服務器市場斬獲60%份額,鞏固62億美元的季度營收龍頭地位。
展望未來,隨着HBF的出現,NAND廠商的春天似乎已經不再遙遠,但面對依舊激烈的市場競爭,廠商可能會圍繞技術話語權展開新一輪的爭鬥,屆時我們也不妨拭目以待,誰能在NAND市場笑到最後。