2025 GPU雙雄拆解:英偉達Blackwell對陣AMD Radeon_風聞
半导体产业纵横-半导体产业纵横官方账号-探索IC产业无限可能。15分钟前

本文由半導體產業縱橫(ID:ICVIEWS)編譯自eetimes
2025年是變革的一年。
與其他行業類似,半導體領域的產品開發週期也呈現出週期性迭代特徵:每隔數年便會出現一次較大變革,而幾乎每年都會有小幅更新。以智能手機處理器為例,這類產品雖每年都會推出新款,但細究之下便會發現,許多所謂的新款其實僅涉及知識產權(IP)模塊的替換——比如更新CPU或GPU的版本,這便是行業內常説的大變化或小變化的具體體現。
智能手機處理器的集成度極高,除了核心的CPU、GPU和NPU之外,還包含眾多輔助功能模塊。其中既涵蓋視頻處理、音頻處理、顯示控制等基礎多媒體功能單元,也集成了安全引擎、傳感器中樞控制器等專用組件,這些模塊共同構成了一顆完整的芯片。
若將芯片的構成劃分為兩大部分:一部分是CPU等核心處理器,另一部分則是上述各類外設功能模塊。通常而言,外設模塊的技術成熟度較高,多已實現商品化,因此在芯片迭代時往往可以直接沿用,無需隨主芯片同步更換。我們通過持續對最新芯片進行開箱解析發現,當深入觀察芯片的內部架構時,各家廠商在技術路線上的重大調整與差異化創新,都會變得清晰可辨。
每隔幾年,芯片行業便會迎來一次標誌性的技術革新——各家企業會對芯片的內部功能佈局及終端配置進行全方位的重大調整。最具代表性的案例當屬蘋果芯片的迭代:從A12 Bionic到A13 Bionic,CPU的物理佈局發生了顯著重構(類似的重大調整在A16與A17芯片中同樣可見)。聯發科的Dimensity系列也呈現類似特徵,從1000系列升級至9000系列時,不僅芯片外觀煥然一新,各IP模塊的佈局也實現了突破性重構。
這類重大變革之後,芯片往往會進入持續演進階段,主要通過升級CPU、GPU等核心IP(即“替換式演進”)實現性能提升。這一過程通常會整合Arm等IP供應商的CPU/GPU開發路線圖,以及DRAM接口等底層技術的演進成果,最終形成一套適配多產品線的佈局規劃——這種模式對IP替換而言效率極高。NVIDIA與AMD的GPU產品同樣遵循類似規律,每隔數年便會迎來或大或小的技術迭代。
2025年正是這樣一個變革節點。據行業動態顯示,NVIDIA計劃在2025年第一季度推出基於全新Blackwell架構的GPU,AMD也將同期發佈採用RDNA 4新架構的產品——兩家企業的上一代產品均於2022年第四季度問世。本文將聚焦這兩款新GPU展開解析,需要説明的是,文中將暫略VRAM接口通道數等細節參數,重點聚焦核心技術演進。
Blackwell 搭載的GeForce RTX 5000系列分析
圖 1 呈現了我們對搭載 NVIDIA Blackwell 架構的 GeForce RTX 5000 系列部分產品的分析結果(其他型號雖已完成解析,但在此暫不贅述)。該系列的發佈節奏延續了以往慣例:1 月推出高端型號,2 月發佈中高端型號,4 月上市中端型號,7 月則推出入門級產品。
近年來,“由高至低” 的發佈策略已成為行業常見模式—— 不僅是芯片領域,智能手機市場亦是如此。蘋果、谷歌、三星電子等企業均採用這一路線:先發布 Pro 等高端機型,間隔數月後再推出入門款。例如,蘋果 iPhone 16 Pro 計劃於 2024 年 9 月發佈,而 iPhone 16e 則預計在 2025 年 2 月登場;谷歌 Pixel 9 系列也將遵循類似節奏,先推出 Pixel 9 Pro,再發布 Pixel 9a。

搭載 NVIDIA Blackwell 的 GeForce RTX 5000 系列 來源:Techanalye 報告
入門款和中等級對比
圖 2 展示了 NVIDIA Blackwell GPU 中所採用的 GDDR7 顯存與上一代 GDDR6X 的芯片對比(入門級型號 GeForce RTX 5050 未納入此次對比範圍)。關於兩者的具體參數在此不做贅述,但值得注意的是,其製造工藝與芯片尺寸均存在明顯差異。此外,內部功能區域的佈局分配也有顯著不同:GDDR7 通過縮短內存訪問長度實現了速度提升,與之相對的是,IO、放大器等組件的面積佔比出現了明顯增加,整體特性更接近高帶寬顯存(HBM)。
就目前情況而言,截至 2025 年第一季度,NVIDIA Blackwell GPU 僅採用了三星的 GDDR7 產品;不過據行業動態顯示,2025 年下半年美光等廠商的 GDDR7 產品也將陸續上市。

Blackwell 全面採用的 GDDR7來源:Techanalye 報告
圖 3 呈現了 NVIDIA Blackwell 架構下,中端型號 GeForce RTX 5060(5060Ti 採用同款芯片)與中高端型號 RTX 5070 的封裝形態及芯片型號標識。NVIDIA 延續了 “從高端到入門級” 的芯片命名邏輯:GB205 對應 RTX 5070,GB206 對應 RTX 5060,而計劃 7 月發佈的入門級型號 RTX 5050 則以 GB207 為芯片標識。這些型號的芯片均標註了流片年份,且統一為 2024 年。作為全新研發的產品,其在 2024 年完成原型設計與性能評估後,已正式進入量產階段。
Blackwell 架構的應用場景十分廣泛,NVIDIA 不僅將其用於遊戲 GPU 領域,還將其拓展至生成式 AI 領域(如 GB200、GB300)、汽車領域(DRIVE Thor)以及工作站領域(DGX SPARK),實現了同一架構在多領域的部署落地。
即便是定位中端的 RTX 5060,其芯片引腳也達到 2088 個球,這一設計旨在提升 VRAM 帶寬與供電能力。值得注意的是,該GPU的球數已超過台式機 CPU:英特爾最新的 Arrow Lake 為 1851 個球,AMD 的 AM5 則為 1718 個球。

GeForce RTX 5060(5060Ti 是同一款芯片)和RTX 5070芯片上的封裝和型號名稱 來源:Techanalye 報告
高端與超高端的比較
圖 4 展示了 NVIDIA Blackwell 架構下的高端型號 RTX 5080(芯片型號 GB203)與超高端型號 RTX 5090(芯片型號 GB202)。這兩款顯卡的芯片均為 2024 年流片產品,與前述中端型號的流片年份保持一致。
RTX 5080 與 RTX 5070 的引腳數量相同,不過 RTX 5070 存在部分未啓用的球腳。這種設計被認為是通過封裝標準化來實現成本控制的策略。而超高端的 RTX 5090,其引腳球數更是高達 5775 個,處於高端顯卡中的頂級水平(不過我們已確認,目前球數最高的是 Apple M3 Ultra,達到 7478 個球)。

NVIDIA Blackwell 高端 RTX 5080 GB203 和超高端 RTX 5090 GB202 來源:Techanalye 報告
四款芯片對比
圖5 展示了四款 NVIDIA Blackwell 芯片,入門級的 RTX 5050(GB207)未包含在內。這是一套由精簡元素構成的可擴展芯片體系,其運算核心與緩存的數量、VRAM 接口通道數量均會根據型號定位進行縮減。而單個核心與 PHY(物理層接口)則保持不變,通過調整規模來形成不同版本。這種擴展設計還具備可複用測試模式的優勢,能提升研發效率。
在這一系列中,定位最高的RTX 5090(GB202)芯片設計難度最大。它包含海量晶體管,隨着芯片面積增大,功耗控制、噪聲抑制以及時鐘偏移調整等問題的複雜度也會同步上升。因此,最合理的研發路徑是先攻克難度最高的芯片設計,再以此為基礎進行精簡調整—— 通常來説,芯片面積越大,功耗下降幅度越明顯,時鐘偏移調整也越棘手,這使得高端大芯片的產品頻率往往會略低於小芯片型號。

NVIDIA Blackwell 的四款芯片,不包括入門級 RTX 5050 GB207來源:Techanalye 報告
圖6顯示了目前市場上兩款晶體管密度最大的芯片。兩款芯片的晶體管密度均超過920億個。雖然由於製造工藝不同,兩者並非同軸比較,但晶體管密度都超過了每平方毫米1億個。對於智能手機而言,每平方毫米晶體管密度超過2億個的芯片已經上市,而且我們可能很快就會看到2納米和1.4納米制程工藝的芯片密度超過3億個。

NVIDIA Blackwell 的四款芯片,不包括入門級 RTX 5050 GB207來源:Techanalye 報告
與25年前的芯片相比
圖7將25年前的NVIDIANV11(開發代號)與最新的RTX 5090進行了比較。各項數據都高出數千倍。從這些數字中可以看到25年來的演變。雖然未來步伐會有所放緩,但我們似乎仍將不斷看到創新的身影。

NV11 與 RTX 5090 的對比 來源:Techanalye 報告
Radeon迴歸單芯片
圖8展示了搭載AMD全新架構RDNA 4的GPU Radeon RX 9070 XT(右),該GPU於2025年3月上市,以及上一代RDNA 3 GPU Radeon RX 7800 XT(左)。最大的區別在於,上一代採用了多芯片組合的芯片,而新款RX 9070 XT則迴歸了單芯片。之所以迴歸,是因為上一代Radeon RX 6000系列是單芯片。

搭載RDNA 4 的 GPURadeon RX 9070 XT(右)和上一代 RDNA 3 GPURadeon RX 7800 XT(左)來源:Techanalye 報告
儘管CHIPLET 有其優勢,但毫無疑問,芯片種類的增加會增加複雜性。雖然由於製造工藝不同,兩者無法進行同軸比較,但通過使用單芯片,集成度提高了 90% 以上。目前,有必要具備一定的靈活性,以便在某一代芯片上使用 CHIPLET,然後在可行的情況下恢復到單芯片。AMD 擁有足夠的靈活性。
*聲明:本文系原作者創作。文章內容系其個人觀點,我方轉載僅為分享與討論,不代表我方贊成或認同,如有異議,請聯繫後台。