Apple 發佈史上最強芯片:M1 Pro 和 M1 Max_風聞
半导体行业观察-半导体行业观察官方账号-专注观察全球半导体最新资讯、技术前沿、发展趋势。2021-10-19 14:20
來源:內容由半導體行業觀察(ID:icbank)編譯自「anandtech」,謝謝。
在今天的Apple 發佈會上,該公司宣佈了一系列新的 MacBook Pro 設備,由 Apple 的 Silicon 系列中的兩種不同的新 SoC 提供支持:新的 M1 Pro 和 M1 Max。
M1 Pro 和 Max 都是去年 推出的M1 的後續產品,M1 是 Apple 的第一代 Mac芯片,開啓了 Apple 用自己的內部設計取代基於 x86 的芯片的旅程。M1 為 Apple 贏得了廣泛的成功,在筆記本電腦市場上以前所未有的能效展示了出色的性能。儘管 M1 速度很快,但它仍然是一個較小的 SoC——仍然為 iPad Pro 系列等設備供電,並且相應的 TDP 較低,自然仍然輸給了競爭中更大、更耗電的芯片。
今天的兩款新芯片有望改變這種狀況,Apple 全力以赴提高性能,擁有更多 CPU 內核、更多 GPU 內核、更多芯片投資,而且 Apple 現在還增加了遠遠超過他們曾經做過的任何功率預算智能手機或平板電腦空間。
M1 Pro:10 核 CPU、16 核 GPU、245mm² 中的 337 億個晶體管
新宣佈的兩款芯片中的第一款是所謂的 M1 Pro——為蘋果所謂的不妥協筆記本電腦 SoC 奠定了基礎。
Apple 以展示封裝開始新產品的發佈,M1 Pro 被證明繼續採用定製的封裝,包括 Apple 將 SoC 芯片和內存芯片封裝在單個有機 PCB 上的獨特特徵,這與其他傳統芯片形成對比,例如來自 AMD 或英特爾的 DRAM 芯片,它們的特點是 DRAM 芯片要麼位於 DIMM 插槽中,要麼焊接到主板上。蘋果在這裏的方法可能會顯著提高電源效率。
該公司透露,與 M1 相比,他們在 M1 Pro 的內存總線上增加了一倍,從 128 位 LPDDR4X 接口轉移到新的更寬、更快的 256 位 LPDDR5,承諾系統帶寬高達 200GB/ s。我們不知道這個數字是精確的還是四捨五入的,但是這個寬度的 LPDDR5-6400 接口將達到 204.8GB/s。
在一次備受讚賞的演示中,Apple 實際上展示了 M1 Pro 和 M1 Max 的die鏡頭,因此我們可以立即查看芯片的塊佈局以及事物的分區方式。
讓我們從內存接口開始,它們現在更加將其整合到 SoC 的兩個角落,而不是像 M1 那樣沿着兩個邊緣展開。由於接口寬度增加,我們看到內存控制器佔用了相當大的 SoC 區域。然而,更有趣的是,Apple 現在顯然在內存控制器後面直接使用了兩個 SLC 塊。
Apple 的系統級緩存塊引人注目,因為它們服務於整個 SoC,能夠放大帶寬、減少延遲,或者只是通過避免芯片外的內存事務來節省功耗,從而大大提高了電源效率。這些新一代 SLC 模塊看起來與我們在 M1 上看到的完全不同。SRAM 單元面積看起來比 M1 大,所以雖然我們現在不能完全確認這一點,但它可能意味着每個 SLC 塊中有 16MB 的緩存——對於 M1 Pro 來説,這意味着總共 32MB SLC 緩存。
在 CPU 方面,蘋果將效率核心的數量從 4 個縮減為 2 個。我們不知道這些核心是否會與 M1 代效率核心相似,或者蘋果是否採用了更新一代的 IP A15 SoC——我們注意到新的 iPhone SoC 在這方面有一些更大的微架構變化。
在性能核心方面,Apple 現在已經翻倍,達到 8 個核心。Apple 的性能核心在 M1 上非常令人印象深刻,但在多線程性能方面落後於其他 8 核 SoC。內核的這種翻倍應該會展示出巨大的 MT 性能提升。
在裸片中,我們看到 Apple 似乎鏡像了兩個 4 核塊,L2 緩存也被鏡像。儘管 Apple 在這裏引用了 24MB 的 L2,但我認為它是一個 2x12MB 的設置,使用了類似 AMD 核心複雜的設置,兩個性能集羣的一致性改為通過結構和 SLC。當然,這是目前的推測,但鑑於所呈現的佈局,這是最有意義的。
在 CPU 性能指標方面,Apple 與競爭對手進行了一些比較——特別是這裏比較的 SKU 是英特爾的酷睿 i7-1185G7,以及英特爾最新 Ice Lake 10nm 的酷睿 i7-11800H、4 核和 8 核變體CPU。
蘋果在這裏聲稱,在多線程性能方面,新芯片的性能都大大優於英特爾提供的任何產品,而且功耗大大降低。展示的性能/功率曲線顯示,在 30W 的相同功率使用下,新 M1 Pro 和 Max 在 CPU 吞吐量上比 11800H 快 1.7 倍,11800H 的功率曲線非常陡峭。在與 11800H 峯值相同的性能水平下,新的 M1 Pro/Max 實現了 70% 的低功耗。這兩個數字都只是巨大的差異,並且遠遠領先於英特爾目前所取得的成就。
除了強大的 CPU 複合體之外,Apple 還加大了其定製 GPU 架構的規模。M1 Pro 現在配備 16 核 GPU,宣傳的計算吞吐量性能為 5.2 TFLOP。有趣的是,這個新的更大的 GPU 將得到更寬的內存總線以及大概 32MB 的 SLC 的支持——後者的作用基本上類似於 AMD 現在通過其 GPU 無限緩存實現的目標。
據説 Apple 的 GPU 性能遠遠超過任何上一代競爭對手的集成顯卡性能,因此該公司直接將 M1 Pro 與 GeForce RTX 3050 Ti 4GB 進行了比較,Apple 芯片實現了相似的性能, 但功率降低 70%。此處顯示的功率水平約為 30W - 目前尚不清楚這是總 SoC 或系統功率,還是 Apple 僅比較 GPU 塊本身。
除了 GPU 和 CPU 之外,Apple 還注意到他們大大改進的媒體引擎,現在可以處理硬件加速的 ProRes 和 ProRes RAW,這對內容創作者和專業攝像師來説非常有趣。Apple Mac 在視頻編輯方面通常享有盛譽,但 RAW 格式的硬件加速引擎將是一個殺手級功能,它將成為這些觀眾的直接賣點,我相信我們會聽到很多人談論的東西。
M1 Max:570 億晶體管和 432mm² 的 32 核 GPU 怪物
除了 M1 Pro,蘋果還帶來了M1的一個更強大的兄弟——M1 Max。雖然 M1 Pro 在性能方面趕上並超過了筆記本電腦的競爭對手,但 M1 Max 的目標是提供前所未有的東西,將 GPU 增加到總共 32 個內核——本質上它不再是帶有集成 GPU 的 SoC但它是一個帶有 SoC 的 GPU。
M1 Max的封裝略有變化,變大了——最明顯的變化是DRAM芯片從2顆增加到4顆,這也對應着內存接口寬度從256bit增加到512bit。Apple 正在宣傳 400GB/s 的巨大帶寬,如果是 LPDDR5-6400,則可能更準確,為 409.6GB/s。這種帶寬在 SoC 中是聞所未聞的,但在非常高端的 GPU 中卻是常態。
在 M1 Max 的裸片上,事情看起來很奇怪——首先,GPU 上方的整個芯片頂部看起來與 M1 Pro 基本相同,指出 Apple 正在重用大部分設計,並且Max 變體只是在塊佈局中向下增長。
額外的兩個 128 位 LPDDR5 塊很明顯,在這裏有趣的是,它們還增加了 SLC 塊的數量。如果確實是每塊 16MB,這將代表 64MB 的片上通用緩存供整個 SoC 使用。除了明顯的 GPU 用途之外,我確實想知道 CPU 能夠使用如此巨大的內存帶寬資源實現什麼。
M1 Max 確實是巨大的——Apple 透露 M1 Pro 的晶體管數量為 337 億,而 M1 Max 的晶體管數量高達 570 億。AMD 在 520 平方毫米的 Navi 21 GPU 設計中宣傳了 268 億個晶體管,而蘋果在這裏以較低的芯片尺寸將晶體管增加了一倍以上。
在芯片尺寸方面,Apple 展示了 M1、M1 Pro 和 M1 Max 並排的幻燈片,它們似乎是 1:1 的比例——M1 目前已知為 120mm²,M1 Pro 為 245mm²,和 M1 Max 432mm²。
大部分裸片尺寸被 32 核 GPU 佔用,Apple 宣稱其達到 10.4TFLOP。回過頭來看,基本上看起來蘋果在這裏基本上反映了他們的 16 核 GPU 佈局。這裏首先想到的是這將是 2 個 GPU 協同工作的想法,但 GPU 的兩半之間似乎確實存在一些共享邏輯。一旦我們看到系統的軟件行為,我們可能會更清楚地瞭解這一點。
在性能方面,Apple 正在與市場上最好的產品展開競爭,將 M1 Max 的性能與移動 GeForce RTX 3080 的性能進行比較,功耗降低 100W(60W 與 160W)。Apple 還提供了 RTX 3080 的 100W TDP 變體以進行比較,在這裏,它的性能優於 Nvidia 獨立 GPU,同時仍降低了 40% 的功耗。
今天發佈的新一代 Apple Silicon 是我們一年多以來一直期待的事情,我認為 Apple 不僅達到了預期,而且大大超越了預期。M1 Pro 和 M1 Max 看起來都具有令人難以置信的差異化設計,與我們在筆記本電腦領域見過的任何東西都大不相同。如果 M1 是蘋果在芯片領域取得成功的任何跡象,那麼這兩款新芯片在為蘋果 Mac 產品奠定令人難以置信的基礎方面也應該沒有問題,這也遠遠超出我們從任何競爭對手那裏看到的。