高通發佈新一代驍龍旗艦芯片,小米12首發!_風聞
半导体行业观察-半导体行业观察官方账号-专注观察全球半导体最新资讯、技术前沿、发展趋势。2021-12-01 13:42
來源:內容來自半導體行業觀察(ID:icbank)編譯自anandtech,謝謝。在今年的夏威夷技術峯會上,高通再次揭開並詳細介紹了該公司今年最重要的發佈——最新的驍龍旗艦 SoC,這顆芯片將為我們即將在2022年推出的安卓設備提供動力。今天,作為活動中的幾個公告中的第一個,高通公司宣佈了新的驍龍 8 Gen 1,它是去年推出的驍龍 888 的直接後續產品。
緊隨前代產品,驍龍新芯片在營銷和產品命名方面發生了非常明顯的變化,這主要是因為該公司正試圖簡化其產品命名和陣容。8 Gen 1 仍然是“8 系列”的一部分,代表着該系列的最高端產品,但公司使用新的命名方法,軀體了之前的三位數命名方式。對於高通的旗艦產品,這非常簡單,但這對 7 和 6 系列意味着什麼,還有待觀察,因為這兩個系列每一代都有多個部分。
在驍龍 8 Gen 1上,高通為其帶來了很多新 IP:我們看到了來自 Arm 的新三核 Armv9 Cortex CPU 內核,全新的下一代 Adreno GPU,大規模改進的成像pipeline ,此外還具有很多新功能、升級的 Hexagon NPU/DSP、集成的 X65 5G 調制解調器,所有這些都在更新的三星 4nm 工藝節點上製造。
新芯片有望大幅提高許多處理元件的性能和效率,並帶來新的用户體驗。讓我們從基本規格開始,深入瞭解芯片上的細節:
CPUs: Cortex-X2和Armv9
關於Snapdragon 8 Gen 1 (簡寫為 S8g1)的介紹,我們從其CPU 開始:這是高通第一款採用Armv9設計的CPU ,其中包括 Cortex-X2、Cortex- A710 和 Cortex-A510,三個核心分別位於處理器大、中和小設置中。在這顆CPU上,高通繼續使用 1+3+4 的核心數設計,這種設置首次在Snapdragon 855上亮相,並且在過去幾年中給設計人員帶來相對成功的體驗。
新芯片的 Cortex-X2 內核時鐘頻率為 3.0GHz,比驍龍 888 上 X1 內核的 2.84GHz 時鐘頻率略高。這實際上讓我有點驚訝,因為我對這一代處理器頻率的增加並沒有太高的期望,但很高興看到 Arm 供應商現在經常實現這一目標。作為對比哦,聯發科最近宣佈的天璣 9000在其 X2 內核上實現了 3.05GHz評率,但這是在台積電 N4 節點上實現的。相比之下,高通在三星 4nm 節點上製造 Snapdragon 8 Gen 1。該公司並沒確認這個工藝是4LPE 變體還是其他的定製,因此我們在規格表中將其保留為“4nm”節點描述。
最令人驚訝的是,高通聲稱在X2 內核上,將性能提高了 20% 或將功耗降低了 30%,特別是後面這個的數字尤其耐人尋味。因為根據三星代工廠描述,他們從 5nm 到 4nm 節點的迭代,僅讓功耗降低了 16%,而30% 的數據比工藝節點承諾的要好得多。我們向高通詢問了什麼樣的改進會導致如此大的功率下降,但該公司並沒具體説明任何細節。我還特別詢問了高通,在新的 X2 內核上,公司是否提供了自己的電壓域(voltage domain),因為在Snapdragon 旗艦之前的1+3 big+middle核心中,實現了共享的相同電壓軌(voltage rail),但該公司甚至不會確認是否是這種情況。Arm 曾指出,在 與X1相同的峯值性能點上,X2 的功率可能相當低,如果高通的營銷材料提到的數據是基於這樣的比較,那麼這些數字是説得通的。
X2 內核配置了 1MB 的 L2 緩存,而三個 Cortex-X710 內核則各有 512KB的緩存。來到中核上,新處理器的主頻略高,做到2.5GHz,比上一代略高 80MHz。根據我們的瞭解,中間內核應該更關注功耗預算,所以也許這種稍微增加的頻率確實更準確地代表了工藝節點的改進。
最後,新芯片還使用了四個 1.8GHz 的 Cortex-A510 內核。與幾周前發佈的天璣 9000 不同,高通在新處理器上利用了 Arm 的名為“合併核心”(“merged-core”)的新微架構方法,這意味着該芯片實際上有兩個 Cortex-A510 複合體(complexes),每個複合體有兩個內核,共享一個通用的 NEON/SIMD pipeline和 L2 緩存。合併核心方法旨在實現更好的面積效率。
Qualcomm 將這種方法合理化,稱在日常使用的線程較少且總體活動較少的情況下,讓單個內核能夠訪問由兩個內核共享的更大的 L2 緩存可以帶來更好的性能和效率。但遺憾的是,該公司並沒有詳細説明這個新芯片的 L2 容量是多少。不過無論是 512KB 還是 256KB,這個配置也沒有聯發科天璣 9000 激進。
Arm 的新 Armv9 CPU IP 還配備了新一代 DSU(DynamiQ 共享單元,集羣 IP),高通也在新的 Snapdragon 旗艦上使用了它。Qualcomm 在這裏選擇了 6MB 的 L3 緩存大小,並指出這是由目標工作負載之間平衡系統性能的決定。
至於系統緩存,高通提到芯片使用同樣的4MB緩存,內存控制器依然是3200MHz LPDDR5(4x 16bit通道)。需要注意的是,與去年的驍龍 888 一樣,CPU 不再可以訪問系統緩存,以改善 DRAM 延遲。在折柳,我們不得不將其與聯發科的天璣 9000 進行比較,因為後者可能具有更差的 DRAM 延遲,但也為 CPU 提供高達 14MB 的共享緩存,而驍龍 8 Gen 1 上僅為 6MB。至於這兩款芯片在實際的商業設備中將如何比較,還有待觀察。
GPU:無名的全新 Adreno 架構
過去,高通公司的 Adreno GPU 架構在其家族和性能水平方面的表現很容易識別。特別是在架構方面,我們可以清楚看到,幾年前 Adreno 600 系列開始於 Snapdragon 845 中的 Adreno 630。但與之前的 400 和 500 系列迭代不同,高通將這種表現方式一直保持到Snapdragon 888系列。到了Snapdragon 8 Gen 1 ,高通改變了一切。
在新的 GPU 命名上,高通完全放棄了任何類型的命名方式,因此並不能透過命名去了解它否在在微架構方面做了重要轉變,而這種轉變在過去會作為新的 Adreno 系列對外營銷。
高通指出,從極高層次的角度來看,新 GPU 可能看起來與前幾代相似,但其中包含大量旨在提高性能和效率的架構變化。Qualcomm 給出了併發處理優化等示例,旨在大幅提升實際工作負載的性能,而這些工作負載可能不會直接出現在基準測試中。另一個例子是 GPU 的“GMEM”在這一代看到了很大的變化,例如增加了 33% 的緩存(至 4MB),現在既是讀寫緩存,而不僅僅是用於 DRAM 流量優化的回寫緩存。
來到高階性能方面,據高通介紹,新GPU的峯值性能提升了30%。在與驍龍888同等性能下,功耗則降低了25%。高通也一反常態地對峯值功耗數據和市場現狀發表了評論。去年,Qualcomm 對 Snapdragon 888 的高峯值 GPU 功率數據進行了合理化,指出這是供應商針對其從其他玩家(尤其是 Apple)看到的情況而提出的要求,並且供應商將能夠在他們的設備中實現更好的熱封套(thermal envelopes)。
但與在相機處理等瞬態計算工作負載中實際使用 GPU 峯值性能數據的 Apple 不同,目前 Android 生態系統並未對 GPU 計算進行任何高級使用。這種承認實際上是一種新鮮空氣和對情況的洞察力,因為我在我們的麒麟 9000、Snapdragon 888 和 Exynos 2100 中特別注意到了這一點,並且Tensor對所有新芯片進行了深入的批評。這是一種非常愚蠢的情況,只要媒體繼續強調峯值性能數據,就不會很快得到解決,因為芯片供應商將很難拒絕客户要求在其上運行芯片的請求。這邊走。
高通表示,公司嘗試緩解這種對峯值性能關注的另一種方法是改變 GPU 性能和功率曲線的行為方式。該團隊表示,他們已經開始改變架構以試圖拉平曲線,不僅要實現那些可以説是毫無意義的峯值數字,而且實際上還專注於在 3-5W 功率範圍內進行更大的改進,但在與 Snapdragon去年的 888 與驍龍 865 相比,這並沒有顯着提升。
因此anandtech認為,新的驍龍 8 Gen 1可能仍然無法與蘋果的 A14 或 A15 芯片競爭。而從提供的效率數據看來,甚至連聯發科的天璣 9000 在同等性能水平下也應該比新的驍龍更高效,因此即使高通採用了三星最新的 4nm 工藝節點,但並能縮短與台積電競爭對手的差距。
大規模的ISP升級
一段時間以來,我一直聽説 2022 年的旗艦將進行大規模的攝像頭升級,而從聯發科和高通對下一代 SoC 的新功能描述,我們也看到了其背後的原因。
Snapdragon 8 Gen 1 的新 ISP 使用了一個新的營銷名稱——“Snapdragon Sight”,其中包括對圖像處理鏈中 IP 塊功能的大幅改進。
據高通介紹,新 ISP 現在能夠實現每通道 18 位色深(color depth),高於上一代 的14 位 ISP。雖然現在的移動圖像傳感器在 ADC 方面仍然勉強是 12 位原生的,但引入了新的 HDR 技術,例如交錯 HDR 捕獲(staggered HDR capture),其中曝光在傳感器的讀數上緊隨其後,這意味着基於這個處理器的新手機現在能夠更快地捕捉圖像,將它們重新組合成更高位深的結果。值得強調的睡,新的 18 位 ISP pipeline現在允許這些新傳感器上疊加三個曝光的 HDR。
增加的位深( bit-depth )應該允許在動態範圍內增加 4 個檔位(4 stops:或 2^4 = 16x 範圍),這對於對比非常強烈的環境和具有非常挑戰性的照明情況下的拍攝大有幫助。這遠遠超出了目前任何其他相機解決方案,並且能夠以這種硬件方式實現這一點,該設計模糊了傳統圖像捕捉技術與過去幾年更多由軟件定義的計算攝影方法之間的界限。
事實上,新的 ISP 架構似乎是將許多現有的計算攝影技術實現到固定功能塊中的一種方式:有一個新的神經網絡控制的 3AA(自動曝光、自動對焦、自動白平衡)和人臉檢測塊,這聽起來與谷歌的 HDRnet 實現方式非常相似。
據介紹,新ISP能讓手機相機的夜間模式通過新的多幀降噪和圖像堆得到了極大改進,現在能夠堆疊和對齊多達 30 張圖像,並在這一代實現更精細的細節。高通公司聲稱。新ISP帶來的夜間模式拍攝效果提升是上一代產品的5倍。
進一步的改進包括一個新的失真校正塊( correction block),它現在也能夠校正色差(chromatic aberrations),以及一個硬件視頻散景引擎(hardware video Bokeh engine),能夠在高達 4K 的視頻錄製中運行。可以將其視為與新款 A15 iPhone 上的新電影模式相同,但不僅限於 1080p。
高通指出,ISP 上的所有 AI/ML/神經網絡功能實際上都是在 ISP 本身上運行和加速的,這意味着它不會卸載到 Hexagon 專用的 ML 處理塊或 GPU。
就像註釋一樣 - 與 Dimensity 9000 的 9Gpixel/s 相比,Qualcomm 的 3.2Gigapixel/s 吞吐量指標似乎較低,這可能是兩家公司宣傳的指標非常不同,聯發科宣傳來自圖像的低位深度像素的吞吐量每幀傳感器數量,而高通則引用了 ISP 本身內的全位深度像素處理。
在視頻編碼器和解碼器方面,新芯片現在支持 8K HDR 錄製,但其他方面似乎與驍龍 888 媒體塊相當。這也意味着在今年的新旗艦上還沒有支持 AV1 解碼。高通不是開放媒體聯盟聯盟的成員,而是支持 VVC/H.266 和 EVC,但是隨着谷歌和 YouTube 積極推動 AV1,而Netflix 等廠商也正在大規模採用該標準,高通在2022年還不支持這個格式,這將變成一個問題。
AI 性能:迭代但可靠
去年的 Hexagon IP 模塊對驍龍 888 來説是一個非常大的變化。當時,高通公司從相對獨立的 DSP/AI 架構轉向了一個更加融合在一起的模塊,能夠對標量、向量和張量運算進行同時操作。今年的迭代則是在之前變化上的改進。Qualcomm 指出,他們將塊的共享內存增加了一倍,從而為更大的 ML 模型(增長速度非常快)提供了更高的性能。
高通這次沒有分享任何 TOPS 數據,而是表示我們新加速器的張量吞吐量性能提高了 2 倍,而標量和矢量處理的增幅較小。與驍龍 888 相比,通過硬件和軟件改進的結合,他們確實將其性能大幅提高,但在同等軟件基礎上比較兩個平台時,這個數字要小一些。
據説這一代 AI 工作負載的能效提高了 70%,這實際上更重要,並且應該有助於更苛刻的持續 ML 工作負載。
集成了X65 調制解調器
在連接性方面,驍龍 8 Gen 1 非常簡單,因為它集成了高通今年早些時候宣佈的X65 調制解調器。
據之前的介紹,高通旗艦級驍龍 X65 5G 調制解調器及射頻系統的關鍵創新包括:
可升級架構,支持跨 5G 各細分市場進行增強、擴展和定製;並通過軟件更新,支持即將推出的全新特性、功能,以及 3GPP Release 16 新特性的快速部署。特別是隨着 5G 擴展至計算、工業物聯網和固定無線接入等全新垂直行業,該可升級架構可以支持基於驍龍 X65 打造面向未來的解決方案,以支持全新特性的採用,延長終端使用週期,並有助於降低總擁有成本。
第 4 代高通 QTM545 毫米波天線模組,旨在擴大移動毫米波的網絡覆蓋,提升能效。高通 QTM545 毫米波天線模組搭配全新驍龍 X65 調制解調器及射頻系統,支持比前代產品更高的發射功率,支持包括 n259(41GHz)新頻段在內的全球所有毫米波頻段,同時保持與前代產品一樣緊湊的佔板面積。
全球首創 AI 天線調諧技術,是將公司超過十年的開創性 AI 研發成果引入移動射頻系統的第一步,為蜂窩技術性能和能效帶來重大提升。例如,與前代技術相比,通過 AI 實現對手部握持終端偵測準確率 30% 的提升。這一提升可以帶來增強的天線調諧功能,從而提高數據傳輸速度,改善覆蓋範圍,延長電池續航
下一代功率追蹤解決方案更小巧、更高效並且具備更高性能——與普通功率追蹤技術相比,具備卓越性能和成本效益。
最全面的頻譜聚合,覆蓋包括毫米波和 Sub-6GHz 頻段的全部主要 5G 頻段及其組合,FDD 和 TDD,通過使用碎片化的 5G 頻譜資產,為運營商帶來極致靈活性。
高通 5G PowerSave 2.0,基於 3GPP Release 16 定義的全新節電技術,比如聯網狀態喚醒信號(Connected-Mode Wake-Up Signal)。
高通 Smart Transmit 2.0,是由高通技術公司許可的獨特系統級技術,可與驍龍 X65 調制解調器及射頻系統搭配使用,通過利用從調制解調器到天線的系統感知功能,在持續滿足射頻發射要求的同時,為毫米波和 Sub-6GHz 頻段帶來更高的上傳速率和更廣的網絡覆蓋。
驍龍 X65 調制解調器及射頻系統的上述創新以及其它諸多性能提升,旨在通過更快的蜂窩通信速度、更廣的網絡覆蓋以及全天電池續航,提供卓越的 5G 體驗。驍龍 X65 將支持新一代頂級智能手機,並支持 5G 擴展至 PC、移動熱點、工業物聯網、固定無線接入和 5G 企業專網等細分領域。
據介紹,這是兼容 3GPP 第 16 版的調制解調器,包括上行鏈路載波聚合等新功能。其他改進包括 3 個 100MHz 載波上的 300MHz Sub-6 帶寬,以及毫米波帶寬從 800MHz 增加到 1000MHz,允許新的峯值理論下行速度達到 10Gbps。
結論
Anandtech總結道,Qualcomm Snapdragon 8 Gen 1 是一個有趣的產品,因為它代表了該系列的一個全新的開始,無論是從營銷意義上還是在技術層面上。作為驍龍 888 的後繼者,新芯片將 CPU 設置徹底改造為新的 Armv9 架構,同時還帶來了非常大的 GPU 改進、大量新的相機功能以及許多其他新功能。
不過Anandtech指出,他們不喜歡高通的一點就睡他們從蘋果的公關策略中吸取了教訓,減少了披露的技術細節數量,甚至丟棄了 GPU、NPU/DSP 或 ISP 方面的 IP 塊代編號等內容。這種不透明適用於生活方式產品公司,但不是一個很好的營銷策略,也不是一家以其開發的技術而自豪的技術公司應該使用的。無論 Qualcomm 的營銷方面和如何轉變,對我們大多數讀者而言,更關注的是他們的技術。
從技術上來説,驍龍8 Gen 1在很多方面都是更大的升級。雖然高通並不像我們從最近的競爭對手公告中看到的那樣激進,但該芯片在 CPU 配置方面表現非常出色,具有高達 3GHz 的新 Cortex-X2 內核、頻率為2.5GHz 的Cortex-A710 中間內核以及新的 A510 小內核。性能指標,至少在 X2 的部分,看起來非常可靠,雖然電源效率仍然是我們在接下來的幾周內必須更詳細地調查的問題,但似乎也比預期更好。
在我看來,新的 Adreno GPU 確實沒有得到應有的關注,因為事情比演示文稿所展示的要複雜得多。雖然我們仍然不認為高通能夠趕上蘋果或像即將推出的聯發科那樣高效,因為人們對三星 4nm 工藝節點是否能夠縮小與台積電競爭的差距的擔憂仍然揮之不去,新架構變化是顯着的,與驍龍 888 相比,我們應該會看到性能和效率的重大改進。
最後,這一代最大的變化出現在相機和 ISP 系統部分。過去幾年,智能手機相機在功能和圖像質量方面取得了巨大進步,而不是放緩(與 SoC 的其他方面相比),技術進步似乎仍在全速前進甚至加速。Snapdragon 8 Gen 1 ISP 現在為我們在過去幾年中看到的許多典型的“計算攝影”技術提供了固定的功能塊,我認為這將在 2022 年為更多供應商實現更大的相機實現旗艦設備。因此,雖然 SoC 的其餘部分可以被視為性能或效率的小幅度提升,但新的相機功能有望真正帶來新的創新和體驗。
總體而言,驍龍 8 Gen 1 看起來是驍龍 888 的一個非常可靠的繼任者。這對高通來説最重要:執行開發和交付絕大多數供應商可以依賴以實現到他們的設備中的芯片。雖然競爭正在多樣化並加強他們的遊戲部分性能,但目前來看,我們很難在市場上找到能與高通匹敵執行力的企業。
換而言之,8 Gen 1 不太可能令人失望。
最後,值得一提的是,在驍龍峯會現場,小米CEO雷軍宣佈,小米12將成為全球首發基於該處理器的智能手機。