華為麒麟990發佈!餘承東:全球首款旗艦5G SoC,業界最強手機AI算力_風聞
量子位-量子位官方账号-2019-09-06 18:15
乾明 曉查 假裝發自 柏林
量子位 報道 | 公眾號 QbitAI
剛剛,華為發佈新一代芯片,麒麟990 5G。
集成5G,AI算力更強,性能再提升。
在發佈會上,餘承東用六個“最”來介紹這款芯片:
全球首款旗艦5G SoC,是業內最小的5G手機方案,也是目前晶體管數最多、功能最完整、複雜度最高的5G SoC。同時支持NSA和SA兩種5G組網模式。

而且,這也是業界最先落地的5G SoC,將會出現在9月19日發佈的Mate 30系列中。
餘承東還説,目前在5G SoC方面,華為的產品比友商的“PPT”還領先。
所以這款芯片到底如何?我們一起來看看~
集成5G,103億晶體管
麒麟990 5G,7nm+EUV工藝製程,採用全集成的5G芯片設計,面積更小,板級面積減少36%。
面積減少,但晶體管數量並沒有減少。
餘承東表示,麒麟990 5G,是業界首款晶體管數量超103億的移動終端芯片,採用了EUV製造工藝,數量達到103億。
相比之下,麒麟980的晶體管數量為69億,提升近50%。
速度上,麒麟990 5G最高下行速率2.3Gbps,最高上行速率1.25Gbps。
對於三星發佈的8nm芯片Exynos 980實現了“最高下行速率2.55Gbps,最高上行速率1.28Gbps”的説法,華為Fellow艾偉也給出了回應。
他説,基於3GPP R-15協議標準,100MHz帶寬能實現的理論速率最高為2.34Gbps,能夠突破這個速率,都是非標的。
餘承東説,這款芯片在實現高速率的同時,還能實現業界最佳能效,與傳統的4G SoC+5G Modem的解決方案相比,能效提升20%。輕負載數據下,功耗可降低44%。
就在上個月,國外研究機構IHS還發布報告,稱華為4G SoC+5G Modem的解決方案浪費能效,現在麒麟990 5G的發佈,無疑是用行動回應這一質疑。
同樣,麒麟990 5G也是業界首個全網通5G SoC,率先同步支持SA/NSA雙架構,也支持TDD/FDD全頻段。
但是,當下還處於5G商用初期,網絡覆蓋並不完善,最直接的體現就是在高速移動和信號較弱的環境下回落到4G。
這些情況,華為也給出瞭解決方案。
首先,支持基於機器學習的自適應接收器,根據5G信號強弱自動選擇最優網絡,實現穩定的5G聯接,這樣下行速率提升19%。
針對上行網絡,採用了智能上行分流設計,能夠在視頻直播、短視頻上傳等應用場景同時使用5G和4G網絡,上傳速率提升5.8倍。
但從發佈會上的情況來看,這款芯片的能力並不僅僅侷限在5G上,性能與AI也有大提升,最直觀的感受,就是圖像處理能力。
把單反的圖像降噪技術用到手機上
麒麟990 5G的採用是ISP 5.0,主要優化的就是視頻處理能力,數據上有大提升:ISP吞吐率提升15%,能效提升15%,照片降噪30%,視頻降噪20%。
在ISP能力升級的基礎上,麒麟990 5G的AR能力也再度提升。
餘承東説,通過從相機捕獲的人臉圖像數據和基於NPU運行的神經網絡算法,Face AR不僅能夠對人臉進行建模、實時跟蹤、表情捕獲,還能進一步分析出心率、呼吸率等健康數據。

在視頻和圖像的降噪上,華為也花了很大心思。
餘承東説,麒麟990 5G首次在手機芯片上實現雙域視頻降噪技術,針對視頻中的高頻、中頻、低頻噪聲混合的場景,增加頻域降噪過程,重點針對噪聲進行精準分離處理,暗光環境下拍攝的視頻更加清晰。
而且, 也是首次在手機芯片上實現基於AI分割的實時視頻後處理渲染技術。
在圖像處理上,實現了BM3D(Block-Matching and 3D filtering)單反級硬件降噪技術。這也是首次將單反級的圖像處理能力應用在手機上,暗光場景噪點更少。
不僅僅在於芯片設計與工藝,還在於麒麟9900 5G背後的AI和性能。
AI跑分創新高,業界最強AI算力
在NPU上,華為採用了新的設計:2大核+微核的設計,繼承了昇騰系列面向智能手機場景的芯片。
麒麟990 5G中的大核,就是Ascend Lite。餘承東説,基於此麒麟990 5G實現業界最強AI算力。
微核,就是Ascend Tiny,主要用於超低功耗應用,在人臉識別的應用場景下,NPU微核比大核能效最高可提升24倍,而且也更省電。
華為方面也用“車拉貨”解釋了其中的原理:
原來大核的時候,無論貨多貨少都需要用“大車”運送,肯定會浪費運力。現在有了微核設計,低功耗的任務,也就是貨少的時候,採用小車運送,保證了“運力”的有效運用。
對於麒麟990 5G的AI表現,餘承東給了個跑分數據:與麒麟970相比,提升12倍,達到76206分,是友商的3倍。
這一跑分來自蘇黎世大學提出的AI Benchmark,已成為業內跑分的重要基準,也是AI能力的直接體現。
之所以能夠達到這麼大的提升,艾偉也給出瞭解釋:用上了華為自研的達芬奇架構。
具體來説,是達芬奇架構採用的3D Cube,能夠針對矩陣運算做加速,大幅提升單位功耗下的AI算力。
每個AI Core可以在一個時鐘週期內實現4096個MAC操作,相比傳統的CPU和GPU實現數量級的提升。
餘承東表示,麒麟990 5G的性能也不僅僅只是體現在跑分上,在運行模型上,也有非常強的性能和能效,比如在Mobilenet、Resnet等等模型,與競爭對手相比,性能高達6倍,能效高達8倍。
算子數量也達到了300+,支持90%視覺計算神經網絡,比如VGG Resnet Mobilenet等等。
餘承東説, 麒麟990 5G也讓很多因為功耗和算力受限的應用成為了可能,並現場演示了AI多人實時換背景的例子。
基於AI多實例分割技術,可以將視頻畫面中的每一個人物主體單獨識別出來,實現多人物視頻拍攝替換背景,同樣,它還可以讓視頻中的其他人消失。
性能:8核CPU+16核GPU
之後,餘承東才給出了麒麟990 5G作為一款SoC芯片的基本性能數據:
麒麟990 5G採用2個超大核(基於Cortex-A76開發)+2個大核(基於Cortex-A76開發)+4個小核(Cortex-A55)架構。
最高主頻可達2.86GHz,與驍龍855相比,單核性能高10%,多核性能高9%。
能效方面針對不同大小的核精細調校,大核能效優12%,中核能效優35%,小核能效優15%。
GPU方面,麒麟990 5G提升到了16核Mali-G76 GPU,同樣與驍龍855相比,圖形處理性能高6%,能效優20%。
餘承東順便也調侃了下友商,説他們發佈的PPT 5G模組,也採用了5核GPU。
同樣,華為也針對遊戲進行了優化。
不僅有Kirin Gaming+ 2.0,也有系統級Smart Cache分流,支持智能分配DDR數據,在重載遊戲等大帶寬場景下帶寬較上一代最高可節省15%,功耗可降低12%。
AI調頻調度技術也再度升級,首次將GPU調頻調度融入CPU、DDR系統調頻調度中,實現CPU/GPU/DDR的智能融合調度,遊戲每幀負載調頻準確度再提升XX%,遊戲幀率穩定60幀。
華為Mate 30小猜想
華為一貫節奏,芯片發佈之後,手機也會登場。
率先搭載麒麟990 5G芯片的,就是這個月同樣在德國發布的Mate 30系列。
那麼麒麟990 5G加持,Mate 30系列會有哪些突破和性能改觀?
結合最新爆料,我們不妨做個總結和猜想:
首先,麒麟990 5G採用的是集成5G設計,而不是4G SoC+5G模組的方案,板級面積更小,能耗更小。這也就意味着,與其他5G手機相比,華為可以更大的電池,續航會更長。
其次,ISP和AI圖像處理能力都有了大幅度提升,結合華為透露出來的相機參數提升,在拍照與圖像處理方面都會有新的能力出現。
這次發佈會上,也透露一些新能力。比如AR不僅僅能夠追蹤面部,還能夠測心率等。
以及AI多實例分割技術,能夠分割多個人,在Mate 20上也有類似功能,但當時只能識別單個人。
而麒麟990,應該可以讓手機實現實時視頻P人了。


第三,打遊戲。搭載麒麟810的榮耀9X都宣稱主流手遊滿幀,這次用上麒麟990 5G的Mate 30系列,肯定會更強。
第四,價格。這次將5G集成到芯片中,華為花了大功夫,而且5G手機還在發展初期,成本不低,價格貴在所難免,但按照華為習慣,國內應該也會比其他地方便宜一些。
最後,餘承東表示,麒麟990有5G版本和非5G版本。
除了有無集成5G,其他都一樣,性能對比數據如下:
這也預示着,Mate30系列可能會有兩種版本:帶5G和不帶5G的。
不知道有無5G,華為的售價會相差多少?
多少價差你能接受?500元?1000元?還是不管差多少都會買5G?