盤點全球手機AI芯片_風聞
海阔天空-微信公众号:tieliu18882019-08-05 16:03
日前,蘇黎世聯邦理工學院AI Benchmark公佈了市場主流AI芯片的測試榜單,紫光展鋭宛如一批黑馬殺了出來——展鋭虎賁T710排行第一。此前展鋭並不在手機AI的頭部部隊裏,此次強勢霸榜,是否也宣告着展鋭也以高姿態加入了AI戰局?而展鋭的加入,也打破了目前全球手機AI芯片4強爭霸的現狀,開啓了5強競爭的新格局。
AI芯片幾個方案
手機芯片廠商之所以聚焦人工智能,是因為一些任務需要AI芯片支持才能高效率完成。比如人臉識別、圖片識別、語音識別等等。目前,就智能手機上跑的AI芯片,有DSP、GPU、NPU幾個方案。
DSP是用傳統SIMD/DSP架構適配神經網絡。高通驍龍處理器就是借用DSP和GPU來跑人工智能。
NPU是最近幾年非常火的芯片,用專門的ASIC來跑AI,優點是具有非常好的性能功耗比,但缺點是通用性不行。
總的來説,從GPU、DSP到NPU,就是從通用到專用的過程,專用性越強,性能功耗比越高。正是因此,以寒武紀、谷歌、華為、蘋果等為代表的一大批廠商選擇了專用芯片路線,犧牲了通用性,換取高性能。
下面,鐵流盤點下全球手機AI芯片的五大玩家:
1. 紫光展鋭
早在2018年,展鋭就發佈了可支持AI應用的SC9863A, 但並不是獨立的NPU. 時隔一年,展鋭即推出了第二代AI產品,
展鋭虎賁T710 ,此次霸榜的黑馬,在本次公佈的AI Benchmark測試榜單中,虎賁T710總分達到了28097,超過了高通新發布的驍龍855 plus和華為麒麟810。而且展鋭虎賁T710在9項測試中全面領先,包括圖像分類、人臉識別、圖像超分辨率以及圖像增強、分割、去模糊,足見在AI方面做了深入探索和優化。
根據公開消息,展鋭虎賁T710集成了業界最新架構的NPU,為AI計算提供了強大的算力支撐,同時還支持運行FP16、INT8、INT4等多種數據位寬的AI算法,可以為AI應用開發提供強大的平台支持。換言之,展鋭虎賁T710選擇了類似於華為麒麟芯片集成寒武紀的方案,在芯片裏集成了NPU模塊,正是依靠NPU強悍的性能,使展鋭芯片的AI性能屹立鰲頭。
2. 高通
高通的AI芯片以高通驍龍855 PLUS為代表,在排行榜上位居第二,僅次於展鋭虎賁T710。相對於展鋭和華為在手機芯片上集成了專門的NPU來跑AI,高通一直沿用CPU、GPU、DSP等傳統單元來跑AI。就高通上一代旗艦驍龍845來説,高通並沒有專用於處理AI任務的NPU,而是用DSP(Hexagon 685)來處理AI應用,有時候CPU和GPU也會輔助DSP跑AI。
在最新的驍龍855上,也沒有像其他方案那樣集成一個專為AI設計的NPU,而是繼續依賴CPU、GPU、DSP等傳統單元,並增加一個AI引擎。
至於為何不做專門的NPU,高通的觀點是不能把所有AI任務都交給一個核心去處理,而是要利用所有可用的資源,來達到效率的最大化,所以整套方案叫做AI引擎。高通的第四代AI引擎軟件套件可以對實現對終端側AI語音、拍攝、遊戲和XR體驗的支持。
高通這種做法主要是為了節約成本,因為額外加入一個NPU模塊,會增加芯片的成本。由於高通處於市場壟斷地位,沒有變革的急迫性,為了賺取利潤最大化,因而在人工智能硬件方面則能省就省。另外,其實現在不少AI應用,原來也是用DSP跑的,高通用DSP、CPU、GPU來跑AI,就現在的情況來看也夠用。
**3.**華為
華為麒麟810在排行榜上位列第三。華為和展鋭一樣,走的是集成NPU的路線,華為麒麟970集成了寒武紀的IP。之後,華為麒麟980則集成了寒武紀雙核NPU,使用了更高精度的深度網絡,支持人臉識別、物體識別、物體檢測等AI場景。
華為最新的麒麟810則拋開了寒武紀,採用了華為自己的達芬奇架構NPU。根據在AI-Benchmark查詢到的以處理器AI跑分進行的最新排名,麒麟810以23944分排名第一,驍龍855和Helio P90分列第二和第三。麒麟810這個成績在發佈時非常不錯的,但長江後浪推前浪,麒麟810在AI性能上已經被後起之秀展鋭T710超越。
**4.**聯發科
雖然聯發科給自己的人工智能模塊起名為APU,但實際上,聯發科的技術路和華為、蘋果、展鋭沒啥區別,本質上都是專用芯片,也就是犧牲通用性換取高性能。在此前的P60中,聯發科就在SoC裏集成了雙核APU。最新的P90則繼承了APU 2.0,在ETH Zurich蘇黎世聯邦理工學院開發的AI跑分測試中,聯發科P90的成績優於高通驍龍855。然而,這個成績相對於驍龍855plus、麒麟810和展鋭虎賁T710的測試成績就遜色不少了。
**5.**三星
Exynos9820是三星首款搭載了NPU的SoC,在AI算力上相對於Exynos9820上一代芯片提升了7倍。很顯然,三星也選擇了和華為、蘋果、展鋭、聯發科相同的技術路線。三星最新的Exynos9825雖然在製造工藝上將採用7nm工藝,但從跑分榜單上看,在AI算力上,相對於展鋭T710和高通855plus還是有一定差距。
結語
當下人工智能就兩類方案,一是以CPU、GPU、DSP等傳統芯片支持AI應用,二是用人工智能專用模塊來支持AI應用。總的來説,這兩個方案各有優劣。不過,隨着人工智能技術的不斷進步,對算力的需求也會不斷增加,鐵流猜測,在不遠的將來,人工智能模塊會像GPU、DSP一樣成為SoC中的必備模塊。如今高通的方案可能會被時代淘汰。
由於AI應用被逐漸發掘出來,未來,各大芯片廠商可能會開啓AI算力競賽。而中國企業在這方面有望擁有越來越大的市場佔比和話語權。