付斌:國產AI芯片發展到哪一步了?
【文/ 電子工程世界】
10月17日夜間,美國又開始收緊制裁了,引發行業眾怒。
一方面,在AI芯片禁令中加入了三條新規:
把性能密度作為出口管制標準,即單芯片超過300teraflops算力/性能密度超過每平方毫米370 gigaflops芯片都會禁止,同時,英偉達A100/A800/H800/H800/L40/L40S/RTX4090、英特爾Gaudi 2、AMD計劃的中國版GPU等特供版AI芯片的供應;
先進芯片出口許可範圍擴大到40多個國家;
對21個國家提出芯片製造設備許可要求,全面限制中國的14nm以下先進芯片製造能力。
另一方面,將壁仞、摩爾線程等國產AI芯片公司列入實體清單。
美國的瘋狂程度令人咋舌,連比H100效率低十倍的RTX4090都不放過。故技重施,不斷用小手段干擾國產發展,這從側面説明,國產AI芯片發展迅速,現在開始,再也不能小看國產的力量了。
01. 不是每種芯片都叫AI芯片
雖然我們每天都在茶餘飯後攀談AI芯片,但實際上,大部分人對於AI芯片並沒有什麼實際的概念,加之廠商直接以“AI芯片”命名,所以很難與器件關聯掛鈎。
所謂AI芯片,顧名思義,就是計算AI算法的芯片。AI算力需求究竟有多誇張?據OpenAI測算,2012年開始,全球AI訓練所用計算量呈現指數增長,平均每3.43個月便會翻一倍,目前計算量已擴大30萬倍,遠超算力增長速度。
計算任何算法的芯片,都歸屬於AI芯片,這既包括最具代表性的深度神經網絡(Deep Neural Network,簡稱DNN)、循環神經網絡(Recurrent Neural Network,簡稱RNN)、卷積神經網絡(Convolutional Neural Network,簡稱CNN),也包括與人腦更為類似的脈衝神經網絡 (Spiking Neural Network,簡稱SNN) 。
理論來説,任何數字芯片都能算AI,畢竟數字芯片,就是算數的芯片,但如果效率巨低、能耗巨大,就沒有意義了。就比如説,CPU作為中央處理器,什麼類型計算都能勝任,但計算AI的效率明顯沒有GPU高,所以服務器中都是使用CPU+GPGPU的形式,讓GPGPU作為AI計算的主力。
此外,很多MCU中也會搭載DSP或者NPU來增強AI計算能力,但這種芯片一般不會單獨叫做AI芯片,畢竟它們針對的場景並非大規模AI算法,也並非堆砌AI算力的主力,而是靠近邊緣的AI算力。
因此,按照上述分類方法,AI芯片主要分為GPGPU(通用圖形處理器)、FPGA(可編程邏輯器件)、ASIC(專用集成電路)、存算一體和類腦芯片幾種。根據在網絡中的位置,又可以分為雲端AI芯片 、邊緣和終端AI芯片。
GPGPU:與GPU不同,GPGPU就是將GPU圖形顯示部分“摘掉”,全力走通用計算,特別適合用在深度學習訓練方面;
FPGA:可編程的靈活性是任何其它計算芯片無法替代的,同時它在AI領域也具備一定計算能力,但相對來説,FPGA的成本就相對高一些了,而且FPGA開發也很難,軟件生態沒有GPGPU的CUDA那麼方便;
ASIC:性能強、功耗低,Gaudi 2就是一種ASIC,NPU也是加入神經單元的一種ASIC,不過針對特定算法計算,算法是無法修改的,想要做另一種算法就要再造一種ASIC芯片,前期開發需要FPGA輔助進行;
存算一體:能耗比極佳,能夠突破存儲牆和功耗牆,但目前只在自動駕駛領域有商業化;
類腦計算:性能更強、功耗更低,算法也變成了SNN,但全世界都在研究之中,還未商業化。

適用於AI計算芯片主要類型,製表丨電子工程世界

類腦芯片主要類型和研發進度,製表丨電子工程世界
02. 每種AI芯片國產發展如何了?
首先,是GPU方面,天下苦英偉達已久。
多家媒體報道顯示,英偉達的數據中心GPU價格貴得驚人,國產還難以替代,此外今年6月起,英偉達就曾多次漲價。
國內GPU融資高峯期主要在2020年,到現在GPU相關融資總額已超過200億元。僅2020年~2021年,GPGPU領域就有近20起融資事件發生。
目前來看,初創公司如芯瞳半導體、芯動科技、摩爾線程、天數智芯、壁仞科技均產品陸續推出產品,並獲好評,龍芯中科、海光信息、寒武紀、芯原股份幾家上市公司也持續耕耘GPU業務。不止如此,也均在替代CUDA上做了一些工作。

國產GPU廠商不完全統計,製表丨電子工程世界
其次,在ASIC方面,分為多種玩家。
一種是專門設計製造ASIC的公司,包括寒武紀、地平線、耐能科技等廠商,分別專注AI芯片的細分領域,採用“大客户捆綁”模式進入大客户供應鏈。
另一種,是各種跨界選手:vivo先於2021年9月發佈ISPV1,再於2022年4月發佈升級產品V1+,並在2022年11月發佈V2;OPPO在2021年12月發表能強化手機圖像處理性能的NPU MariSilicon X,之後在2022年12月揭露採用台積電6nm RF製程的藍牙音訊SoC MariSilicon Y;阿里巴巴在2019年9月發佈AI芯片含光800。

國內ASIC芯片玩家不完全統計,圖源丨 偲睿洞察
FPGA方面,電子工程世界歷史文章《英特爾分拆FPGA業務,國產發展幾何?》中介紹,目前國內與FPGA相關研發企業數量超過28家,其中已在A股上市的企業包括復旦微電子、安路科技、航錦科技,成都華微電子上市“已問詢”。此外,紫光同創、高雲半導體、京微齊力、中科億海微、智多晶、遨格芯微、易靈思的表現值得關注。
具體來説,復旦微電在國內較早推出億門級FPGA,新一代十億門級產品正在研發中,並且有可編程片上系統的技術儲備;紫光同創覆蓋高、中、低端等多層次FPGA市場;安路科技在FPGA/集成CPU、FPGA、數據處理專用引擎等單芯片產品方面都有儲備,量產供貨產品已覆蓋100K以內的邏輯單元規模,並且PHOENIX1 系列中邏輯單元為 400K 的新產品已成功流片;京微齊力基於22nm工藝製程的FPGA已成功量產;易靈思基於RISC-V軟核的FPGA已商用,並在16nm、40nm有長期的產品規劃。
通過對比國際尖端產品,核心參數差距依然較大。雖然大器晚成,不過,國內也非常注重軟件生態的建設。
除此之外,百度也曾經使用FPGA做AI加速,此後又推出專用於AI計算的崑崙芯(開始是FPGA,後來是基於FPGA的XPU)。

國內FPGA企業不完全統計,製表丨電子工程世界
存算一體芯片方面,電子工程世界在歷史文章《清華研發出“全球首顆”,這種芯片要火了?》中介紹,前幾年,國內湧現了大量存算一體公司,這批公司在兩年前大多還處在A輪以前,彼時多家公司獲億元融資,短短兩年時間許多明星公司又獲2~3輪新融資,賽道熱度依舊,資本依然看好這項新技術。
並且,有很多產品也逐漸浮現:
今年5月,後摩智能正式發佈首款存算一體智駕芯片——鴻途H30。12nm工藝製程下,該芯片物理算力達256TOPS,在Int8全精度的計算提供下,計算延時只有1.5ns,能效比為30~150TOPS/W,比業界同等精度計算條件下的水平提高了3倍以上,而且它是車規量產支持L4,而這也存算一體在大算力這一領域走在了前列;
蘋芯科技已開發實現多款基於SRAM的存內計算加速單元,致力於為人工智能行業提供了低成本、高效率、低能耗、高性能的芯片解決方案;
九天睿芯擁有自有專利的模擬預處理與6T SRAM存算一體技術,解決了傳統計算架構的瓶頸和耗電散熱難題,做到更低的延遲和更快的處理速度;
達摩院研發的存算一體芯片是全球首次採用混合鍵合(Hybrid Bonding)的3D堆疊技術,將計算芯片和存儲芯片 face-to-face 地用特定金屬材質和工藝進行互聯。

國內存算一體芯片企業不完全統計,製表丨電子工程世界
類腦芯片方面,全球範圍內,參與神經形態計算芯片開發的機構主要包括三類:英特爾、IBM、高通等為代表的科技巨頭企業,斯坦福、清華為代表的高校/研究機構以及初創企業。
國內研究則包括清華大學、浙江大學、復旦大學、中科院等頂級學府和機構,同時近兩年不斷湧現初創公司,如靈汐科技、時識科技、中科神經形態等。其中以清華大學的天機芯和浙江大學的達爾文芯片最具代表性。

國內類腦芯片企業不完全統計,製表丨電子工程世界
可以説,國內已經在各種形態的AI芯片上都有所佈局,而國產的芯片算力也越來越強大,美國已經開始忌憚。
當另一方面,國內也在加強制造能力建設。ASML的2023Q3最新財報顯示,Q3'23相比Q2'22中國淨銷售額佔比從24%增長至46%。

要知道,半導體產業高度全球化,美國這樣一定會自食其果。而我國商務部也表示,美方不當管制嚴重阻礙各國芯片及芯片設備、材料、零部件企業正常經貿往來,嚴重破壞市場規則和國際經貿秩序,嚴重威脅全球產業鏈供應鏈穩定。美國半導體企業損失巨大,其他國家半導體企業也受到影響。
參考文獻:
[1] 財經十一人:美升級對華AI芯片制裁力度,美芯片企業提出擔憂.2023.10.18.https://mp.weixin.qq.com/s/a6r3faTG1t4PCn5hQVdrWw
[2] 偲睿洞察:大模型背景下,AI芯片廠商面臨怎樣的機遇與挑戰?|深度研報.2023.6.25.https://mp.weixin.qq.com/s/EUzg3R8vLrjS6KzIBRjaDw
[3] 拓墣產業研究:中國芯片自主化風潮將進一步帶動ASIC市場.2023.7.5.https://mp.weixin.qq.com/s/ZF6EuAh4oGOfj-KJntFc9A
[4] ASML阿斯麥光刻:https://www.asml.com/en/investors/financial-results/q3-2023