英偉達的國產平替,“GPGPU”概念有機會嗎?_風聞
果壳硬科技-果壳旗下硬科技内容品牌2022-01-19 13:27
是不是在標題裏看到了一個熟悉又陌生的詞?GPGPU,即通用圖形處理器(General-Purpose Graphics Processing Unit),它的確是一個從GPU衍生出的概念。如果説GPU是巨頭的遊戲場,GPGPU就是一塊正在快速開發的新市場。果殼硬科技(ID:guokr233)連線天數智芯首席技術官呂堅平,深度探問國產GPGPU突圍之路。
本文系“1000家硬科技公司”欄目第3篇,關注GPGPU雲端芯片公司天數智芯。
付斌 | 作者
李拓、劉冬宇 | 編輯
果殼硬科技團隊 | 策劃

GPU的另一種用法
GPU芯片,也就是我們常説的“顯卡”,擅長做並行計算;CPU則長於橫向計算。兩者組成異構計算的一對黃金搭檔。
但你我都知道,過去一年裏讓GPU一直缺貨的原因之一,是它“不務正業”的應用,“挖礦”。礦工們將大量顯卡安裝在一個機架上組成礦機,通過瘋狂壓榨GPU芯片算力性能來賺取加密貨幣。

圖源 | NVIDIA
計算領域正初步形成“專用”和“通用”的格局。隨着人工智能產業爆炸式增長,導致計算複雜化和算力不足,加上CPU並行計算能力不及GPU,使得GPU的通用性計算優勢愈發明顯,在一眾xPU中脱穎而出,成為算力時代VIP。
為了進一步專注通用計算,GPGPU便應運而生。
GPGPU並不比GPU更厲害,只是去掉GPU的圖形顯示部分,將其餘部分全部投入通用計算,併成為AI加速卡(一種並行計算硬件)的核心。
翻開GPU的歷史一查,滿本都寫着兩個字是“通用”。
在誕生之初,GPU的重要使命是“跑遊戲”。遊戲開發商普遍希望利用畫面的差異化優勢奪得市場,但僅憑調整硬件參數,無法實現獨具特色的圖形渲染效果,要滿足各方需求,就必須增強其通用性。
從上世紀八十年代到2005年,大量專用GPU芯片廠商浮現。芯片遵循摩爾定律,要18~24個月才能迭代,這意味着硬件也只能隨之起舞,而彼時處於發展期的圖形算法,幾個月甚至幾周內就會發生巨大進步。
GPU在圖形領域的可編程性經歷着不斷演進的過程,直到2006年,英偉達 CUDA(Compute Unified Device Architecture,統一計算設備架構),及對應工業標準的OpenCL的出現,讓GPU實現更廣泛的通用計算功能,GPGPU的概念才算真正落地。

GPU發展歷程
在加入天數之前,呂堅平曾在英偉達、英特爾、三星、聯發科等眾多跨國半導體巨頭擔任要職,見證了GPU的改變。他坦言,在2000年初在英偉達研發GPU架構之際,團隊“頭腦風暴”就討論過“兩個圖像如何相加”“原有圖形上的通用計算如何實現”等問題,彼時就發現GPU可以做很多圖形外的計算任務。
後來,英偉達經過多次迭代,發掘了許多圖形之外的應用領域,諸如超算、醫療、科學運算等,並獲得了不錯的回報,並使用GTX/RTX和Tesla兩個前綴區分顯卡和AI加速卡。
近幾年GPU大會顯示的趨勢是:GPU將會向大規模擴展計算能力的高性能計算(GPGPU)、人工智能計算(AIGPU)、更加逼真的圖形展現(光線追蹤 Ray Tracing GPU)三大主要方向發展[1]。
GPGPU是GPU未來重要趨勢之一,也是國產的一次機會。

入場門檻極高,卻誕生了一個奇蹟
在顯卡這個成熟市場,強勢的英偉達、AMD令後來者難以立足,加之支持桌面級顯示和遊戲渲染的顯卡,背後需要很多技術支持和迭代,因此市場由國外巨頭長期把控。不過,該領域並非沒有“叫板者”,只是門檻過高,強如Intel,也難以如願。自1998年推出第一款GPU i740、2007年推出Larrabee都相繼失敗,而當這家巨頭重啓獨立GPU計劃時,已是2020年。
通過GPGPU佔領市場,成為國產廠商的另一個選項,這是天數選擇GPGPU賽道的原因。
實際上,巨頭也做GPGPU,只不過,不同之處是:巨頭如英偉達和AMD,在定製“數據中心級GPU”(實即GPGPU)時,只是刪除了顯示接口,留下圖形部分;國產後進者在研發GPGPU時,則不僅去掉了GPU的顯示功能,還去掉了圖形渲染功能。去掉的功能雖多,但由於國產廠商的研發工作從零開始,難度依然與GPU相當。
高算力的GPGPU芯片,底層硬件如同迷宮,設計和生產的要求十分複雜、專業和苛刻。GPGPU芯片上會放很多運算單元,讓這些運算單元最適當組合並擁有最高的運算效率實現難度極大,一個部分計算單位效率不佳,對整個芯片的影響將放大上千倍。
芯片量產前還要經歷冗長的設計測試流程。通常一款高端芯片前端和後端設計要耗時1~3年,設計完成後流片環節需要3~6個月,期間還會有流片失敗一切重來的風險。即使成功流片,還需經過3~12個月的產品測試調優,才能開啓量產。
天數則用三年時間發佈了“天垓芯片”,是唯一一款量產的國產全自研GPGPU芯片,一舉打破國外巨頭多年的市場壟斷。

“天垓芯片”大事記,製圖 | 果殼硬科技
根據天數官方數據顯示,“天垓芯片”以同類產品1/2的芯片面積、更低的功耗,達到了世界先進水平。
該芯片採用7nm製程、容納240億晶體管及採用2.5D CoWoS晶圓封裝技術,支持單精 (FP32)及半精 (FP16)等混合精度訓練,多機多卡互聯,單卡半精度算力每秒147T,單精度性能可達每秒37T。筆者查閲英偉達Tesla V100的參數表顯示[2],單精度性能可達每秒14T(PCle)/15.7T(SXM2),在單精度性能上“天垓芯片”性能是Tesla V100的2倍。

“天垓芯片”參數指標
“可以用奇蹟來形容,畢竟英偉達做了很多年,我們第一代就有了這種性能。這也要得益於核心團隊在GPU領域耕耘多年。”

國產滿滿的機遇,一個策略是關鍵
呂堅平向筆者展示一組數據顯示,2019年中國GPU芯片板卡市場規模為86億元,2025年將會達到258億元,增長將近3倍,年複合增長率高達32%。GPGPU將持續“瓜分”整體市場,更多場景將仰賴通用計算,包括數據中心、互聯網甚至未來的元宇宙。
他認為國產廠商在GPGPU上有兩個機遇。
其一,GPGPU較容易有利潤和市場空間。一方面並行計算與AI推理訓練的價值遠遠超過顯卡,每張單卡的價格比較友好;另一方面人工智能也是較為新興的市場,整個業界包括英偉達都在摸索階段,對於新創公司來説,不會輸在起跑線上。
其二,國內廠商正在尋求英偉達以外的替代供應商,這樣不僅有更多的可選餘地,也能保證貨源安全。此外,在自主可控大趨勢下,國產企業抱團取暖才能打破壟斷的枷鎖。
天數的GPGPU芯片能應用在計算視覺、智能語音、智能推薦、自然語言處理在內的AI領域和深度學習、智能製造、生命科學、物理科學、地球科學在內的HPC高性能計算領域。
“天數是國內唯一一家擁有GPGPU產品的公司,從目前已採用天數產品的客户回饋來看,都相當正面。”他説,“這個過程非常艱難,因為客户用的都是國外的產品,天數也採用了兼容主流GPGPU生態的策略,讓客户更容易遷移。”
呂堅平表示,天數的底層架構和軟件完全自主研發,在面對風險問題時,除採取各種規避風險的方法,還會盡量凸顯自主架構的優勢,不依賴最新的製程。
官方網站[3]顯示,天數還與國內重要行業夥伴一起,從源頭對設計定義和本土優化,為大規模商業化做準備。

摩爾定律之外,是GPGPU的未來
每當算力芯片發展受阻,總會有人跳出來高呼“摩爾定律已死”。21世紀初,摩爾定律老化,導致CPU時鐘速度競賽戛然而止。時隔多年,在納米節點逐漸接近1nm時,業界總要討論:是延續摩爾定律,還是另闢蹊徑。
為此,呂堅平曾發表文章,跳出過去芯片設計窠臼,以可微分GPU及可微分ISP為例,提倡以AI為本的可微分硬件理念。希望藉此可重振軟硬件彼此加持的雄風,緩解甚至逆轉摩爾定律衰退[4]。
呂堅平預測,GPU硬件/軟件界面將繼續使GPU成為“AI世界的CPU”,基於 AI渲染會讓張量加速成為GPU中的主流。虛擬世界和現實世界互相映射的數字孿生理念將主導市場,最終解決架構爭論[5]。
天數表示,未來將會越過傳統,跳接回歸GPGPU的新圖形標準、使核心圖形硬件可微分,以便可以運用可微分的圖形硬件製作更強的AI,以及運用AI帶動更優越的可微分圖形硬件[6]。
關於天數智芯

硬科技公司相關情況,製表 | 果殼硬科技
References:
[1] 熊庭剛. GPU的發展歷程、未來趨勢及研製實踐[J].微納電子與智能製造, 2020, 2(2): 36-40.
[2] NVIDIA V100規格表, https://www.nvidia.com/en-us/data-center/v100/
[3] 天數智芯官方網站, https://www.iluvatar.com.cn/
[4] CP Lu,PhD. How AI Might Help Revive the Virtuous Cycle of Moore’s Law, 2021.10.09, https://towardsdatascience.com/differentiable-hardware-9bb03aad4563
[5] CP Lu,PhD. Will The GPU Star in A New Golden Age of Computer Architecture?, 2021.07.22, https://medium.com/m/global-identity?redirectUrl=https%3A%2F%2Ftowardsdatascience.com%2Fwill-the-gpu-star-in-a-new-golden-age-of-computer-architecture-3fa3e044e313
[6] 天數智芯官方網站, 由GPGPU帶領更先進的圖形,讓AI啓動元宇宙及數字孿生的應用, 2021.11.10, https://www.iluvatar.com.cn/newsinfo/yougpgpuda/