成立3年後首發新品,壁仞科技7nm芯片不輸英偉達4nm旗艦?

【文/觀察者網 呂棟 編輯/周遠方】
全球通用GPU算力紀錄首次由一家中國企業創造?
8月9日,在距離成立三週年還有一個月之際,壁仞科技在上海發佈首款通用GPU芯片BR100。據該公司透露,這款採用台積電7nm製程的芯片,單芯片峯值算力可達到每秒千萬億次浮點運算,也就是PFLOPS級別。甚至與英偉達最新發布的4nm旗艦相比,BR100性能數據也毫不遜色。

圖源:壁仞科技(下同)
由於具有靈活性高、應用場景廣泛等特點,通用圖形處理器(GPGPU)近幾年引發大量資本和人才的追捧,國內也相繼湧現出天數智芯、壁仞科技、摩爾線程等多家創企,業內融資紀錄屢屢被刷新。但在一陣市場喧囂過後,一家企業能否經受住考驗最終還是要看技術和產品。
在壁仞科技之前,天數智芯已在去年3月發佈首款7nm雲端訓練GPGPU產品,第二款產品7nm雲邊推理芯片“智鎧100”也於今年5月成功點亮。更激進的是摩爾線程,成立不到300天,該公司便於去年11月宣佈首顆國產全功能GPU研製成功,同時完成A輪20億元融資。
在高技術壁壘領域,進展過快難免引發質疑。在摩爾線程宣佈不到一年就研發出全功能GPU後,有自媒體撰文直言:“看到國產GPU快速發展,確實是一件振奮人心的好事,但是在振奮之餘也應該有所警惕。僅僅300天就能從0開始研發出首顆國產全功能GPU芯片,這究竟是彎道超車還是一場騙局。”
但無論爭議的結果如何,GPGPU芯片本身的價值並不容小覷。頭豹研究院TMT行業高級分析師霍瀚松在接受觀察者網採訪時指出,GPGPU是雲計算行業的關鍵芯片,而云計算是中國數字經濟發展提供算力等資源的基礎設施,掌握GPGPU技術及一定的行業主動權是推動中國信創乃至數字經濟發展的關鍵。
首款產品不輸英偉達旗艦?
與消費電子領域的圖形GPU並不相同,通用GPU是略掉GPU中圖形專用的硬件,保留通用計算的部分。
“BR100的正式發佈,標誌着全球通用GPU算力紀錄第一次由一家中國企業創造,中國的通用GPU芯片正式邁入‘每秒千萬億次計算’新時代。”8月8日,壁仞科技創始人、董事長、CEO張文在發佈會上説道。
當天,上海市閔行區區委書記陳宇劍,區委副書記、區長陳華文,上海市經濟和信息化委員會一級巡視員傅新華,工信部科技司原司長鬍燕,閔行區副區長李鋭等人均參加了發佈會。
壁仞科技成立於2019年9月,名字取於武夷山“壁立萬仞”巨石。
從註冊成立到2021年3月完成B輪融資,壁仞科技在短短18個月裏融資額超過47億元,並吸引了前AMD全球副總裁李新榮、高通GPU團隊前負責人焦國方、海思自研GPU負責人和首席架構師洪洲等人加入。
作為公司掌舵人,張文本身並沒有GPU技術背景。他擁有哈佛大學法學博士履歷,曾擔任商湯科技總裁,主導過商湯科技總部落地上海。2019年,在看到國內有巨大的AI芯片市場,但90%以上依賴國外產品後,張文決定創立壁仞科技。
憑藉驚人“吸金”和“招攬人才”能力,張文在業內也獲得“中國第一大獵頭”、“融資機器”等稱號。在這些稱號背後,市場更期待經過三年研發後的壁仞科技,能拿出什麼樣的產品。
據壁仞科技披露,BR100系列今年3月一次點亮成功。該芯片採用台積電7nm製程,集成770億晶體管,使用Chiplet(芯粒)技術,2.5D CoWos封裝技術,芯片面積達到1000平方毫米。性能上,BR100芯片16位浮點算力達到1000T以上、8位定點算力達到2000T以上,單芯片峯值算力達到PFLOPS級別。

“大算力芯片創業至少要15億元起。而且芯片行業本來就是資金密集、人才密集和資源密集的行業,壁仞科技經過了1065天研發,正式發佈的首款GPU,打破了全球通用GPU算力紀錄。”張文在發佈會上説道。
根據發佈會上的數據,壁仞科技BR100對比英偉達在售的7nm製程旗艦GPU“A100”,在Int8、BF16、TF32/TF32+、FP32數據格式下至少有3.3倍的峯值性能優勢,在FP32數據格式下性能優勢更是達到13.1倍。

即便與今年3月最新發布的英偉達H100 GPU相比,BR100在各種數據格式下也不乏性能優勢。要知道,H100是英偉達專門為超級計算機設計的GPU,該芯片採用台積電4nm工藝,擁有800億個晶體管。

在發佈H100時表示,英偉達CEO黃仁勳曾表示,20個H100 GPU便可承託相當於全球互聯網的流量,使其能夠幫助客户推出先進的推薦系統以及實時運行數據推理的大型語言模型。
“BR100之所以能夠實現國際領先的算力,最底層的支撐來源於自主原創的芯片架構。”張文在發佈會上説道。
據壁仞科技聯合創始人、CTO洪洲介紹,“壁立仞”架構以數據流為中心,對數據流進行深度優化,通過六大技術特性,比較完整地解決了數據搬移的瓶頸和並行度不足的問題,使得BR100芯片在給定的工藝下實現了性能和能效的跨越式進步。
洪洲還提到,BR100採用了Chiplet設計理念,讓芯片總面積可以突破光罩尺寸對單芯片面積的限制,集成更多的算力和通用性邏輯;此外,通過縮小單個計算芯粒的面積,還可以同時提升產能與良率,進而極大地降低硅片的成本,並支持更靈活的產品策略。
在現場,壁仞科技還發布了BR100系列的另一款產品BR104,該款芯片同樣基於“壁立仞”架構,擁有1個計算芯粒,性能約為BR100的一半,“同樣超越了國際廠商的在售旗艦產品”。

除了BR100通用GPU芯片之外,壁仞科技還發布了OAM服務器——海玄,以及基於BR100的OAM模組——壁礪100,基於BR104的PCIe板卡產品——壁礪104,以及自主研發的BIRENSUPA軟件平台,該平台支持主流深度學習框架。

壁仞科技聯合創始人、總裁徐凌傑透露,BR100系列芯片以及相應硬件計算產品將於今年年底量產。
對於GPGPU這種大算力芯片來説,量產只是第一步,最重要的還是生態建設和商業化落地。
在本次發佈會上,壁仞科技宣佈加入由百度飛槳發起的硬件生態共創計劃。除此之外,平安科技宣佈將以平安云為基礎,結合壁仞科技產品共同打造高端通用智能的算力平台,中國移動也“希望壁仞科技的新品與中國移動的算力網絡整體的發展深度適配”。
生態建設方面,壁仞科技在兼容客户現有基礎設施的同時,也試圖打造自己的生態。據該公司披露,壁仞科技開發者雲也已經正式上線,官網上已開放邀測。
“賣出去是另一個挑戰”
在當前國內GPGPU賽道中,壁仞科技只是競爭者之一,天數智芯、沐曦集成電路、登臨科技、摩爾線程等多個玩家同樣涉足這個領域。而在他們背後,同樣是大量的資本和人才。
就在上個月,天數智芯完成超10億元人民幣的C+輪及C++輪融資,其中C+輪由金融街資本領投,C++輪由厚朴投資和旗下的厚安創新基金領投。幾乎同時,沐曦集成電路宣佈完成10億元人民幣Pre-B輪融資。今年初,登臨科技也宣佈完成B輪融資,金額未披露。
而在去年11月,摩爾線程A輪20億元融資中,上海國盛資本、五源資本、中銀國際旗下渤海中盛基金、建銀國際、前海母基金、招商證券等知名機構也紛紛現身。
由於GPGPU的技術門檻高,融資金額大,核心團隊的能力和建制成為吸引投資的重要指標。
縱觀目前國內的相關企業,無一不有精英團隊加持,核心團隊幾乎全部來自行業巨頭,如AMD、英偉達、三星、華為、高通等。
“技術密集、人才密集是芯片行業的特點。”頭豹研究院TMT行業高級分析師霍瀚松在接受觀察者網採訪時指出,與此同時,GPGPU是一個門檻極高的領域,全球市場基本上被英偉達和AMD兩家國際龍頭掌控。
以中國雲端AI訓練芯片市場為例,英偉達2021年的市場份額在90%左右。
“從資本角度來看,GPGPU是一個規模巨大、回報豐厚的市場,極具投資價值,而高級人才經過過去將近二十多年的學習已形成了一定的積累,推動技術發展則離不開資金的投入。兩者向該領域集中,實際上是打破該領域被國際龍頭統治的僵局,從而實現國產替代的一次良好機遇。”霍瀚松表示。
從產品落地進度來看,成立於2015年底的天數智芯目前相對較快。據該公司披露,截至2022年3月底,其首款7nm雲端訓練通用GPU產品--天垓100已實現銷售訂單近2億元。2022年5月,該公司第二款產品——7nm雲邊推理芯片“智鎧100”成功點亮。

天數智芯7nm雲端訓練芯片BI 拍攝/觀察者網
2017年底成立的登臨科技,曾在去年6月發佈過首款GPU+產品送樣的消息。此後該公司還曾透露百度飛槳適配登臨GPU+系列芯片、與視覺科技企業極視角達成戰略合作等信息。
“深度學習算法,數據中心、智能駕駛等對算法需求高的行業,皆是GPGPU的目標應用領域,因此這種芯片也是數字經濟時代不可或缺的一塊芯片。在‘東數西算’工程及國家政策的驅動下,中國市場對GPGPU有着巨大需求。”霍瀚松指出。
第三方機構預測,到2025年,中國GPGPU芯片板卡的市場規模將達458億元,年複合增長率高達32%。
但隨着資本和人才的聚集,市場在關注GPGPU“燒錢”的同時也少不了質疑。畢竟落地速度最快的天數智芯,在成立六年多、融資數十億後目前也僅實現了2億元的訂單,最終能有多少利潤落袋不得而知。
“做出來本身就是挑戰,賣出去又是另一個挑戰。產品是否符合市場和客户的需求,是否有客户願意為買單,可能比做產品的難度更高。”雲岫資本董事總經理符志龍曾坦言。
在2021年世界人工智能大會上,天數智芯高管在接受觀察者網採訪時也曾表示,一個企業首先要考慮怎麼自負盈虧,不能只想着去燒投資者的錢,最終還是要靠產品從市場上獲取回報,這樣才能可持續發展。現在不少企業都把產品規劃做的很大,如果不能儘快實現造血機能的話,並不是什麼好事情,負擔會變得很重,再加上現在大家對估值期望都很高,如果業績上支撐不了的話,就會變得很難辦。