這類芯片,被人民日報點名!_風聞
半导体行业观察-半导体行业观察官方账号-专注观察全球半导体最新资讯、技术前沿、发展趋势。34分钟前
引言
“強化人工智能芯片、算法等關鍵領域的國產替代,探索可重構、存算一體、超規格高算力智能芯片等新型架構芯片”——人民日報《搶抓人工智能發展的歷史性機遇》
近日,人民日報刊文《搶抓人工智能發展的歷史性機遇》,其中特別提到一項關鍵技術——“可重構芯片”,這種被寄予厚望的芯片,有望成為AI時代的“加速引擎”。今天,讓我們沿着技術發展脈絡,全方位瞭解其技術原理,探究它如何革新計算模式。
全系列文章共分為五個篇章,今天為該系列文章的第一篇。
可重構芯片:數據驅動 動態重構
可重構芯片(Reconfigurable Processing Unit, RPU)是一種能夠動態配置計算資源的新型芯片。該類芯片的核心在於內含可編程的處理單元及互連網絡,能夠基於具體應用的計算需求和數據流特性,在運行過程中利用動態重構技術實現計算單元、互連結構和數據通路的動態按需配置,從而以接近“專用電路”(ASIC)的方式進行數據驅動下的計算。硬件層面的動態重構不僅具有完備的可編程能力,支持各類算法和應用;而且提供了更精確靈活的硬件調度能力,大幅提高了芯片的面積效率和能量效率。因此,高能效比、高擴展性和高度的靈活性是該類芯片的最大特點。
技術原理:高性能計算芯片中的“變形金剛”
正是因為這種高度的靈活性,曾有媒體將可重構芯片稱為芯片界的“變形金剛”,其革命性體現在兩大核心技術特徵:
(1)數據流驅動架構
通過數據流直接驅動芯片計算和數據傳遞。與傳統CPU的指令驅動模式不同,其硬件資源(處理單元和互連網絡)由數據流特性即時動態映射,消除了指令解碼、分支預測等傳統開銷,能效比提升可達十倍量級。
(2)多層次重構能力
支持從微架構到電路層的多粒度重構:
計算單元重構:通過配置參數定義運算器功能(如算子和精度切換)互連網絡重構:動態調整計算單元間的連接拓撲存儲系統重構:根據數據訪問模式優化緩存分配策略
可重構芯片的內部結構主要有以下幾部分組成:
計算陣列:由處理單元(PE)陣列構成,每個PE具有多種算術邏輯運算能力,通過可編程互連網絡形成複雜的數據路徑。可重構控制器:發射“配置信息”,動態調整計算陣列的連接方式和運算模式。這種分離設計(數據流與控制流獨立)使得芯片能夠像CPU一樣靈活可編程,同時保持接近ASIC的能效。存儲器:分為配置存儲器和數據存儲器。配置存儲器存儲計算陣列“配置信息”;數據存儲器存儲計算陣列所需的原始數據、中間數據和結果數據。
圖1.可重構芯片基本架構[1]
動態重構是可重構芯片(RPU)的“核心殺器”。它以無指令驅動的數據流計算方式和動態重構能力,顯著區別於傳統CPU和GPU。與CPU的馮·諾依曼指令驅動架構不同,其硬件資源(處理單元和互連網絡)可直接由數據流映射任務需求,消除了指令解碼和分支預測等指令開銷,能效比更高;相比GPU的固定並行化架構(依賴SIMD/Warp調度),可重構芯片通過動態重構支持多粒度、多類型的並行模式,尤其適合動態負載場景(如AI推理)。可重構芯片的動態重構能力使其在能效、靈活性和開發成本間取得最優效能,尤其適合在算法快速迭代或需求多變的領域應用。因此,可重構芯片也被學術界和產業界視為CPU、FPGA和GPU之外的第四類通用計算芯片。
可重構計算進化史:從理論到實踐的跨越
可重構芯片的發展歷程呈現出全球技術演進與國家戰略驅動的雙重特徵。
自1991年“新機器範式”提出可重構計算架構以來,該領域逐步從理論研究走向產業實踐:
1997年加州大學伯克利分校啓動GARP項目,對可重構計算架構進行概念驗證;
2003年麻省理工學院啓動MORPHEUS項目,探索可重構計算在專用領域的應用。
2006年清華大學成立可重構計算實驗室,研究可重構計算理論和架構實現。
2015年清華大學在可重構芯片方面的研究成果榮獲國家技術發明二等獎。
同年,國際半導體技術路線圖(ITRS)將可重構芯片列為“未來最具前景芯片架構技術”。
2016年,美國電子復興計劃(ERI)明確將可重構計算(軟件定義硬件)列為未來計算芯片的核心架構技術。
2017年,國務院在《新一代人工智能發展規劃》中將可重構計算列入“新一代人工智能關鍵共性技術體系”,重點支持其發展。
2017年清華大學團隊突破動態重構、多粒度融合等關鍵技術,研製出“Thinker”系列可重構 AI 芯片,實測表明,該芯片運行典型人工智能任務時,能效比顯著高於同類 GPU。Thinker芯片被《麻省理工科技評論》專題報道。
2019年初,清微智能公司的首款可重構芯片,也是全球第一顆可重構商用芯片大規模量產。
同年,賽靈思推出包含粗粒度可重構陣列(CGRA)架構的Versal系列產品,面向數據中心和高端智能駕駛,算力達到128TOPS。
2020年美國SambaNova公司發佈基於可重構芯片的DataScale平台,並在多個美國多個算力中心、國家實驗室和研究機構規模部署。
2021年Mobileye公司在L4自動駕駛芯片中嵌入粗粒度可重構陣列。
2022年穀歌TPU v4藉助可重構互連技術實現算力躍升(同等芯片數量時,處理速度達A100的1.67倍)
2023年日本採用可重構芯片建造了“富嶽(Fugaku)”超級計算機,名列全球超算排行榜(TOP500)第二名,處理AI任務的性能達到A100集羣的6倍。
從這一發展脈絡不難洞察,可重構芯片的價值正逐步獲得廣泛認知,並開始在實踐中得以深度應用。
可重構芯片未來發展演進
可重構芯片作為下一代計算範式的核心載體,將沿着智能化融合與彈性化演進兩大主軸深度發展,通過架構創新與跨層技術協同,構建適應多元場景的算力基座。其演進路徑主要體現在以下三個維度:
架構革新:動態異構與資源複用
多層次重構能力:通過動態層次化重構技術(數據級/張量級/任務級)與混合粒度架構設計(如粗粒度可編程單元與細粒度加速器協同),實現計算資源在時空維度的彈性調度與高效複用,突破非規則計算負載的資源適配瓶頸。並行化擴展:支持從SIMD到數據流驅動的多樣化並行模式,結合非馮架構的存算一體化設計,顯著提升算法映射效率,尤其適用於稀疏計算、圖計算等複雜場景。
軟硬協同:敏捷開發與智能編譯
SDH(軟件定義硬件)範式深化:基於配置輕量化管理、運行時自適應優化及AI驅動的智能編譯框架,構建從算法到硬件的敏捷開發鏈路,降低開發門檻並提升硬件資源利用率。多模態計算融合:集成存內計算、近似計算、模擬計算等新型計算單元,結合3D集成與光互連技術,實現能效數量級提升,滿足AI大模型訓練推理、邊緣端即時決策等場景的差異化需求。
場景驅動:垂直優化與生態構建
領域專用化演進:針對自動駕駛、工業物聯網、生物計算等垂直領域,形成可配置模板庫與敏捷開發套件,加速算法-芯片協同優化。開放生態延伸:通過多層次編程模型拓展(如RISC-V擴展、Triton框架)建立軟硬件解耦生態,推動跨平台工具鏈與開源社區建設,釋放長尾應用創新潛力。
結語
《人民日報》提及的可重構芯片,是實現高算力、高能效智能計算的有效途徑之一。從技術原理而言,它通過“軟硬件雙編程”達成了靈活性與高能效的統一;從發展歷程來看,其突破既依託國際學術屆長期積累的成果,更離不開國內產學研多年的持續探索。當下,伴隨後摩爾時代的來臨,可重構芯片將成為解決“性能牆”“存儲牆”“功耗牆”難題的關鍵所在。正如計算機圖靈獎獲得者Patterson教授所説:“我們正進入計算架構的另一個黃金時代”,而中國實踐的一系列成果正在證實,可重構芯片必將在未來的科技發展浪潮中扮演愈發重要的角色。
可重構芯片究竟藏有什麼“神秘魔法”?為何它是最有前景的AI計算架構?下一篇文章,我們將從多維度深度剖析其中奧秘。
[1]DE SUTTER B, RAGHAVAN P, LAMBRECHTS A. Coarse-Grained Reconfigurable Array Architectures[M/OL]//BHATTACHARYYA S S, DEPRETTERE E F, LEUPERS R, 等. Handbook of Signal Processing Systems. Boston, MA: Springer US, 2010: 449-484[2020-12-22].
[2]PODOBAS A, SANO K, MATSUOKA S. A Survey on Coarse-Grained Reconfigurable Architectures From a Performance Perspective[J/OL]. IEEE Access, 2020, 8: 146719-146743.