奇異摩爾:面向計算時代,構建超大規模異構計算平台_風聞
科闻社-科闻社官方账号-天助自助者07-18 15:19
隨着AI爆發式增長,數據、算法、算力和應用場景逐漸成熟,AI產業在國內賽道已正式啓航。但AI產業的加速發展,需要底層芯片的支撐,故而,在7月上旬上海舉辦的2023世界人工智能大會上,有多個論壇圍繞芯片如何支撐AI算力發展和需求這一主題展開。

這其中,包括了由上海集成電路行業協會主辦的《從“端”到“雲”,勇攀“芯”高峯》,奇異摩爾聯合創始人兼產品及解決方案副總裁祝俊東應邀參加了論壇,介紹了該公司建構超大規模異構計算平台的具體實踐。
祝俊東首先介紹説,奇異摩爾是一家基於Chiplet架構,為客户提供核心通用互聯芯粒及系統級解決方案的服務商,以數據存儲和傳輸為核心,通過自研的Kiwi Fabric互聯體系高效連接不同類型的功能單元,目標是成為超大規模分佈式異構計算平台的基石。他認為:
隨着算力需求的不斷提升,由於摩爾定律逐漸無法滿足芯片面積和芯片級聯提升的需求,引發了硬件和系統的規模過載。業界迫切需要構建更大規模的整合計算系統,以應對持續增長的算力需求。
此外,隨着芯片工藝技術的不斷演進,算力場景應用也在不斷增長,倘若針對不同應用場景升級迭代芯片,企業將面臨巨大的資金挑戰。同時,為了滿足高性能計算對的效率需求,通用處理器(CPU)地位逐漸被GPU取代。異構計算和Chiplet技術,可以把CPU和GPU拼搭成一整個芯片,從而更好的實現通用性與性能的平衡。
全球主要芯片巨頭如AMD、Intel、Nvidia都在構建超大規模異構計算平台。

基於奇異摩爾的實踐,祝俊東表示,要構建超大規模異構計算平台,需要五大軟硬件關鍵技術。
第一:適用於超大規模異構的計算架構,以實現軟、硬件的結合,以及單個計算單元性能的最大化;
第二:統一的編程模型以及協議的庫堆棧,以提高軟件的應用性;
第三:從CPU到GPU、NPU等不同類型的計算單元的芯粒支持;
第四:超大規模的傳輸網絡及互聯網絡,把不同的計算單元、存儲、連接等單元高效地連接在一起;
第五:先進封裝技術,讓不同的芯粒用接近甚至超過SoC的互聯密度連接,像一顆芯片一樣工作。
祝俊東指出,上述五大技術中,後三大技術都與Chiplet緊密相關。這也是Chiplet成為構建大規模異構計算平台的關鍵因素的根本原因。
祝俊東表示,作為一家專注於Chiplet互聯的公司,奇異摩爾專注於解決所有和互聯、存儲、調度相關的硬件和算法問題,為高性能芯片打造更好的互聯基礎設施,從die-to-die到die-to-chip,直至chip-to-chip。在單算力芯片受限的情況下,幫助芯片公司通過Chiplet架構提高互聯效率,滿足數據中心、自動駕駛等大算力場景對算力和能效的追求。