GPU-CPO,國內首創_風聞
半导体行业观察-半导体行业观察官方账号-专注观察全球半导体最新资讯、技术前沿、发展趋势。58分钟前
在英特爾、博通、Marvell、英偉達等巨頭的聯手推動下,CPO(co-packaged optics:共封裝光學)這個概念越來越被人熟悉。尤其是在人工智能大模型推高數據中心數據流量傳輸、“超節點”日漸走紅的當下,CPO被提上了緊急議程。
知名分析機構Yole也預測,為了解決數據中心面臨的功率、密度、可擴展性、帶寬和距離限制等問題,產業界正在推動從銅纜到光纖,從可插拔光模塊到CPO的轉變,這將帶動CPO市場規模從2024年的4600萬美元躍升到2030年的81億美元,複合年增長率達137%。有見及此,除了文章開頭提到的幾家廠商以外,包括台積電、格羅方德等在內的傳統巨頭和不少初創企業也投入到了這個轟轟烈烈的CPO浪潮中。
CPO營收預期
作為全球領先的光電混合算力提供商,曦智科技也成為了這個技術的重要推動者。在近日開幕的2025世界人工智能大會(WAIC 2025)上,曦智科技聯合燧原科技推出了國內首款xPU-CPO光電共封裝原型系統,為本土的數據中心互連樹立了一個新標杆。
光互連,大勢所趨
歸根到底,CPO的誕生,本質是激增的流量需求與電信號傳輸瓶頸的矛盾,驅動光互連發展的必然走向。
如文章開頭所説,超大規模數據中心和雲服務提供商的數據流量呈指數級增長,導致對網絡基礎設施帶寬的需求大幅增加,伴之而來的首個要求,就是驅動交換機系統和以太網光纖提供越來越高的總帶寬。不過我們也清楚,由於數據中心在設定之初,對功率和能耗等參數都有一個預設。換而言之,帶寬的提升,必須要在一個可控的功率範圍內實現,否則帶來的改動將是昂貴的。
近年來,隨着數據傳輸量的飛增以及數據傳輸速度要求的指數級增長,這種矛盾越來越突出。
曦智科技聯合創始人,首席技術官孟懷宇博士在接受半導體行業觀察採訪的時候也直言:“光進銅退是過去幾十年的一個主旋律。光通信一開始發力點是長距離的跨洋通信,後來逐漸進入更短的距離,目前在數據中心內部通信中已經成為主流。隨着速率越來越高,光在越來越短的距離通信上取代銅,是一個不可逆的趨勢。”以數據中心的應用為例,孟懷宇告訴半導體行業觀察,當前數據中心機櫃之間的互連已經默認使用光。但在十幾年前,它們依然是銅。
之所以會發生這樣的轉變,是大家意識到銅的侷限性越來越明顯,光互連的成本也在下降。在看到第一個廠商嚐到甜頭並大獲成功以後,大家就紛紛效仿,進而推動行業完成變革。在孟懷宇博士看來,同樣的故事,也將在近期火熱的超節點上演。
當前國際主流超節點方案是通過提升單機櫃功耗來部署更多GPU,但受限於數據中心機櫃的功耗天花板,GPU密度提升存在瓶頸。而在引入光互連技術之後,就可以通過增加機櫃數量保障GPU總量從而構建超節點網絡。相比銅纜,光纜的遠距離傳輸優勢為超節點帶來交付與機櫃解耦的核心價值:
1.突破規模上限:擺脱單機櫃功耗束縛,支持萬卡級彈性擴展;
2.激活存量設施:兼容現有機房供電與散熱架構,降低部署成本;
3.靈活交付模式:可按算力需求動態調整節點規模,實現分階段建設;
4.相比電纜(粗、重),光纜部署更加友好
事實上,數據中心中使用光互連,也不是什麼新鮮事。
例如早在1995年就被廣泛使用的可插拔光模塊(根據設計的不同,可區分為DPO和LPO),就是數據中心的寵兒。但由於這種模塊被安裝在PCB邊緣,ASIC則在封裝基底上,這就讓PIC/EIC與ASIC芯片之間擁有了較遠的距離,而信號損耗隨着距離的增長而變得更為明顯。此外,這些模塊的體積較大、互連密度低、功耗較大,隨着使用的增多,會給系統帶來很大的功耗負擔。
DPO和LPO的區別
這就驅使業界在2020年左右提出了NPO(Near packaged optics:近封裝光學)。
可插拔光模塊和NPO的不同
如圖所示,NPO架構將光引擎與封裝ASIC相鄰佈局於光學基板上,二者通過高性能基板互連。根據OIF標準,NPO中ASIC與光學元件的間距可達150mm,同時確保信道損耗≤13dB。
不過,這依然不能滿足客户。於是,將光器件和硅片集成在單一封裝基板上,旨在應對下一代帶寬、功耗和成本挑戰的CPO應運而生。
CPO,蓄勢待發
有關注數據中心內通信的讀者應該有印象,在此前,英偉達曾引發了一波“光退銅進”的討論。起因是該公司黃仁勳當時在介紹DGX GB200 NVL72時候表示:
“英偉達在整個系統中使用了長度合2英里共5000條NVLink線纜。如果將其切換成光學器件,就必須使用收發器和重定時器。僅這些收發器和重定時器就需要20000瓦功耗。但採用現在的方案,我們通過NVLink交換機完全免費完成了這項工作,並且節省了這些功耗用於計算。”
正是這番言論,引發了大家對光互連在數據中心應用前景的擔憂。
每台交換機配備288條銅纜的 NVSwitch
姑勿論我們對英偉達的這種理解是否正確,抑或在當前他們真的覺得銅纜更好。但從他們在GTC 2025大會上發佈了全球領先的硅光交換系統這個消息看來,英偉達是看好CPO的方向的。據他們介紹,與傳統的可插拔光模塊相比,創新的共封裝硅光技術具有顯著優勢,包括功耗降低3.5倍、延遲更低以及網絡可靠性顯著提升。
從英偉達的這個“風波”,更是折射出國內發展CPO的勢在必行。
眾所周知,在數據中心通信中,大家公認的功耗三座大山分別是交換ASIC、光模塊和SerDes。當中,對於擔負數據傳輸重任的SerDes來説,還有一個不能規避的客觀事實,那就是隨着速率提升,功耗也要提升。而且,受到傳輸材料的影響,為了保證信號傳輸效果,就需要把距離縮短,CPO就是實現這個目標的一個方法。由此,我們可以看到做出使用銅纜決定的英偉達在SerDes的實力。
兩種不同類型的2.5D CPO
如上圖所示,藉助先進封裝,CPO技術能將光收發模塊和控制操作的ASIC芯片異構集成到一起。這個設計不但縮短了芯片與模塊之間的佈線距離,還通過將光學引擎和電交換芯片封裝在單個芯片中,形成具有一定功能的微系統。避開了BGA和LGA的管腳密度的限制,並以更短的導線驅動收發器,顯著減少通道損耗,進而降低能耗。
孟懷宇博士也告訴半導體行業觀察,之所以英偉達還在選擇銅纜,是因為他們本身模擬設計就是世界一流,再加上他們在對先進工藝和數字糾錯能力有很高要求的SerDes上面有很深的積累。“在當前的全球競爭態勢下,國內的參與者是時候選擇CPO了。尤其是考慮到當前供應鏈的成熟度,CPO蓄勢待發。”孟懷宇博士表示,“相比傳統光模塊,CPO可以顯著提高帶寬與密度,降低功耗和成本,提高光互連可靠性。”
在WAIC 2025上,曦智科技聯合燧原科技推出國內首款xPU-CPO光電共封裝原型系統,通過將光學引擎與計算芯片(XPU)在基板上實現光電共封裝,將電芯片與光芯片的傳輸距離縮短,大幅提升信號完整性並降低損耗,從而提升出口帶寬並降低延遲。特別是與傳統可插拔光模塊相比,由於光電共封裝技術可以讓每個GPU內部都配有一個光引擎模塊,因此可省去大量光模塊帶來的系統功耗,同時有效提高光電轉換的穩定性。
國內首創,意義重大
作為一種發展已久的技術,CPO發展至今,衍生出了多種方案。如在光引擎方面,提供了基於硅光和基於VCSEL的技術路線選擇;來到硅光調製器方面,則有MZM(Mach-Zehnder Modulator)和MRM(Microring Modulator)之分;在封裝和互連方面,也各有各的優勢。
具體到應用場景上,作為一個物理層的技術,CPO能把光電的引擎和主芯片封裝在一起,當中主芯片常見的是交換機芯片和GPU,這也讓各大廠商基於各自優勢,選出了最適合他們的決定。例如博通就提供了可連接到博通以太網交換機和博通XPU的CPO平台解決方案;至於另一個資深玩家英偉達則基於公司在可插拔光模塊和MRM積累,利用其獨特的硅光子工藝平台,打造了基於微環調製器的CPO系統。
來到曦智科技和燧原的合作,則是國內首次採用CPO技術實現GPU直接出光的成功案例。
“我們這個合作是基於短距SerDes實現的,這是全球首創。”孟懷宇博士告訴半導體行業觀察,他進一步指出,這種短距方案,還沒有人做過嘗試。但公司做了一系列的技術驗證,證明這是可行的。
“該項目驗證了xPU-CPO光電共封裝技術的可行性與技術方向,同時為中國人工智能基礎設施建設與先進光學封裝產業突破奠定了關鍵技術錨點。”孟懷宇博士説。
在孟懷宇看來,現在國內的CPO產業鏈已成熟,特別是在上游廠商開始紛紛入局以後,CPO的落地更是指日可待。在問到既然萬事俱備 ,為何目前CPO還沒有大規模落地的原因時,孟懷宇回應道:新技術和新產品必然伴隨一定的風險,大多數廠商對於技術方向的選擇都會有慣性,會根據自身的風險承受能力來調整節奏。因此,CPO的規模化落地會需要一些時間。但任何積極的驗證都會加速這個過程。
而曦智科技的成功,必定將給大家更多信心。