一顆野心勃勃的GPU_風聞
半导体行业观察-半导体行业观察官方账号-专注观察全球半导体最新资讯、技术前沿、发展趋势。25分钟前
在GPU領域,長期以來幾乎只看得到英偉達、AMD、英特爾三家巨頭,尤其是英偉達,憑藉其強大生態、技術積累和品牌影響力,牢牢掌控着高端遊戲與專業圖形市場。從RTX 20、30 系列的光線追蹤,到RTX 40 系列的AI加速,無一不是工業級性能與軟件生態的綜合體現。
然而,就是在這樣一片巨頭橫行的紅海中,出現了一家初創公司:Bolt Graphics。他們的目標不是花裏胡哨地跟風,而是用一塊叫做 Zeus 的新型GPU,直指路徑追蹤的終極可能。有人説這是“挑戰英偉達最強顯卡的”嘗試,那筆者想説,這不僅僅是挑戰,更像是“另闢蹊徑”,從不同的維度重新定義“GPU”的未來。
為何路徑追蹤成為突破口
過去十年,遊戲畫質最大的質變來自即時光線追蹤(RT)。在陰影、反射、全局光照等場景中,它讓遊戲世界更接近真實。但RT本質仍是對可見線路的近似,以局部採樣實現“足夠好”的效果。許多遊戲開發者在燈光設計中犧牲了物理真實性,換來性能與效率。
路徑追蹤(Path Tracing),則是徹底不同的路線。從場景出發,探測出在任意波段傳播的所有光線路徑。即便是煙霧、毛髮、次表面散射,它也能一併涵蓋。其通過精確採樣得到無噪點結果,解決了幾何鋸齒、高頻紋理振鈴、摩爾紋等走樣問題。儘管計算成本高,但輸出效果的細膩度和動態範圍表現,使其向真正物理精確的渲染邁出了重要一步。
對於視覺精度有極端要求的人來説,路徑追蹤是真正的“無妥協畫質”。但它的計算量極其龐大:傳統方式下即時路徑追蹤所需算力,是普通GPU的十數倍甚至百倍。
路徑追蹤的早期形式源於 Jim Kajiya 1986 年的開創性論文《渲染方程》。這篇 SIGGRAPH 論文堪稱所有渲染研究的源頭 ——Kajiya 正式定義了一個積分方程,涵蓋了現代渲染理論的全部內容。該方程整合了光在物體間反射的所有可能路徑及能量貢獻,統一了漫反射、鏡面反射和焦散效應,摒棄了 “光源與幾何分離” 的觀念,提出所有幾何都能反射和發射能量,由此終結了點光源概念,要求包括光源在內的所有幾何都具備物理面積。
通過將材料屬性明確分為漫反射和鏡面反射成分,為開發高級雙向反射分佈函數(BRDF)描述材料奠定了基礎,同時淘汰了以往的環境光項。為闡釋其統一渲染理念,Kajiya 實現了一個暴力路徑追蹤器來求解該積分方程。當時他的理念遠超時代,渲染一張 512×512 像素、每像素 40 次採樣的圖像需 20 小時。他還提出了重要性採樣概念,以及如何用層次 k-d 樹加速計算。
1997 年,Eric Veach 在博士論文《穩健蒙特卡洛光傳輸模擬方法》中,為圖形行業提供了大量理論和技術,推動路徑追蹤的實際應用。 metropolis 光傳輸和雙向路徑追蹤技術,讓渲染研究者得以開發漸進式求解器,通過高效採樣光路實現無噪點結果。再加上通用可編程 GPU 的普及,計算能力大幅提升,加速了相關計算。
如今,路徑追蹤持續發展,在多個行業得到應用。
為了得到電影級畫面,比如4K、60 FPS的路徑追蹤渲染,迪士尼、皮克斯等機構仍然依賴CPU農場,以每幀上千小時的渲染時間來換取觀感。這一點,可以從諸多公開資料看到:例如,一部動畫電影中某個城市街區的場景渲染甚至耗盡了當年64GB的服務器內存,折算下來連256個CPU核心也得跑上小時級別。
對此,初創公司Bolt的做法是:“我們就做那個終極路徑追蹤GPU”。而不是在現有架構基礎上打補丁。他們放棄傳統光柵化圖形流水線,選擇從芯片底層出發,定製一整條路徑追蹤算力通道。
一家專注於光追技術的公司
據瞭解,Bolt成立背景比較低調,其團隊以來自圖形、渲染、計算架構領域的工程師為主,大多來自英偉達、AMD、Intel,以及電影製作公司背景。這些工程師意識到儘管光追技術火了,但路徑追蹤的“極致潛力”仍未被觸及。
他們自稱的使命是“重新設計GPU,為架構師、玩家、藝術家和研究人員提供改變世界的工具”。這個定義非常宏大,也非常清晰:目標清晰、定位極端——高性能路徑追蹤、可視化與HPC兼容性。
目前Bolt公佈了三種計劃中的Zeus版本,分別是“單芯片” Zeus 1c,TDP 約 120W,基於 RISC-V 自定義亂序標量 + 向量單元,採用小容量高速 LPDDR5X + 大容量 DDR5。路徑追蹤性能約 77 億射線/秒,支持 INT8、INT16、AV1 等加速功能,核心設計以高密度路徑追蹤加速單元為主,不做張量計算。
而“雙芯粒” Zeus 2c則集成兩顆計算和兩顆 IO 芯粒,芯粒間帶寬高達 768GB/s,功耗翻倍性能翻倍,更適合專業工作站,LPDDR5X 焊死,DDR5 可定製,適度下放給中小型預算客户。
最貴的是“四芯粒” Zeus 4c(數據中心版本),其TDP來到了500W,內含 2TB DDR5 + 256GB LPDDR5X,其設計為 2U 服務器卡,一機可配四塊組成集羣,支持 NVMe、400Gb/800Gb 以太網、Redfish BMC 級監控;旨在構建可擴展路徑追蹤與 HPC 集羣平台。
目前Bolt主要可能會在三個方向進行發展:專業工作站市場,對FP64、單精度算力和圖形精度都有要求,Bolt 可以與英偉達 RTX A6000、Blackwell 工作站版競爭;在數據中心租賃市場:4c Zeus 配上 800G 網絡和 180TB 內存集羣,可用於渲染農場、數字孿生平台、雷達仿真等;而在消費級遊戲市場,如果Bolt未來推出低功耗單芯片卡,也有可能配合 DirectX/Vulkan 而進入遊戲市場。
Zeus,有何優勢?
關於Zeus這三款產品,最令人矚目的無疑是它們的內存架構。傳統GPU習慣用 GDDR,為帶寬犧牲容量。而Bolt選擇 LPDDR5X(帶寬) + DDR5(容量),後續還要支持堆棧 SRAM、共封裝光學芯片。一個 Zeus 4c 卡的總內存將直逼 2.25TB,遠超消費級顯卡。這不僅有利於路徑追蹤數據集場景,且對 HPC 數據集非常友好。
而在接口上,這張卡也面面俱到:雙 PCIe 5.0 x16,400G Ethernet,未來支持 800G——明顯瞄準數據中心通信需求。這意味着它不是一塊麪向普通消費市場的顯卡,而是從一開始,就定位在專業工作站甚至服務器機櫃級集羣領域。
Bolt 宣稱,一套典型 4K 路徑追蹤場景(20 次反射、30 FPS)下,英偉達 RTX 5090 需要 280 張卡,而Zeus僅需28 張卡就能完成。這意味着效能提升了整整 10 倍。功耗方面,更是以驚人的 1/10 全面碾壓傳統 GPU。
其提供的數據源顯示:RTX 5090 在 4K 120 FPS 狀態下每像素支持8條光線;Bolt 的 1c卡支持“25 條以上”,2c版可上到“100 條”。這意味着它們在單位時間內處理路徑追蹤的密度,比英偉達現實用途 GPU 強上 4–12 倍。
不過需要注意的是,目前Bolt測試依靠模擬器、仿真環境,而非實卡驗證,但從整體方向與趨勢來看,Bolt的架構似乎已經具備真實跑通路徑追蹤的能力。
除了圖形渲染外,Zeus 在 HPC 領域也宣稱提供顯著加速。FP64 是 HPC 的核心,而英偉達主攻 AI 上的 FP16、FP32,因此在 64-bit 運算上不佔優勢。Bolt 發佈的資料稱:
FP64 計算上:單芯版約 3 倍於 5090,雙芯版約 6 倍;在電磁波模擬(如 CT、MRI、EM 兼容性掃描)中,他們聲稱性能高達 Blackwell GPU 的 300 倍;APC 數據還提及,4c卡的模擬空間是 Blackwell B200 的 40 倍(38 億模擬單元 vs. 9110萬);值得一提的是,Zeus還支持 IEEE-754 FP64 標準並執行數值一致性——這對 HPC、科研人士而言,意味着結果可復現、可信賴。
生態或是打破壟斷的關鍵
通用 GPU(包括英偉達、AMD、Intel)基本都使用封閉 ISA,如英偉達的 PTX、AMD 的 LLVM IR+GCN、英特爾的 Xe-LPG。Bolt 不走尋常路,完全選擇基於開源 RISC-V 標量 + 向量擴展 RVV 1.0。這意味着其CPU 核設計完全自由,可定製,且編譯器可全開源,易被社區接受,而客户也可透過 LLVM 自行構建工具鏈。
換言之,Bolt不僅做芯片,也在打造一個開放、定製、可融合的生態平台。
當然,一塊卡若沒有配套的軟件,就只是石頭。Bolt投入大量資源開發專屬路徑追蹤引擎 Glow Stick,承諾與主流渲染工具高度兼容:包括 Blender、Maya、3DS Max、Houdini、Nuke 等。其支持高精度採樣和物理蒙特卡洛積分,Ptex、OpenShadingLanguage、多級 MipMaps;全路徑追蹤所有光學特效、包括焦散、散射等,API 提供 Shader/Pipeline 定製,開發者可深度控制等應用功能。
最重要的是,免費配套,捆綁髮卡。
據瞭解,接下來Bolt還將推 Apollo 電磁仿真器,與 Glow Stick 並行運作,將 HPC 和渲染結合,為科研、工程提供統一平台。
目前Bolt 已開始與多家行業軟件提出 SDK、插件形式合作,包括引擎集成商(如Unreal、Unity),渲染農場管理(如 Deadline),主機操作系統廠商,芯片合作伙伴等。
他們甚至在構建能對接 DirectX、Vulkan 的驅動環境,但一個現實是——Windows 驅動生態比起 Linux(HPC)更難推進,Bolt 仍有相當工作要做。
大規模量產依舊遙遙無期
儘管表現出了很大的潛力,但目前 Bolt 暫時只有模擬器與仿真環境,要到 2025 Q3 才會交付首批開發套件,2026 年底才可能進入量產。這種初創企業常見的倒計時式壓力會考驗其資金、團隊管理、合作伙伴信任。
一旦 Tape-out 出問題、交付延誤或成本遠超預期,都可能讓這個項目被迫縮表。更何況,在過去英特爾 Arc、英偉達 40 系卡,甚至 AMD RDNA 家族產品上都有“產品性能遠低於宣傳”的案例。Bolt 的壓力顯而易見:他們必須在交付硬件時,就能提供一個性能不遜於演示的數據。
當然,軟件生態的構建又從另一方面給量產構成了壓力:沒有 CUDA,沒有成熟驅動,不能跑主流遊戲引擎,就意味着Zeus需要在渲染和 HPC之外另闢路徑,比如專往行業軟件、科研領域紮根。他們設想“先讓電影工作者、設計師、科研人員嚐鮮”,再慢慢鋪向遊戲開發者社區。但這需要幾十個樣板項目、考試級商業案才能敲定合作。
據瞭解,Bolt 當前已啓動早期訪問計劃(EAP),吸引了一批視覺特效藝術家和研究機構參與測試。如果這些早期用户現場評價好,Bolt就有機會藉助他們的作品樹立案例牆。但真正的挑戰在於:這些項目是否能及時轉化為商機,以及是否願意為一套未量產顯卡支付數萬甚至數十萬美金?
寫在最後
對於光追應用來説,Bolt可以稱得上是未來可期。
如果 Bolt 真能將 Zeus 做到每幀幾十條路徑追蹤線,那樣的遊戲畫面將前所未見:光照更逼真、陰影投射更柔和、大氣效果更真實。這種“電影般畫質”的遊戲可能成為未來 AAA 遊戲的新目標。如果有平台支持這種技術,玩家體驗的“圖形上限”將被重新拉高。
除此之外,未來的渲染將逐漸與模擬融合——例如建築渲染同時進行光學、温力、電磁多物理耦合計算。如果 Zeus 可實現“路徑追蹤+物理耦合”聯合加速,它可能打開一個全新的跨領域市場。Bolt的Apollo與Glow Stick,從現在看就是這種融合路線圖的第一步。
但以上均是從樂觀的角度看待,從PPT走向生產,從模擬走向現實,從部分應用走向生態整合,Bolt 要同時戰勝時間、安全性、合作、用户信任四道關。成功的可能性和失敗的風險同樣存在。但即使失敗,也是一場 “次世代 GPU 賽道”的技術試驗,為未來提供思路與經驗。
所以,如果你關心GPU行業發展,關注圖形技術,或期待高保真渲染與模擬的結合,請把 Bolt 和 Zeus 放入你的觀察列表。因為它可能正是 GPU 領域的下一個“極端挑戰者”。





















