TPU突圍,谷歌積極推銷自研芯片_風聞
半导体产业纵横-半导体产业纵横官方账号-探索IC产业无限可能。09-04 17:55

本文由半導體產業縱橫(ID:ICVIEWS)綜合
谷歌積極向外部數據中心推銷部署自研芯片。
據報道,谷歌近來接觸了一批主要購買英偉達芯片的小型雲服務供應商,商談在他們的數據中心裏同時部署谷歌芯片。知情人士稱,谷歌已經有所進展,與總部位於倫敦的Fluidstack達成協議,在其紐約的一處數據中心託管谷歌TPU。
谷歌也曾試接觸過其他雲服務商,包括有“英偉達親兒子”之稱的CoreWeave。谷歌的談判表明其正試圖接近那些“背靠英偉達扶持”的新興雲服務供應商。與谷歌、亞馬遜這樣的大型雲服務公司不同,這些新興企業幾乎只使用英偉達的芯片,而且更願意採購多種英偉達產品。英偉達已向其中的許多公司注資,並優先供應眼下最搶手的芯片。
據悉,谷歌談妥Fluidstack的方式很簡單粗暴——如果Fluidstack無法承擔建造紐約數據中心的費用,谷歌同意作為“後備擔保”來介入,並提供最高32億美元的資金支持。
目前尚不清楚為何谷歌積極向外部數據中心推銷自研芯片。要知道在此之前,谷歌基本不對外出售自研TPU。Capvision此前數據顯示,谷歌TPU70%-80%的算力用於內部業務場景使用,剩餘20%-30%以自建租賃方式供外使用。
有分析認為,或許是由於谷歌自建數據中心速度難以追上芯片需求增長,或可能是希望通過其他雲服務商為自家TPU尋找更多新客户。如果是第二種原因,那麼谷歌無異於更直接地在與英偉達展開競爭。分析指出,第二種做法類似於雲服務商租賃英偉達GPU的模式,英偉達主要是向這些雲服務商銷售芯片,而谷歌擴大部署TPU,自然會導致這些數據中心中的英偉達GPU數量減少。
谷歌下代TPU性能暴增16倍
近日,谷歌詳細披露第七代TPU架構“Ironwood”超級計算平台,主要聚焦在單個Superpod的硬件構成與架構設計。
據介紹,單個Ironwood Superpod集成9216枚芯片,每片配備192GB、帶寬7.4TB/s的高帶寬存儲,峯值算力高達 4614TFLOPs。相較之下,2022年發佈的TPU v4集成4096枚芯片、配備32GB HBM,峯值算力275 TFLOPs,而2023年發佈的TPU v5p集成8960枚芯片,配備95GB HBM,峯值算力459 TFLOPs,這意味着Ironwood Superpod單芯片性能較TPU v4提升超過16倍。
在物理佈局上,Ironwood沿用過去三代的3D Torus(立方環網)拓撲,每個邏輯單元為4×4×4節點陣列,即64芯片,封裝於單個機架。而一個Superpod包含144個機架,還配備光學交換機機箱以實現跨模塊互連,以及用於液冷的冷卻分配單元(CBU)機架,互連方面為提高靈活性與可擴展性,採用PCB走線、銅纜和光纖的混合方式。
在機架設計上,頂部設有泄漏檢測盤以監控液冷系統,下方是供電模塊,具備兩路電源域,將416V交流電經整流轉換為直流電。整套系統支持液冷散熱,滿載運行功率可超過100kW。
谷歌TPU需求正在上升
據報道,谷歌的第六代Trillium TPU芯片自去年12月向外部客户開放後需求強勁。分析師預計,第七代Ironwood TPU的需求將顯著上升。谷歌的TPU芯片算力最高可達42.5 exaflops(百億億次浮點運算),並已大幅提升高帶寬內存容量。這些芯片成本效率也顯著提升,這是吸引更多前沿實驗室關注的主要原因之一。
初創公司Anthropic此前雖在小規模上使用TPU,但分析師指出,該公司近期正在招聘TPU內核工程師,這可能意味着他們正考慮從使用Amazon Web Services提供的Trainium芯片轉向TPU。Trainium是亞馬遜為AI訓練設計的芯片,該公司已對Anthropic投資80億美元。
分析師還指出,馬斯克的xAI公司也對購買TPU表現出興趣,部分原因在於今年“JAX-TPU工具支持的顯著改進”。JAX是谷歌開發的一個高性能計算Python庫,能夠讓程序在TPU上高效運行。直到最近,JAX生態系統還限制了TPU在Google外部大規模部署的可能性。
今年6月,OpenAI啓動了一項重要戰略調整:將租用谷歌雲平台TPU,為其核心產品ChatGPT提供關鍵運算支持。這是OpenAI首次在核心業務場景中規模化引入非英偉達芯片,也標誌着打破了英偉達長期以來的壟斷地位。
*聲明:本文系原作者創作。文章內容系其個人觀點,我方轉載僅為分享與討論,不代表我方贊成或認同,如有異議,請聯繫後台。