我國在超算並行計算芯片上的發力,已經站在了CPU發展的潮頭了_風聞
密集雨-反器材并非不可战胜,用暴风机甲血战到底2022-09-02 07:35
【本文由“誰人笑我太瘋癲”推薦,來自《美限制英偉達向中國出口GPU旗艦A100/H100,中方回應》評論區,標題為小編添加】- 徐長根 我國正好要發展自主GPU架構,謝謝!
AI芯片跟GPU其實關係相對有限,倒是更接近於計算卡。
早前有業內人士評估認為,只有高端GPU有比較多的核心專屬緩存,從而適應大規模並行計算的需求。但是這樣的核心專屬緩存對遊戲的圖形渲染領域幾乎沒什麼用,因為圖形渲染中沒有那麼多的變數需要頻繁讀緩存。而高端GPU用作計算卡時,雖然性能不錯,但核心專屬緩存則仍嫌小。
因此結果是高端GPU的單位功耗的圖形性能並不算出色,反而是中端遊戲顯卡有比較強的性價比;而高端GPU用於大規模並行計算時則因緩存太小,不得不頻繁讀取內存而顯得效率不夠高。
基於此,我國專門研製了申威眾核處理器,申威26010處理器就是採用了256+4的眾核結構,更適合進行大規模並行計算,而不是圖形計算。
順帶一提,按照目前的芯片發展趨勢,採用異構加眾核結構的CPU目前正在逐步發展,預計將成為未來計算機發展的主流。例如目前我工作中使用的CPU Corei9 12900KF,就是計算核心8+8的結構,一共24個線程,已經可以算是初步的異構芯片了。而Intel下一代據説還有32+8核48線程的型號,而我們需要知道的是,早些年的低端GPU也就是32個流處理器。
所以從這個角度看,無疑我國在超算並行計算芯片上的發力,已經站在了CPU發展的潮頭了。
當然從產業生態的角度説,目前以往針對單線程編寫的程序,在未來異構化、並行化的CPU面前將難以充分發揮其性能。而這,需要依賴與並行CPU相配套的新式編譯器、運行庫等配套核心軟件來解決。而這些,我國無疑還有很多短板。例如申威26010的配套編譯器,還是自行改寫的Linux GCC編譯器,稱為SWGCC編譯器,這樣的編譯器雖然開源,但未必有足夠充分的優化,因此也未必能夠充分發揮我國大規模並行CPU的性能。