新一代國產芯片,能不能追平英特爾10代處理器?_風聞
酷玩实验室-酷玩实验室官方账号-10-25 09:20
上週三,美國收緊對於我國的芯片政策,相比上次,這次更加嚴苛,不僅用於AI計算的高算力芯片被禁,還可能要波及4090這樣的消費級產品。
消息發出後,4090顯卡瞬間成為微博熱搜,雖然現在還無法確定4090顯卡是否會正式出現在這一波的名單中,但從美國修改政策頻率來看,芯片已經成為生產力提升過程中的絕對主角。

儘管近些年,我們在GPU或者説加速計算芯片上出現了壁仞100這樣不錯的產品,但去年剛流片成功的它,今年就被寫上了實體清單,所以壁仞100大規模量產很有可能將被推遲。因此,目前在市場上我們還看不到類似英偉達或者AMD的國產GPU。
但在起步更早的國產CPU領域,已經可以看到一些可以達到國際主流水平的產品了,比如在這個月GMIF2023大會上,龍芯宣佈最新CPU——3A6000將會在這個季度正式發佈。

作為一直關注國產芯片領域的我們,也是早早申請了媒體測試機,終於在兩週前拿到了搭載3A6000的主機。
**國產芯片啥樣?**打開主機,不僅主板和CPU出自龍芯,其餘配件也都出自國產廠商,內存和硬盤也分別來自紫光和大華,機箱電源也是來自愛國者。只有顯卡採用了AMD的RX580芯片,但戰狼的型號命名,讓它在一眾國產配件前也不是很違和。

龍芯3A6000實拍圖,右上角的ES代表測試版
這塊最新主板上還集成了龍芯自主研發的最新7A2000橋片,除了用來控制像USB,音頻,網絡這樣的接口外,裏面還集成了龍芯自研的GPU芯片,也就是説,即使不裝上顯卡,這台電腦依然可用,並且實現了全部配件**100%**國產化。

龍芯自主研發的7A2000橋片,帶有GPU功能
在系統方面,除了主流的國產統信操作系統還有龍芯自研的Loongnix。兩者都是基於Linux的系統,但為了照顧大家的習慣,在界面設計上都非常貼近Windows,所以用起來的學習成本很低。
真的追上10代酷睿了嗎?在流片成功時,龍芯官方公眾號曾發文稱,3A6000的總體性能已經追上2020年上市的Intel第10代酷睿4核心處理器,雖然Intel最新的產品是第十三代,但這些年CPU性能過剩,第10代的性能已經足以覆蓋日常辦公,娛樂和遊戲等需求。
並且在頻率方面,10代i3也領先不少,它的基礎頻率就達到3.6Ghz,睿頻加速後,單核最高可以達到4.3Ghz。而龍芯3A6000的頻率和前一代一樣,只是固定的2.5Ghz,不過這次它增加了超線程技術,從4核心4線程升級到了現在的4核心8線程。
這次測試,我們採用了兩款軟件——SPEC 2006用來測試CPU和Stream用來測試內存速度。
SPEC作為市面上專業的測試軟件,SPEC是先編譯然後再運行各類測試項目,所以這個軟件理論上可以運行在各種架構CPU和各類的系統中,無論是X86還是LongArch,無論是Windows還是Linux上,SPEC都可以用來測試當前平台處理器的性能。因此SPEC也成了目前主流的CPU測試軟件。

SPEC編譯過程截圖
Stream用來測試CPU和內存之間的速度,在CPU設計中,內存控制器是非常關鍵的一環。因為要處理的數據一般都儲存在內存中,所以如果CPU計算速度上去了,但是和內存之間的數據交換速度過慢,就會大大限制CPU的發揮。所以Stream也是必要測試的一個項目。

Stream測試過程截圖
在SPEC2006的測試中,龍芯3A6000的整數部分單核得分40.4,多核得分146,浮點部分單核得分51.6,多核得分136。

SPEC得分截圖
而10代i3的只有整數單核和浮點多核的得分略高於3A6000,其他兩個項目龍芯得分均超過對手。(10代i得分:整數:單核42.5 多核147 浮點:單核51.3 多核 150)
在這個純CPU計算性能比拼中,龍芯可以説是和10代i3打了一個五五開。看來在計算性能方面,現在的龍芯可以讓大家放心了,接下來看看新一代龍芯在內存交互上有着怎麼樣的表現。
在Stream測試中,龍芯和內存的最高交互速度出現在四線程的測試中,四個項目的速度都超過了40GB/S,在同樣的項目中,i310100F只有30GB/S,同樣的情況也出現在單線程和8線程的測試中。因此,在內存控制器方面,龍芯的表現已經超過10代酷睿i3了,並且還超出不少。

Stream最終成績,均超過40G/S
綜合上面的這兩項測試來看,在理論性能方面,龍芯3A6000確實已經有10代酷睿四核處理器的水平。那麼在實際體驗中,用起來是怎麼樣的呢?
不過在此之前,要説一個非常有意思的事情,在拿到龍芯主機時,為了測試兼容性,我把同事的兩條頻率為3200的16G金士頓內存插上去,測試沒有問題後,就一直用了下去。在SPEC跑分的時候,成績總是低不少,後來把兩條國產內存換上去,分數就正常了,看來這國產硬件之間似乎可以產生某種神秘的BUFF。
國產芯片能幹啥?作為自主的研發的代表,龍芯的3A6000在底層上採用了自主研發的LongArch(以下稱龍架構),和Intel的X86架構有着非常大的區別。
所以龍芯的CPU無法裝載Windows系統,目前只能使用開源的Linux系統,而不同的架構和系統讓很多Windows上的軟件無法在龍芯的系統上運行。
所以,我們在測試完性能後,還要看看龍芯的生態軟件發展成什麼樣子了,不然買回龍芯電腦只能用它來跑分,而不能用來實際使用一些日常軟件,就有些説不過去了。
龍芯目前最主要的任務肯定就是辦公生產力了。Linux版本的WPS已經可以很好的適配龍架構了,使用起來和Windows上的不能説大差不差吧,只能説一模一樣。大家看到的這篇稿子就是我在龍芯電腦上敲出來的。

輕度辦公沒問題了,那麼重度呢?讓我們一起測測看吧。
首先打開50M的百萬字的Word文件,基本上可以實現秒開,在經過幾秒加載後,就可以順暢地編輯全文了。在打開200M的Word文件時,會有3秒左右的延遲。這種情況和我日常使用的11代i3移動處理器差不多。
接下來的50M的Excel和PPT以及500頁的PDF,都是可以實現秒開,並且直接編輯。但旁邊的筆記本這次就要慢上很多了。

在娛樂方面,主板橋片上集成GPU就有點撐不住了,在播放4K本地視頻的時候,基本上處於播放PPT的狀態。
裝上RX580戰狼顯卡後,視頻播放就沒有什麼壓力了,本地4K和B站在線4K都非常流暢,不過要説明一點,在B站觀看4K視頻中,如果遇到彈幕較多時,會出現掉幀的情況,並且彈幕越多,掉幀越嚴重。

在遊戲上,可以説是有意外收穫了,本來以為Linux上並沒有什麼遊戲可玩。但現在的龍芯可以通過轉譯(可以理解為把外文翻譯成中文),可以運行不少X86架構上的遊戲,並且流暢度都非常不錯。
像勞拉,火炬之光2,甚至魔獸世界都可以流暢運行。經典的CS1.6,魔獸爭霸3,通過轉譯也都可以運行起來,並且還非常流暢。

在做轉譯測試的時候,發現3A6000居然可以運行Photoshop,雖然會遇到字體的BUG,但日常P圖完全夠用了。

像瀏覽網頁等日常體驗,3A6000可以説是毫無壓力,無論是一次開幾十個網頁還是説各大網站的高清視頻播放,體驗完整性上絲毫不遜於Intel等X86平台。
國產芯片目前的最大敵人:生態系統通過理論性能測試和日常使用體驗來看,龍芯最新的3A6000確實已經追上2020年發佈的10代酷睿四核處理器,並且這還是在頻率比競品低了1個多Ghz的前提下。
按照龍芯董事長鬍偉武的介紹,龍芯目前也在踐行Intel的Tick-Tock戰略,目前處於打磨架構的階段。下一代龍芯如果能用上比12nm更加先進的製程,那麼性能會變得更加強悍。
在2002年龍芯1號剛剛發佈的時候,性能只有當時主流型號的5%,2021年的3A5000基本能達到當時主流性能的50%(差不多是第四代酷睿的水平),而今年的3A6000已經基本上追上主流水平了。不得不説,龍芯這幾年的性能提升是肉眼可見的快。

圖片來源:龍芯在上證路演截圖
但這個時候不禁讓人想到一個問題,在性能達到主流後,軟件生態怎麼樣?如果空有一身本領,沒地方用,那就悲劇了。
如果想要啓動個原神,還需要先轉譯,再繁瑣的設置一番,並且玩起來還有些字體上的BUG,那就不好了。
根據目前市面上的主流軟件生態,龍芯現在面臨三個問題:
第一,需要有一套龍芯自己的系統,並且這套系統的兼容性最好要做到像X86架構下的Windows那樣,從Intel處理器換到AMD處理器,系統都可以兼容,在最新的Windows11系統下也可以玩20多年前Windows98上運行的紅警2。
第二,能不能搞一套轉譯性能更好的東西,把X86上成熟的應用做到可用,不要求以多高的性能運行,只要兼容性最好就行。
就像蘋果搞的Rosetta1一樣,當初Mac從IBM處理器遷移到Intel處理器時,它就保證了不少關鍵程序的可用性,一直到五年後,基本上所有的程序都完成了Intel的X86架構原生支持,Rosetta1才下線。而2020年,在蘋果宣佈Mac產品線全部從Intel轉移到自研的M芯片後,Rosetta2正式上線,至今幫助不少像AfterEffects等專業軟件保證兼容可用。

蘋果轉向Intel芯片時,專門推出Rosseta1
第三,就是如何吸引更多的開發者來開發基於龍架構的應用?只有開發者多了起來,龍芯應用才會出現百花齊放的效果。
好在3A6000成功流片後,龍芯內部也意識到這個問題。在今年的業績説明會中,胡偉武把龍芯自己的生態解決方案拿了出來。
首先,龍芯要基於Linux打造自己的操作系統——Loongnix(以下稱龍系統)。傳統的Linux在大的版本更新後,軟件兼容性上常常會出問題,打個比方,就像大家從Windows10升級到Windows11,突然發現,在Win10上運行好好的軟件,在Win11要麼無法運行,要麼運行起來一大堆的Bug。
龍系統目前着重解決的就是應用在不同版本Linux之間不兼容的問題,現在在龍系統上運行的軟件,在大更新以後,也依然可用。在硬件兼容性上,龍系統的目標也是達到任何一代龍架構的CPU,都可以運行最新的龍系統。
龍系統另外一個目標就是要打造成為Linux裏面的安卓,其他使用龍芯CPU的廠家可以根據自己的需求在龍系統上進行魔改,就像小米在安卓上開發出自己的Miui一樣。

另外在開發應用上,龍芯目前也在學習iOS和安卓,打算搞出一套自己的龍芯自主編程框架。幫助開發者們更好地開發基於龍架構的各種生態應用。相信過幾年應該就可以在微信安卓版旁邊看到微信龍芯版了。
其次,在轉譯方面,龍芯也在努力地搞出一套高效的轉譯,因為具有完全的自主性,所以添加一些優化進去,會更加方便。不過這個轉譯效果來看,目前還不夠理想,比如前面測試Photoshop,還有一些遊戲等,多少會有影響使用的BUG出現。
希望在未來優化過後,能做到蘋果一樣的效果就好,效率也不用特別高,能達到轉譯前的80%左右就行,主要是兼容性要好。這樣才能吸引更多的Windows用户過來。
另外,根據介紹,接下來龍芯這套轉譯系統還會支持ARM上的應用,所以不久後應該就能看到一些安卓應用在龍芯上跑起來了。
最後就是如何吸引開發者過來,説實話,這是一個很難破解的難題。想要有更多的開發者,就需要有很大的用户基礎,想要更多的用户,就需要有開發者開發出好用的程序。
因此,想要打破這個循環,就需要有一方做出部分犧牲,是用户犧牲體驗,還是開發者犧牲收益。目前來看,龍芯的做法只能是後者。畢竟,在開放性的市場,不能讓按着用户的頭來用自己的產品。所以龍芯現在大力加強瀏覽器,影音軟件等基礎軟件體驗,然後再聯合微信,QQ,騰訊會議,飛書等這樣的大企業把必要的應用生態做好,吸引更多的用户進來,從而進入到一個良性循環。
芯片追趕,一切才剛開始兩年前,我們還在為中國自主的CPU的性能突破慶祝,現在,3A6000的出現,讓性能不再成為國產CPU的短板。我們反而開始擔心起來沒有軟件在這顆處理器上運行起來。
起初我想用甜蜜的負擔來形容這一切,後來我發現,想要打造自己的芯片,其實遠比我們想的要難。
當你的芯片性能足夠好的時候,你還需要建立起一整套自己的生態體系,用户才能買單。
在這一點上,龍芯才剛開始。
雖然競爭對手已經霸佔市場多年,但龍芯的機會還是有很多的。從上到下的自導自主,意味着很多方面優化起來會更加方便。比如傳統X86平台的電腦,在運行一些機密軟件的時候,需要配一台密碼機才可以,而龍芯因為內部添加了這些加密的指令集,所以使用龍芯電腦的時候,不需要添任何外部設備,就可以運行這些加密的軟件。
在生態上的追擊,龍芯表現出的決心更大,在今年的多場演講中,胡偉武多次提到,在性能追平後,將全力轉到生態建設上來,目前龍芯自己就有幾百名軟件開發人員,下游的開發人員更是達到了幾十萬。相信幾年後,我們就能看到一套生態基礎完善,邁入良性循環的龍芯體系。
在GPU方面也是如此,現在我們已經有了超過英偉達A100的壁仞100,但英偉達靠着CUDA已經培養出一大批在GPU上編程的開發者。這就像蘋果的iOS一樣,背靠如此多的開發者,就會有非常多的應用給用户使用。對於英偉達來講,CUDA就是它的iOS。
目前剛剛起步的國產GPU公司也意識到這個問題,像壁仞和摩爾線程,它們在追趕性能的同時,也在大力發展自己的社區,兼容目前主流的開發框架。
國產芯片的未來,讓人無比期待,龍芯用了20年就追上了別人60年的水平,所以現在,請大家給予國產GPU芯片的一些寬容和支持,生態環境還需大家一同建設。
參考資料:
https://www.oschina.net/news/251812 龍芯中科官方公眾號
https://zhuanlan.zhihu.com/p/652886534 10代i3數據
https://m.jrj.com.cn/madapter/finance/2023/07/11082237682237.shtml 壁仞科技BR100資料