哎呦CPU,您可別累着,兄弟CIPU在雲上幫把手_風聞
谭婧在充电-谭婧在充电官方账号-偏爱人工智能(数据、算法、算力、场景)。-2022-06-21 14:34

圖文原創:譚婧
雲廠商對新型計算架構的渴望,是歇斯底里的。
幾條街之外,都能聽見嘮叨聲:“哎呦,CPU,快放下,您哪敢動這,可不能把資源浪費在網絡和存儲的負載上。”

雲計算的基礎技術工作之一,就是通過“軟件定義”的方法,把傳統的、以CPU為中心的計算體系架構,變成可售賣的公共計算資源。
如今,做好雲計算,光懂軟件不夠了,要懂更多東西:計算機體系結構。
由此拉開雲廠商突圍基礎設施戰場的序幕,阿里雲打贏這一仗,更有資格服務全球400多萬客户,用好全球百萬台服務器。

百萬台服務器,這麼多,怎麼管?
“飛天”來管。
飛天是阿里雲自研的雲計算操作系統,也是分佈式操作系統。
通過虛擬化,池化,調度的技術,把所有的物理資源通過算力的方式,就像一台服務器這樣進行工作。
把這麼多的物理資源以雲計算的方式送到客户手裏。

計算機先驅艾倫·凱(Alan Kay)曾説過:“真正在乎軟件的人,應該自己造硬件”。

為了讓雲計算的軟件更厲害,我們拉上專用硬件來幫忙。
原來是硬件 “統一”幫忙,現在是硬件“特意”幫忙,所以是專有硬件。
所以,智能網卡和DPU被熱烈討論。

每一家雲廠商的軟件不一樣,更準確地説,各家雲計算廠商的系統軟件棧大有不同,要專門為需求設計硬件,定製化硬件加速。

一切損失,皆是浪費。
多系統的性能跟傳統硬件提供的性能相比,會有一些硬件性能的損失。看看阿里雲今天的規模,浪費0.1%,都是一大筆錢。
為了得到更好的產品,光靠通用硬件不行。
而軟硬件的深度協同的技術演進路徑下,雲廠商有獨家秘訣(Know-How)。

往大里説,雲計算時代呼喚新型計算機體系架構。

這次創新,是從計算機在IDC的內部體系結構裏面做創新,從以往的以CPU為中心的體系架構,邁入以“雲操作系統+CIPU”為中心的體系架構。
飛天雲操作系統運行在CIPU之上,管理和調度底層物理資源。飛天內核包含神龍計算、盤古存儲、洛神網絡和安全,都對CIPU本身所具備的能力做了深度適配。
CIPU是一顆雲端處理器,它相當於把飛天操作系統跟服務器銜接。
軟件上,CIPU支持飛天雲操作系統,高效完成虛擬化資源編排調度。

硬件上,飛天操作系統通過CIPU能快速雲化管理數據中心物理設備,並對網絡和存儲硬件進行加速。
這樣一來不僅不會再浪費CPU的算力,還能增強網絡和存儲的性能。
CIPU是雲計算時代的新型計算機體系架構。
想了解今天,必須讀懂昨天。
第一步,搞懂任務卸載。
CPU承擔兩個角色:
第一個是計算。
第二是控制,有很多控制邏輯,它去協調整個服務器上的各種組件,包括網絡、硬盤。
這對一個單一服務器來説,這個邏輯非常正確。
而云計算管理的服務器規模非常大,就是它要控制的是數以百萬的節點的存儲的資源、網絡的資源,它要來進行控制,這個時候單一CPU的控制能力是做不到的。
如此體量下,飛天雲操作系統需要把控制和計算的邏輯進行重新定義。
CPU單打獨鬥,既要處理大量的上層應用,又要維持底層軟件的基礎設施,還要處理各種特殊任務(IO類協議),不堪重負。

所以,把“負擔”從CPU上卸載下來,包括將網絡進程,虛擬化功能卸載到專用硬件上,數據中心的服務器裏,會逐步加入各種加速卡,雲計算領域會湧現出一批代表性產品。
算力資源就好比“房屋實用面積”,有沒有浪費,全憑技術實力。

第二步,搞懂計算架構。
“飛天+CIPU”想要達到的目標,是把上百萬台服務器變成一台超級計算機。
大量的計算需要跨網絡存儲、跨網絡進行數據交互,在這個過程裏面,CIPU來加速。CIPU是一個大數據中心、大雲計算的控制器的概念,是算力加速。
阿里雲認為,應打破以CPU為中心的傳統雲計算體系架構,定義新一代雲計算基礎技術。
阿里雲這款CIPU處理器,和CPU不是替代關係,CIPU是一種不同的計算架構形態。
“靈感”來自於阿里雲神龍卡,神龍卡是阿里雲自研的產品,外界不能生產神龍卡,阿里雲也不對外銷售。
可以説,神龍卡是CIPU的一種實現。或者説,CIPU是神龍卡的產業化標準。
雲計算的基礎設施是多流派技術的集大成者。
有軟件,有硬件,有計算,有網絡,有存儲,有虛擬化,有安全,有加速器,有驅動,有框架,有應用,精粹交織。

雲計算業務的成熟度高,逼着基礎設施的成熟度攀高,這也是阿里雲定義新型計算機體系架構的動因。
(完)
更多閲讀
AI框架系列:
DPU系列:
2. 永遠不要投資DPU?
其他:
3. 隱私計算:消失的人工智能 “法外之地”
4. 售前,航空母艦,交付,皮划艇:銀行的AI模型上線有多難?
6.兩大榜單揭曉啦,2021年中國高性能計算機性能TOP100+國際人工智能性能排行榜AIPerf500
7. “重型卡車自動駕駛,無量產,則無意義”贏徹科技CTO楊睿剛博士觀點
漫畫系列
1. 萬字大稿深度解讀硅谷風投A16Z“50強”數據公司榜單
4. AI for Science這事,到底“科學不科學”?
最後,再介紹一下主編自己吧,
我是譚婧,科技和科普題材作者。
為了在時代中發現故事,
我圍追科技大神,堵截科技公司。
偶爾寫小説,畫漫畫。
生命短暫,不走捷徑。
還想看我的文章,就關注“親愛的數據”。


“分享、在看、點贊、打賞 “都是愛