阿里雲發佈CIPU,對於企業客户意味着什麼?_風聞
BImpact-宇婷,To B行业观察者、资深媒体人、博主。-2022-06-22 10:16
極致聚焦TO B行業
商業記者宇婷原創、一線報道
記者宇婷工作微信:jizhitubei
2022年阿里雲峯會上,阿里雲智能總裁張建鋒表示,阿里雲今年最重要策略是“B2B”,也就是“Back to Basic”,回到雲計算的本質。
雲計算的要義是推動包括軟件和硬件驅動的技術創新,從而提升算力。
阿里雲這場發佈會的重點放在:數據中心體系架構變革之上。
作為一個雲計算廠商,服務這麼多客户以後,阿里雲發現客户對他們的訴求是:逐步從業務邏輯為中心,轉向了數據處理為中心。
此次,涉及到變革的關鍵技術是——CIPU。CIPU(Cloud Infrastructure Processing Units 雲基礎設施處理器),將替代CPU成為雲時代IDC的處理核心。
1、原來需要3.5台,現在2.5台就夠了
雲上客户的需求發生了很大變化,數據密集型的計算越來越多,不斷地提高了對雲計算提供的低時延、高帶寬的需求,這些需求很難通過傳統體系結構去滿足。
CIPU推出,原來需要3.5台同樣規格的計算資源,今天可能因為CIPU,企業用户只需要2.5台的同樣規格的服務器,就可以完成這樣的計算。
效果是為雲上的客户帶來更好的性能,尤其是更好的性價比。
CIPU是跑在阿里雲的雲操作系統底下,來支撐雲操作系統更高效地做雲資源的管理和加速。從客户視角來講,客户看到的其實就是虛擬的計算集羣、存儲集羣、網絡集羣,到客户這裏直接體現為算力。
區別在於被CIPU管理的數據中心提供了雲算力,調度效率以及它的運行算力的性能會有比較大的區別,明顯要好於不用CIPU加速的這些雲算力。
阿里雲要達到的目標是——所以從客户視角來講,他其實是無感的。客户的應用不需要改任何代碼。但能更快、更敏捷、更靈活了,性能更好了。
客户看到的其實就是雲上的一個池化的統一管控的算力資源。客户取用的時候,就是能發現:第一有更好的性價比;第二,當他的應用不需要做任何的調整的時候,本身性能就會更高。
客户對雲計算的要求是什麼?不是直接使用硬件,客户希望通過虛擬化的技術來使用軟件而使用硬件,所以他是可以不關心操作系統及其以下部分,操作系統及其以上部分他做到標準化就可以了。
2、“因為我們不去研發,就沒有人會去研發。”
阿里雲是怎樣想到在CIPU上進行創新呢?
在阿里雲近幾年的創新過程中,明顯看到了一種“端到端”的痕跡。
如何讓飛天操作系統跑得更好,別人幫不了阿里雲,在這一點上阿里雲只能選擇端到端去自研,垂直往下。但是一旦是客户能感受到的部分,阿里雲的邊界守在用開放的方式與生態合作(硬件、軟件合作方)。
“因為我們不去研發,就沒有人會去研發。”阿里雲高管也在採訪中對記者表達。
另外,作為一個雲計算廠商,需要降低自己的成本。
阿里雲不但要做資源池化,資源池化本身要應對的是多租户環境,因為要服務不同的客户。從這個視角來講,最大的挑戰是當你資源池化達到全球上百萬台服務器的時候。整體的虛擬化或者説資源池化出的算力,無論是計算資源還是存儲資源、網絡資源,這些資源如何能夠進行統一的管理、調度、編排,而且是讓它更有效地發揮出它的性價比?這是不變的難題。
過去十多年,雲計算技術發展經歷了兩個階段:
第一階段是分佈式技術,推動互聯網企業從大機向分佈式系統整個遷移;第二階段誕生了資源池化技術,通過計算存儲分離的架構,對資源統一的調度編排,提高雲計算的可靠性和可用性。
進入第三階段,CIPU的研發是要協助或者説承載飛天雲操作系統需要去納管的整體編排、調度的上百萬台服務。
在CIPU這個品類裏面,推出新物種,在雲上能夠大規模普惠化的高性能網絡加速服務,叫eRDMA,延時能低到5.5微秒。CIPU推出,阿里雲針對上層的飛天雲操作系統包括我們更上層的要跑在雲上的應用,做了非常多的定製化開發。與之相對的飛天雲操作系統本身的內核,如神龍計算平台、盤古存儲平台、洛神網絡平台包括安全內核,實際上都是對CIPU本身所具備的能力做了深度的適配。
從而讓客户在低成本組網之外,結合龍蜥的操作系統,以及用户態的一些驅動技術,讓客户不需要修改一行代碼,能夠無縫地加速所有的分佈式應用。阿里雲基於CIPU的架構,加飛天操作系統架構,推出的eRDMA(彈性RDMA)的技術。系統對延時要求特別高,它在阿里雲上開發幾乎不用改代碼。使用阿里雲的龍蜥操作系統就可以。
eRDMA就是典型的是一個物理世界不存在,但是它是虛擬出來的大規模普惠化的網絡延時技術。物理世界它不一定存在,但是在雲計算裏面就存在,它解決了企業的特殊問題,這裏面背後就是軟件定義。軟件定義的背後就是飛天操作系統。飛天操作系統怎麼跟這些差異化的硬件進行協同和協作?那麼就需要有一個CIPU。
3、為無法計算的價值
目前,數據中心的低碳綠色,是中國乃至世界上絕大部分數字化轉型必須做的思考。
這兩個階段的演進推動雲計算發展,但它們都是通過軟件定義的方法,基於傳統的以CPU為中心的體系架構去做優化,已經觸及瓶頸。
“飛天+CIPU”,形成軟硬件結合。CIPU向下接入物理的計算、存儲、網絡資源,快速雲化並進行硬件加速;向上接入飛天雲操作系統,管控阿里雲全球上百萬台服務器,讓算力虛擬化損耗降到0,並通過規模化應用RDMA網絡技術,讓訪問雲端比訪問本地硬盤更快。
與英特爾、英偉達的路線不同(產業鏈上的供應商),阿里雲的CIPU是通過雲的規模、業務,客户雲的需求,根據飛天操作系統從頂層定義,又根據垂直業務定義芯片,寄託於CIPU的精準度能夠精準解決雲操作系統關於管理、控制和調度的問題,以及部分核心業務加速。
與AWS對比。阿里雲認為其與AWS其實都邁入到了類似的一個新階段,只是説有些區別是因為阿里雲在不同的市場裏面,看到的風景不太一樣。舉例,在應用跑起來以後,其性能無論在計算、存儲還是網絡的技術指標上,有優勢。這是因為國內的客户對性能的要求和性價比的要求非常極致,也與垂直的技術棧的深入有關係。
為什麼要重提無法計算的價值?雲計算解決的是不同規模的企業,能夠用上高可用的分佈式技術,滿足業務的需求。
在之前採訪無影的案例中,我也感受到,未來服務器或者主機的概念有可能會淡化,雲服務真正被接受的時候,企業的算力直接從雲計算公司獲取。
企業客户在數字化改造的時候,沒有能力搭建分佈式系統。不需要改代碼的情況下,企業用户就可以獲得別人可能投入了幾百人或者上千人,投入了大量錢研發出來的一個eRDMA的技術,在阿里雲上什麼都不需要投入就可以獲得這樣的技術紅利。
但即便進入第三階段,無論是軟件定義還是軟硬驅動,雲計算的本質仍然沒有變。
除了迴歸技術本身,這次也提醒了雲計算的本質,依然是讓更多中小企業享受到技術紅利。這是雲計算能夠幫助我們突破計算限制,實現從個人到企業的創新的重要原因。
技術的發展趨勢是從技術的整合走向了技術的融合,從技術整合走向技術融合,使得摩爾定律可以繼續生效。
我回想曾經看到的一篇文章,有一個很有趣的細節,阿里雲剛成立的前兩年,員工出差用餐時,開發票的服務員總是“好心”地將“阿里雲計算有限公司”,寫成”阿里雲計算機有限公司”。多加一個“機”字。
軟件、硬件,推動技術發展,潮流總是重複的。
參考:阿里雲技術產品負責人蔣江偉(小邪)、阿里雲虛擬化技術負責人蔣林泉(雁楊)、阿里雲基礎產品首席架構師黃瑞瑞媒體採訪,以及張建鋒 阿里雲智能總裁/阿里巴巴達摩院院長演講