阿里雲「變奏」,迴歸技術還是瞄準利潤?_風聞
蓝洞商业-将价值写作进行到底2022-06-16 17:24

阿里雲的邏輯是,當規模足夠大時,就可以攤銷相對固定的研發與技術成本,從而實現盈利。但做大規模的前提是深耕技術,實現技術突破才可能有好的市場表現,繼而做大規模。
撰文|藍洞商業 郭朝飛
雲計算進入調整期,騰訊雲改變模式、注重盈利,阿里雲則強調要回歸技術。
「今年我們最重要的策略是B2B,就是Back to Basic,回到雲計算的本質,雲計算的核心競爭力是技術,堅持在技術的長征路上,不斷取得新的突破。」阿里雲智能總裁張建鋒在2022阿里雲峯會上説。
同時,阿里雲發佈一款雲數據中心專用處理器CIPU(Cloud Infrastructure Processing Units 雲基礎設施處理器),其向下接入物理的計算、存儲、網絡資源,快速雲化並進行硬件加速;向上接入飛天雲操作系統,管控阿里雲上百萬台的服務器。
對此,張建鋒的解釋是,雲計算進入一個新的發展階段,需要定義全新的技術體系,從數據中心的內部體系結構裏做一些創新,體系架構從以CPU為中心轉變為雲操作系統+CIPU為中心。
強調底層技術,並不意味着阿里雲準備放棄收入與利潤。
5月底,阿里發佈截至2022年3月31日的2022財年財報,本財年阿里雲在抵銷跨分部交易前全年收入為1001.8億元,抵銷後為745.68億元,13年來首次實現年度盈利,經調整EBITA盈利11.46億元,上年虧損22.51億元。
張建鋒將之視為自然而然的結果,「這是對阿里雲長期堅持技術投資的回報。」
阿里雲的邏輯是,當規模足夠大時,就可以攤銷相對固定的研發與技術成本,從而實現盈利。但做大規模的前提是深耕技術,實現技術突破才可能有好的市場表現,繼而做大規模。
如此看來,迴歸技術也是瞄準利潤,這本來就是一回事。
新的爭奪點
阿里雲已經進入第13年。在這十幾年中,從行業與技術來看,雲計算也走過了兩個不同的發展階段。
在第一階段,互聯網企業大量出現並高速成長,以分佈式和虛擬化為代表的雲計算技術出現,並逐漸替代大型機和小型機,滿足企業業務擴展帶來的算力彈性需求。
進入第二階段,在以CPU為中心的分佈式架構下,雲計算公司通過軟件定義的方法,將計算、存儲資源池化,構建計算存儲分離的架構,規模化編排和調度,形成超大規模的計算和存儲資源池。
「兩個階段有共同的特點,都是通過軟件定義的方法,基於傳統的、以CPU為中心的計算體系架構去做優化,已經觸及瓶頸。」張建鋒説。
阿里雲基礎產品首席架構師黃瑞瑞向「藍洞商業」等分析了當前資源池化面臨的巨大考驗。
作為雲計算廠商,資源池化的同時,要服務大量不同客户。拿阿里雲來説,其在全球有上百萬台服務器,資源池化出算力後,其挑戰在於如何對大量的計算、存儲、網絡等資源,進行統一的管理、調度、編排,並且有效地發揮性價比。
「這個是非常關鍵的點,而且是個非常巨大的挑戰點。」黃瑞瑞坦承,這也正是雲計算第三階段,CIPU的一個非常重要的職責。
同時,用户對低時延、高帶寬的需求也越來越高,以CPU為中心的計算體系架構已無法滿足。
事實上,2015年阿里雲就有團隊開始着手解決這些問題。兩年後,阿里雲發佈神龍雲服務器,其實現虛擬化損耗為零。此後,神龍、彈性RDMA等核心技術被垂直整合,形成以CIPU為中心的架構。
在這個全新體系架構下,CIPU向下對數據中心的計算、存儲、網絡資源快速雲化並進行硬件加速,向上接入飛天雲操作系統,將全球數百萬台服務器連成一台超級計算機。
從全球範圍來看,一些科技巨頭亦有佈局。比如亞馬遜推出Nitro系統,英特爾與英偉達分別做出IPU(Infrastructure Processing Units基礎設施處理器)與DPU(Data Processing Unit 數據處理器),後兩者的目的都是分擔CPU的網絡控制、存儲管理和安全等工作負載,提高數據中心效能。
阿里雲虛擬化技術負責人蔣林泉告訴「藍洞商業」等,英特爾、英偉達是供應商,與阿里雲不是對手關係,阿里雲是雲服務商,CIPU是為雲而生。「我們認為跟AWS其實都邁入到了類似的一個新階段,只是説有些區別,因為我們在不同的市場裏面,看到的風景不太一樣。」
雲計算技術進入新的爭奪點。
獲取後坐力
阿里雲一直走的都是做深基礎、技術變現的路線。
在阿里雲早期,曾被質疑過「明明可以坐高鐵,卻偏偏要騎自行車」,但依然堅持核心技術自研。
阿里雲技術產品負責人蔣江偉向「藍洞商業」等回憶,2009年前後阿里雲就開始做基礎底層產品相關的工作,比如研發數據庫、存儲系統,阿里雲的第一行代碼就是盤古存儲的代碼。在硬核技術上投入,是阿里雲的基因。
神龍計算、盤古存儲、洛神網絡等是阿里雲產品的核心。
為了解決服務器的虛擬化性能損耗的問題,阿里雲自主研發了神龍架構。該架構通過把虛擬化轉移到專用硬件中進行加速,其將物理機的高性能與虛擬機的靈活性相融合,虛擬化損耗幾乎為零,性能又比傳統物理機更強勁,還可隨時擴容,極大降低了客户成本。
盤古存儲則是將所有的磁盤虛擬成一個超大規模、穩定可靠的磁盤。實際上從用户角度,形象地説面對的是一個超大的存儲湖、存儲池或者存儲海,也並不用搞清楚存儲的物理位置或者具體的機器類型。隨着數據的增長,用户隨時可以申請到更大規模的存儲。
洛神網絡是基於軟硬一體的雲網絡系統。客户上雲時,洛神可以快速構建一張全球化網絡,根據業務需求隨時獲取各種網絡服務。同時,用户可以實現雲上和雲下業務的一鍵打通,通過多種方式將IDC、客户站點、分支站點接入阿里雲,享受統一的管理和一致性的業務體驗。
此外,阿里雲還自研數據庫,這與當年阿里的「去IOE( IBM的小型機、Oracle數據庫、EMC存儲設備)」有關。
2013年7月10日,淘寶核心系統中的最後一台Oracle數據庫下線。三年多以後,阿里雲自研的雲原生數據庫PolarDB發佈,2018年4月正式商用。此後,阿里雲針對不同應用場景,開發出多款數據庫產品。
正是有了自研技術、做深基礎的積累,幾年後,阿里雲逐漸進入越來越多的行業,規模越做越大。數據顯示,2014年~2018年4年間,阿里雲增長約20倍,曾連續12個季度營收翻番。
2020年12月,阿里雲首次實現盈虧平衡,在2021財年第三季度實現營收161億元,調整後EBITA盈利2400萬元。張建鋒很清楚,這是阿里11年來長期投入的結果,他表態「會繼續加碼技術投入,深耕產業數字化。」
飛天系統+CIPU的體系架構將讓阿里雲實現更大規模的增長。
數據顯示,CIPU與計算結合,快速接入不同類型資源的服務器,可以實現算力「0」損耗,硬件級安全的加固隔離;CIPU與存儲結合,對存算分離架構的塊存儲接入進行硬件加速,雲盤存儲IOPS最高可達300萬,長尾時延降低50%;CIPU與網絡結合,可對高帶寬物理網絡進行硬件加速,構建大規模彈性RDMA高性能網絡,時延最低可達5us。
此外,基於CIPU和飛天的新一代雲計算架構體系,在通用計算、大數據、人工智能等核心場景的計算測試中展現了優越的性能。
張建鋒給出一組數據:在通用分佈式計算領域,Redis性能提升68%、MySQL提升60%,Nginx提升30%;高吞吐類的互聯網業務上雲之後,比自建物理機的集羣吞吐量提升30%,業務高峯期延遲下降了90%;在大數據和AI等計算與數據雙密集場景下,相比傳統的TCP網絡,彈性RDMA高性能網絡的吞吐能力提升30%以上;雲原生方面,容器啓動速度快了350%,在Serverless 場景下6秒可拉起3000個彈性容器實例。
阿里雲迴歸技術,可以獲取更大的後坐力,打向更遠更大的市場。