阿里雲李飛飛為什麼提出雲原生數據庫時代下的“四化”與“四做”_風聞
BImpact-宇婷,To B行业观察者、资深媒体人、博主。-03-30 22:01

圖注:阿里巴巴集團副總裁、阿里雲智能數據庫事業部總負責人李飛飛及瑤池數據庫核心產品
撰文|宇婷
3月24日,阿里雲瑤池數據庫峯會在北京召開,並官宣了“瑤池數據庫”這一全新品牌。瑤池在中國的古代神話裏是“匯聚寶藏的地方”,寓意能夠匯聚從OLTP到OLAP各方數據庫產品、多種類型的數據,讓數據業務持續在線,讓數據價值不斷放大。
“我們的理念很簡單,更快、更穩、更安全、更好用。”阿里巴巴集團副總裁、阿里雲智能數據庫事業部總負責人李飛飛明確表達了他對雲數據庫這一賽道的未來思考和戰略思考;以及基於用户和數據庫技術發展的思考。
“雲數據庫已經成為數據庫行業的事實標準。”
他在記者羣訪中進一步提醒:但是對於這個事實標準上,大家可能有不同的觀點,比如是100%還是60%、70%的覆蓋深度。
“如果今天還不去擁抱雲原生數據庫,不按照雲原生數據庫的方式來研發自己產品的廠商,我認為是沒有前途的。只不過它們可能還有一些線下的獨立部署機會,但是這個機會是在持續不斷地萎縮。”站在數據庫廠商的角度,他這樣認為。
阿里雲數據庫產品事業部資深解決方案專家李聖陶也在訪談中進一步解釋了雲原生數據庫主要區隔的是傳統數據庫,包括傳統線下部署和商業化軟件。這一不可逆趨勢背後的用户剛需是唯有云原生架構能夠解決新時代下系統架構的矛盾。
“雲原生化不僅僅發生在數據庫的領域裏,也發生在應用、基礎設施等領域裏。”
“這本質是我們今天的業務開始接觸互聯網,甚至未來接觸AI之後,業務的迭代速度會越來越快,業務都要為企業創造價值,這個過程中要求快速迭代、穩定、低成本、彈性的系統”
去年雲棲大會,第一次聽到李飛飛在演講中分享了“四化”這個概念。仔細看這組分享,他的思考不僅僅是站在阿里雲瑤池數據庫的商業維度提出,而是站在雲數據庫賽道上提出“四化”。我想這也是李飛飛提出四化的原因之一,當下國內雲原生數據庫競爭激烈,也許最終會剩下不到20家甚至更少的玩家,競爭混亂之中需要有中正的聲音,來指出行業發展的真正階段。
這篇文章會以阿里雲瑤池數據庫為例,分析為什麼雲原生數據庫是不可逆趨勢?以及在這個趨勢判斷下,國內數據庫賽道競爭中,站在廠商角度如何更好服務客户。

雲原生數據庫在快速地向“四化”演進
給李飛飛啓發並提出“四化”的是——30年前或者準確地説40年前,中國啓動了四個現代化的歷程。這個思考被拆解為:雲原生化、平台化、一體化、智能化;落實在“瑤池數據庫產品上,是打造“雲原生+一站式”的數據管理與服務,以作為國產數據庫帶領客户實現換道超車。
“堅決做一體化,通過標準的API打通,”
“本質上,這就像是作戰方式,以前傳統的作戰方式:陸軍是陸軍,空軍是空軍,炮軍是炮軍,各打各的。今天各打各的沒有希望成功,你應該海陸空立體作戰,”在訪談中,李飛飛談到一個數據,通過雲原生一體化HTAP的解決方案,瑤池目前已經可以在用户場景中實現:用50%的成本獲得近兩倍的性能提升。
根據李飛飛的現場演講和羣訪,我這樣理解四化的含義:
首先關於雲原生化,開篇已經分析了這一趨勢。目前,沒有人會質疑數據庫向雲原生化演進的必要性和現實的緊迫感,成熟的存儲計算分離技術、存儲池化、計算池化帶來高可用、高可靠彈性,現在進入雲原生2.0階段,秒級彈性、智能的負載預測、跨機的能力,是雲原生的具體表現。
第二點,關於平台化。隨着數據量爆發式地增長,數據形態的多元化,以及ToB客户業務的多樣化,數字化深入帶來業務多樣化是必然的。在這個趨勢下,傳統的單一的數據庫產品包打天下解決所有問題的時代已經結束。取而代之的是用一個平台化的思維去構建可能有多個引擎,基於平台來提供一個一整套的、一站式的能力和解決方案,這是平台化裏最核心的思想。
這一點上,可以拿阿里雲瑤池數據的產品舉例:例如雲原生數據庫PolarDB,在CPU、內存、存儲三層技術上解耦,更容易實現雲上資源秒級擴容,同時保障了金融級高可用、高可靠能力。以及PolarDB和雲原生數據倉庫AnalyticDB打通融合,形成“雲原生一體化”的HTAP數據庫。
當下數據庫平台廠商不只瑤池這一個品牌,包括Oceanbase、華為、騰訊等友商都有基於雲的數據庫產品;還包括眾多創業公司。如果在商言商,平台化的另外一個邏輯是你只有堅持做平台化,從商業的角度才可能得到邊際成本下降的邏輯,這也是一個很樸素的道理。
堅持和雲平台去打通做軟硬協同創新,不要僅僅在軟件這一層去創新,而是要聯動底下硬件的基礎設施,拿阿里雲瑤池舉例的話,比如神龍、倚天芯片、智能網卡、智能壓縮卡與數據庫產品聯動,能夠實現一個新的產品高度,降低廠商成本,進而降低ToB用户成本。
接下來説,第三點則是一體化。
雲原生數據庫會將大數據PaaS平台之間的孤島打破。比如離在線一體化、處理分析一體化,OLTP和OLAP通過Zero-ETL核心技術,在存儲層數據自動地搬遷、增量同步。這些比較偏向技術層面的解決方案核心是把ToB客户的複雜性屏蔽掉。這一點也是在AIGC時代之後,將多模數據統一在一個存儲引擎成為未來的必然趨勢。
這裏特別想強調下對於“集中分佈一體化”的理解。集中式數據庫、分佈式數據庫的區分越來越沒有必要。因為從客户視角看,客户是不想做這個區分的,這個問題應該由數據庫解決。數據庫能夠在集中式和分佈式之間平滑切換。
李飛飛解釋,數據庫的分類應該是傳統的數據庫和雲時代的數據庫,在傳統數據庫時代有集中式、有分佈式,在雲的時代也有集中式和分佈式。集中式和分佈式和雲原生不是對等的。
因為在傳統數據庫的部署形態下,資源沒有被池化,資源也沒有被解耦,把集中式和分佈式打通理論上是做不到。但是雲原生數據庫形態下,因為資源被池化了、資源解耦了,從集中式到分佈式是平滑的過渡。做集中式到分佈式平滑遷移的時候,數據必須要做物理搬遷,但是原生的話,存儲池化、雲盤,數據在雲盤裏去做自動的,因為是無感知,這是分佈式一體化具象的表現。關於這一點,業界目前的邏輯不夠嚴謹。
除了集中分佈以外還有離在線一體化,傳統大數據BSP、在線分析數據庫MPP,這個邊界今天也在快速被打破。所謂的湖倉一體,本質就是把MPP和BSP有機融合起來。從客户視角留給複雜數據庫廠商,把簡單留給客户。客户不用再關心從在線到離線搬遷、同步。從客户業務視角,客户技術團隊不需要關心細節,該在線就在線,該離線就離線,你有智能化的調度、混合負載的能力、在線離線工作的隔離機制來滿足該在線就在線,該離線就離線,互相做到不干擾,不影響。這些是正在發生或者接下來要突破的技術。
最後是智能化,用一句英語概括是:“AI For DB,DB For AI。”
AI For DB就是用智能化的技術來做數據庫的運維,比如異常檢測、HA切換,參數調參。這個過程類似於AI和智能駕駛的關係。
DB For AI,例如在PolarDB裏用自然語言來做查詢。阿里雲瑤池數據庫會在今年下半年正式發佈PolarDB全新的接口。用雲原生多模數據庫Lindorm舉例,多模數據處理一體化的能力在AIGC趨勢下是前提。
除此之外,李飛飛還強調了瑤池數據庫在AI維度的邊界。阿里雲瑤池自己不會做模型,但提供靈活的模型導入的能力和接口,可以把第三方以及客户自己研發的模型能夠一鍵導入到內核裏,並且支持模型的數據庫化的存儲和使用,從而做各種各樣的推理。這是AIGC趨勢下,Lindorm非常大的發展機會。

智能化AI浪潮下:
雲原生多模數據庫Lindorm迎來新機會
本次峯會上,關於AI、AIGC對於瑤池數據庫的改變,也是記者當天關注的焦點,同時也是整個數據庫團隊高管在表達過程中的興奮點。
總結來看,AI和AIGC的趨勢下,瑤池數據庫整體發生三個層面變化:
一是從運維管控層面,智能化AI平民化以後,運維和調優會變得更加智能化。智能的調參,智能的運維,高可用的檢測告警,異常的報警,所有這些東西都會智能化,AI和數據化的深度結合。
在數據庫裏,瑤池數據庫會支持AIGC的應用。李飛飛解釋,這裏有一個前提,技術上必須能夠支持海量的多模態的數據,而不是單一形態的數據。Lindorm靈動就非常好地滿足了這個條件。
概括一下:海量的多模態數據的低成本、高效率的存儲和處理;並且支持足夠的開放,用平台化的方式去支持靈動,去無縫導入第三方的模型。
第二個改變在於瑤池數據庫可以更開放的迎接多模態數據模型的導入。
李飛飛演示了在Lindorm靈動裏通過簡單一個SQL就可以導入任何第三方的模型,包括開源的模型和用户自建的模型。用户導入的模型類似被放一個機密容器裏,保證安全。導入模型以後,結合多模態數據,想象空間天花板被打開。
多模態數據高效低成本的存儲,加上第三方靈活開放應用的導入,“任何事情幾乎都可以實現,個人認為一定是個爆發點。”李飛飛打了個比喻來形容效果。他再次強調,阿里雲瑤池數據庫產品只是平台化數據的基礎設施和模型導入和數據結合的能力。
第三個改變則是,多模態靈動的數據庫,傳統結構化關係型數據庫,人和它的交互的方式也會發生很大的變化,會變得更加自然的、更加智能的交互。
在演示和採訪中,李飛飛還描述了——用自然語言問有多少歌曲,多少歌名,自動生成SQL,這個技術和PolarDB深度結合,從自然語言可以產生SQL來控制怎麼樣產生AI模型。
“怎麼讓客户更容易接觸AI,這是最重要的,客户可以更自然的來使用AI模型。”阿里雲數據庫產品事業部PolarDB for MySQL產品部負責人楊辛軍認為。
李飛飛也在採訪中表達了自己對AI的思考。他認為,AI也在成為事實標準,現實世界數字化以後,高效處理數據的能力與下游應用能否爆發密切關聯。
他認為:過去一二十年是信息時代數字化,也就是説企業的信息化辦公實現了數字化。AI到了臨界點,一定會催生這麼兩件事,一個叫物理世界數字化,還有一個是生物世界數字化。數據庫在這裏會發揮什麼樣的關鍵作用?第一,多模態的數據一定會成為事實標準,因為宏觀世界數字化、微觀世界數字化各種各樣的數字一定會層出不窮,數據的多樣性就像生物有多樣性,數字化的世界裏數據也是有多樣性的。
回到數據庫領域,因此多模態數據的存儲和處理會促進處理多模態數據庫爆發式增長。
那想象的天花板空間在哪裏?
阿里雲智能CTO周靖人也在當天的演講中提到一點:“把數據能夠有效地管理起來,特別是今天我們如何做好數據的存儲、數據的分析。如何使用好數據,也發生了一系列的範式的轉變。”
似乎在最近一個月,我們從數字化一步跨入了AI的時代。結合對周靖人的演講分析。
雲計算是以算力為基礎,以數據為核心,以技術為牽引——這是計算算力的服務化,這就像是電力服務化一樣。算力服務化以後,使之有意義的是數據的注入,因此物理世界數字化、生物世界數字化進一步映射。而以ChatGPT為代表的多模數據應用和背後的算法架構成為趨勢後,算力+數據+智能,這是期待已久的數據核裂變。

“四化”是戰略,“四做”是策略
在四化的戰略和技術趨勢判斷之下,李飛飛還明確提出了阿里雲瑤池數據庫將堅持“四做”:做深基礎、做強核心、做精場景、做好體驗。
做深基礎很好理解,是指承載雲原生化和平台化的理念,和雲平台進行深入地結合。做強核心是要在雲原生這個賽道上持續做全球數據庫的領導者,加強核心產品的核心能力。做精場景就是要結合各行各業不同的場景,比如説運營商、金融、互聯網,打造場景化的解決業務痛點能力的數據能力。最後是做好體驗,統一API,簡化客户用户使用以及開發者使用數據庫的門檻,結合智能化的不斷提升數據庫的應用性。
從去年雲棲大會到當下的幾個月裏,阿里雲瑤池數據庫在“四做”上有怎樣的進展?
楊辛軍回覆ToB新勢力:“今年主要的工作聚焦在做好企業客户在新功能上的使用體驗。要一步一步,重點把體驗做好,比如Serverless怎麼樣更好展示客户使用了多少錢,讓客户每天能夠精準控制。”
他提到很多客户會擔心用了Serverless對支付的價格有影響和波動,“這是我們要做好企業的工作,怎麼讓用户更好地使用這些功能。‘四做’肯定是一步一步地隨着產品的發展逐步演進。”
阿里雲數據庫產品事業部產品與解決方案部總經理王偉民回覆ToB新勢力:“在業務需要永久保留數據資產的前提下,如何降低數據規模不斷增大帶來的成本壓力,是當下關鍵。
數據庫的技術演進,核心還是用户價值創造的三個方面,更好的效率,更低的成本和更好的體驗。”
理解下王偉民和楊辛軍的回答,當下全面雲原生化,更有效利用雲上的彈性和計算資源;對於客户來説時間就是效率,就是金錢;用户會越來越注重體驗,包括API統計、控制枱的治理、甚至文檔等。以及面向行業的具體解決方案打造和示例,這些李飛飛的團隊需要在未來的時間裏一步步穩紮穩打,向前推進。
最後提供一些根據阿里雲瑤池數據庫官宣的產品和技術情況,阿里雲數據庫目前擁有全球領先的技術和認證,中國市場份額第一,Gartner連續三年進入領導象限,AnalyticDB和PolarDB多次獲得國家獎項。
據瞭解,瑤池數據庫目前已經應用於政企市場,如服務自然人税收管理系統、全國60%的省級醫保信息平台、中國郵政、上海證券交易所、南方基金等ToB客户。瑤池旗下的PolarDB提供了100%兼容MySQL/PostGreSQL的版本,並且提供高度兼容oracle的能力。
在產品上,瑤池將在2023年下半年發佈在PolarDB上智能的人機接口的產品的能力(NL2SQL技術),此前這一技術獲得了NL2SQL耶魯大學榜單全球第一名。

圖注:“雲原生數據庫的四化”

彩蛋:阿里雲瑤池數據庫三大產品Logo美學:
三個核心產品數據倉庫AnalyticDB、雲原生數據庫PolarDB、雲原生多模數據庫Lindorm,這是阿里雲瑤池數據庫的三個核心產品。
三個產品logo設計有一致性的地方,都是一個“D”,然後把D的左下角定為座標系的原點,以左下角座標系的原點開始
AnalyticDB的logo,以那個原點往右上看45度是斜着火箭發射的樣子,火箭的兩個小翅膀
同時讓它又是很巧妙的是“A”,火箭往下擴和往下收,又相當於它是MPP數據庫,它是傳統MPP數據庫做在線加速,同時它的底座又藴含着無限的能量和數據,暗示MPP數據庫離在線一體化、湖倉一體的邏輯,而且45度看就是“A”,所以是AnalyticDB的Logo。
PolarDB是比較容易理解的,原來起名的含義就是“極致”的,PolarDB的含義是極致的數據庫,我們要做世界第一、世界最極致的數據庫。然後又取了一個Polar bear,北極熊,所以它是熊頭,從左下角原點往上45度看是熊頭。
最後講Lindorm,中文叫做靈動,我們Logo從左下角的原點往上斜向45度看是海浪的樣子。海浪是從海里來的,意味藴含大量的數據,而且是多模態的數據,海洋生物多樣性是這個地球上最豐富的,遠超陸地世界,故Lindorm icon採用了活潑的波浪樣式。
另外還有一個小彩蛋,Lindorm的logo從右下往左上看是一個小恐龍頭,也就意味着lindorm希望它能夠像恐龍一樣強大,但是又是個小恐龍,非常靈活。
以上是這三個logo設計的含義。