PolarDB 再升級:歡迎來到雲數據庫 x AI新時代_風聞
产业家-产业互联网第一媒体1小时前

大模型時代,數據庫的變化走到了哪?
作者|思杭
編輯|皮爺
出品|產業家
“搭積木”、“‘自動駕駛’”、“三層解耦”,這些形象的標籤成了1月17日阿里雲開發者生態大會當天最出圈的詞彙。
會上,一名小學生受邀上台演示了數據庫查詢的場景。一種“全民編程”的氣氛向現場觀眾席捲而來。而讓個人開發者和企業用户都可以像“搭積木”一樣開發和管理數據庫,這也正是阿里雲在2024年甚至更長時間裏的新願景。

而AI,正是其中的關鍵武器。
從IBM小型機,到Oracle“統治”時代,再到以AWS、GCP等雲數據庫巨頭引領的新時代,全球數據庫行業交錯發展了40年之久。而在最近的十年時間裏,國產數據庫成為新的弄潮兒。
2023年底,一張亮眼的成績單新鮮出爐。阿里雲瑤池數據庫入選Gartner雲數據庫魔力象限,並連續4年蟬聯“領導者”地位。

而與之對應的一個事實是,在國內雲計算行業增速放緩的背景下,入選企業只有阿里雲一家。放眼國際,IBM、SAP等傳統商業數據庫廠商,均跌出“領導者”象限。
雲數據庫正是其中的主角。**實際上,在不少數據庫企業的眼中,雲數據庫都被視為一個國內數據庫行業換道超車的機會。**其中不僅包括公有云大勢所趨的推動,更重要的是雲數據庫所涉及到的底層創新,如存算分離和軟硬一體技術等等,也正在成為數據庫行業的新潮流。
2023年,據墨天輪統計,雲數據庫佔國內數據庫總數的20%。而早在2021年,中國信通院就做出相關預測。“80%的企業都認為雲數據庫是未來數據庫行業的發展方向。”
在大模型一路“狂飆”的今天,雲數據庫又來到了超車關口。
一、從傳統數據庫到雲數據庫的“新需求面”
在很長一段時間裏,業務高峯期間的流量指數級增長都是企業最怕遇到的問題,比如雙十一期間的淘寶和春運期間的12306等等。這已經成為一種行業共識。
而在流量爆表的另一面,業務也對數據庫,尤其是傳統數據庫提出了極高的要求,包括存儲、計算等一系列環節都成為不少企業難以解決的問題。
根據一組不完全數據統計,在過去幾年裏,有超過70%的新型企業都因海量數據的挑戰而對業務產生了影響。
天貓雙十一是最常見的例子。每年雙十一大促的,入駐天貓的商家都深知一個“爆款規則”,即提前幾周乃止一個月對企業自身數據庫計算能力和存儲量做臨時升配。
但儘管如此,在雙十一流量高峯期間,客户的數據庫還是會出現了問題。具體來看,由於傳統數據庫需要進行定期運維,而這種運維升級所需要的時間是6-8個小時。在此期間,不僅企業需要支付高昂的運維成本,更嚴重的情況則是由於資源衝突導致的升配失敗。
在零售之外,中國聯通這類的大型企業也在面臨同樣的問題。
與互聯網業務不同的是,互聯網業務交易量大,但速度快。而聯通業務的特點則是會遇到多種需求,業務鏈條極長。
比如看似十分簡單的選手機號的業務,一整條鏈條需要涉及到手機號碼選擇、套餐選擇、開網,以及實名校驗和反電信詐騙各種校驗。
這種業務複雜、鏈條冗長的場景,對聯通內部的IT系統是一個極大的考驗,其不論是運維還是維護,都需要保持業務無感知以及絕對的安全,否則一旦出現問題將影響每個用户的日常生活。在這些之外,更要注意成本。因此,同樣地,留給其內部數據庫管理的難度極大。
實際上,不論是電商企業,還是如中國聯通這樣的大型運營商,傳統數據庫高企的成本和業務對彈性的運維需求也恰在成為採用雲數據庫的最強推動力。因此,極低的運營成本和彈性存儲、計算便成為了對數據庫企業的剛性需求。
根據不完全統計,在面對業務高峯帶來的峯值時,雲數據庫的最大優勢便是可以為企業提供彈性擴縮容能力。在這種彈性場景下,雲原生數據庫PolarDB的成本僅為傳統商業數據庫的十分之一。
另外,在廠商的幫助下,雲原生數據庫可以做到開箱即用,服務商提供從安裝、部署到運維的全流程服務,基於雲端的運維和彈性存儲計算等進一步降低企業的運營和使用成本。
根據中國信通院報告顯示,2022年中國公有云數據庫市場規模為219.15億元,較2021年增速51.6%,而本地部署的增速為14.4%。
二、解耦、AI、積木:
從彈性運維到智能運維
而在這個確定性的趨勢之下,阿里雲又向前了一步。
1月17日,阿里雲PolarDB開發者大會上發佈了“三層分離”的新版本,基於智能決策實現查詢性能10倍提升、節省50%數據庫成本。
而這裏的“三層解耦/三層分離”則是阿里雲的特殊標籤。
此前,在過去40多年的數據庫行業發展中,一個極為普遍的情況是數據庫的計算與內存都是綁定在一起的,也就是俗稱的存算一體。其中部分數據庫可以做到計算和存儲資源進行解耦,不過沒有數據庫能做到計算和內存的解耦。
但對於數據庫而言,計算、內存和存儲資源全部綁定在一起,這種強耦合性會極大地限制數據庫的彈性能力,很難進行跨機遷移。
而放在現實生活中,最常見的例子是在淘寶雙十一流量高峯,如果計算和內存無法進行分離,最直接的影響一方面是企業的數據庫部署和運營成本十分高昂,另一方面則是對企業的計算資源造成極大的浪費。
這也是阿里雲“三層解耦”方案的價值之處。
這種強解耦不僅帶來的是運維和成本上的彈性,更在產品體驗層面被強化。“未來,個人開發者和企業用户可以像‘搭積木’一樣開發和管理數據庫。”阿里雲數據庫產品事業部負責人李飛飛表示。
實際上,所謂的“搭積木”,其核心邏輯在於,在統一源數據管理和保證多租户隔離的前提下,企業可以自主調用搭配阿里雲數據庫的產品組組件,包括計算單元、存儲引擎、向量引擎能力等等,滿足業務對數據庫的精準需求,而對阿里雲而言,則是真正從原子化的層面滿足企業自身需求。
從具體效果來看,“搭積木”的體現,一方面是剛剛提到的極致彈性,另一個則是強Severless能力。
對Severless化的一個通俗解釋是,其更像一種按需付費的交付方式,用户不需要擔心數據庫的存儲、計算等資源問題,也無需進行配置和維護、更新,可以大幅節省在服務上花費的時間和資源。
對企業而言,其只需要將重心放到本身的業務邏輯即可。
早在2017年,Serverless就在國內落地,也正是在這一年阿里雲推出Serverless平台。後來,隨着Serverless平台逐漸深化,“像搭積木一樣簡易”這樣的願景也開始一點點落地。
而在其中,AI是非常重要的價值工具。“在大模型時代,誰能夠讓整個端到端的流程更簡單、更易用,誰就會在市場上佔據先發優勢。”李飛飛表示。
更客觀來看,不論是彈性運維,還是Serverless,其本身都是對數據庫產品力和使用體驗的進一層深化,而如今在大模型的加持下,數據庫的產品力將更為強大。
除了已有的向量引擎等數據庫底層進化之外,李飛飛告訴我們,**在數據庫的智能運維方面,阿里雲通過AI大模型能力,可以對企業內部的業務數據進行智能監控,**再加上AI的智能分析能力,在一定程度上減少數據庫維護、更新等人工成本。
再比如在數據庫產品的服務層面,基於大模型可以對工單進行更為高效的管理,如今,這項能力已經在阿里雲數據庫團隊內部使用。
“數據庫和大模型結合的想象力很豐富,包括原有的BI,商業數據分析過等過去企業內部基於數據的動作,未來仍然會存在,但是會基於大模型的場景進行,這個想象力也是無窮的。”
三、2024,走到數據庫的關口
實際上,我們再來看這個命題:即大模型究竟能為數據庫做些什麼?
繼2023年,大模型“狂飆”了一年後,關於這樣的討論在持續發酵。甚至幾乎所有大廠都All in AI來做大模型。
但就目前而言,與大模型結合更多可落地的場景在於上層應用,如AI Agent,或者與SaaS工具層的結合。而對於底層的數據庫而言,大模型對數據庫行業造成的潛在影響則在於智能化。
從大模型與數據庫的本質進行分析,大模型需要依託海量的數據來訓練、學習,而數據庫的作用則是進行存儲、篩選和處理數據。
因此,兩者碰撞在一起的想象力,則可以通過可視化工具,來進行配合,比如通過大模型進行數據的收集、標籤管理、數據資產沉澱,再利用AI大模型能力進行數據智能分析,並以清晰可視化的方式,實現真正的數據和業務結合。
這也是目前企業裏較為常見的需求,即將數據庫與AI和BI相結合的方向。
而從這些視角來理解,其實不難看出對當下而言,數據庫行業正在堅定地發生一些變化。
首先,站在更大的行業視角,在雲數據庫成為新趨勢的背景下,雲數據庫成為了國產數據庫企業換道超車的新機會。而在此基礎上,像阿里雲所推出的“三層解耦”和“搭積木”理念,再加上AI加持的智能運維能力,也更是加速了雲數據庫替代傳統商業數據庫的趨勢。
在過去2023年,整個數據庫市場已經站上了數字路口的開始。從去年Gartner發佈的雲數據庫魔力象限就可以發現,IBM、SAP等傳統商業數據庫廠商,均跌出“領導者”象限。
而從過往的歷史趨勢來看,一直以來在數據庫行業具有“統治者”地位的Oracle也在雲計算時代由於戰略判斷失誤而失去了其原本的霸主地位。
而另一組根據信通院的統計則是,目前國內數據庫有接近300家公司,這裏麪包括OLTP、OLAP、NoSQL等類型,已經被大量應用在企業業務中。
李飛飛告訴我們,未來堅持傳統軟件思維模式的數據庫企業會越來越艱難。“堅持雲原生化、一體化、平台化和智能化,才是數據庫的下一個方向和未來。”
雲原生化意味着企業從購買資源向購買能力轉變,加速數據業務上雲。其中“三層解耦”和Serverless能力便是最好的體現。
平台化對應的是基於平台來提供一站式的能力和解決方案,比如通過提供標準的API接口體系來減少業務煙囱。
一體化則是聚焦客户的業務場景,通過多產品一體化的體驗,來簡化開發、管理和運維,避免數據搬遷。如處理分析一體化、離在線一體化、集中分佈一體化、多模處理一體化。
最後,智能化便是結合AI提升運維效率和查詢效率等等。而放在未來的大模型時代,智能化的想象力和應用力也將會越來越豐富。
不難看出,**2024年數據庫行業在AI的推動下,既定的雲端進化速度正在加速。**而伴隨着市場和企業對於雲數據庫需求的越發增加,中國數據庫廠商正在成為一股不可忽視的力量。
“核心還是持續為客户創造更大的價值,這是阿里雲數據庫和PolarDB產品的根本使命。”李飛飛説道。