科技雲報道:將技術普惠進行到底,百度智能云云原生數據庫GaiaDB來啦!_風聞
科技云报到-深度原创企业级IT内容行家6小时前
科技雲報道原創。
OpenAI再度扔出重磅炸彈。
近期,OpenAI公司在社交平台上宣佈,其收購了領先實時分析數據庫公司Rockset。
OpenAI強調,OpenAI將在其產品中整合Rockset技術,基於Rockset提供的數據索引和查詢功能,使公司能夠將其數據轉化為可操作的智能(Actionable Intelligence)。Rockset主打實時搜索和數據分析,是基於RocksDB,Rockset將RocksDB搬到雲上進行雲原生化,為用户提供了更加靈活、可擴展、低成本的數據庫解決方案,並且減輕了數據庫存儲引擎的開發時間。
如今,不管是AP還是TP領域,雲原生數據庫作為數據庫的全新範式,以高彈性、高穩定性、低成本、普惠化的特性,為全球數據庫行業提供了有價值的探索。

數據庫的全新範式
在雲計算出現前,關係型數據庫通常採用本地部署方式,其中,商業數據庫代表有Oracle、Microsoft SQL Server、IBM Db2,開源數據庫代表則是MySQL、PostgreSQL。那時,大多數企業都是自行採購硬件和租用IDC。除服務器外,機櫃、交換機、網絡配置和軟件安裝等底層很多事情都需要專業人士負責。
搭建底層系統方面,傳統數據庫架構依賴於高端硬件,每套數據庫系統可擴展的服務器少、架構相對簡單,且無法支持新業務的擴展需求。如果企業想要提升性能,主要靠採用配置更高、更先進的硬件。當然,這樣成本也會更昂貴。並且,它無法應對高併發讀寫。比如以Web 2.0為代表的網站,其數據庫負載非常高,本地部署的傳統關係型數據庫往往無法應對每秒上萬次的讀寫請求,硬盤I/O成為性能瓶頸。
除了擴展性差,傳統關係型數據庫還面臨一些挑戰,比如部署成本高,維護難度大;由於私有化部署,數據庫內核迭代升級比較緩慢。
2010年初,隨着企業上雲進程的加速,大量企業開始嘗試將傳統數據庫搬遷至雲端,傳統數據庫逐漸從私有部署轉化為雲上部署,但變化主要集中在部署模式自動化,運維能力的提升,並未充分利用雲計算的能力為數據庫技術本身賦能。近年來,雲基礎設施的迅猛發展也進一步帶動雲數據庫的應用,並且因其按需擴展和按需付費等卓越特性,受到了中小企業和互聯網客户的廣泛歡迎。
然而,雲數據庫並非專為雲場景或雲環境設計和構建的,沒有結合雲的彈性,規模擴展等能力做出特殊優化,它僅僅利用了雲的資源。雲數據庫的部署和管理方式與傳統的本地數據庫相似,其存在一些固有的問題,比如存儲空間浪費、計算資源浪費、數據恢復時間長以及數據延遲、系統性能受限、網絡帶寬消耗大、缺乏彈性擴展和自動化管理能力等,這些問題阻礙了業務的進一步發展。
例如遊戲行業中,業務存在明顯的流量峯谷,這種特性使得傳統的數據庫很難應對極致的彈性需求,從而帶來資源利用率不足、運維人力成本高等問題。又比如面對秒殺和雙十一等場景,傳統數據庫擴容後無法縮容,導致資源浪費。
這時,雲原生數據庫作為一種全新數據庫範式被提出來,其核心是設計一種更符合“資源彈性管理”理念的數據庫架構,充分利用雲平台的池化資源,適應雲平台的基礎設施。並且,經過多次迭代更新,雲原生數據庫的技術也普惠到了更多的場景和部署環境,包括私有云場景,為企業提供數據安全可控的解決方案。
目前,市場中的代表產品包括阿里雲PolarDB、百度智能雲的雲原生數據庫GaiaDB、騰訊雲TDSQL-C等,可以完美兼容傳統的使用習慣,對交易類場景可以提供低延時的事務處理能力。同時由於藉助了分佈式存儲池化能力,擴展性也得到了極大增強。
據Gartner預測,到2025年,基於雲原生平台的數字化業務比例將達到95%,這將帶來雲原生數據庫市場的快速增長。
市場上解決擴展性的問題除了先進的雲原生存算分離架構外,還有一個方向就是採用計算節點分佈式的方式實現,市場上的典型就是 OceanBase,TiDB 等。
雲原生數據庫——看上去很美****應用有門檻
據中國信通院調研,當前57.9%的企業會考慮使用雲原生數據庫並將其應用到主要業務系統中,另外42%的企業還處於觀望狀態。從應用行業角度,互聯網行業佔比55.4%,而金融、製造、消費行業平均佔比不超過10%。
一邊是被互聯網行業廣泛接受和採用,另一邊傳統企業依然顧慮重重裹足不前,什麼原因導致雲原生數據庫遭遇“冰火兩重天”?事實上,企業在數據庫技術選型過程中仍然面臨挑戰,比如數據庫能否靈活部署?技術是否足夠成熟?是否具備良好的兼容性和服務可持續性?這些問題不僅決定着雲原生數據庫的普及水平,很大程度上也影響着企業的業務穩定性與創新效率。
從市場上看,OceanBase、TiDB、TDSQL、PolarDB是企業選擇最多的數據庫產品。其中,以OceanBase、TiDB為代表的開源分佈式數據庫,雖然具備高度的部署靈活性,可在公有云、私有云進行隨意部署,但在某些高級特性和語法上與MySQL、SQL存在差異,這可能需要更多的適配工作,從而阻礙了企業線上業務的全面開展。
TDSQL、PolarDB具有良好的語法兼容性,能夠兼容絕大多數常用的MySQL語法,但其高度依賴底層專有高性能硬件,尤其是對內存和網絡帶寬有嚴格要求。如果硬件資源不足,數據庫性能會受到嚴重影響,甚至可能導致無法正常運行。同時,兩個產品不支持第三方IDC,這意味着如果用户想要使用TDSQL或PolarDB,就必須綁定使用騰訊雲和阿里雲提供的服務,這讓用户對於雲服務商的選擇性大打折扣。這使得企業沒有辦法自由地使用雲原生數據庫。
當企業在選擇一款擴展能力強的數據庫時,顧慮主要集中在部署和使用兩個環節。
首先,在數據庫部署方面,雲原生數據庫的存算分離架構將數據存儲和計算分離開來,使得存儲和計算資源可以獨立擴展和管理,雖然具備了良好的擴展性,但對軟硬件環境存在依賴,導致類似 PolarDB,TDSQL 必須綁定使用其雲服務。
其次,分佈式數據庫規避了部署的問題,但是在數據庫使用方面,架構上的限制,導致其語法和標準的 MySQL始終有一些差異,這讓企業擔心陷入被綁定或者需要付出修改應用的代價,也讓企業陷入兩難境地。
因此,技術成熟度最高、部署最靈活、系統穩定性最好是企業選擇一款數據庫的關鍵考量標準。
可以看到,無論是OceanBase、TiDB,還是TDSQL、PolarDB,雖然這些數據庫產品都是市場主流產品,但並沒有降低客户使用雲原生數據庫的門檻。那麼企業如果想保持兼容性的同時,又能靈活部署,還要穩定性好的雲原生數據庫還有其他選擇嗎?
GaiaDB的雲原生數據庫****普惠之路
圍繞選擇雲原生數據庫的三大關鍵標準,百度智能雲自研的雲原生數據庫GaiaDB應運而生。GaiaDB在設計之初就堅持的高可用、易部署、易使用的技術路線,其背後所展現出的技術普惠思想,讓企業得以在通用服務器上部署並使用高性能的數據庫服務,將技術創新的“果實”惠及千行百業,使企業能夠真正享受到雲原生數據庫的價值。
從整體技術看,百度智能雲GaiaDB採用存算分離的雲原生架構,實現按需、極致彈性擴展能力,線上最大實例超過500TB,整體規模達到數十PB。目前已實現泛互聯網、金融、人工智能、遊戲、交通等全行業覆蓋,不僅兼容開源生態,還在保持與單機一樣的兼容性的情況下,實現了更加靈活的彈性、企業級高可用和高性價比,為用户帶來新的雲原生數據庫體驗。
此外,百度智能雲GaiaDB相比其他同類型雲原生數據庫,有兩個最鮮明的優勢。
第一,數據庫的易於部署是實現普惠目標的關鍵環節。不同於很多雲原生數據庫需要依賴底層高性能的硬件,GaiaDB基於通用硬件設計實現,不依賴於任何特殊硬件和基礎設施,讓用户可以實現雲上雲下一套架構,這樣的方式使GaiaDB具有較強的通用性和良好的經濟性。
對於大多數企業和開發者而言,簡單、快捷的部署流程能夠極大地降低技術採納的門檻。很多企業出於安全合規要求或多雲容災要求,需要將數據庫部署在自建IDC或跨雲部署,這需要數據庫產品提供更加靈活的跨平台部署能力。
對此,GaiaDB雲上雲下采用一套技術架構,不僅大幅降低了數據庫的部署門檻,同時也降低了搭建成本。值得一提的是,GaiaDB是全球唯一能支持多雲的雲原生數據庫,基於通用硬件實現了高性能硬件同樣的效果和更好的可用性。
第二,易用性方面,GaiaDB為了方便開發人員進行調試,還開發了可以運行在筆記本上的GaiaDB Lite,這樣開發人員就可以把數據庫下載到自己的Mac筆記本上調試,非常方便開發人員使用。
作為一款100%兼容MySQL的雲原生數據庫產品,百度智能雲GaiaDB良好的兼容性讓用户可以保留已有的使用習慣和相關技術棧,就能夠輕鬆地管理和使用數據庫。同時,技術棧兼容可以讓開發者和業務可以快速遷移到雲原生數據庫,既能保障100%的兼容性,又能兼容擴展能力,這使得業務的遷移更加絲滑,用户原有的技術體系和人才儲備得以延續使用,全面降低了雲原生數據庫的遷移成本和學習成本。
在運維方面,GaiaDB引入了智能化的運維和管理功能,進一步降低了數據庫的運維難度和成本。通過內置的監控、診斷和優化工具,用户可以實時瞭解數據庫的運行狀態、性能瓶頸和潛在問題,並及時進行優化和調整,極大提升了數據庫的運維效率。此外,GaiaDB還支持自動備份、恢復和容災等功能,確保數據的安全性和可用性。
為進一步降低數據庫運維門檻,GaiaDB正在與大模型的能力結合,為用户提供智能的運維輔助能力,幫助數據庫運維工程師高效獲取數據庫知識,並做出快速準確的運維決策。
在做足充分技術準備的同時,百度智能雲GaiaDB還在雲上提供免費版本,為高校學生、個人開發者、初創企業等初階羣體提供雲原生數據庫完整功能,實現雲原生數據庫技術的廣泛應用與普及,進一步推動雲原生數據庫在更大範圍的普惠。
今年,百度智能雲GaiaDB還將發佈5.0版本,重點方面會瞄着更普惠、更智能、更強大三個方向進行演進。GaiaDB 5.0將支持單主集羣、Serverless,這幾個關鍵能力都是分別滿足不同場景低門檻的訴求,讓用户使用GaiaDB更輕鬆和容易。同時,GaiaDB將在支持Copilot的基礎上從開發、運維、使用多個角度利用大模型的能力進行增強,包括NL2SQL、智能運維、智能問數的能力。
百度智能雲GaiaDB通過基於雲計算的特性,為用户提供了有別於分佈式數據庫的全新使用體驗,在降低數據庫TCO的同時,提供極高的擴展性,同時又規避了分佈式數據庫帶來的兼容性問題,這使得雲原生數據庫成為繼雲託管數據庫之後備受市場關注的數據庫方案。
技術創新永無止境。從傳統關係型數據庫、雲數據庫,再到雲原生數據庫,數據庫技術不斷變革。我們相信,以百度智能雲GaiaDB為代表的雲原生數據庫作為支撐企業業務的關鍵IT基礎設施,在技術普惠的驅動下,更多企業將受益於這項技術所帶來的便利,更好地滿足業務發展需要,通過激發數字生產力,為描繪數字未來藍圖貢獻力量。
【關於科技雲報道】
專注於原創的企業級內容行家——科技雲報道。成立於2015年,是前沿企業級IT領域Top10媒體。獲工信部權威認可,可信雲、數博會、國家網安周與全球雲計算等大型活動的官方指定傳播媒體之一。深入原創報道雲計算、人工智能、大模型、網絡安全、大數據、區塊鏈等企業級科技領域。