中國多主數據庫:壓強投入,期待破繭_風聞
大数据在线-11-05 17:42
拿破崙曾説:“戰爭的藝術就是在某一點上集中最大優勢兵力”,強調了力量集中的重要性。
如今,國際形勢風雲變幻,西方世界對中國的圍剿不再僅僅體現在軍事和地緣政治上,而更多表現在經濟與科技上。在科技領域,我們不得不再面臨一次從根技術、硬件到軟件的全面突圍戰爭;而無數戰略家總結的“集中力量突破一處”策略,仍是值得中國科技界借鑑的獲勝密碼。
中國數據庫產業突圍之戰
中國大地人傑地靈,自古以來,在一個領域發展早期,我國一定會出現百家爭鳴、百花齊放的場面。近10年來,中國數據庫產業迎來了黃金時代,從互聯網掀起的“去IOE”浪潮又開闢了新的架構賽道,使數百家數據庫企業噴湧而出;作為IT系統中最核心的軟件之一,相關行業標準的出台也為中國數據庫發展帶來重大利好。
然而,正如不是每一次創新都能帶來產業革命,當前繁榮發展的背後也隱藏着隱憂;隨着經濟下行週期的到來,中國數據庫需要儘快在業務落地上找到突破口。
金融業數據庫使用情況一直是數據庫產業發展的風向標。1998年,IBM DB2、Informix在金融核心系統落地商用,奠定了此後20年大小機在核心繫統的格局;如今,金融業成為大小機下移的急先鋒。隨着近年來數據庫國產化工作推進,中國數據庫在金融業IT系統規模增速喜人,但質量仍存在隱患。
據金融信息化研究所2022年編撰的《金融業數據庫供應鏈安全發展報告》顯示,當前銀行業辦公系統與一般系統中國數據庫使用比例已突破50%,但在核心繫統使用比例仍在15%左右;而在證券和保險業,非核心繫統中國數據庫使用比例均低於30%,核心系統低於20%。
需知核心系統與非核心繫統數據庫採購價格有倍數差異,無法突破核心系統可能使許多數據庫廠商難以形成商業正循環,最終影響到其業務連續性;而金融行業對中國數據庫的投資佔整體的46%,如果在金融業內數據庫廠商無法商業正向閉環,在其它行業“找補”將更加艱難。
中國數據庫市場內卷也是構成危機的主要因素。據信通院2022年編撰的《數據庫發展研究報告》統計,中國數據庫廠商數量佔全球總量的32%,是除美國外全球第二大數據庫廠商發源地;但中國數據庫市場規模只佔全球的5.2%。“僧多粥少”的局面加上廠商間核心技術“大同小異”的特點,導致在競標中各中國數據庫難免陷入低價競爭,進一步加深商業難以正向閉環的惡性循環。
近年來不時傳出中國數據庫廠商因項目虧損導致不得不對客户“停服”的不良事件,一方面損害了行業對中國數據庫的信任度,另一方面也打擊了資本市場對產業向好發展的信心。
總體來講,當前中國數據庫雖有強勢發展勁頭,但從關鍵行業應用情況及市場發展趨勢來看,仍面臨產業突圍的關鍵戰鬥。
多主數據庫或是突圍關鍵缺口
事實上,中國數據庫並非沒有出海的野心。OceanBase曾在菲律賓第一大電子錢包GCash有過成功案例。但在非互聯網行業的交易型數據庫領域,在“自家園子”尚未成功戰勝Oracle、DB2等廠商的中國數據庫,尚無信心面對出海後更加腥風血雨的競爭。萬丈高樓平地起,中國數據庫產業突圍的方向仍是不斷提升自身實力。
然而,提升自己同樣需要找到方向。西方數據庫系統廠商起步遠遠早於國內,在引擎、管理系統乃至算法等方向均有深厚技術積累;雖然MySQL和PostgreSQL的開源化幫助其它廠商拉近了技術代差,但實際產品水平仍有不小差距。更難拉近的是使用經驗上的鴻溝,因為軟件的催熟往往是靠着大量用户反饋來完成的,而缺少使用體驗與反饋的中國數據庫必然會有更多的Bug和更少的功能,使最終用户的使用體驗差距更大。
總體來説,數據庫產業是一個優勢積累型的市場,一味追趕永遠無法實現領先,唯有通過革命性創新開闢新賽道,才有機會改變格局。如今,這一革命性創新似乎已經顯現,這就是多主數據庫。
什麼是多主數據庫?簡單來説,就是集羣中所有節點可以同時讀寫數據。傳統基於數據分片實現節點同時讀寫的數據庫,在某一時刻能夠讀寫某一個分片的節點仍只有一個,其本質仍是“一主多備”的架構;而多主數據庫中,任何數據分片都能在任何時刻被所有節點併發讀寫。這樣做的顯著好處是線性提升了數據庫的併發度,使數據庫性能可以沒有瓶頸的橫向擴展;而分片型數據庫的性能嚴重依賴分片策略,如果某個分片訪問頻度過高則將導致性能瓶頸。
此外,多主數據庫還有穩定時延、節省資源、提升運維效率等優勢。早在上個世紀80年代,數據庫產業就興起了對多主數據庫的研究,但至今穩定商用案例仍只有Oracle RAC,這也支撐它成為關係型數據庫的絕對王者。當前多主數據庫賽道還有大量空間,一旦取得突破,數據庫產業格局仍有顛覆的可能性。
筆者認為多主數據庫是中國數據庫的一個關鍵突破口。對於多主數據庫來説,單機能力與集羣規模是其一體兩面,二者可以相互彌補,這給予中國數據庫以規模換性能的重要機會。
從過去二十年發展看,中國數據庫產業發展大方向就是集羣化。由於數據庫單機性能瓶頸,加上國內互聯網市場高度發達帶來高併發訴求凸顯,中國數據庫大都往不斷擴大集羣規模的方向發展,也因此在集羣數據管理上積累了豐富經驗。
然而,不改變主從數據庫的本質,集羣規模擴大反而會導致事務處理時延增加,無法真正提升交易性能;而多主數據庫可以在提升併發度的同時不影響事務效率,進而真正激發出集羣威力。
近年來的產業動態也證明了這一點。早在2022年3月,阿里雲就發佈了其基於存算分離的多主架構PolarDB方案;2023年3月,華為宣佈其基於存算分離和自研Cantian引擎,可幫助主備數據庫升級多主架構,並於同年9月將Cantian引擎正式開源;9月的DTCC數據庫技術大會上,優炫軟件正式發佈其基於共享存儲的數據庫多讀多寫方案,萬里數據庫也解讀了其通過Cantian引擎實現GreatDB多主架構的最新進展;10月,金融數據庫技術大會上,金融信息化研究所攜10家中國數據庫產業鏈領軍企業,共同啓動金融多主數據庫應用推進計劃。可以説,中國數據庫產業已經全面瞄準多主架構這一關鍵缺口,開啓了一場轟轟烈烈的突圍戰爭了。
突圍關鍵:集中力量於一個缺口
雖然方向明確,但突破多主數據庫依然困難重重。多主數據庫完全實現穩定商用乃至國際領先,還有許多技術難題需要攻克。
比如,多主數據庫節點間如何高效的交換緩存數據,這是事務的隔離性能否保障的關鍵;再比如,當集羣規模擴大後,多主集羣內如何高效管理,節點故障如何防止腦裂;還有多主集羣使用的共享存儲能否應對整個集羣的高併發訪問,能否承擔一些近數據計算工作以緩解計算集羣壓力等等。每一個問題放眼全球數據庫產業都沒有“標準答案“可以借鑑,我們需要“摸着石頭過河”。
事實上,“摸着石頭過河”對中國科技界不是新鮮事,我們在很多科技領域都已探索至無人區,依然能夠實現突破性創新。但以當前中國數據庫產業陣型來看,在多主數據庫之路迅速取得突破恐怕難言輕易。由於數據庫產品具有極強的商業屬性,難以像其它尖端技術領域由國家牽頭研發,導致中國數據庫從業人數眾多,但力量分散,任何一個廠商都難以獨自攻克多主數據庫難題。
據信通院統計,中國43%的數據庫企業人數小於50人,只有前9%的企業擁有50-200人的核心研發團隊;而交換機、存儲等多主數據庫必須的硬件基礎設施產業,也尚未與數據庫產業實現廣泛的研發合作。與之對比,數據庫行業巨頭Oracle常年保持上千人的核心研發團隊,且自身擁有強大的存儲研發能力,其ASM本身就是一個能力超強的存儲軟件,才能打造出業界經典的多主數據庫Oracle RAC。
借鑑先進經驗,當務之急是中國數據庫產業如何擰成一股繩,共同朝着既定目標分工合作攻克難關,而不再是各自為戰、無效內卷,筆者認為,此事非政策性機構牽頭不能完成。
令人振奮的消息很快傳來了。10月13日,在2023金融業數據庫技術大會-數據庫技術創新發展分論壇中,金融信息化研究所攜10家數據庫產業鏈的領軍企業,共同啓動金融多主數據庫應用行動計劃。
據筆者瞭解,金融信息化研究所主要承接人民銀行金融科技研究課題,長期耕耘於中國金融科技研究諮詢與產業孵化工作,與中國人民銀行下屬的中國金融電子化集團有緊密聯繫;而由金融信息化研究所主辦的金融業數據庫技術大會歷年均有人行、銀監會、國有大行和股份制大行等高層領導與會,在業內影響力巨大。一言以蔽之,金融信息化研究所完全有能力對多主數據庫的產業發展進行統籌推進,此次應用行動計劃具有極強的落地性。
參與行動的首批企業也頗有意思。有阿里、奧星貝斯、達夢、南大通用四大行業巨頭壓陣,天翼雲、萬里數據庫、優炫數據庫等近年來在多主數據庫取得商用突破的新興廠商也加入其中,雲和恩墨的出現則意味着openGauss生態同樣有意邁向多主架構。
更為讓人眼前一亮的,是此次代表華為出席的,是國產高端存儲領軍企業華為存儲,這意味着此次合作不再僅僅是數據庫界的大聯歡,而是整個IT產業界的歷史性握手。首批企業組成呈現生態多樣化、路線多樣化、產業結構多樣化的特點,而金融信息化研究所則可驅動金融行業提供廣泛的產品應用與催熟場景。期待在行動計劃工作組的統籌下,各與會組織可以合理分工、充分合作,共同加速中國多主數據庫穩定落地商用。
無數勝利的經驗告訴我們,發現缺口、集中力量突破,是打贏局部戰爭、進而取得全面戰爭勝利的關鍵。如今,在政策機構的統籌牽引下,中國數據庫產業正積聚力量向多主數據庫發起衝擊。在空前的壓強投入下,期待中國數據庫破繭化蝶的一天。