湖倉一體火了,千萬企業搭建“數據房子”新思路_風聞
Tech星球-Tech星球官方账号-聚焦互联网前沿科技和新商业。2022-07-16 12:15
來源 | Tech星球
文 | 賈寧宇
如果説目前投資領域正火的賽道,“數據智能”一定能算香餑餑。
2021年8月,超級獨角獸Databricks 獲得16億美元H輪融資,估值高達380億美元,4年估值翻百倍。另一家企業Snowflake,2020年上市首日市值超700億美元,成為迄今為止規模最大的軟件IPO,創造了美股中的投資回報神話。
回看國內市場,數據智能也正在成為資本熱衷賽道。譬如,數據智能服務商滴普科技,曾經一年之內融資4次,前不久又獲得1.1億B+輪融資,僅成立四年便已成長為新一代湖倉一體數據智能基礎軟件領域獨角獸。
此類企業主要鑽研的是數據智能賽道的核心產品,即以湖倉一體為架構的分析型數據庫。數據顯示,2021 年中國分析型數據庫的市場規模為 249.9 億元,預計 2024 年,中國分析型數據庫市場規模將達到 521.4 億元。
“如何讓數據驅動業務,讓數據的價值真正釋放,我認為應該從根本上先解決底層基礎軟件系統問題,再去考慮上層數據應用。”滴普科技聯合創始人、FastData產品線總裁楊磊告訴Tech星球,當全球進入數據大爆炸時代,企業比拼的真正內力是大數據帶來的最終價值。
市場再升温,“湖倉一體”為何火了?
回顧以往,國內外企業最早採用的數據存儲處理方案,基本是Oracle、IBM為企業搭建的 “數據倉庫”,它接納的是報表、SQL等結構化數據,並不適宜半 / 非結構化數據的處理。甚至一些大型企業邀請IBM來做整體商業諮詢,搭配整套本地化軟件體系,建立規範的數據倉庫。在2002年,還誕生了Hadoop技術,滿足了企業基本的數據存儲分析等需求。
但隨着企業業務的發展,對存儲任何形式(包括結構化和非結構化)和任何格式(包括文本、音頻、視頻和圖像)的數據基礎設施,以及實時性提出更高要求。由此,Databricks於 2016 年推出 Delta Lake,這一派不再為企業搭建“數據倉”,走的是“數據湖”路線,雖然滿足了企業結構化和非結構化數據存儲的需求,但它們不支持事務處理,不保證數據質量,並且缺乏一致性/隔離性。而Snowflake的迅速竄紅,其基於雲的數據存儲和分析服務,又提供了一種新的方式與思路。
因此,行業就出現一種呼聲:有沒有一種技術方案,解決數據倉和數據湖的缺點、再融合二者優點?在2020年,行業發展到了一個節點,終於出現了一套更優秀的方案。
這一年Datebricks首提Lakehouse,也就是“湖倉一體”概念。“湖倉一體”並不是簡單的湖+倉的技術整合,而是一種融合了數據湖和數據倉庫優勢、更開放的新型架構。有人把它做了一個比喻,就類似於在湖邊搭建了很多小房子,有的負責數據分析,有的運轉機器學習,有的來檢索音視頻等,至於那些數據源流,都可以從數據湖裏輕鬆獲取。
因為融合了數據湖和數倉的優勢,以及面向AI時代的新型架構等優勢,Gartner在2021年度數據管理領域報告中宣佈,“湖倉一體”首次進入成熟度模型。至此,“湖倉一體”引發了更大關注度。
在楊磊看來,“湖倉一體”火了的深層次原因,主要是現在數據的體量已經足夠大,大規模數據統一實時處理的需求愈加被重視。另一個促成湖倉一體發展的,是 AI 機器學習的大規模普及,各行各業都急需用機器學習算法支撐數據的管理與創新。
百舸爭流,創新者競賽雲時代
換而言之,湖倉一體架構的形成,是一場市場供需倒逼而來。但Databricks等企業沒有深入拓展國內市場,國內上千萬家企業又面臨着數字化升級的挑戰,國內數據智能服務的廠商就顯得至關重要。Tech星球經過調研,發現國內主要有兩類玩家。
數據智能市場國內外代表廠商
第一類是國內諸如滴普科技等創新廠商,他們在技術架構上很多采用了全新一代的設計,包括了湖倉一體、流批一體、雲原生等,並且對存儲計算引擎做了大量優化,能夠以低成本、高性能滿足企業的多種分析需求。
“我們認為湖倉一體的解決方案,不是單純的底層的技術能力,更多的是在於滿足客户的最終業務價值,把整個數據底層,以及數據的中間的調度和處理層,以及上面的一些數據分析服務層,能夠提供給客户一條龍的服務,也是比較符合中國市場的一個定位。”
楊磊提到,為了將湖倉一體這些技術解決方案更好地落地,滴普科技還在數據基礎平台之上,與行業專家合作,更好地把為客户建設的數據平台使用起來,體現出客户具體業務的剛需價值,更追求效果服務。
而國內提供數據升級的第二類玩家,是大廠基於公有云業務推出的“湖倉一體”解決方案,如華為雲的FusionInsight、火山引擎的LAS、阿里雲的MaxCompute等。
從IaaS資源層到數據層、應用層提供完整的解決方案,是這類玩家的優勢。當然,很多客户並不希望數據服務和公有云服務過渡捆綁,這樣會導致過於依賴某一平台。
楊磊告訴Tech星球,滴普等新鋭玩家與公有云平台也是合作關係,他們的產品FastData也可以部署在這些主流公有云平台上,客户可以選擇雲平台的數據服務,也可以採用獨立第三方服務。
而且滴普的湖倉平台其實包含幾部分,比如“流批一體”數據分析處理引擎DLink、數據智能開發平台 DataFacts,用於企業數據科學分析、可視化建模、機器學習等的數據科學分析平台 DataSense。
FastData實時湖倉平台架構
不可否認的是,更敏捷的雲化部署,也是當下的市場趨勢。
去年12月,滴普科技董事長兼CEO趙傑輝曾在滴普內部一場關於戰略審視的會上表示,“戰略的核心不僅在戰(做什麼),更重要的是略(不做什麼)。”在這場會議中,滴普明確了Cloud First戰略,並把國際化、生態化視為公司下一步提升的重點。這實際上是讓滴普科技等企業,與雲平台巨頭站在了同一競爭環境中。
據悉,在滴普科技內部,已經在逐步升級客户服務模式,通過雲服務方式為多個行業提供服務。滴普原來的DIC(DataInnovation Center)服務團隊,如今已經升級為新DIC(Data Intelligence Cloud)團隊,幫助客户快速雲化部署服務。
不以數字化“忽悠”,為客户提升商業價值
在大多數企業數字化升級,尤其是大中型企業升級過程中,商業化價值都已經成為核心考核指標。
以往,企業在數字化轉型中注重對營銷應用端的改造,隨着數字化轉型的深入,越來越多企業意識到,優化底層技術應用對提升自身經營效率、以及支持業務科學決策起到的重要作用。企業更追求如何搭建“數據房子”,帶來真正增長價值。
藉助滴普科技的FastData 進行數字升級的百麗國際集團,便是如此。
兩年前,百麗國際科技中心開始與滴普科技合作,在原有基礎上,持續完善數據字典項目,歷時16個多月的時間,梳理了近600個維度、1300+個指標,最終達到了數據邏輯的統一性,完成了數據標準化建設。
楊磊介紹,在與百麗合作過程中,滴普基於實時湖倉平台FastData的核心能力,雙方在短短幾個月時間裏,完成了現有多個數倉的統一,通過湖倉一體實時架構,實現門店級到區域級到集團級實時數據分析能力,把之前T+X的分析時間縮短為T+0實時分析。
比如,現在百麗的門店店長在早晨上班時,就能看到昨天下班後全天的經營數據分析,而在過去,這個週期可能需要兩到三天。
並且將原來只針對企業CEO服務的數據分析平台,變為各種數據智能應用,下沉到一線員工的使用場景。雙方共建的標籤工廠、店長AI助手應用等產品服務,就能提供實時數據反饋基礎,更好地支撐和反哺業務管理層的工作開展。
百麗的數字化建設在行業具有標杆性意義,因為百麗不僅自身重視數字化,集團共有上千人的技術團隊,是數字化典型企業,同時也是滴普科技深度合作的夥伴。
不止百麗,如今,數字化變革已經深入千行百業,越來越多的企業開始選擇與專業的技術創新廠商合作,通過共同搭建數據智能平台,提升企業的生產經營效率,進一步實現體驗創新、管理創新和模式創新。
隨着數字化轉型的深入,意味着數據智能已步入最好的時代。根據中國信息通信研究院發佈的《中國數字經濟發展報告(2022年)》,2021年中國數字經濟規模達到45.5萬億元,同比名義增長16.2%,佔GDP比重達到39.8%。
當然,從湖倉一體的趨勢,以及滴普科技的發展歷程證明,“數據房子”打好地基很重要,更關鍵的是最終打造出的“房子”能夠提升經營效果,最終提升商業價值。