產品、生態、邊界,袋鼠雲陳吉平:讓數據產生價值_風聞
产业家-产业互联网第一媒体2022-09-26 18:42

重產品,有邊界,強賦能,在袋鼠雲身上,一個在中國產業土壤中成長起來的TO B獨角獸形象正在愈發清晰。
作者|三七
出品|產業家
在中國,大數據正在從萌芽邁向成熟。
根據數據顯示,在過去的幾年時間裏,我國大數據市場規模從2019年的619.7億元增長到2021年的863.1億元,複合年增長率達到18.0%,發展勢頭強勁。
從2015年入局至今,袋鼠雲在去年成功獲得第四輪融資,成為業內極少數處在C輪的企業中的一員。
在大數據蓬勃發展的如今,這個能拿到C輪融資的企業的獨特之處到底在哪?以及於中國的數據智能賽道上,袋鼠雲的定位究竟是什麼?
電話另一邊,陳吉平向我們娓娓講來。作為袋鼠雲的掌舵人,在過去的幾年時間裏,他代表的不僅是袋鼠雲這一個企業的生長髮展,也更是整個中國數據產業的求索和探知。
一、從“數據倉庫”走向“大數據”
永遠快人一步的決策前瞻性——這是在採訪中,陳吉平和袋鼠雲給我們的最直觀感受。
早先,陳吉平就職阿里,花名拖雷,是淘寶第一代數據倉庫建設者。據他回憶,在2004年到2010年間,不止阿里,中國整個業界都還沒出現大數據的概念,當時市面上廠商做的叫數據庫(TP)或數據倉庫(AP)。
隨着移動互聯網時代的到來,產業市場的數據量呈現迅猛增長的態勢。對於數據倉庫而言,其僅僅可以作為結構化數據存儲的一種方式,而伴隨着企業數字化進程的推進,在結構化數據之外,企業更產生了大量的半結構化、非結構化數據,其數量更為龐雜且無序,但其同樣具備數據價值。大數據技術應運而生。
“雖然都是處理數據,但數據倉庫和大數據處理還是不一樣的。”陳吉平告訴我們, “直到13年,業界出現大數據概念,我才開始在阿里做大數據。不過 那時候,大家對大數據只不過存在一些概念,留下了一個影子。”
2014年,陳吉平參與了阿里巴巴第一代大數據平台的規劃與建設,擔任阿里集團數據治理、數據規劃、數據安全負責人,打造了集團的統一數據標準與數據安全體系。
從原本的IOE架構,到數據中台架構,數據層面產生了天壤的差別,在數據處理量、數據種類、數據預判上都有着不同程度的升級,相當於從“水庫撈蝌蚪”轉向“大海捕魚”。
首先,數據量以TB、PB為基本處理單位,在數據量上爆炸式飆升。
其次,在數據類型上,種類繁雜,包含結構化、半結構化及非結構化數據等多種類型。
另外,還需要依據現有數據來預判其餘數據出現的可能性,並將收集到的數據作為資源來輔助解決其他領域所遇到的問題。
2015年,陳吉平有了一個堅定的念頭。即經過在數據行業的多年摸爬滾打,他認為,雲計算解放了生產力,而大數據作為其中的生產要素也即將能被同步釋放。
想法之後,動作迅速跟進 。陳吉平的選擇是離開阿里,正式創辦袋鼠雲。
根據不完全統計,2015年全年產生的數據量等於歷史上所有人類產生的數據量的總和。此後,全球大數據儲存量的增速保持在40%左右,到2016年甚至達到了87.21%的增長率。
這場“數據風暴”一直持續到現在。根據相關機構統計,未來幾年中,數據將仍會保持着40%左右的增長率持續增長。
因此,海量數據的處理成為全球共同的挑戰。
但困難也意味着機遇,對陳吉平而言,袋鼠雲的成立也恰代表着:他已經準備好了。
“袋鼠和大數據的前兩個字諧音,比較好記。而且袋鼠是陸地上跳得最高、最遠的動物,它只會前進不會後退。”陳吉平笑談,袋鼠雲的名字就這樣定下了。
二、“全鏈路數字化”,新數據路線背後
實際上,陳吉平需要面臨的挑戰要更大。
即相比海外更加先進的數據處理技術,我國龐大數據量所帶來的壓力更大,此外,在數據收集、整理之外,釋放海量數據的實際價值,也更是眾多企業亟需解決的難題。
IDC發佈的統計數據顯示,美國的數據產生量佔比約為21%,歐洲、中東、非洲(EMEA)的數據產生量佔比約為30%,日本和亞太數據產生量佔比約為18%,全球其他地區數據產生量佔比約為8%。而中國,數據產生量約佔全球數據產生量的23%。此外,我國由於底層架構的不統一,由此產生的數據也多種多樣,數據呈現難度極大。
對於這些,陳吉平和袋鼠雲選中的方法是——產品。
1、打通數據孤島
在傳統IT架構中,由於各系統從後段到前端均為相互獨立的個體,極易出現整體系統架構過於龐大,運行時耗費大量人力物力。
同時,企業為了快速實現業務需求所採取的煙囱式開發模式也導致不同業務線數據完全割裂,造成大量數據指標重複開發、浪費儲存和計算資源的情況。
解決這一問題的關鍵在於增強數據傳遞及匯聚能力。陳吉平結合多年經驗發現,對數據工程師來説,一個好的平台賦能是很重要的。平台不過關,當在數據量大時,開發效率便會很低。
發現這一痛點後,袋鼠雲推出了第一款產品——數棧DTinsight。
聚焦於打通數據鏈路,賦能企業將全域資產匯聚,統一數據治理的能力。在此前數據庫、大數據處理經驗的沉澱下,這款產品在技術能力、響應能力、兼容能力及安全保障能力上都體現出先天優勢。
但很快,又隨即出現了第二個痛點。
2、數據的可視化呈現方式
“擁有數據後,如何讓數據更快更好的呈現這件事,在我國擁有很大需求。”陳吉平拿石油舉例,“對於石油來説,你能夠看得見實物,可以把這個實物的價值最大化,提煉成汽油、柴油、煤油,這些都是看得見摸得着的。但數據是縹緲的,你需要讓用户去直觀地感受到數據、用明顯的方式看到數據,實時地監測數據。”
袋鼠雲把用户的這項需求沉澱為第二個產品,易知微EasyV。
能夠基於數字孿生技術,對場景訴求、數據探索指標、故事線及交互整理,策劃出可視化設計,實現可視化組件開發、模型調試、動效開發等呈現,為用户提供低代碼數字孿生可視化平台。
終於,在深耕行業7年後,袋鼠雲着手佈局基礎架構及智能分析,着手化解第三大痛點。
3、延伸產品能力鏈路
對於數據倉庫而言,其僅僅可以作為結構化數據存儲的一種方式,而伴隨着企業數字化進程的推進,在結構化數據之外,企業更產生了大量的非結構化數據,其數量更為龐雜且無序,但其同樣具備數據價值。
湖倉一體是一種結合了數據湖和數據倉庫優勢的新範式,是同時處理結構化和非結構化數據的底層數據架構,在用於數據湖的低成本存儲上,可以實現與數據倉庫中類似的數據結構和數據管理功能。
這不是一件容易的事。首先從技術上來看,儘管國外已經有相關的如DataBricks等企業跑出來,但在國內,湖倉一體仍然沒有大規模落地,產品層面的研發尚且有難度,比如對於流批一體的支持,再比如數據共用和跨庫分析的能力等等。
這一次,袋鼠雲又走在了前面。
2022年,袋鼠雲從“數字化基礎設施供應商”升級為“全鏈路數字化技術與服務提供商”,並推出數駒DTengine、數雁EasyDigit兩款產品,搭建起全鏈路產品線。

數駒DTengine,是袋鼠雲研發的極速湖倉引擎,包含大數據基礎平台EasyMR,以及高效計算和管理的數據湖平台DataLake。基於數駒的數據存儲管理能力,可以同時支持上層計算引擎批和流的計算能力,幫助企業構建流批一體的數倉平台,實現一套架構同時滿足流批業務操作,降低學習、使用、維護成本,提高開發效率。從而讓企業產生的所有數據,都能夠被採集、被存儲、被計算,賦予數據全新價值。
除了夯實底層基礎平台外,袋鼠雲在應用層也拓展了相應能力。 數雁EasyDigit,是一站式數據智能分析與洞察平台,包含指標管理分析EasyIndex、客户數據洞察DataTag兩個產品。能夠實現標籤和指標的全場景、全流程開發和管理,構建出以業務價值為導向的數據分析與應用體系,從而幫助客户實現營銷效率最大化。
“產品和服務是相輔相成的,服務需要依託在能為用户提供相應解決方案和服務能力上。”陳吉平認為,最大的目的是讓數據產生價值,用基礎架構讓用户建立起從0~1的數字化能力,用共創的形式進行連接,賦能出能力。
憑藉全鏈路賦能的產品模式,如今袋鼠雲已賦能5000多家不同行業的燈塔用户成功進行了數字化轉型,並且連續多年被Gartner評為數據中台標杆供應商。
大數據這條路,陳吉平和袋鼠雲已然打起頭鋒。
三、用生態做加法、定邊界
“授人以魚不如授人以漁。”在過往二十年間,我國經歷了PC時代到移動互聯網時代變革的陣痛。而今,已經走入下一個時代的風口。
根據國際機構Gartner最新公佈的報告顯示,“數字經濟”2021年在我國經濟佔比中已達到40%,除互聯網等傳統數字經濟領域外,金融、零售、高端製造等領域等中國企業數字化轉型整體成熟度正在不斷提升。
這也印證,“數字化轉型”在中國經濟發展中“已成為主流基調”,對提升經濟發展質量和可持續性“有重要的正向作用”。
信息化、數字化、智能自動化這“三化”中,擁有層層遞進的關係。 可以説,只有在信息化完成後才會有數字化,有了數字化才能產生智能化。數字化,是我國發展到全面智能路徑中的不可迴避之隅。
在產品之外,陳吉平的第二個選項是生態。
“生態是我們一直有專門團隊去進行培育的。服務不代表要去替客户把所有活幹完,提供‘保姆式服務’。而是要去做‘管家’,提供核心、關鍵的規劃、戰略,從而提升客户自身的數字化能力,把工具用起來。”陳吉平如是説道。
在數字化轉型浪潮中,將數據利用起來是走向智能化發展的第一步。而傳統企業,由於缺失科技實力,所以需要有一批對應技術商來為他們賦能。
由於行業浩瀚、痛點各異,企業需求也不盡相同,客觀來看獨立完成整個生態鏈建設難度是極大的。
從數據萌芽到步入成熟,陳吉平一路走來,清晰看到數字化轉型並非交付產品即可,建設完成後仍需長期運營、維護的核心問題。也由此,萌生出構建生態底座,與合作伙伴共同賦能的念頭。
於是,在2020年,袋鼠雲正式開啓“飛躍計劃”,聯合社會各界打造“數字生態共同體”,賦能企業數字化發展。從根本切入方式來看,即袋鼠雲構建底層的數據底座,完成“難度最大”的數據底層梳理,上層的企業可以基於低代碼為企業做場景化的產品和服務。
生態圈賦能的想法顯然和行業玩家不謀而合。自實施以來,“飛躍計劃”已吸納了200多位夥伴加盟,涵蓋金融、政府、教育、軍工、製造等30多個行業。
從更本質的角度來看,基於生態做產業服務一方面可以幫助更多產業鏈上的其它企業成長,以袋鼠雲的數據能力為核心,幫助企業可以以貼身的姿態更好地服務企業客户;另一方面,也是最關鍵的,這種模型也更能幫助袋鼠雲建立自己的業務邊界。袋鼠雲正在以最開放的模式,和合作伙伴一起加速中國企業數字化轉型。
有所為有所不為,在中國的TO B浪潮裏,這是最關鍵的哲學,也是企業最能長久生存的關鍵方法論。
對於袋鼠雲的未來,陳吉平的認知一直是清晰的。**重產品,有邊界,強賦能,**在袋鼠雲身上,一個在中國產業土壤中成長起來的TO B獨角獸形象正在愈發清晰。