上百億藍海市場,CDM有何“數據魔法”?_風聞
大数据在线-2021-04-19 09:00
如同高跟鞋之於女人,格子衫之於程序員,奧特曼之於小男孩…總有一股説不清,道不明的因子,讓他們如同被施附了魔法一般,甘願沉浸其中。今天,CDM之於企業ITer,也正在徐徐呈現屬於它的獨一無二的“數據魔法”。
早在2017年Taneja Group的一項研究就表明,超過30%的公司正在考慮或實施CDM(Copy Data Management,數據副本管理)產品。在國內,金融和運營商行業的多家頭部用户也在近兩年相繼完成了CDM產品的部署和應用… 隨着數字化轉型進入深水區,數據成為企業最關鍵的生產資料,CDM“何許人也”,又究竟有何魔力,贏得了諸多企業的青睞?CDM技術“朋友圈”目前聚集了哪些“小夥伴”,這項技術未來又將保持怎樣的演進……
一個數百億美元的藍海市場
統計顯示,平均每個企業要為應用開發、QA、用户驗收、產品支持、報告和備份等,從生產數據源創建8-10份數據副本。因此,以一個5TB的生產數據庫為例,往往要為下游創建出40-50TB的數據副本。一家500強企業甚至擁有超過上千個生產數據庫,數據副本達到PB級規模。
大量的數據副本存在不可避免地造成了一定程度的資源浪費以及維護開銷的增長,有數據表明,企業80%的存儲能力都被次級數據所使用。
援引自IDC的數據也顯示,目前每年在Copy Data上的開銷達到460億美元,企業內的數據副本消耗了60%的存儲空間,並且65%的存儲軟件和85%存儲採購由此產生。
資料來源:IDC
不僅如此,在傳統的生產協作流程中,當開發和測試人員想要獲取必須的數據副本時,往往需要從提交申請,到完全準備好環境,耗時幾天甚至以月為單位(數據交付時間視數據規模,環境準備情況等而定)。
這樣的數據管理實踐並非最佳,不僅大量浪費了存儲資源,而且還帶來了數據合規和敏捷性等方面的問題,影響了用户應用程序的快速迭代,這對於今天追求敏捷轉型和DevOps轉型的企業而言難以接受。
為了幫助企業統一管理海量的非關鍵性數據,尤其是冗餘的數據副本,業界採用了CDM技術。什麼是CDM?它的主要應用場景又是什麼?Gartner對此提出:它從生產環境通過快照技術獲取有應用一致性保證的數據,在非生產存儲上生成“黃金副本”(Golden Image),這個“黃金副本”數據格式是原始的磁盤格式,可再虛擬化成多個副本直接掛載給服務器,分別用於備份恢復、容災或開發測試。
Gartner《Hype Cycle for Storage and Data Protection Technologies, 2020》報告指出,CDM技術已經度過了了早期的技術炒作期,目前處於“泡沫化的低谷期”(trough of disillusionment),這從側面説明一些客户開始在非關鍵性業務場景集中部署這項技術,而且Gartner也預測CDM技術將在未來5-10年內進入“實質生產的高峯期”(plateau of productivity)。
聚焦到CDM技術實現的業務價值,主要體現在以下幾個方面:
第一,降低存儲成本。利用數據虛擬化技術,單個數據副本即可滿足開發、測試、備份、恢復、數據脱敏、統計分析等多種工作負載需求,同時利用高效的數據壓縮技術,進一步節省了存儲空間,減少企業不必要的存儲開支(以下圖上訊信息ADM產品數據拷貝方式為例)。
ADM數據拷貝方式
第二,縮短數據交付週期。數據準備從原來的按天或者月為單位,縮短到分鐘級,數據分發達到秒級。基於CDM技術的數據副本的交付與管理,大大節省了數據交付的時間,為企業構建了更加敏捷的數據管理基礎架構,加速了企業的DevOps建設,縮短了業務的開發測試周期,實現了產品的快速迭代。
第三,降低人力時間投入。傳統方式下,數據的導入和導出無法自動完成,面對開發和測試人員的需求,需要通過人為的傳遞才能完成數據從生產環境到測試環境的遷移,而且這個過程中還可能需要持續的獲取增量數據資源。CDM技術實現了全流程的自動化配置和編排,從審批到數據的導入和導出,這個過程只需要在統一的管理界面上鼠標點擊操作,幾步即可自動完成,極大減輕了存儲管理員和DBA的工作負荷,降低人力時間投入。
第四,提升數據集中管控能力。過去,數據移交到使用部門之後,管控權利完全在使用部門,只能用流程來控制數據的用後銷燬,存在較高的安全管控風險。CDM融合了數據動態和靜態脱敏,權限管控,合規審計等多種數據保護策略,以集中的數據管控,防範敏感數據泄露,杜絕不當或者誤操作,以及保留事後的可追溯。交付使用的數據,可以通過CDM管控平台實現數據的統一集中管控,杜絕測試數據出現數據孤島,在數據使用完之後,可以實現數據的快速回收以釋放佔用資源,杜絕暗數據的出現。
備份和CDM,孰是孰非
在國內,備份和CDM容易被混淆,有不少備份廠商在其備份產品上通過增加一些CDM功能,作為備份的補充,比如用作快速拉起恢復或者備份校驗,也許從用户肉眼可見的角度看,功能上都歸整到了統一的界面上,但實際上二者的後台邏輯相差甚遠。
備份從根本上是作為數據的保底存在,一旦發生物理或邏輯故障,為用户提供了災難恢復的手段。而CDM側重於對數據的生命週期管理,是牽涉到用户數據獲取,數據存儲,數據使用的全流程的生產力工具。
傳統備份技術是將數據恢復後交付使用,恢復的過程很長,而CDM保存的是原始格式數據,可以直接交付使用。
從功能上看,備份更多是作為CDM其中的一項數據獲取手段。CDM副本數據管理基於數據虛擬化等核心技術,自動化實現了從數據獲取到數據使用再到數據歸檔,數據銷燬的全生命週期管理。其中,在數據獲取環節既可以通過用户既有備份系統內獲取數據,也可以通過從生產環境實時獲取數據,又或者用户以腳本的方式自助上傳數據等多種方式。相比備份,CDM更加關心的是數據的交付使用與管理。
全球生態,風景這邊獨好
過去的十多年時間,CDM的主要玩家分佈在北美。在國內,從上訊信息2016年發佈了國內第一款真正意義上的CDM產品開始,近兩年CDM技術在金融和運營商這兩個行業的蓬勃發展,推動了開發測試場景的數據架構轉型,並且大有替代傳統備份之勢。
1、Actifio
Actifio成立於2009年。2020年,谷歌宣佈收購Actifio,收購完成後,Actifio會併入Google Cloud。
Actifio的多雲複製數據管理(Copy Data Management)軟件平台虛擬化拷貝數據,允許以原生格式對數據的虛擬副本進行完整的生命週期管理。通過一套豐富的API,Actifio的軟件可以無縫地集成到任何IT服務管理工具、DevOps工具鏈或定製的腳本和應用程序中。
Actifio數據虛擬化IT架構及實現原理
2、Cohesity
Cohesity成立於2013年,公司CEO兼聯合創始人Mohit Aron,之前還聯合創立過Nutanix,目前該公司最新的市場估值達到37億美元。
對於Cohesity公司來説,在線備份只是其完整數據管理平台的一部分,該平台專注於解決大規模數據碎片所造成的問題。它側重於幫助企業保護和管理位於許多不同位置的二級數據。
3、Rubrik
Rubrik也是由前Nutanix的人員發起創立,提供跨越本地、雲端和混合雲環境中的企業數據管理和備份服務。
全球有2500多家企業和政府使用Rubrik公司的Cloud Data Management解決方案來管理和協調跨數據中心和雲的數據。其提供一個單一的數據平台,可以跨數據中心和雲安全地提供備份,恢復,分析和合規性。承諾快速恢復,提供接近0的RTO。另外還提供SLA自動化和API優先的架構。
4、Delphix
Delphix成立於2008年。Delphix提供了一個API優先的數據平台,該平台跨越多雲並支持從雲原生主機到舊式大型機的所有應用程序。Delphix可自動執行一系列關鍵的複雜數據操作,包括遵守GDPR和CCPA等隱私法規。
Delphix聲稱藉助其平台,可將數據佔用空間減少10倍,將資源調配速度提高100倍。藉助Delphix虛擬化,用户可在幾分鐘內大規模配置輕量級虛擬數據庫副本,大規模地將數據從生產環境複製到非生產環境,以及使用刷新,回滾和快照功能管理虛擬數據庫等操作。
5、Catalogic
Catalogic 2013年成立,總部位於美國新澤西州。ECX是該公司提供的CDM軟件產品,大大簡化了副本數據管理,實現了數據副本的自動化和編排,可以在整個企業和雲中利用該副本進行各種創造價值的用例。藉助Catalogic ECX,將開發/測試基礎架構管理時間減少了多達99%。
ECX還可以幫助用户將數據移動到雲中,利用雲中成本更低,更具彈性的計算基礎架構,藉助ECX,在某些用例中利用雲時,用户的投資回報率超過300%。
6、上訊信息
上訊信息2010年成立,2016年率先發布了國內首款CDM產品—敏捷數據管理平台(ADM),這是一款集數據驗證恢復、數據虛擬化、數據脱敏和數據庫審計為一體的數據全生命週期管理產品。通過一個平台,解決數據獲取,數據存儲,數據構建,數據使用,數據歸檔,數據銷燬的所有數據問題。
數據使用的全生命週期管理,資料來源:上訊信息
ADM核心技術-數據虛擬化技術,可以通過一份數據的“黃金副本”快速創建出多份數據副本交付使用,所交付的數據都是可讀可寫的,並且可以達到分鐘級的數據交付效率,以及實現10倍以上的存儲成本節省。目前,ADM獲得了金融和運營商行業多家頭部客户的使用和持續復購。
CDM:我的未來不是夢
對每一家致力於數據驅動的企業和組織而言,CDM技術無疑重塑了其過去臃腫的數據架構和繁冗的數據管理流程,以敏捷的數據架構就緒企業數字化轉型,加速業務交付,提高企業的決策效率以及生產力水平。
但這並不是CDM的全部,這項令人着迷不已的技術未來又將擁有怎樣的蜕變?做一些預測:
第一,跨越本地數據中心,邊緣和多公有云的數據流動和存儲。CDM需要滿足混合多雲時代用户對數據在不同端的流動和統一管理的需求,支持不同位置的基礎環境,例如可利用公有云更加經濟、彈性的存儲資源,進一步降低OPEX。而無論是部署於邊緣,本地還是多公有云,都需要滿足一致性和可用性服務體驗。
第二,以數據為中心,打通數據上中下游鏈條,實現數據的全生命週期管理。從產品的角度,可以基於靈活的license授權,為用户按需交付備份容災,備份校驗,數據虛擬化,數據脱敏,合規審計等不同功能,而從後台邏輯來看,支持一個統一的數據平台,能夠無縫連通數據的全生命週期統一管理。
第三,CDM技術與垂直應用場景的緊耦合,強關聯。例如,開發測試場景下,能否基於一套數據平台,跑通所有的開發測試作業,而無需額外使用第三方平台,例如測試版本控制,以降低額外的資源消費,提高開發測試效率。
相信隨着技術的不斷完善以及生態的成熟,CDM,未來可期!