多雲數據存儲,理想與現實之間還差着什麼?_風聞
大数据在线-04-17 19:43
去年底,“數據二十條”正式頒佈,數據要素全面提速已是指日可待。
無疑,數據作為數字經濟的基礎,其價值的釋放依賴於數據的流動、共享和應用。數據要素只有充分地流動和應用起來,才能夠實現價值的最大化。
換而言之,進入多雲時代的用户們,數字化轉型已然邁入縱深階段,業務側用數的及時性和靈活性大幅提升,這也促使了數據的“雙循環”出現:數據在內部能夠很好地拉通、流動、共享和管理,數據對外需要與各大公有云服務商對接、流動與應用。
這一切使得多雲數據存儲成為今年以來市場的熱門話題。那麼,企業上雲和用數面臨着哪些重要挑戰?多雲數據存儲有着哪些新趨勢?哪些存儲能力是用户未來不可忽視的?近日,信通院攜手雲計算與數據存儲廠商聯合發佈了《多雲數據存儲白皮書》(以下簡稱:《白皮書》),全面分析了當前多雲數據存儲所面臨的挑戰與未來發展趨勢,為企業多雲時代的用數帶來了一份絕佳參考指南。
多雲時代,企業用數有這些攔路虎
多雲環境正在成為越來越多用户的標配。根據混合雲產業推進聯盟的數據顯示,我國已經有88.7%的用户選擇了多雲架構。
多雲之所以獲得用户們的青睞,究其原因,主要是它可以取長補短,最大限度匹配業務對於靈活性的需求,同時實現成本最優化;此外,多雲還能實現多元供應體系,減少對單一雲平台的過度依賴和提升雲環境的容錯率,避免因為故障導致全線業務崩塌,保障業務連續性。
作為多雲架構中數據資源的載體,多雲數據存儲肩負着數據要素的傳輸、處理、存儲和應用等多個環節,在數據要素價值釋放中扮演着極為重要的角色。因此,隨着數據要素化全面提速,多雲數據存儲的重要性也得以凸顯。
不過,理想很豐滿,現實就有多骨感。就在多雲數據存儲蓬勃發展之際,市場參與者眾多、煙囱式的建設方式以及對於上雲應用適配不足,使得數據流動有限、壁壘眾多,無形中成為企業上雲和用數的攔路虎、絆腳石。
《白皮書》就指出,多雲時代,企業在上雲用數主要面臨五大挑戰:多雲數據流動難、跨雲數據共享難、多雲應用改造難、數據安全保護難和數據應用能效低五大挑戰。
比如,很多企業用户都面臨着多雲數據流動難的情況,尤其是跨雲流動的數據多樣性還很不足。眾所周知,當前很多企業的多雲環境往往是:私有云+多個公有云+邊緣側的組合,企業往往根據不同應用的不同特點,將應用部署到最合適的環境之中,但卻面臨着跨雲數據一致性難以保障、數據跨雲流動耗時低效、數據難以跨企業應用、跨數據存儲類型流動等問題。
另外,跨雲數據共享難也是當前眾多用户面臨的一大難題。由於每家雲服務商在應用接口、數據交換標準、技術採用上存在着差異,所以天然在生態上難以互通、跨雲調用數據難度大,多雲之間數據共享等互操作性難度大且成本高昂。
以某零售企業為例,它自身在本地私有云環境部署了傳統的數據倉庫應用,而營銷團隊可能在A雲上正在使用某款雲數據倉庫應用來做個性化營銷,而數據科學團隊則可能在B雲上正在進行其他模型的機器學習訓練,一旦出現新項目需要共享多雲之間的數據,就會遇到數據可移植性和互操作性的難題,跨雲數據共享難度可見一斑。
因此,數據存儲作為雲的數據底座,肩負着多雲數據自由流動、高效共享與應用的重任,未來必然會被所有上雲用數的企業所倚重,成為他們數字化轉型中的堅實底座。
這些多雲數據存儲趨勢不容忽視
今天,大多數企業均會與多個雲服務商合作,數據通常分散在不同的地方,數據可能存放在數據存儲廠商的存儲系統之中,可能放在公有云服務商的雲存儲之中,還可能存放在邊緣側的超融合系統之中,技術棧極為複雜且管理困難,很容易造成更多的數據孤島。
因此,《白皮書》認為,多雲環境下第一個最為迫切的重要趨勢就是面向多雲構建統一的數據底座,以消除跨雲數據共享的難度,讓跨雲數據共享不再成為難事。這其中,構建全局數據視圖又至關重要,以數據為中心,基於統一元數據構建全局命名空間提供統一數據視圖,通過全局數據視圖和廣域網絡,實現數據跨雲、跨域、跨服務商共享。
例如,在超算雲環境中,數據密集型科研場景的大量湧現,很多超算用户常見的情況是:在數據中心C進行AI訓練,但數據源來自於數據中心A和B,數據中心A和B還需要對訓練結果數據實時可見和按需訪問。藉助跨域全局文件系統實現統一數據視圖,超算用户可以實現跨雲/數據中心的數據共享,更加高效完成各種超算任務。
《白皮書》認為,多雲環境中第二個重要的趨勢就是多雲環境數據流轉、數據分類分級將是常態,企業需要增強的智能分級存儲能力,從而使能數據跨雲流動。眾所周知,數據的智能分級多年前已經在存儲系統中出現,當時由於閃存價格昂貴,存儲系統利用分級技術實現冷熱數據的流動,從而在性能、成本、容量等方面實現最優。
如今,這種智能數據分級存儲能力需要進一步進化與演進。多雲環境中,企業的數據規模、數據類型、數據分佈、數據保護等級、應用類型等均遠勝過往,多樣化應用對數據存儲有着不同的需求,數據不僅僅需要在存儲系統內部不同介質之間流動,還需要在不同存儲系統,甚至跨雲之間實現全生命週期的流轉。
所以,企業需要增強基於策略的數據智能分級流動能力。在多雲環境中,利用基於數據存儲的分級、複製等技術,實現企業多雲數據中心之間、不同類型數據存儲之間基於策略的數據分級流動,以實現跨雲數據複製,數據遷移,數據備份等。
例如,很多企業級存儲系統均有網關功能,可以與公有云進行對接,將數據複製或者備份到公有云之中,不僅實現了存儲容量、成本的最優,還能利用公有云實現數據保護與容災。
《白皮書》認為,在多雲環境中,雲邊協同的場景會越來越多,隨着雲邊協同不斷深入,邊緣IT基礎設施會加速向功能齊全、集成度高和寬環境適配的超融合架構演進,來實現資源協同、應用協同、數據協同、智能協同、管理協同五大雲邊協同。
事實上,當前在很多行業中,雲邊協同場景成為常態,像無人駕駛、智慧礦山、智能交通、智慧零售、智慧能源等均是典型的雲邊協同。這種場景往往是典型的智能化應用場景,會綜合運用到雲計算、物聯網、大數據、人工智能等多種技術,邊緣側環境複雜、並且會持續產生大量數據,需要將邊緣側數據傳輸到雲端進行人工智能模型訓練,然後再將模型下發到邊緣側運行。
例如,在很多智慧風電場景中,規模通常能達到上千甚至上萬颱風機,一個風機具備2000個以上的檢測點,檢測點每天產生的數據量能夠達到PB級別,在雲端集控中心的工業大數據平台需要不斷收集海量數據進行訓練和迭代各種算法模型,然後將運維預警模型下發到邊緣側,對於邊緣側的基礎設施的功能、性能、環境適配等要求越來越高。
除了這三大趨勢之外,《白皮書》認為,多雲數據存儲還需要加快面向容器演進,從而助力應用雲化改造;加快部署安全可信數據存儲,從而加強多雲數據安全;推動介質節能、算法節能等數據存儲高效節能技術,從而實現綠色低碳發展。
《白皮書》倡議:推動多雲數據產業發展
如今,業界普遍認為多雲不是雲發展過程中的一個臨時階段,而是企業基礎設施的一種新常態,未來將持續在企業數字化轉型中發揮着關鍵作用。
多雲數據產業由於存在着大量的市場參與者,既有各種雲服務商,還有廣大傳統企業級存儲廠商,更有一些邊緣設備、安全廠商,雖然技術路徑、產品側重點各有不同,但大家普遍意識到,“各自為政”的思維愈發不符合用户在多雲時代的用數需求,加強多雲數據產業建設,不斷完善產業生態,實現數據自由流動、數據高效共享是產業發展的必然趨勢。
為此,《白皮書》聯合產業界發出了三大倡議:
首先,繼續完善多雲數據存儲能力,持續促進數據共享、跨雲自由流動。數據存儲層最適合解決數據自由流動的難題,雖然當前雲服務提供商和數據存儲廠商已經有了很多合作,在數據互通、數據災備和數據服務等方面實現不小突破,但未來需要加大合作力度,消除更多障礙,讓多雲數據交互安全、可信,從而在業務中產生更大價值。
其次,多雲數據存儲需要聯合更多行業用户進行創新實踐,助力行業推廣應用。像金融、政府、交通、能源、零售等行業均在向多雲環境演進,典型應用實踐很容易形成推廣效應,在該案例所屬行業中起到帶頭作用,有利於多雲數據創新在不同行業中的推廣與應用。
第三,繼續構建與完善多雲數據互聯互通標準,搭建產業合作平台,構建開放的數據流動環境。當前,多元環境中各大廠商雖然實現了一定程度的互聯互通,但是行業標準的建設尚處於早期階段。行業標準是行業通用語言,也是產業長期發展的基礎。未來,需要圍繞實際應用場景,聯合產、學、研、用各方,通過業界優秀實踐孵化行業標準,推動多雲數據存儲產業良性發展。
總體而言,隨着企業上雲與用數成為大勢所趨,多雲數據存儲也面臨着產業發展的關鍵時刻,解決數據流動、數據共享等難題已經迫在眉睫,這不僅僅需要產業界在技術、產品與解決方案上持續創新與突破,更需要產、學、研、用各方構建起良性生態,讓多雲數據存儲真正成為釋放數據價值的“助推器”。