亞馬遜雲科技發佈全新數據管理服務Amazon DataZone
- 幫助客户在整個企業內對數據進行編目、發現、共享和治理
- ENGIE*、福克斯和伊塔烏聯合銀行等客户成功應用**Amazon DataZone*
北京2022年12月1日 /美通社/ -- 亞馬遜雲科技在2022 re:Invent全球大會上宣佈,推出一項全新的數據管理服務Amazon DataZone,它可以讓客户更快、更輕鬆地對存儲在亞馬遜雲科技、客户本地和第三方來源的數據進行編目、發現、共享和治理。藉助Amazon DataZone,管理員和數據資產管理者可以使用精細的控制工具管理和治理數據訪問權限,確保數據訪問發生在正確的權限和正確的情境之下。Amazon DataZone使工程師、數據科學家、產品經理、分析師和業務用户可以輕鬆訪問整個組織的數據,從而發現、使用數據,通過數據進行協作來獲得洞察。
當前,企業收集的數據達到PB甚至EB級別,這些數據來自多個部門、多項雲服務、眾多本地數據庫以及第三方數據源(如來自合作伙伴解決方案和公共數據集)。在企業可以釋放數據的全部價值之前,管理員和數據管理者作為數據生產者與管理者,需要在保障數據的管控和治理的前提下允許數據訪問,確保數據只能由正確的人在正確的情境下訪問。另一方面,整個公司的員工(如數據消費者)都希望發現和分析來自數據生產者的信息,以推動決策制定。數據需要被管控以保證安全,產生新的洞察需要允許數據訪問,企業必須在二者之間尋求平衡。然而企業內數據多樣,部門林立,用例不同,這些都對治理策略的落實提出挑戰。一些企業通過建立目錄來管理信息,但這些目錄系統維護起來相當耗時,需要數據生產者手動標記每個數據集,額外添加來源或描述等情境信息來保證數據可以被檢索和發現,同時缺乏內嵌的訪問控制來簡化數據治理。企業很難保持數據分級分類的一致性,以及各個數據生產者必須保持自己的信息即時更新,這使得在整個企業中搜索數據變得非常困難,並可能導致數據過時。在這種情況下,數據消費者即使找到了所需信息,也無法快速通過目錄直接向數據所有者請求訪問權限,也就無法加載數據分析服務以及與他人協作。最終,決策者無法及時獲得所需信息,或者可能根據不完整或過時的數據做出欠佳的決策。
Amazon DataZone是一種全新的數據管理服務,它助力數據生產者輕鬆管理和控制數據訪問,使數據消費者能夠發現和使用數據、開展數據協作以獲取業務洞察。數據生產者可以通過Amazon DataZone定義數據分級分類,配置治理策略,連接一系列亞馬遜雲科技服務(如Amazon S3和Amazon Redshift)、合作伙伴解決方案(如Salesforce和ServiceNow)和本地系統,從而創建自己的業務數據目錄。Amazon DataZone使用機器學習為每個數據集收集和建議元數據信息(如數據來源和數據類型),並根據客户的分級分類和偏好進行模型訓練,不斷優化,從而消除數據目錄維護的繁重工作。設置目錄後,數據消費者可以使用 Amazon DataZone搜索和發現數據資產,檢查元數據使用情境,請求數據集訪問權限。當數據消費者開始分析數據,他們會創建一個Amazon DataZone數據項目,即門户系統中的一個共享空間,用户可以在其中提取不同的數據集、與同事共享訪問權限、進行分析協作。Amazon DataZone與Amazon Redshift、Amazon Athena和Amazon QuickSight等亞馬遜雲科技數據分析服務進行了集成,數據消費者能夠在其數據項目的情境中訪問這些服務,他們的數據在這些服務中自動可用、無需單獨的登錄憑證。Amazon DataZone還提供應用程序編程接口(API)以與自定義解決方案或與DataBricks、Snowflake和Tableau等合作伙伴進行集成,因此,客户可以輕鬆發佈、搜索和使用其所有的數據資產。
“良好的治理是整個組織都可以訪問數據的基礎,但我們經常聽客户説,在使數據可發現和保持控制之間很難取得適當的平衡。"亞馬遜雲科技數據庫、數據分析和機器學習副總裁**Swami Sivasubramanian表示,“藉助 Amazon DataZone,客户可以使用單一服務在強大的治理控制和簡化的數據訪問之間取得平衡,從而輕鬆查找、組織數據,使用數據進行協作。Amazon DataZone在整個企業內解放了數據的束縛,每個員工都可以幫助推動獲取新的洞察,最大限度地發揮數據價值。”