政務數據共享:AI 數據湖帶來範式轉換_風聞
大数据在线-1小时前
共建數據強國、加速政務數據共享,是一場深刻的治理革命與時代命題。
作為國家數據資源中體量最大、覆蓋最廣、權威性最高的“富礦”,政務數據的共享與開放程度,已成為衡量國家治理現代化與核心競爭力的關鍵標尺。
如今,中國政務數據共享的破壁時刻來臨!2025年6月,國務院《政務數據共享條例》(以下簡稱:《條例》)正式發佈。《條例》圍繞“統籌協調、標準統一、依法共享、安全可控”四大原則,提出構建全國一體化政務大數據體系的目標。此舉標誌着中國政務數據共享邁入體系化發展的新紀元。

如果説《條例》是中國在數據基礎制度建設上的持續完善,那麼AI數據湖解決方案的出現,則是技術支撐落地層面的完美呼應,其創新的“存-管-用”三層架構有望推動政務數據從“被動共享”向“主動賦能”躍遷,為數字政府建設注入持續動能。
此時此刻,一場由制度與技術雙輪驅動的政務數據共享革命正式爆發。
三重困境背後的核心挑戰
今年是數字中國戰略推進的第十年。
如今,中國在數據的“量”上已然領跑:2023年數據生產總量達32.85ZB,佔據全球數據總量的近30%;其中政務數據年均增速更高達56%。但“量”上去的同時,“質”的方面依然有待提升:僅有2.9%的數據被有效保存,不到美國存留率的一半。
數據強國的真諦,不在於僅僅存儲多少數據,而在於數據要素的流通速度,以及在各種場景的價值轉化效率等。目前,我國的數據規模優勢並未徹底轉化為治理效能與市場動能。因此,從數據大國走向數據強國,做好政務數據共享是必經之路。
無獨有偶,《條例》的出台也折射出當下我國政務數據層面所面臨的三重困境:數據煙囱導致行政效率損耗、安全與共享的二元對立和數據要素價值釋放不足。
困境的背後是亟待解決的三大核心挑戰:
數據整合難題:需將分散的政務數據平台納入統一體系,打破“數據孤島”;高效管理需求:需實現海量多模態數據的動態更新、質量校核與跨域共享;安全與效率平衡:在保障數據安全(尤其是個人信息保護)的同時,提升數據流通效率。破解難題,三大能力至關重要
數智化時代,一個政府組織就像一副軀體,數據猶如組織的血液,其強壯與否的關鍵在於是否有足夠的“血液”供給到經濟社會的肌體之中。因此,隨着《條例》的發佈,“供得出”、“流得動”和“用得好”成為政務數據得以充分共享與應用的三大必備能力。
第一,構建海量數據存儲,破解"存不下"困局,才能實現數據“供得出”。
《條例》後續的執行,必然進一步引發數據的匯聚和存儲需求。例如,某省應急廳通過跨域數據融合,構建台風路徑預測模型,預警準確率從67%提升至89%,每年減少經濟損失超20億元;這將進一步要求更長週期、更高質量的保存海量數據,尤其是多樣化、多類型的非結構化數據,數據將持續變温、變熱並且永不刪除。
在這一趨勢下,傳統存儲將面臨成本與性能的雙重挑戰。新的數據存儲需要通過存儲介質創新和以數據為中心的體系架構,以更低成本、更綠色節能的方式存下持續翻倍的數據,具備高容量密度、低功耗密度和EB級高彈性擴展能力,同時不斷提升性能密度,支撐數據價值價值挖掘的效率提升。
第二,從存下數據到管好數據,構建全局統一數據管理能力,打破“數據孤島”,推動政務數據不僅“供得出”而且“流得動”。
政務數據是政府部門依法履責過程中收集和產生的各類數據。其共享瓶頸不僅在技術層面,也在於權屬與利益分配機制等方面。政務數據“不願共享、不敢共享、不會共享”的情況,滋生出底數不清、重複採集、資源浪費、重複勞動、協同困難、效率低下等一系列問題,直接導致數據“看不見”,看到了也“拿不到”,“不讓拿”或“不敢拿”。
為此,《條例》明確將數據分為無條件共享、有條件共享、不予共享三類,要求部門不得擅自增設共享壁壘;提出“誰管理誰負責,誰使用誰負責”原則,以減少數據提供方因共享而擔責的後顧之憂。
同時,《條例》也清楚指出技術創新的支撐是措施落地的關鍵,積極鼓勵政務數據共享領域的技術創新,加速解決數據共享和流動的難題,並強調需要保障政務數據共享全流程各環節安全可控。
因此,全局統一數據管理能力至關重要。通過跨機構的統一數據視圖和聯邦集羣管理,實現物理分散的政務數據在邏輯上的統一訪問,提供入湖增量數據秒級同步和高效的數據檢索,滿足高效管理的需求;同時打造可信數據空間,覆蓋數據提供方、數據使用方和數據服務方,通過數字合約形成數據的有效控制,實現數據要素流通和訪問控制,解決數據流不動、不敢流的問題;
第三,提高數據質量、釋放數據潛能,確保數據“用得好”。
數據共享的最終目的是實現數據價值最大化,讓數據從“成本負擔”成為“價值源泉”;而數據複雜、清洗難、AI應用開發和部署難等挑戰阻礙了政務數據在數智時代的價值發揮。
通過自動化工具對數據進行“清洗、標註、分類”的技術路徑是解題的關鍵,以某汽車製造企業為例,在數據湖底座上引入自動化工具之後,數據利用率可從不足25%提升至60%以上。
因此,先進的數據基礎設施需要能從數據匯聚到數據分析、數據處理,到數據編目提供端到端、一站式支持,實現智能數據分類、生產統一數據目錄,針對不同格式/不同來源數據融合,統一數據格式,實現智能數據標籤;支持數據要素智能提取,將數據轉化為知識;梳理數據間關係,自動生成知識圖譜。同時,需要提供北向標準API、可視化操作界面,提供開放的生態對接。
AI數據湖方案:助力政務數據範式躍遷
一直以來,中國政務數字化的底層邏輯是:用制度創新來降低各種成本,用技術革命來提升生產要素效率。
政務數據共享亦不例外。要想政務數據的供給端“供得出”、流通端“流得動”、應用端“用得好”,既需要制度層面的持續創新來破局,也依賴技術層面的不斷突破來支撐落地。制定與完善制度猶如劃定跑道,技術創新與突破則像鋪設軌道,只有這樣才能讓政務數據共享之路在安全與效率的平衡中走向未來。
近期,華為發佈了AI數據湖解決方案,構建創新數據基礎設施的 “存-管-用”三層架構,與《條例》要求形成高度契合:
存儲層:OceanStor Pacific數據湖存儲高效承載海量數據
海量數據歸集的最優綠色底座:基於61.44TB的自研大容量SSD與2U36盤位的高密專用硬件,並結合2:1非結構化數據壓縮能力,提供業界最高容量密度。同時,實現0.25W/TB業界最低能耗密度,顯著降低政務數據存儲成本。極致性能滿足高效供數需求:其單節點提供90GB/s和240萬IOPS性能,並結合EB級橫向擴展、性能線性增長、多協議無損互通,實現多業務、多格式、多協議數據的充分整合和高效供給。
管理層:DME Omni-Dataverse統一數據空間提供智能化的數據管理引擎
跨地域協同能力:基於全局命名空間技術,實現跨數據中心(DC)、跨地域的數據按需訪問,為“全國一體化政務大數據體系”提供物理支撐。動態目錄管理:通過元數據自動標籤化與智能分類,支持政務數據目錄的動態更新與版本追溯,滿足數據目錄“編制-發佈-更新”全流程管理的要求。可信數據空間:內置可信數據空間能力,覆蓋數據供應方,中心,需求方,數據一旦進入到空間,通過數據智能合約形成整個數據的有效控制,實現全流程數據的訪問控制。
AI工具鏈層:成為數據價值釋放的加速器
一站式AI工具鏈ModelEngine,從數據工程、應用編排、資源調度等多方面高效賦能政務數據的AI開發和應用。實現數據到知識一站式自動化生成,包括數據的清洗、數據的增強如自動生成高質量問答對、自動將數據轉換為向量知識庫。
毫無疑問,《條例》的出台與華為AI數據湖解決方案的發佈,不僅為共建數據強國這一時代命題帶來了答案,也標誌着我國政務數字化進入“制度+技術”雙輪驅動的新階段。通過存儲底座的重構、管理模式的創新與AI能力的深度融合,AI數據湖解決方案為《條例》落地及時的提供了技術創新的參考架構,更將推動政務數據從“被動共享”向“主動賦能”躍遷,為數字政府建設注入持續動能。未來,隨着更多應用場景的落地,這種“政策牽引+技術託底”的模式或將成為全球政務數字化轉型的標杆範式。