梅宏院士:數據要素化三大問題值得關注
4月30日,中國科學院院士梅宏在2025數字中國峯會期間表示,數據要素化是我國數字化轉型的重要表徵,但現階段尚處初步探索階段,面臨諸多挑戰。
據瞭解,我國是全球首個將數據確立為生產要素的國家,發展數據要素市場有兩個重要目標:一是增強我國經濟發展的新動能,推動資源高效流動、市場主體加速融合,提升經濟社會各領域資源配置效能;二是在世界各國爭相發展數字經濟之際,有利於我國做強做優做大數字經濟,構築起國家競爭的新優勢。
梅宏指出,將數據確立為重要生產要素,並通過各類手段讓其參與社會生產經營活動的過程,可分為遞進的三個層次:首先是認識數據的資源屬性,數據資源化是數據要素價值釋放的前提,包括原始數據的獲取以及後期的數據加工組織;其次是建立數據的資產屬性,即在法律上確立數據的資產屬性,成為和不動產、物產等一樣可以如表的資產,這是要素價值得到保障的根本;第三是實現數據的資本屬性,使得數據的價值可度量、可交換,成為可以被經營的產品或商品,這是要素價值得以釋放並創造新價值的途徑。
“數據要素化是我國數字化轉型的重要表徵。”梅宏表示。他認為,數字化轉型包含數字化、軟件化、網絡化+軟件定義(平台化)、智能化+數據要素化這幾個層級。轉型的最終目標就是要構建以數據為中心的組織體系和運行模式。
目前來看,我國數據要素化尚處起步探索階段,在資產地位、權屬確權、流通交易、利益分配和安全隱私等方面存在諸多障礙。“兩年前我在貴陽數博會上曾經有數據要素化十問(能否以及怎樣把數據列為資產?數據要素如何加入生產函數?如何理解數據的權屬性質,怎樣確權?如何實現公共數據的真正開放?如何構建高效的數據流通交易體系?如果數據要變現和流通,有沒有可度量的基本單元?怎樣度量評估數據的價值?怎樣合理分配數據帶來的收益?如何平衡發展與安全?如何為數據要素化提供技術支撐?),這些問題至今仍沒有答案。在未來數據要素化過程中,需要繼續探索。”梅宏説道。
梅宏指出,當前有三個重要問題值得關注。其一,數據共享開放似有倒退現象。這幾年,隨着數據的重要地位越來越被強調,加上安全法、個人信息保護法等相關法律的實施,數據共享的意願有走低傾向,公共數據的開放進展甚微。從國際視角看,數據跨境流動也出現了趨嚴的傾向,這個問題不破解,數據的價值發揮就面臨問題。
其二,公共數據授權運營好像成了唯一途徑。公共數據作為社會數據的粘合劑甚至催化劑,是國家重要的基礎性戰略資源,它的開放運營對促進數據要素市場發展、提升社會治理能力具有重要意義。各地紛紛成立數據集團承接授權運營任務,然而這些新機構的技術能力不足,體制機制也不利於創新。如何在做好授權運營的同時激發並充分利用來自民間的創新活力是一個重要挑戰。“或許可以將公共數據進一步分類分級,我覺得這是一個可行的這種方案。”梅宏説道。
其三,數據應用和AI大模型的綁定太過緊密。“當下的AI熱潮主要是源於深度學習取得突破性進展,數據驅動智能、計算實現智能。數據為體,智能為用,就像燃料和火焰的關係一樣。”梅宏表示,“在算法、數據、算力三要素中,數據最為關鍵,大模型能力的天花板是由數據來定義的,但是我們需要知道,數據應用一直伴隨着人類社會的發展,過去已經存在多樣性的數據應用場景,用數據訓練模型只是數據應用的新場景之一。”
在他看來,深度學習帶來的是處理分析海量多模數據的高效的自動化手段,但是傳統的數據處理分析方法仍有用武之地,實際上沒必要所有的場合都去祭出大模型這把“牛刀”,也並非所有的數據都可以成為生產要素。
據瞭解,我國是全球首個將數據確立為生產要素的國家,發展數據要素市場有兩個重要目標:一是增強我國經濟發展的新動能,推動資源高效流動、市場主體加速融合,提升經濟社會各領域資源配置效能;二是在世界各國爭相發展數字經濟之際,有利於我國做強做優做大數字經濟,構築起國家競爭的新優勢。
梅宏指出,將數據確立為重要生產要素,並通過各類手段讓其參與社會生產經營活動的過程,可分為遞進的三個層次:首先是認識數據的資源屬性,數據資源化是數據要素價值釋放的前提,包括原始數據的獲取以及後期的數據加工組織;其次是建立數據的資產屬性,即在法律上確立數據的資產屬性,成為和不動產、物產等一樣可以如表的資產,這是要素價值得到保障的根本;第三是實現數據的資本屬性,使得數據的價值可度量、可交換,成為可以被經營的產品或商品,這是要素價值得以釋放並創造新價值的途徑。
“數據要素化是我國數字化轉型的重要表徵。”梅宏表示。他認為,數字化轉型包含數字化、軟件化、網絡化+軟件定義(平台化)、智能化+數據要素化這幾個層級。轉型的最終目標就是要構建以數據為中心的組織體系和運行模式。
目前來看,我國數據要素化尚處起步探索階段,在資產地位、權屬確權、流通交易、利益分配和安全隱私等方面存在諸多障礙。“兩年前我在貴陽數博會上曾經有數據要素化十問(能否以及怎樣把數據列為資產?數據要素如何加入生產函數?如何理解數據的權屬性質,怎樣確權?如何實現公共數據的真正開放?如何構建高效的數據流通交易體系?如果數據要變現和流通,有沒有可度量的基本單元?怎樣度量評估數據的價值?怎樣合理分配數據帶來的收益?如何平衡發展與安全?如何為數據要素化提供技術支撐?),這些問題至今仍沒有答案。在未來數據要素化過程中,需要繼續探索。”梅宏説道。
梅宏指出,當前有三個重要問題值得關注。其一,數據共享開放似有倒退現象。這幾年,隨着數據的重要地位越來越被強調,加上安全法、個人信息保護法等相關法律的實施,數據共享的意願有走低傾向,公共數據的開放進展甚微。從國際視角看,數據跨境流動也出現了趨嚴的傾向,這個問題不破解,數據的價值發揮就面臨問題。
其二,公共數據授權運營好像成了唯一途徑。公共數據作為社會數據的粘合劑甚至催化劑,是國家重要的基礎性戰略資源,它的開放運營對促進數據要素市場發展、提升社會治理能力具有重要意義。各地紛紛成立數據集團承接授權運營任務,然而這些新機構的技術能力不足,體制機制也不利於創新。如何在做好授權運營的同時激發並充分利用來自民間的創新活力是一個重要挑戰。“或許可以將公共數據進一步分類分級,我覺得這是一個可行的這種方案。”梅宏説道。
其三,數據應用和AI大模型的綁定太過緊密。“當下的AI熱潮主要是源於深度學習取得突破性進展,數據驅動智能、計算實現智能。數據為體,智能為用,就像燃料和火焰的關係一樣。”梅宏表示,“在算法、數據、算力三要素中,數據最為關鍵,大模型能力的天花板是由數據來定義的,但是我們需要知道,數據應用一直伴隨着人類社會的發展,過去已經存在多樣性的數據應用場景,用數據訓練模型只是數據應用的新場景之一。”
在他看來,深度學習帶來的是處理分析海量多模數據的高效的自動化手段,但是傳統的數據處理分析方法仍有用武之地,實際上沒必要所有的場合都去祭出大模型這把“牛刀”,也並非所有的數據都可以成為生產要素。