請回答2021:我的數據值多少?如何被交易?_風聞
IT时报-《IT时报》官方账号-2021-07-16 09:27

圖源:東方IC
30秒快讀
1
目前已基本明確,在上海浦東,建設一個數據交易所,此前上海數據交易中心已成立五年,在數據交易方面有經驗可循,接下去要進一步大膽探索。
2
全社會數據總量中,政府只佔20%,剩下80%是社會數據,包括互聯網數據、企業工業數據,而且這個趨勢將不可逆轉繼續下去。
3
未來的數據交易市場應該是三級的,第一級市場是數據資源市場,第二級市場是數據元件市場或者要素市場,第三級市場是數據的產品市場。三級市場確權以後,產權、權屬、權益都會非常清晰。
一系列與數據有關的消息正傾瀉而下。
7月10日,國家網信辦發佈《網絡安全審查辦法(修訂草案徵求意見稿)》,要求掌握超過100萬用户個人信息的運營者赴國外上市,必須審批。
7月12日,廣東省印發《廣東省數據要素市場化配置改革行動方案》,提出推動建設省數據交易場所,規範數據入場交易,培育數據要素交易市場。
加上此前2021年6月10日,第十三屆全國人民代表大會常務委員會第二十九次會議通過的《中華人民共和國數據安全法》。
毫無疑問,數據將成為未來最有價值的資產,無論對政府、企業還是個人。然而,面對每年指數級上升的數據量,圍繞數據收集、保護、流通、交易、監管的各種標準、政策、規範都還在路上。
當“數字化轉型”成為全球課題,身處第一梯隊的中國將如何回答好“數據治理”這道題?
“不出意外的話,我們國家近期會推出關於培育數據要素市場若干個指導意見。”復旦大學管理學院教授黃麗華近日在2021世界人工智能大會上透露。
不僅如此,一些全新的數據產業框架正初現雛形,而正在全力推進數字化整體轉型升級,打造“國際數字之都”的上海,正在先行先試,數據交易所也將在社會主義建設引領區浦東率先成立。
01
蟬聯城市開放數據指數冠軍
什麼是數據?一個簡單卻難以回答的問題。對於計算機而言,它不過是0和1組成的電子符號,但在現實中,它可能是你在互聯網上不經意留下的一句話、雙11“剁手”的數十筆訂單、健康雲系統裏的一張核酸報告,或者在各種政府系統裏畫下的人生軌跡、被黑客買賣的一條條個人信息……那麼,這些數據究竟屬於誰呢?

圖源:網絡
黃麗華將數據分為兩類:公共數據和社會數據,前者因其產生業務的機構是國家機關,因此具有公有資產屬性,而後者,大多伴隨企業業務而生成,其權屬和利益分配是目前世界難題。
在相對權屬明晰的公共數據領域,上海已先行一步。
2019年10月,上海市為推動普惠金融,扶持企業發展,降低銀行業務風險,組織各政府部門公開數據資源,通過制度與技術雙重管理,將公共數據安全、合規、高效向社會企業有條件開放,形成了普惠金融試點應用。
大數據流通與交易技術國家工程實驗室數據資產評估中心主任張立鈞透露,截至今年5月,已有18家上線銀行對接,調用數據超過200多萬次,向銀行提供超過5.4萬家企業的信息,為中小企業貸款超過700多億,今年還會有超過15家金融機構參與普惠金融試點。
根據上海社會科學院綠色數字化發展研究中心發佈的《2021全球重要城市開放數據指數》,上海蟬聯全球重要城市開放數據指數的冠軍。

圖源:澎湃
截至目前,開放了5000餘項公共數據,形成8個標杆項目,11個領域大數據聯合創新實驗室匯聚1000億條行業數據,訪問量達9900萬人次。
02
公共數據應以共享為原則
“公共數據應當以共享為基本原則,不共享為例外。”目前,上海正在積極推動數據立法,上海市人大財經委主任委員戴柳表示,起草過程中重點考慮的四個核心要義是:數據是重要生產要素、數據的共享開放開發與安全保護、數據權屬與數據權益以及公共數據賦能與社會數據交易。

圖源:網絡
2021年3月5日,上海市發佈的《2021年上海市公共數據治理與應用重點工作計劃》明確提出,2021年上海要進一步推動形成全市數據治理一體化格局。這項工作的重點承接方是上海大數據中心。
據上海市政府辦公廳副主任、上海大數據中心主任朱宗堯此前披露的數據,截至今年5月,上海數據湖歸集數據658.59億條,跨部門數據共享調用65.33億次,跨層級數據交換244.28億條,數據總容量超100TB。此外,全市已經歸集了561種電子證照,隨申辦實名註冊人數超過5000萬,每天的訪問人次達2000萬左右。
不過,摸着石頭過河兩年之後,戴柳也發現,儘管成績明顯,公共數據的共享依然存在不少明顯短板:第一,儘管各個系統數據比較豐富,但數據煙囱依然存在;第二,高頻數據共享嚴重不足,根據國家權威部門統計,權威部委之間數據共享比例是個位數,如果是高頻數據,更只有這個比例的四分之一;第三,數據歸集的及時性和更新的及時性不夠;第四,基層部門難以分享到數據。
黃麗華團隊對接受普惠金融數據的銀行和企業走訪也發現,使用效果參差不齊。“很多企業並不知道這些公共數據到底有什麼含義,不理解數據,自然也無法與自己的需求做匹配。”還有不少企業向黃麗華反映,自己沒有數據加工和建模能力,拿了數據也不會用。
專家學者的擔憂在《IT時報》記者對城市治理的實地調查中也多有發現。一位區城運中心人士便遇到過這樣的尷尬:提出的某個數據需求報告,經過層層上報審批之後,最後拿到的數據卻根本不是自己想要的。
“數據質量不佳和數據難出湖,是兩個亟待解決的難題。”朱宗堯此前在某個論壇上如是表示。
03
數據應雙向循環
對於公共數據的進一步開放共享,戴柳提出三個原則:建立公共數據需求清單、責任清單、負面清單,簡稱三張清單;其次,明確共享應當是便捷的;第三,數據流動應該是雙向的,從基層收集上來再返回給基層。
所謂清單式大數據治理是以數據共享交換為核心理念,一方面,以責任清單和負面清單的形式,將數據使用安全風險轉嫁給以大數據中心為代表的管理方,使各機構“敢於”共享數據;另一方面,精簡業務流程、降低業務耗能的需求其參與“三清單”治理,使各機構“勇於”交換數據。
法律和技術也在進一步推動問題的解決。
星環科技為上海市和上海多個區縣數據中心建設提供底層支撐,其創始人兼CEO孫元浩告訴《IT時報》記者,隨着《上海市公共資源交易平台數據規範(試行)》發佈、上海市公共數據標準化技術委員會成立等一系列規範措施的出台,數據質量將逐步提升,而數據“出湖”,反哺基層,也將隨着技術的進步,可以工具化處理。他透露,目前正在為上海大數據中心開發一套數據加工服務工具,根據不同需求,設計邏輯和模型,從而加快數據成為產品之後的出湖速度,類似“隨申碼”這樣的數據產品,將在各行各業陸續見到。
法律層面,儘管國家層面的數據管理條例還未出台,但各地方政府早已開始行動,《深圳經濟特區數據條例》將於2022年1月1日起施行,上海、山東等地的數據條例預計今年年底也將頒佈。

“治理,毋庸置疑將是數字經濟的核心關鍵詞,沒有之一。”上海社科院綠色數字化發展研究中心執行主任李易表示。
04
數據交易進入3.0
相較公共數據,社會數據作為生產要素的應用市場前景更為廣泛,面對的挑戰也更加嚴峻。
**此前,政府掌握八成以上全社會數據資源,是不少高層決策的依據,但最近幾年,這個觀點已被顛覆。**國家信息中心大數據發展部規劃與應用處處長王建冬透露,根據去年的一個內部調研報告,全社會數據總量中,政府只佔20%,剩下80%是社會數據,包括互聯網數據、企業工業數據,而且這個趨勢將不可逆轉繼續下去,“未來是一個萬物互聯的世界,各種各樣的設備、物體都會產生數據,政府的數據佔比還可能進一步壓縮,甚至到2%”。
社會數據的爆炸,意味着未來數據要素市場有非常廣闊的空間,但首先要釐清的是,數據到底該如何交易?隱私如何得到保護?權益人的利益能否合理分配?
**國內大數據交易市場始於貴陽大數據交易所,成立於2015年4月,此後,國內各地興起一股大數據交易中心熱,截至目前,全國約有20多個數據交易中心。**但黃麗華認為,6年過去,大家依然還只是在探索,打頭炮的貴陽大數據交易所更是已泯滅於眾人焉,成了一座“空房子”。

圖源:網絡
最新消息,《證券時報》7月12日報道,貴陽大數據交易所目前業務陷入停滯狀態,國資正計劃全盤接管。
“大數據交易市場的模式,如今已經走入3.0時代。”李易此前告訴《IT時報》記者,隨着2019年數據作為重要生產要素地位確立,業內越來越明確,必須建立“數據可用不可見”新型交易範式,制定相關的數據管理條例,而大數據交易所必須具有鮮明的國資背景。
從本屆人工智能大會上熱議的話題來看,可信AI、隱私計算、聯邦學習等分論壇都座無虛席,通過技術將數據“脱敏”,乃至快速生成數據產品,已經成為對數據交易前提的共識。

圖源: 大數據技術標準推進委員會
黃麗華則提出更加系統性的建議:以國家戰略為指導,以現有法律為基本準繩,邊發展邊規範,培育與發展市場六大體系,如流通與交易規則、市場參與者、市場監管者、市場運營與合約服務、技術基礎設施服務和社會性保障體系,以證券市場類比,既有證監會、上交所,也有證券公司、資訊平台。
戴柳透露,**目前已基本明確,在社會主義現代化建設引領區浦東,建設一個數據交易所,此前上海數據交易中心已成立5年,在數據交易方面有經驗可循,接下去要進一步大膽探索。**但他強調,可交易的數據一定是經加工後的公共數據、脱敏後的個人數據、社會數據,同時要建立數據交易定價導則原則,數據的控制權、收益權、處分權可以單獨交易,也可以組合交易。
05
數據資產化“小步快跑”
當然,最核心的問題,或者説,最難的問題,依然是數據確權。
“這是個世界性難題,但如果等這個問題解決了,再來發展數據要素市場,顯然是來不及的。”黃麗華認為,全球各國都已經意識到數據資產的價值,紛紛出台相關的安全與管理條例,我們必須小步快跑。

圖源:IT時報
換個思路,數據確權的目的如果是實現數據資產價值並且分配的話,在社會數據權屬尚不明晰的前提下,數據資產化的嘗試並非不可行。
成立於2016年的上海數據交易中心,今年首次亮相人工智能大會,並宣佈攜手天津、內蒙古、浙江、安徽、山東、湖北、湖南、廣東、廣西、海南、四川、深圳等13個省市數據交易機構,正式成立全國數據交易聯盟。目前,由上海數據交易中心打造的中國開放數據平台匯聚超過1萬個高質量數據集,全國18省公共數據100000個開放數據集以及人工智能行業2000餘個高質量開放數據集。
中國電子信息產業集團副總經理陸志鵬則提出,數據交易只能是原始數據的衍生品,他稱之為數據元件。所謂數據元件,是指通過對數據脱敏處理,由若干個相關字段形成數據集,通過建模形成的數據特徵。通過對數據元件確權,在通過數據元件對數據產品進行賦能,從而實現數據資產鏈和數據價值鏈的深度融合。
“未來的數據交易市場應該是三級的,第一級市場是數據資源市場,第二級市場是數據元件市場或者要素市場,第三級市場是數據的產品市場。三級市場確權以後,產權、權屬、權益都會非常清晰。”陸志鵬認為,將數據資源交給市場配置,比在自己手上更有效率,更加公平,更加透明。
作者/IT時報記者 郝俊慧
編輯/王昕 挨踢妹
排版/黃建
圖片/東方IC、大數據技術標準推進委員會、澎湃、網絡
來源/《IT時報》公眾號vittimes