杜鳴皓:數智文明時代,“數據要素”是越多越好嗎?_風聞
杜鸣皓频道-《数智经济》《轻资产时代》《金牌公关人》作者12小时前
人類進入數智文明,千萬不要把“數據產業”變成第二個“房地產”。
答案:數據不是越多越好。
人們常説,數據治理就像是“治水”。
宏觀的自然系統裏,水太少會幹旱,水太多會氾濫,人類的數智文明系統也一樣,被束之高閣的“死數據”可以多,要經常維護的“活數據”要少,整體的數據量要追求適度合理,與社會發展相適應,數據量太少不足以支撐數智文明,數據量氾濫則勢必引發局部的數據災難,要動態維持數據量與整體社會算力、能源可承載的水平。
數據產業,應該像人體“腎臟”系統的治水看齊,人體的水液太多,就會得“蓄水病”,人就會反應遲鈍,變笨、變傻,數據作為數智文明時代的生產要素,它也需要像人體水循環一樣,時刻保持“代謝循環”,保持合理數據量,不可以無限制地持續增長。
人類數智社會的數據量越多,數據治理的難度就越大,對應的算力、電力等資源承載也會水漲船高,人類並不會因為數據量的絕對“多”而產生更聰明的AI,數據一味求多的不合理“治理”,反而會適得其反,讓智能系統讓人得了蓄水證一樣變“遲鈍、笨拙”。
舉一個例子,“比特幣”就是一個糟糕的數據治理案例,決定了它不會有未來。
它的區塊數據,會隨着交易的增加而無限增長,缺乏基本的數據代謝能力,跟腎水治水不一樣,人體會把一些水液排泄掉,但比特幣就像是貔貅一樣,它不排泄,最終會導致比特幣交易遲滯和去中心化失敗,它以犧牲整體系統的智能、敏捷為代價,確保個體交易的隱私安全和去中介化,這不是人類數智文明時代應有的數據治理範式,同時這也是人類未來發展區塊鏈技術和Web3.0網絡,需要特別注意的問題。
所以,相比於絕對數量的“多”,數據產業更注重合理數據量基礎上的“精”,同時,儘量不用合成數據,要用“元數據”,有人給元數據了一個定義,就是2022年大模型之前互聯網上的數據,因為後面的數據被AI污染了,被污染這一點是事實,但這樣定義非常不合理,言外之意好像2022年之後的數據就沒有“元價值”了,這是典型的數據歧視,其實,只要是一手數據都可以定義為“元數據”。
從宏觀的文明發展來看,整個人類歷史當中,曾產生浩如煙海的“數據”,但只有少部分價值數據被保留了下來,大量的其他數據成為了歷史的塵埃,為什麼人類不把所有的數據都保留下來呢?
因為人類文明負擔不起,數據量越多,所需要構建的人類文明系統就越重,它不利於人類文明的新陳代謝和持續進步,數智文明作為人類社會的第五文明,對數據“代謝”的治理態度,並不會有本質的區別。
人類進入數智文明,千萬不要把“數據產業”變成第二個“房地產”,推動從“地租時代”向所謂的“數租時代”轉型,幻想着只要創造數據就能收租賺錢,因為以量制勝的畸形數據觀,將會縱容各國政府的政績衝動,為保數據量而減少對非價值數據的正常代謝出清,甚至憑空造出很多低價值數據,導致出現嚴重的“數據泡沫”和數據調用困難,從而讓整體數智文明出現效率降低、智力蜕化,人類文明將因此遭遇數據反噬。