2%的人擁有80%的財富?警惕人工智能時代的數據幻覺_風聞
杜鸣皓频道-《数智经济》《轻资产时代》《金牌公关人》作者1小时前

昨天,跟招商銀行有關的一組“財富數據”衝上了熱搜第一,震驚了很多人——“2%的銀行客户,擁有80%的銀行存款”。
數據來源是這樣的,招商銀行佔2.35%的私人銀行、金葵花等客户資產高達10.82萬億,而招行整體個人存款總額是13.32 萬億。從數據上看,給人的感覺是——“2%的人佔據了80%的財富”,但真實情況是,招行的私人銀行業務是行業龍頭,國內很多資產超千萬的人,都把錢集中存到了招行等少數幾個私人銀行業務強大的銀行裏,所以這個數據並不具有普遍性;如果你去分析地方銀行的“存款結構”,同樣可能得出相反的結論——大家都普遍窮的很穩定,社會基尼係數很低。
其實,我們的生活有非常多這樣以偏概全的“數據”。人工智能時代,也是數據的時代,很多數據都有苛刻“前提條件”,如果人工智能時代的數據管理出現混亂,大量這樣“二次加工”的數據被廣泛傳播,就會出現“2%的人佔據80%社會財富”的誤判。
如果任由這樣的信息傳播下去,“社會輿情”就會密集出現,中國版的“阿拉伯之春”也可能會被別人用心的國家策劃出來。
今天就藉此聊一聊數智文明時代、人工智能時代的“數據治理”話題。
人工智能時代的數據治理,不是數據越“多”越好,也不是數據被“處理、加工的次數”越多越好,而是要遵循數據的基本規律,否則人工智能提供的信息可能就會錯亂,並影響到人們的日常生活。
如何做好數智經濟時代的數據管理呢?作為《數智經濟》作者,我認為要做好以下三點:
第一,儘量使用原始數據。
不要對數據進行非必要的整合,數據在每加工一次就會失真一次。人們已經發現,人工智能在訓練一段時間時候會“變傻、變笨”,因為在後期很多都是訓練的它自己生產的數據;自己吃自己生產的數據,這在生物學上相當於“近親繁殖”,人工智能上叫“模型漂移”,我們用國內主流AI大模型,就會發現一個問題,它們置信區間比較寬,回答的內容有很多錯誤,需要你去仔細甄別。
第二,標註數據條件。
數據絕對不是通用的,就像人類的科學研究一樣,每一個公式都有嚴格的“時空條件”限制,脱離特定的時空環境,它就不是科學了,而是謬論。我們隨便舉一個牛頓的公式、愛因斯坦的公式,沒有一個是普適性的,脱離了具體的“時空條件”設定,牛頓、愛因斯坦、波爾的科學都是“偽科學”。所以,任何數據都是有條件的,人工智能調用數據的時候,也要把數據條件同步調用過去,否則人工智能就不可信,國內AI大模型出現的回答“錯漏”,主要原因就在於“數據調用時出現了超出數據條件”的問題。
第三,要用區塊鏈保存連續數據。
區塊鏈保存的是有時間戳的連續數據。宇宙、事物都是動態的、變化的,動態的數據才能反映真實,而用新的數據覆蓋舊的數據的做法,是不可取的,脱離了事物發展的本質。關於這一點,“易經思維”可以説是人工智能時代的數據科學之母,因為易經處理數據的思維是“變化的、動態的、連續的”,易經是處理“不確定性”的科學思維,它不是在靜態數據中抽取“常道”,而是在連續數據中找到“非常道”。
未來,人工智能聰不聰明、可不可信,表面上取決於算法、算力,但本質上取決於數據,如果引用的數據都是錯誤的、不連續的、非原始的和超出數據條件的,人工智能就不可能正確,而且還可能因為數據錯誤調用而越來越笨,它自己都跟自己都會“打架”。
我們現實生活中,一定要養成這樣一個良好的習慣——當你看到一組“數據”的時候,不要立刻就相信它,而是一定要對它有三個追問:**它的原始數據是什麼?它的數據條件是什麼?這個數據是怎麼變化的?**三個問題都問清楚了,才能確認數據是否則真實、準確,越是在人工智能時代,越不要輕易相信被多次“加工”過的數據,數據每加工一次,就會失真一次。
未來的人工智能,進行倫理管理是有必要的,但同樣也要進行信用管理,當一個人工智能,頻繁對人類進行錯誤引導、輸出錯誤的信息,就應該給它“黃牌”“紅牌”“圈小黑屋”。當下,對人工智能進行“倫理管理”是很多人公認的,但我可能是第一個呼籲對“人工智能”進行“信用管理”的人,我也把它寫進了即將在今年出版的《數智文明》這本書中(“數智躍遷”最終將改名“數智文明”)。

| 科技道,數智經濟第一人(代表作《數智經濟》《數智經濟100大生產力躍遷(籌)》)
| 商業道,資產輕量化導師(代表作《輕資產時代》《商業向心力》《末端爆發》)
| 公關道,公關三十六計玩咖(代表作《金牌公關人》《無公關,不品牌》)