祛魅科學(四):數據僅能用數值記錄狀態,卻無法記錄運動而生命在於運動_風聞
道学民科-02-12 22:48
最近不是ChatGPT刷屏了,不論大數據還是AI最基礎的就是數據了,正好我最近看《三體》電視劇琢磨三體問題有些小收穫,算是有了金剛鑽,可以攬數據這個瓷器活了。慣例先聲明:如果把大數據和AI看成一種工具的話,我永不反對,還會非常歡迎,好用的工具誰不愛。
先説數據怎麼產生的?以我這水平一貫的按照刻板印象來,我敲一下鍵盤馬上就產生了數據,用科班的話來説數據因運動而產生。有人會問,要是不動也能產生數據呢?請你參考絕對零度。既然數據是因運動而來的,那麼我用一個簡單的例子,描述一下整個過程,大家自然就能看出問題所在。
從山腳到水邊有百米遠,狗以每秒一米的速度,花費百秒可以從山腳走到水邊。這是一個經典的完美的運動描述。能被記錄下來的是什麼?山腳到水邊的距離,狗的速度,花費的時間。至於狗是如何從山腳到水邊的,有記錄嗎?有人會説二哈是走着過去,京巴説不定是小跑着,茶杯犬必須要衝刺才行。別廢話了現在就假定是細犬走着過去,那麼細犬第一步是邁左前腿還是右前腿?邁腿的時候尾巴搖不搖、舌頭吐不吐,鼻子嗅不嗅?我這一切都是為了記錄下運動。到這裏大家要質疑我九年教育白學了,其實沒有,我是知道公式:距離=速度×時間(100=1×100)。對比一下前面的自然語言描述,大家發現了吧,數據只能用數值來記錄狀態,卻無法記錄運動。而運動需要公式、定理、定律來表達。一旦用公式,定理,定律來表達運動,參考祛魅科學(二),失真的問題就不能忽視了。
有人可能不好理解,為啥數據無法記錄過程。我再舉一個例子,大家都看過電影吧。那種老式電影是用膠片的,膠片是一幅靜態的圖像,通過每秒三十幀的運動,這才能讓人眼看作連續的運動成為電影。放電影的運動能記錄下來嗎?再拿一台攝影機錄一下不就行了,完成記錄的是攝影機裏的膠片,膠片是一幅靜態的圖像,請問記錄的運動呢?這個描述是有些燒腦,但能確定的是運動是無法記錄的。
既然數據無法記錄運動,運動的表達依賴公式、定理、定律,失真就不可避免。萬幸的是人類出了位馮•諾伊曼,發明了計算機,數據的計算處理就有了新的辦法。人就可以把更多的精力投入到失真的問題上了,今天的大數據和AI其實就是縮小失真後才體現了價值。咱曾經也當過一段時間的碼農,所以高級編程語言也會一點,也知道編程三板斧:賦值、if判斷、for循環;往上走就是遞歸、遍歷、迭代;計算機最拿手的是窮舉法,數值解窮舉來近似的完成解析解。大數據指的是數據量大管飽;AI指的是算法精妙,兩者結合完成對失真的調製,主要應用迭代和窮舉達成最優解。這也僅僅是治標不治本,現在看起用大量數據加精妙算法完成了失真的收斂,以後隨着數據量的繼續迅猛增加,失真還能控制的住嗎?
數據只能用數值來記錄狀態,而數值是關於量的抽象,公式、定理、定律又是一種基於抽象後的量而建立的,如同老話説的螺絲殼裏做道場。不論大數據還是AI都針對的是可量化才能應用,對於無法量化的是無能為力了。而眾所周知運動是無法量化的,生命恰恰又在於運動,一個生命無法運行意味着死亡。現在説的數字生命這四個就是一個悖論組合,數字是可量化的,生命是不可量化的。以後真有數字生命也應該叫作數理生命,數理是可以包含“不可量化”這層含義的。
最後説説別看ChatGPT刷屏,好像很厲害,那怕以後的人工智能更厲害,請大家不要忘記所有的這些都是基於精妙的算法才成立的,而精妙的算法是人設計的。當你面對像ChatGPT這樣看起來匪夷所思的機器時,最容易忽略的就是這台機器也是人設計製造出來的。就如同大家現在習慣了各種公式、定理、定律之後,而忘記其失真的事實。更重要的是人不會設計製造一件無意義的工具的,而任何一件工具都不可能只有好處,或者是隻有壞處。
我非常希望有人能證明運動是可以量化的,那麼意味着以後可以走直線了。
又算是蹭了熱點的尾巴了,從ChatGPT刷屏到現在時間不夠,我自己瞎想的也沒有琢磨透徹,寫出來的東西只能求上天保佑能自圓其説,湊合的看吧。這次ChatGPT刷屏的熱點,還有一個感慨,就是現在最不科學的就是,科學教只講科學不講人,沒有人才是科學教的科學。參考《小破球二》馬兆名言:“沒有人的文明,毫無意義!”。