如何通曉當代人類全部科學文明?_風聞
汪涛_纯科学-自由撰稿人-纯科学创始人,致力于将完善的科学方法引入社会领域07-16 10:08
很多網友希望能專門對通曉能力進行一下介紹。這對第三代科學是非常重要的一個課題,本文就來整理相關的內容。
一、通曉當代人類全部科學文明的必要性和意義
在古代的智者中,可以見到不少通曉當時全部人類知識的智者。但無論是歐美、中國還是其他國家的學者,普遍認為在今天知識信息爆炸的時代已經不可能做到這一點了。也有很多人可能會認為具備這種能力沒有意義,無論是搞學術研究還是做實際工作,需要的是專業,只有在專業的狹窄領域精益求精,才能有效地出成果。這樣的分科與專業當然是永遠需要的,但人類也同樣永遠需要通曉自己所處時代全部的文明成就,否則一定會出現各類不同的問題。
1. 全科型專業領域的天然需要
有很多學科領域表面看起來是一個專業,事實上對研究者的知識結構會有全科型的需要。以經濟學研究為例,它就是一個需要全科型的知識結構為基礎才能進行研究的。
經濟活動包含了需求、生產、交易三個方面。無論是馬克思的社會主義經濟學還是微觀經濟學、宏觀經濟學等各個學派,都認為需求是無法直接去精確研究的。馬克思的經濟學將商品分為使用價值和價值兩個屬性,而後將使用價值抽象掉,只研究商品的價值。但馬克思因為最重視勞動,所以對生產過程有非常詳盡的直接觀察和研究。在《資本論》一書中用了兩章的篇幅來專門討論手工業和機器大生產的技術細節。
在微觀經濟學中對需求和生產兩個方面基本上都是做了最大程度的簡化,將一切經濟研究全都變成對各種數學模型的研究。以效用、偏好、預期、邊際收益等不同數學模型去替代對人類需求本身的直接測量和分析。生產過程涉及近乎人類當代所有不同學科的科技知識,基本上被經濟學家視為畏途。雖然也有人提出應當直接分析所有生產過程,但絕大多數經濟學家都認為這是不可能做到的事情。因此僅用一些抽象的生產函數來替代對生產本身技術細節的直接測量與研究。
這導致的結果是什麼?經濟學就變成一種打着經濟學各種名詞旗號的“異類數學”,是一羣數學水平和能力不足以達到直接在數學領域獲得任何成就,所以就把數學概念打上經濟學概念標籤來形成自己的職業領地,從而搞出一種異類數學。數學領域的學者們搞不懂他們在研究些什麼東西,而真正經濟領域的人也搞不懂他們在研究些什麼東西。通過這種“異類數學”,不僅可以為一批人找碗飯吃,一不小心還能蒙上個“瑞典中央銀行紀念阿爾弗雷德·諾貝爾經濟科學獎”。
至少在今天,整個西方學術界根本就沒有一個具備經濟學最基本研究能力的人,那些研究的東西必然都是不合格品,居然還能發出那麼多諾貝爾經濟學獎。其確切的名稱應當叫“瑞典中央銀行紀念阿爾弗雷德·諾貝爾異類數學獎”。客觀地説,因為金融等某些領域,其涉及的需求與生產知識較少,從而純粹的異類數學產生的問題還沒那麼大。這也是異類數學可以在這些領域發揮相對積極作用的原因所在。
事實上,經濟學領域有很多學者是意識到這一點的,只是另外一些學者認為要做到這一點難度太大,沒有實際可能性。所以經濟學研究的要點就是必須學會進行簡化。但全科型知識結構就是經濟學研究的必要基礎,在缺少全科型知識結構支持前提下的簡化,很容易導致出現實質性的偏差。
因此,如果不具備通曉能力,就不可能有正常的經濟科學。象經濟學這類必須建立在全科型知識結構基礎上的學科還有很多。如果不具備通曉能力,這些領域的研究雖然不説絕對沒有一點意義,但必然是充滿荒謬和錯誤的。這樣的領域還有:
**科學學。**這門學科本身就是要研究整個科學的,如果不具備通曉能力,不能理解所有當代人類科學知識,怎麼可能完善地研究科學本身呢?
**歷史學。**人類的歷史最重要組成部分就是整個人類科技知識,如果不具備通曉能力,歷史研究顯然是會存在欠缺的。
**數字化。**數字化是整個社會一切生產領域和社會領域的數字化,如果不具備通曉能力,如何保證對數字化有完整準確的理解?以我參與撰寫的華為《大交通時代》一書為例。這還僅僅是談交通行業數字化的書,但其涉及的專業領域已經是跨越數以百計:高速公路、高鐵、航空、地鐵、城市交通、橋樑、隧道、機場、高鐵站、地鐵站、高速公路服務區、智能交通監控、港口、船舶、航運、5G、雲計算、大數據、傳感器、導航、人工智能、物聯網、數據庫、身份識別、定票系統、支付、數字貨幣、財務、安全……這還僅僅是大類的專業領域,往下第二級的細分會有數量級的增長,要再細分到第三層就更多了。
這些不同專業領域不僅形成各自不同的“信息煙囱”,而且各種説法都不一樣,甚至對這個問題本身的描述都不同,有的叫“信息孤島”。各個細分領域的專家都很多,可是,要能夠把所有這些技術和社會領域的專業知識全都串起來,就必須要具備通曉的能力才可以做到。在這本書的撰寫過程中,我是唯一可以順利地穿通所有專業領域,並可以在通曉能力基礎上做出判斷的專家。參見:汪濤,華為《大交通時代》。


該書最後部分由我寫的評價
因此,即使一些並不一定要通曉當代全人類知識的領域,也需要接近於準通曉的能力,它還是需要通曉的方法和能力。
科技政策。政策的制定是要影響整個科技領域的,如果不具備通曉能力,如何保證制定的政策對整個科技領域的影響是正面的?但我們所有科技政策就是對科學一知半解的人制定的。我們所説的“一知半解”,並不是説他們就是外行,而是很可能制定科技政策的人,或者參與制定科技政策的資深科學顧問,都只能是各個狹窄專業領域的專家,他們不能通曉整個人類的科技知識,這樣的專業建議肯定都是有專業侷限帶來的偏差的。
如果有人就是故意要利用制定政策機會給自己創造尋租的條件,即使擁有院士、博導等頭銜的真正資深專家們,也可能説不出反對的理由是什麼。不是他們不想説,不敢説,而是真的看不清也説不清。因為只有在全科型知識結構支撐下,才能對科技政策有最客觀準確的理解和判斷。
2. 應對戰略忽悠和避免“殘缺性學術”的需要
可以説,戰略忽悠的基本原理,就是利用某些需要跨越很多專業學科領域才能準確理解的問題,通過故意去掉其中某些必要專業知識而形成的錯誤論調。因為經濟學本身就是需要全科型知識結構才能有效研究的學科,所以整個西方的經濟學最大用途就是用作戰略忽悠。
任何科學研究本身也都必然是要進行一定的抽象和簡化的,這就使戰略忽悠與科學的真正簡化之間很難進行有效的區別。但真正出於科學的研究目的而進行的簡化,是不能改變最基本的研究對象基本邏輯框架和結構,經濟學的研究必需要具備全科型的知識結構,原因是其研究對象本身就需要全科型的知識結構。只是在遇到具體問題時,可能還是主要涉及部分的專業範圍,可以針對具體問題進行有效的簡化,但不能對整個經濟學的學科進行非全科型的簡化。例如,當我們要談石油的經濟問題時,不僅要對整個石油的生產環節技術知識有系統的瞭解,而且要理解與其相關的一切能源技術的競爭性影響,上下游技術進步情況等。
我曾在**“中美關係——輕舟已過萬重山(下)”**一文中提到過一個美國“航母海上棺材論”的戰略忽悠。這個忽悠的基本論點是非常正確的,問題只是作為其前提條件的彈道導彈打航母的技術在蘇聯時代無法實現。如果前提不能成立,論點本身無論多麼正確都沒有任何實際意義,都只能是戰略忽悠。而前提條件是否成立,就必然涉及到非常不同的技術領域。因此,戰略欺騙的高手們從來不關注任何論點,關注的都是論點成立的前提條件是什麼。
我們再以當前社會上反對中國當年人口政策的一些論點來説明。只要有飯吃,人口當然是越多越好嘛,這個是清楚明瞭的,無可爭議的論點和真理。但問題就在於其基本的前提:人如果多到沒飯吃怎麼辦?由於當前中國生育率持續下降,這類論點似乎越來越受社會大眾歡迎。有沒有飯吃不是人口統計學問題、也不是消費能力和勞動力數量問題,而只是糧食專業問題。糧食可不僅僅是農學(主要研究種子),而且涉及到地理、水資源、氣候、土壤、能源、設施農業、化肥、其他農業相關物資生產、國際糧食市場、國際糧食戰略、人口發展史、饑荒與戰爭、糧食發展史等眾多不同專業領域。如果你不對這些專業領域有深厚研究和理解,就很容易被忽悠。
即使要研究如何促進生育率提升,也需要考慮房價、教育、生育投入產出等眾多不同專業領域。如果只是以“某個領域的問題不存在”(如糧食絕對不存在問題)等藉口去完全屏蔽某個必要專業領域的研究,在這類必需全科型或準全科型知識結構才能有效研究的領域,就必然會得出錯誤和純屬戰略忽悠的結論。
如果一種必須全科型知識結構才能研究清楚的領域,實際卻是建立在殘缺知識結構的基礎上,所導致的結果必然是一種“殘缺性學術”。當前有大量怪異的學術觀點,並不是因為他們有什麼創造性,只不過是因為它們沒有完備地研究應當研究的所有相關專業領域,從而必然存在不同的殘缺而導致的。
3. 中華民族文明覆興的需要
中華民族的文明覆興已經成為今天中國、全球華人和世界各國有識之士的共識。問題是:如何才能真正實現中華文明的復興?是僅僅從中國老祖宗的古紙堆裏翻出來一些東西去世界上推廣就可以的嗎?當然不可能。復興肯定不能簡化成古蹟翻修,而是必須站在當今全人類一切最優秀文明成就(當然也包括中國自身最優秀文明)的基礎之上,繼往開來、去創造性地開拓全新的未來人類文明。要做到這一點,就必須從整體上清楚地、完備地把握當今整個人類文明、尤其是科技文明的一切成就,這就必然要求具備全科型的知識結構才能真正做到。所以,通曉能力是真正實現中華文明覆興的基本功,不具備這種基本功,就必然存在一些深刻的約束和限制,真正的中華民族復興就可能只是幻想和奢望。
中華民族的復興當然需要能夠超越一切人類文明,包括當代的一切西方文明和古代中國的文明成就,使得人類的文明能夠邁上一個全新的台階和層次。如果不具備全科型的整體視野,怎麼可能做到這一點?
4. 交叉學科研究的需要
事實上,現代科學已經越來越進入跨學科的時代。因為在任何單一方向上,已經越來越遭遇理論極限了。宇宙大爆炸的時間也就138億年,而現在人類開發的望遠鏡已經接近可以看到138億光年遠的宇宙。整個宇宙可以被認知的極限也就是930億光年的直徑。對撞機可以測量的下限已經接近可以製造的技術極限。這也是中國大型對撞機CEPC和SppC爭議很多,遲遲定不下來的關鍵原因所在。
但是,這並不意味着説人類的科學發展就可以停滯了。縱向走得越來越難,意味着橫向走(橫向交叉)的必要性就越來越大。即使是很多純粹某一學科內部的問題,往往也是需要依賴於該學科以外其他學科專業的知識來解決。中國也越來越重視跨學科和交叉科學的研究。
2020年12月30日,國務院學位委員會、教育部發布《關於設置“交叉學科”門類、“集成電路科學與工程”和“國家安全學”一級學科的通知》(學位〔2020〕30號),設置了交叉學科門類(代碼14),和兩個一級學科(代碼分別為1401、1402)。
國務院學位委員會又於2021年11月17日印發實施《交叉學科設置與管理辦法(試行)》(學位〔2021〕21號)。
經中央編辦復字〔2020〕46號文件批准,國家自然科學基金委員會於2020年11月成立交叉科學部,成為基金委的第九個學部。
國家自然科學基金委上的介紹
交叉科學部下設綜合與戰略規劃處和另外四個分別管理不同交叉學科方向的處室。
官網上的各處室職能介紹是:
綜合與戰略規劃處:負責組織相關專家和科學處進行交叉學科戰略研討;制訂項目資助和學科發展戰略;統籌各類基金項目與行政經費的年度預算、資源配置和資助計劃等;負責科學部各類項目的綜合管理;制訂交叉科學研究的評價機制及管理辦法;負責科學部信息與網絡建設、政務管理和運行保障等;承辦科學部領導交辦的其他任務。
交叉科學一處:基於數學、物理、化學等基礎學科的交叉科學研究,面向國際科學前沿和國家重大需求,解決信息、生命、材料、能源、環境等領域的核心基礎科學問題,取得重大突破或形成新的學科增長點。
交叉科學二處:基於先進材料、現代工程、信息技術等領域的交叉科學研究,面向國際科學前沿、國家重大需求和經濟主戰場,解決我國社會發展過程中相關的工程控制、先進製造等領域的關鍵科學和技術問題。
交叉科學三處:面向人民生命健康,基於理學、工學、醫學等領域的交叉科學研究,發展生物醫學前沿技術方法,闡明生命相關複雜系統的多層次跨尺度相互作用與調控機制,揭示生命現象背後的科學規律和共性原理,探索生命健康研究新模式,應對人類健康與疾病防治中的重大挑戰。
交叉科學四處:基於自然科學的理論和方法,採用多學科會聚、多工具融合的交叉科學研究手段,研究人類社會發展過程中的資源開發利用、全球變化應對、人類文明演化、自然-社會耦合互饋等宏觀複雜系統,解決人類可持續發展中的重大科學問題。
這些交叉科學研究的進展當然會推動相關領域的進步。但是,交叉學科的交叉可能性,是一切學科相互之間進行交叉,以上不同處室間的學科也很可能是相互交叉的。所以,最好的交叉學科研究是基於全科型的知識體系,這就需要通曉能力為基礎。因此,真正的準確概念不是“交叉科學”,而應當是“全科型科學”,或“通曉型科學”。
5. 各專業學科有效及高效學習和研究的需要
正因為現在科技知識信息大爆發,更需要掌握全科型的方法。因為缺少全科型的認知方法,很多專業學科自以為的新研究成果,事實上早就在其他學科研究過了,只要簡單拿來就可以獲得更為完善的解決。這反過來導致了更多無效的,重複的學習和研究投入,帶來更多重複的知識信息。具備全科型的認知方法,即使只考慮單一的專業學科的學習和研究,也是最為有效的、高效的,甚至是越來越必須的。
6.其他
當前,美國對中國貿易戰輸了,科技戰,生物戰,軍事競爭,台海挑撥等都失敗或越來越處於下風。除了糧食戰爭、核戰爭,還有一個可能的優勢就是輿論戰。而美國輿論戰的絕大多數手段和着力點,都是利用了缺乏全科型認知能力的缺陷,人為製造和利用殘缺性學術的認知。因此,全科型知識是有效應對美國輿論戰最有效的武器,可對其一劍封喉。
另外,面對以GPT為代表的通用人工智能的爆發,人們只是在感嘆它會取代哪些職業,但為什麼不去考慮另一方面更重要的問題:在AI的時代,我們人類自身該如何發展和提升?成為全科型人才,是人工智能時代提升人類自身最重要的出路。人工智能最大的優點就是它不斷在進步和演進,人類自己也需要不斷地進步。進步的最簡單途徑就是能夠具備通曉當代人類一切知識的全科型認知能力。
二、通曉的難度
全科型知識結構和通曉能力的必要性和好處是顯而易見的,問題只是其難度,或者説表面看起來的難度太大了。
1. 數量太大
這個數量太大不僅是人類存量的知識信息量太大,而且僅每年新增的知識信息從純粹的數量上來説,就大到一個人要想全部接受的話,都難以想象的程度。
以美國國家科學委員會2022年1月發佈的研究報告為例,2020 年全球S&E論文(科學與工程論文)產出達到290萬篇。從2010年到2020年,全球S&E論文產出的複合年增長率為4%。一個人別説是把一年內的所有論文全看完,僅僅把每年全球所有S&E論文的標題、作者、摘要、關鍵詞等(假設平均為每篇論文有200字)看完,相當於要閲讀5.8億字,連做到這個都是極為困難的。假設一個人以每1秒鐘10個字的超快速度閲讀,其他什麼事都不做(不吃飯、不睡覺、不上廁所)一直連續不斷地保持這個超快閲讀速度,也需要671天(接近2年)才能讀完。
互聯網上的流量不僅規模巨大,增長也極快。2020年全球互聯網流量相比十年前增長15.9倍。2022年,僅中國移動互聯網接入的流量就達2618億GB,同比增長18.1%(數據來自工信部)。
2022年,僅中國上市新書就有17萬餘種,這還是相比2021年減少了約2.5萬多種的情況。一個人要在一年內讀完這17萬種圖書,同樣是一個難如登天的工作,更別提全世界圖書總量。
2. 差異懸殊
不僅知識信息的數量巨大,其學科差異也非常多,學科的類別成千上萬。
根據中國《學科與分類代碼》(GB/T 13745-2009),包含科學、工程技術與哲學、藝術、宗教等所有學科知識,共有62個一級學科或學科羣、676個二級學科或學科羣、2382個三級學科。
中國教育部出台的《普通高等學校本科專業目錄》(2023版),共分為13大門類、93個專業類和792個專業。研究生教育的學科有14大門類(增加交叉學科)、405個專業。
另外可作參考的還有:
《中國圖書館分類法》從A到Z,L、M、W、Y未用《學位授予和人才培養學科目錄》《國家教育部研究生專業參考目錄》《美國國會圖書館分類法》(Library of Congress Classification,簡稱LCC)美國教育部國家教育統計中心(NCES)公佈的《學科專業分類目錄2020版》(CIP-2020)
當然,如果從專業研究學科數量的學者們視角來看,學科的數量會更多。例如下面這篇論文中提到的學科估計數量是近萬。估計學科數量近兩萬的學者也有。
據統計,整個科學知識體系,迄今已包含近萬門學科。自然科學的分支學科、邊緣分支學科約有4000 ~ 5000 門,社會科學的分支學科、邊緣分支學科約有近 2000 門,交叉科學的分支學科、邊緣分支學科約有近 2000 門,哲學、數學、系統科學、思維科學的分支學科約有 1000 門左右。
不同學科不僅意味着更多的知識信息,而且掌握他們的思維方式等也差異巨大,甚至完全相反。例如,數學要求極端嚴謹、具有理想空間的思維習慣,但別説是藝術,即使是科學的測量又要求理解到一切測量過程都必然存在的誤差,並且要有極強的動手能力。軟件尤其互聯網軟件習慣於迭代的產品改進方式,但在船舶領域,不可能給你迭代的空間。造航母哪能允許你不行了就卸載重裝一個?機械與電子產品的流水線組裝,化工的高爐,礦山的開採,農作物的生長,牲畜的養殖與放養,房地產、道路橋樑、機場港口的建造業工程建設……各個行業差異之大,思維方式之不同,會使得習慣了某一個領域的人,在另一個領域以往的知識很可能成為巨大的障礙。
3. 資源獲得的困難
相比於前兩者,其實更困難的是相關資源的獲得。有些知識你可以到圖書館找本相關的書來讀就可以。但真正要學好一門知識可能涉及到很多業內的實際資源。例如學習生物學,如果根本沒有見識相關物種的機會,學習起來就非常難。要學習計算機,如果連計算機都沒有,要學習從何談起呢?
4. 其他
雖然以上困難都是客觀存在的,但更大的困難還是認知上的,當前全世界幾乎所有學者都認為今天一個人要具備通曉能力是一件不可能的事情。主觀的觀念上就認為不可能,那就根本不會去想,更不會去做,也就不會尋找到解決問題的辦法。
三、通曉能力的基本原理——消除冗餘
1.基本原理——消除冗餘
即使有如上所述的巨大困難,具備通曉能力依然是可行的。首先我們來討論其可行性和原理。儘管表面看起來現代人類知識信息的存量和新增數量都無比巨大,新增量還在不斷增加,所有知識信息相互間的差異懸殊,但深入研究就會發現,其存在大量的冗餘。所謂“冗餘”,就是重複的,並非真正新增的東西。例如,互聯網上流量巨大,但絕大多數都是屬於“複製——粘貼——轉發”這類操作,並沒有多少真正的新內容。
俗話有云“天下文章一大抄”,我們當然不能説所有文章都是抄的,當前通過網絡對文章查重的能力也很強,論文審查的一個重要方面也是查重。但這種查重僅僅是説不要最簡單地複製,如果改個名字,進行下簡單的修改,查重軟件就未必能查得出了。在有查重軟件的條件下,通過簡單修改,實質還是重複的內容依然佔據論文的主導。每年290萬篇科技論文,真正屬於新研究發現或創新的內容能有千分之一甚至萬分之一就不錯了。
如果直接去閲讀人類當前的知識信息存量及增量,這肯定是不可能實現的困難任務,但一切困難任務在被簡化到一個人可以完成的程度時,它就是可行的任務了。從消除冗餘的角度出發,就可以使通曉能力成為可行工作。
2. 信息壓縮技術的參考
以消除冗餘進行簡化本身都不算是全新的發現或方法。信息壓縮技術中已經有非常全面成熟的消除各類信息冗餘的方法,我做的工作只不過是將其總結擴展到知識領域而已。此處先系統介紹下信息壓縮技術的原理和方法。下面介紹的排序,是大致按普通人或非信息壓縮技術領域的專業人員理解起來從易到難的順序進行,並且為了使人們理解更容易,只解釋原理,並不完全是實際使用中的術語表達。
**消除重複的信息冗餘。**簡單重複就是最主要的冗餘。消除重複,也就是一種最普遍、最簡單的消除冗餘的方法。例如,在存儲技術中就有“查重”的功能,如果有兩個存儲的信息塊是完全一樣的,就可以把其中一個不再存儲,只在信息目錄裏標註它和另一個相同就可以了。這樣就省掉了一半的存儲量。如果有N個信息塊是完全一樣的,就可以接近節省N-1倍的存儲量。在視頻的信息壓縮中,有可能某一段視頻是靜止的,那麼,只要保留最初的一幀圖像,後面可以用最少量的信息標註上與第一幀完全一樣就可以了。這樣只需要一幀圖像加上極少量標註的信息,就可以存儲或傳遞很長一段靜止視頻信息。如果是網上轉發或複製粘貼的信息,當然只要看最原始的原創內容,其他就可以不用看,也不會對信息接收有任何知識內容損失。在傳真機的信息傳遞技術中,因為要傳真的一般是文件,而文件上的文字信息其實只有“空白”(可以用0表達)和有文字(可以用1表達)兩種情況。如果一行一行地掃描,就會形成一長串0和1組成的信息。因為文件的特點是要麼為大段的空白(很長一串0),要麼為一長段(如橫線)也可能是一小段(如文字的一豎被橫向截取一小段)1。如果有110個0,需要重複傳110次0,但如果只傳“110個0”這樣的信息,就可以極大地減少信息傳遞量。**消除絕大部分重複、少量差異的信息冗餘。**很多信息相互間不一定是完全重複,而可能是絕大部分重複,只有一小部分是有差異的。處理方法可以是隻存儲或傳遞兩個信息有差異的部分,其他部分標註上相同即可。例如在視頻壓縮中,對於並非絕對靜止的視頻,可以先傳最初的一幀完整信息的圖像(這個叫初始幀,一般用字母I表達 ),後面只傳與初始幀有差異的部分(稱為預測幀,一般用字母P表達)。由於有差異的部分是極少的,所以可以節省大部分重複的信息量。這個方法在視頻壓縮技術中叫“運動估計”或“運動預測”。另外還有雙向預測幀B,是根據前後兩幀來計算B幀的偏差值。最新採用的小波變換,可以更好地提取圖像中重複的對象塊,使得計算差異部分的信息量儘可能更小。**變換與丟棄次要的細節。**信息變換是一種相對抽象和複雜的方法。例如最主要的離散餘弦變換(專業名稱叫DCT),其原理是把圖像中某一塊原始空間域的圖像信息變換成頻率域的信息。這個變換要真正實現信息壓縮,一般需要與丟棄細節信息的操作相配合。它是把體現細節且數值極小的高頻分量直接丟棄掉。因為在一幀圖像內部從空間上看有變化的部分,在頻率域是體現細節的高頻分量,而大部分變化較小(大塊相同或相近顏色亮度的部分)的是低頻分量。可以説,低頻分量是一幀內存在的重複或大部分重複的像素信息。通過空間與頻率域的變換,大塊相同或相近的圖像,其頻率分量就集中在低頻部分,中高頻部分絕大部分數值為0或非常接近於0。將接近於0的頻率分量直接丟棄(歸0),會有細節損失,但損失極小,從而可實現“有損壓縮”。有損壓縮雖然會帶來信息損失,但影響非常有限,並且對於不同目的來説,可能會允許不同程度的信息損失。這一點是非常重要的,允許損失的信息量越多,就可實現越大比例的信息壓縮。**熵編碼。**常見的熵編碼有:香農(Shannon)編碼、哈夫曼(Huffman)編碼和算術編碼(arithmetic coding)。它的原理是根據消息出現概率的分佈特性而進行的無損數據壓縮編碼。出現概率比較多的信息就採用更短的編碼,出現概率較少的信息就採用更長的編碼,這樣在保持信息熵不變的前提下,最後總的編碼信息量更少,從而實現無損的數據壓縮。**其他。**信息壓縮也是一個專業細分學科,相關技術還有很多。但熵編碼、DCT、小波變換、運動估計等就是目前實際應用中最主要的技術。人們在電腦中經常使用JPEG等壓縮圖像使用了熵編碼和DCT,壓縮視頻等使用了熵編碼、DCT、小波變換、運動估計,而文件壓縮中一般主要使用的是無損壓縮的熵編碼。
四、獲得通曉能力的原理
1. 基本原理
事實上,通曉能力的基本原理與信息壓縮技術有極大的啓發性和延續性,只是知識壓縮更多體現在關注實際內容上(可稱為語義)的冗餘,而不是表面信息表達或編碼的冗餘上。例如對同一個知識點,僅僅換一種説法來表達,雖然從表面信息表達上看是很少重複的,但實際內容上卻可能完全重複。舉個簡單例子,是換一種自然語言來表達相同知識內容。
中文:太陽從東邊升起。
English: The sun rises from the east.
以上兩個句字從表面的信息表達看是高度不同的,但從實際內容看又上是完全一樣,完全重複的。在信息壓縮中,無論是消除重複,還是有少量差異的重複,DCT變換,運動估計(預測)等,都需要有一個初始的基礎,這個基礎(在視頻壓縮中是初始幀I,在圖像壓縮中是最低頻的分量)需要全部信息。要想實現知識的壓縮,也需要找到類似初始幀I這樣的“核心知識集”。這部分知識是需要全面吸收的。一旦有了這個基礎,就主要關注未學習知識與核心知識集之間的差異量,就可以快速學習了。
舉個例子,只要系統學習了數學上最具普遍性的數理統計學,其他幾十門“XX統計學”(生物統計學、醫學統計學、藥物統計學、人口統計學、森林統計學、勞動統計學……)的專業學科,你只要學習一下它們與數理統計學之間有差異的地方,一門這樣的學科長則幾天時間,短則半個小時就學完了。這個就叫“觸類旁通”。要實現觸類旁通,一定是絕大部分一樣,只有少量差異的不同知識體系。只要明白了這少量的差異,整體就全明白了,會有“一點就通”的感覺。所以,雖然知識壓縮與信息壓縮在原理上幾乎一樣,但在方法上信息壓縮側重消除冗餘的方法,而知識壓縮則是側重核心知識集的建立。我們先來説下基本的消除知識冗餘的方法和原理。
2. 消除知識冗餘
要對知識進行壓縮,從而可以用最少的時間和精力投入獲得最大量的知識,關鍵也是要消除知識冗餘。其方法原理與信息壓縮也是類似的:
**消除重複的知識冗餘。**轉發、複製拷貝粘貼、摘抄、引用……這些都是純粹重複的知識。當然,即使純粹重複的知識再看一遍,可能也有加強學習和記憶的效果,但不會帶給人新的知識。**消除絕大部分重複、少量差異的知識冗餘。**評論、綜述等還算是有點技術含量的“絕大部分重複、少量差異”,有很多純粹是換個説法、但又稍加點個人理解。**靜態差異、動態差異、高階動態差異。**靜態差異就是通過橫向比較不同知識點之間存在的差異,而動態差異是隨着時間的變化,同一領域的知識點會出現的變化。如果總結出知識信息隨時間變化的規律,就可以只關注動態差異與變化規律之間的偏差,從而使差異盡最大可能地減少。例如摩爾定律就是著名的半導體發展變化的規律,但它並不是絕對準確的,實際發展會與它有一定偏差,那麼只要關注實際發展與摩爾定律之間的偏差,就可以用最少的知識信息量去把握半導體發展的變化。後者就是高階動態差異。**適當丟棄次要的知識細節。**如果要求掌握一切細節知識信息,即使有了上述消除知識冗餘的處理,其數量可能依然會大到無法實現完全接受。但如果適當丟棄次要的知識細節,只在需要時去深入特定專業的知識細節,就可以節省大量的次要知識和信息量接收工作。
五、通曉能力的基礎——核心知識集
1. 數學
數學是整個科學的核心基礎之一,這一點不僅所有學者都會同意,而且在這個方面因數學本身的語言體系也比較統一,所以不會有爭議。只是需要説明一下數學本身並不是一個單一的學科,而是已經成為一個很龐大的學科羣。從對科學的意義和價值角度來説,可以把所有數學分為三個層次。
**最基礎的層次:**數理邏輯與數學基礎。它是現代公理化方法,可對比一下古希臘亞里斯多德的第一原理及四因説:質料、形式、動力、目的。這個是為科學提供最基礎的邏輯。
**建立在嚴格公理化基礎上的、具有演繹性的數學知識:**如數論、代數學、代數幾何學、幾何學、拓撲學、數學分析、非標準分析、函數論、常微分方程、偏微分方程、動力系統、積分方程、泛函分析、概率論、運籌學、組合數學、離散數學、模糊數學、數理統計等。
**可能存在近似的數學方法:**計算數學、應用數學、計算機數學等。
理論上説,一切科學都必須以數學作為其邏輯基礎。但現代科學的不同學科中對數學的應用程度是不同的。尤其是公理化方法並不是在所有學科中都能以最嚴格的方式遵守,甚至包括在理論物理學中,有些學者都認為並不一定能遵守最嚴格的公理化方法。在化學等學科中,更是難以採用公理化的方法。但這種情況的存在並不能否認數學、包括公理化方法是一切學科都應當樹立的標杆。
我在這個方面所做的突破性工作是通過引入時延,有效解決了循環因果律的問題,也就是把循環因果律還原成了經典因果。這個突破可有效解決大量以系統科學等為核心的現代科學方法(系統論、控制論、協同學、混沌學、超循環理論、耗散結構理論、突變論)與經典科學的統一問題。
2. 統一測量學
這個領域是我工作的重點。數學與統一測量學是一切科學的兩大基礎,是最重要的兩大核心知識集。有了這兩個核心知識集的支持,一切科技領域的專業學科都只不過是用相同的工具去做一道新的作業題而已。過去,各個學科在數學術語和方法上是比較統一的,但在實驗與測量問題上卻是各自為陣,專業術語各不相同。這種“只是換個説法”是知識信息冗餘的最重要體現方式。很多在統一測量學角度來看已經在某些學科中有效解決了的實驗和測量問題,在其他各個細分學科中不僅是大量低水平地重複解決,而且解決得不完備甚至是錯誤的。這種實驗與測量領域的“低水平重複建設”問題非常嚴重。以下就是各個學科對實驗和測量上“只不過換個説法”的結果:
物理學 實驗
化學 實驗、化學分析、儀器分析、計量化學
天文 觀測
地質 勘探
生理 解剖、活檢
歷史 發掘、探方、測年、斷代
新聞 採訪、訪談
社會 調研、考察
經濟 計量經濟學
軍事 預警、戰場感知、態勢感知、偵察、情報
……
我曾問過很多計量經濟學(也有叫經濟計量學,Econometrics)的教授和專業學者,是否理解這個學科中的“計量”一詞是什麼概念?幾乎無人能回答清楚。這個是當然的,別説是現在這個學科專業的人,就是創立這個學科,給這個學科起了這個名字,並且因這些工作獲得第一屆諾貝爾經濟學獎的拉格納·弗裏希(Ragnar Frisch)和簡·丁伯根(Jan Tinbergen)等人,他們都沒搞清楚,你們怎麼可能搞得清楚。當初他們是仿照“生物計量學”(Biometrics)一詞而起的名字。
但“生物計量學”又是個什麼來歷呢?牛津大學有個在測量學領域影響很大的學術刊物叫Biometrika,與生物計量學是同義的。這個學術刊物雖然名字叫生物計量學,但事實上就是測量學的專業刊物。一個很著名的例子是測量學中的“學生分佈”,也叫“t分佈”,提出這個方法的最經典論文“平均數的規律誤差”(The Probable Error Of a Mean),就是1908由威廉·戈塞(William Sealy Gosset)以“學生”的名義發表在Biometrika刊物上。
所以,生物計量學準確地説就是“生物測量學”。經濟計量學準確的術語應當叫“經濟測量學”。術語的偏差會帶來什麼後果?就是低水平重複建設,而且是有眾多殘缺和錯誤的低水平重複建設。
系統學習了“統一測量學”,這些學科也就是半個小時就可以學完、並且獲得的知識會比經濟計量學完備、準確、有效得多。學完經濟計量學以後,可能還是不知道該怎麼去測量市場需求尤其微觀個人或單一企業的市場需求、各個行業的甚至具體到某個企業某個車間的詳細生產過程、各種交易過程,但學完統一測量學後這些都不是個事兒。經濟計量學能做的事情,統一測量學絕對的100%都能做,並且比經濟計量學做得好上十倍、百倍。因為統一測量學是一切科學測量的全集。而統一測量學能做的事情,有很多經濟計量學做不了。大致來説,計量經濟學主要是採用統計學的方法,針對於宏觀經濟或某些行業的宏觀經濟數據進行統計,在此基礎上的一些建模、模型預測等。
3. 學科的本質——最大程度的精簡
為什麼有了數學和統一測量學這兩大核心知識集以後,還是需要各個專業學科?這就涉及到學科的本質在第三代科學條件下該如何理解的問題。過去人們只是簡單地認為科學就是分科而學,但事實上學科是某一些知識積累到一定程度,可以從中抽取出核心知識集,這樣就可以最大程度地對知識進行精簡。
但是,學科一旦出現,會帶來重大的現實社會的影響,因為學者羣會按照學科進行分工,學校,研究單位,職稱評價等都會按照學科進行歸屬。發表論文的學術刊物也會按學科進行定位。這樣一來,就會使學科帶來社會現實的巨大影響。從純粹科學的角度説,學科本不應當受社會現實左右的,但事實上並非如此。這是我們需要充分意識到的問題。
4. 八大專業核心知識集
心理和精神機械化學生物、農業、醫學電子信息、軟件金融法律、政治、管理戰爭、競爭、競賽與博弈
以上八大專業核心知識集的詳細介紹參見《實驗、測量與科學》第十八章 如何獲得全科型知識結構。此處要説明的是,獲得了這些專業方向的核心知識集,就可以在相應領域實現觸類旁通,而不同核心知識集之間可能會使專業人員有隔行如隔山的感覺。這種核心知識集當然可以更加細分,甚至細分到某一個很狹窄的課題。當然,人們可能會分出不同的,或者更加細分的核心知識集。這些核心知識集的形成不僅僅是因為他們表面上的知識更為接近,而且是因為其思維方式,基本方法等都具有相通性或從另一角度説就是更大的冗餘性。
獲得這些大的專業領域知識集是以數學和統一測量學兩大最核心的知識集為基礎,同時可以通過閲讀相關領域一些經典著作或經典論文。經典著作之所以成為經典,是因為他們可以更適合承擔該領域核心知識集的載體。它們雖然最初學習起來可能很困難,但當學完了以後,再學該領域其他著作或論文就非常容易了。
從理論上説,第三代科學的全科型方法和通曉能力在單一學科內也可發揮強大的作用。它不僅可以極大節省單一學科內學習新知識的難度,而且可以使任何單一學科知識更為完善。只是在目前階段,我個人的工作還是更主要把通曉方法應用在現在所説的交叉學科或跨學科研究上。
因此,我常對人説,如果一個問題解決不了,最好去找這個領域優秀的專家。如果很優秀的專家解決不了,就去找這個領域最頂尖的,諾獎級的權威專家。如果這個領域最頂尖的權威專家也解決不了的問題,你再來找我。
這樣説當然不是人家這個領域最頂尖的專家專業水平也還是不夠,而是説這樣的問題往往就是因為問題本身遠遠超過該專業學科範圍,涉及到其他學科,尤其是大量其他學科專業,需要用到全科型和通曉能力才可解決的。如果只是涉及跨越其他一、兩個學科,可能找到相關領域的專業人員請教一下別人就可能解決問題。但如果跨越的學科專業太多,例如達到10個、幾十個甚至更多時,一方面把這麼多不同專業學科的專家湊在一起本身就太難,另一方面即使是能把他們湊在一起了,相互之間也幾乎無法溝通,不知道你到底想幹什麼。
我希望人們能真正認識到通曉能力在各種場合都可以具有的價值。一般各個領域的人都不太歡迎非本專業的人跑過來發表意見,因為很容易導致外行之言,並且這樣的人往往只是喜歡簡單地從其他專業角度進行指責,但又不能真正解決問題,別人也不好説什麼。而我抱持的原則就是隻去為各個領域解決問題,不是添亂,更不是去搶屬於別人的飯碗。因此,無論我在任何領域寫文章和書,基本上都會得到這個領域專業人士甚至最權威專家的歡迎和認可。
致謝!在此感謝楊學志博士將他博士後論文提供給我作為寫本文的參考,正好其主題是研究小波變換在遙感圖像處理中的應用,論文中有非常豐富的信息壓縮技術介紹。
參考閲讀:(見純科學公眾號)
概念跨學科定義法——第三代科學方法論介紹
第三代科學意味着什麼?
上交大學術講座:第三代科學與經濟學
第三代科學與我們的機遇
通曉當代所有科學文明成就——中國如何領導世界(六)
CEO小班課:第三代科學
科學地證明科學始於測量
正確的認知來自科學的測量方法

