袁嵐峯:中文知識庫建設還得加把勁
作者:袁岚峰
筆者經常用論文、專利等指標,來論證中國的科技水平比一般人想象的高,實際上跟英國、法國、德國、日本處於同一層次,只跟美國有顯著差距。但是論文、專利反映的是前沿研究水平,人們平時接觸更多的科技內容,還是來自教材、網頁等知識庫。而在這個方面,中文跟英文的差距不小。
以我講過課的物理化學為例,國內的教材雖然已經有許多種,但還沒有一種比得上牛津大學Peter Atkins教授的名著。Atkins教授可以説把一生都貢獻給了這套物理化學教材,不斷修訂再版,他的名字成了一個著名品牌。在內容的準確性、內容的邏輯關聯、解釋的易理解性等方面,都可以看出雕琢的精心程度。而中文教材即使內容很豐富,往往也缺乏條理,令學生迷失在大量的記憶之中,或者缺乏解釋,讓學生感覺這些理論好像天上掉下來的,又或者思路過於劍走偏鋒,從高深的概念(如熵)出發推導日常可見的概念(如温度),令一般的學生望而卻步。廣而言之,在整個自然科學領域,優秀的中文教材都太少,遠低於在前沿研究重要論文中中國學者所佔的比例。
再來看網頁方面。由於工作的關係,我對網絡知識庫用得比大多數人都更頻繁。我的基本印象是,在這方面中文跟英文的差距比教材方面還大。
舉一個最近的例子。計算機科學中最重要的未解之謎是“P對NP問題”:所有的可以快速解決的問題的集合叫做P(快速的意思是,計算量是問題規模的多項式),所有的可以快速驗證解的問題的集合叫做NP,那麼P是等於NP,還是真包含於NP?也就是説,能夠快速驗證的問題是否都能快速求解?我看了維基百科,感覺大有收穫。這個詞條內容十分豐富,像一篇井井有條的論文,任何人看完以後都可以對這個問題獲得相當深入的瞭解。而看國內百科,相比之下就寫得差遠了,東一榔頭西一棒槌,許多重要的東西沒寫,不重要的東西倒寫進去了,不少表述很模糊,甚至還有一些錯誤。讀者看完這個詞條,只能知道幾個術語,但對這些術語的內涵還是所知甚少,甚至可能被誤導。
我説這些,絕不是要指責國內百科。無論如何,有知識庫比沒有要好得多,有無是質的區別,做到什麼程度是量的區別。國內百科以及廣而言之的中文網絡知識庫,已經對社會做出了相當大的貢獻。我在這裏想強調的是,差距客觀存在,而且我們現在有條件、有能力去改進,我們應該去改進。
台灣人朱學恆主持了麻省理工學院開放式課程計劃的中譯計劃,還翻譯了奇幻文學名著《魔戒》(譯林出版社2011年10月第一版),他在此書的前言中説:“一個文明的知識數量,決定了這個文明的力量和影響力。終有一天,也許是在華盛頓的某所高中,也許是在西雅圖的某所公立學校會有一個高中生舉起手,問他的老師説:‘老師,中文那麼難學,為什麼我們還要看那麼多中文書呢?他的老師深吸一口氣,很認真地告訴他:‘孩子,因為最先進的知識要看原文書,才有競爭力呀!’”
這樣的情懷和願景,令人動容。(作者是中國科學技術大學合肥微尺度物質科學國家實驗室副研究員,科技與戰略風雲學會會長)