莊朝暉:人工智能的皇冠問題——人工創新_風聞
chzhuang-2021-05-10 20:07

一直以來人工智能的研究目標是通過圖靈測試,圖靈測試的目標是能夠機器模擬普通人對話方面的智能。這個目標已經基本接近完成,現在有必要提出更高遠的目標,也就是讓機器人模擬科學家的智能,進行人工創新(Artificial Innovation),設計“人工牛頓”,“人工愛因斯坦”。這個目標可以稱為人工智能的皇冠問題。
現有的人工智能領域,跟這個問題比較相關的是非單調性研究。非單調性,指的是舊有知識可能會被挑戰甚至推翻,會被新的更準確的知識所取代。例如在科學創新和偵破案件中,就體現了典型的非單調特徵。我認為,一個完整的非單調研究,應該要能夠刻畫科學上的理論創新和偵破中的非單調模式。例如黑體輻射問題,直接引出了普朗克的量子論。這裏黑體幅射是如何挑戰舊有的理論?機器能否像人類一樣創造出量子論?這就涉及到人工智能最核心的問題之一——人工創新。
1、非單調性根源自知識基礎的非單調性
一個完整的知識系統包括知識庫和推理機制,知識庫相當是前提起點和內容,邏輯推理機制相當是推演步驟和方法。現有的非單調研究,主要集中於各種非單調性推理機制的研究。我認為非單調性,並不是根源自推理方法的非單調性,而是根源自知識庫的非單調性。例如,量子理論取代非量子理論,並不在於使用了不同的推理方法(都是使用溯因推理方法),而是創造和使用了新的假説和理論。再比如在偵破案件中,也經常會有以前接受的證據後來被推翻的狀況,這時候也會更新或者推翻以前的結論。這裏作為非單調性根源的假説和證據,都是知識基礎。但是,現有的知識庫並沒有區分知識的種類和來源,從而不能有效地進行更新。
所以,我認為非單調問題並不是根源自推理機制,而主要根源自知識基礎的非單調性。現有的非單調研究都集中於非單調邏輯推理的研究,我認為是走了錯誤的方向。非單調推理研究幾十年了,始終沒有大的進展。我認為非單調性的研究,應該主要是對於知識基礎的重新分析和研究。知識是如何獲得的?知識有沒有不同的類別?知識的理由是什麼?知識被挑戰或推翻後如何更新?
2、對於知識基礎的重新分析
對於知識基礎的重新分析,就涉及到哲學上的認識論,所以我在認識論層面先對知識進行重新分析,梳理西方認識論對於知識的觀點,發現西方知識論經常要麼走絕對主義(知識是永真的)要麼走相對主義(知識與一般信念一樣),這種思維就影響了人工智能的研究。傳統知識庫的設計中帶着上帝的視角,做了這樣的預設:知識一經被接受為真就會永遠為真。在傳統的知識庫中,並不保存知識之所以為真的理由。這也導致當舊有的知識被挑戰或擊敗時,我們無法確認問題發生的位置來進行準確的更正和更新。
所以,我對於知識進行了重新分析[1],在2014年的國際分析哲學會議發表了A Re-analysis of Knowledge[2]。這篇主要是哲學層面的研究,認為知識應當進行分類研究(六類知識:事實,定義,邏輯真理,演繹所得,歸納所得,溯因所得),不同類別的知識有不同的理由(/依據)。這些挑戰西方論識論的哲學成果,在中國分析哲學界是有震撼影響的。
舉個例子,“所有的鳥都會飛”(命題1)和“所有的鳥都是動物”(命題2)這兩個命題,雖然結構上一樣,但是依據是很不相同的。命題1是來自歸納,命題2是來自定義(/約定)。所以,我提出了應該區分這兩種“所有”,使用不同的邏輯符號來表示。這是弗雷格以來,對於“所有”分析的一個補充。
例如,“所有的鳥都會飛”,這是歸納所得,當被事實質疑的時候,是可以被擊敗和更新的。“所有的鳥都是動物”,這是定義,如果被事實質疑的時候,首先應該考慮是不是事實錄入錯誤了。這兩者結構上相同,但是本質上是很不相同的。所以,我提出使用不同的符號來表示這兩種“所有”,就好像自然語言的“或者”,符號上有析取符和異或符兩種表示。
科學上的基本假設和偵破中的假設,則主要是來自溯因推理所得,當面臨事實(包括判決性實驗)質疑的時候,這時候可以使用算法來自動抉擇一個更合理的假設。所以,我提出這種方法就是來自前人的科研實踐,也符合生活中的非單調實踐。
3、知識應該附帶上它們的理由
在計算機層面,我做了知識結構的改變。知識是因為它們的理由而成立的,而且不同種類的知識,他們的依據和被挑戰的方式是很不相同的。所以,知識庫裏面每條知識應該附帶上它們之所以被認為成立的理由及推理方式。
這個觀點的基礎就是邏輯學的第四大定律:萊布尼茲的充分理由律。我們之所以接受某個知識,是因為接受了這個知識的理由。日常生活中,如果兩個知識是衝突的或矛盾的,這時候我們是檢查這兩個知識的理由,來評判誰更加準確。
現有的知識庫,每條知識直接列出來,沒有附帶理由。這其實已經違反了充分理由律,知識就被誤認為是無條件成立的,從而被誤當成不可置疑的公理。這樣的知識庫設計,知識要麼就是被認為100%正確,要麼就是認為一錯全錯不容修正。
中文成果“一個帶有依賴關係的知識庫”發表在廈大學報[3],英文成果也發表在2014年知識發現的國際會議上並做了主題發言[4]。
現在使用的知識表示,還是單調邏輯時代的產物,本來就沒有考慮知識需要更新的時候怎麼辦,所以每條知識都沒有保存它們的類別和理由。所以,為了適應非單調推理,知識表示也應該提出新的表示方法。所以,我就根據哲學上的知識論,整理和提出了六種不同種類的知識。這六類知識有不同的類別,在被質疑,反駁或者證偽的時候,也有不同的更新或改變方法。現在所提出的六類知識是:事實,定義,邏輯真理,演繹所得,歸納所得,溯因所得。
4、小結
我認為,非單調性的問題不在邏輯推理,而在知識基礎。知識庫應當進行重新的設計,比如我提出的知識分類,並且每條知識的表示要附帶理由和所用推理方式。這樣人力與計算力的結合,才有可能更全面解決非單調推理問題,甚至有可能做人工創新(Artificial Creation)。舉個例子,比如法庭上雙方有不同意見,這時候就是列出意見的理由,然後法官根據理由的支撐程度,再來判斷哪個意見更有道理。從知識庫的結構革新,也才有可能進一步推進萊布尼茲的夢想,未來才有可能出現機器人科學家。
在邏輯學上,也做了一個小小貢獻,區分了兩種“所有”。兩種“所有”的區分有可能會進入未來的邏輯教科書。就好像自然語言的“或者”,也有兩種意思和符號“析取”和“異或”。
這種方法需要對於現有的知識進行重新的分類和表示,所以是一個很大的知識工程。當然,實踐中,也可以先選擇一個較小的領域開始研究,比如偵破推理或者法律辯論。我認為,神經網絡因為深度學習的出現而重新興盛起來。知識工程也可能因為知識表示的新方法,而重新興盛起來。當然,這需要領域專家的人力進行知識的重新分類和表示,也需要充分利用計算機的巨大計算力。
上面是拋磚引玉,也希望有專家能夠接上去研究。我認為,這個領域是一片科研的藍海,也是中國人工智能實現彎道超車的一種可能。
參考文獻:
1、莊朝暉,關於何為知識的思考,“科學視野裏的佛教”研討會,山西太原,中國佛教協會主辦,2008年10月(編入《佛教.文化.科學.慈善》,中華宗教文化交流協會編,上海辭書出版社,ISBN978-7-5326-2823-0,P328-P337)
2、Chaohui Zhuang, A Re-analysis of Knowledge, Beijing International Conference on Analytic Philosophy, Beijing, China, Nov. 15, 2014.
3、莊朝暉,一個帶有依賴關係的知識庫,《廈門大學學報(自然科學版)》,第50卷第6期,2011年11月,989-993.
4、Chaohui Zhuang, a knowledge base with dependencies, Proceedings of the 2014 11th International Conference on Fuzzy Systems and Knowledge Discovery, Xiamen, China, Aug., 2014.