AI是理性的,人類是非理性的,果真如此嗎?_風聞
返朴-返朴官方账号-关注返朴(ID:fanpu2019),阅读更多!2021-07-15 11:17
一階謂詞邏輯、概率論、計算理論等規範性理論模型並不是為了解釋人類智能、認知、思維、意識等現象而建立的,為什麼要理所當然地把它們作為普適的規範性模型——或者説 “理性”—— 的一般標準呢?
撰文 | 王培(美國天普大學計算機與信息科學系)
“人是理性的動物,但卻常常做非理性的事”,這種貌似矛盾的説法差不多算是老生常談了。本文不是要語出驚人地唱反調,只是想討論一下,“理性” 的標準是什麼,而理性動物們怎麼就做出非理性的事來了?
理性這個話題可以算源遠流長了。開始是個哲學論題,後面邏輯學、心理學也加入進來,直到成為經濟學等社會科學的基本概念,而到我這裏,自然最後還是會拉到人工智能的設計問題上來。
心理學從總體上説是描述性的理論,其目標是發現人類心理活動的規律性。但是,心理學在研究推理和判斷這樣的心理活動時,與規範性的理論發生了密切聯繫,而後者來自於數學、邏輯學、決策論、博弈論、倫理學等學科和領域,其目標是確定 “人應該怎麼做才對”。一類常見的心理學研究是把一個描述性模型(人實際上如何推理和判斷)和一個規範性模型(人應當如何推理和判斷)相比較。如果二者相符,那麼人在這個方面的行為就算是理性的,否則就算是非理性的。
下面讓我們分析心理學中兩個最常被用來顯示非理性行為的例子。有興趣的讀者可以先根據自己的自然反應回答這兩個問題,然後看看自己的答案是否也在非理性之列。
“選擇任務”
桌上有四張卡片,上面分別標有D,K,3,7。
這些卡片都是一面標有字母,而另一面標有數字的。
你的任務是:翻動最少的卡片,來確定下面“普遍規律”的真假:
“如果一張卡片的一面是D,則另一面就是3”
這個簡單實驗是心理學家Peter Wason五十多年前設計的,一般被稱為“華生選擇任務” 或 “四卡問題”(the Four-Card Problem)。這個實驗及其各種變體(如修改卡片上的標記)已經在世界各地的不同人羣中被重複多次,其結果相當一致。當然,不同的人表現不同(比如有人把所有的卡片都翻過來檢查,也有人隨便翻),但總的説來,被翻最多的是標着D的那張,其次是3,再次是7,最少的是K。
根據目前公認的 “經典邏輯”(一階謂詞邏輯),上述待驗證規律可以嚴格表述為全稱命題:“對論域中的每個對象而言,如果它是一面標有D的卡片,則其另一面一定標着3”。
既然這一規律的描述對象只有那四張卡片,那麼只要其中有一張不滿足此描述,命題就不成立(為假),否則命題成立(為真)。很顯然,D卡片的另一面如果不是3,則該卡片為反例,命題為假,其它卡片就不用翻了。如果D卡片的另一面的確是3,那説明此命題對該卡片成立,即該卡片為正例。
但既然全稱命題説的是 “每個對象”,那麼找到個正例仍無法確定命題的普遍有效性,所以還要查下去。
類似地,如果3卡片的另一面是D,即該卡片構成正例,否則(比如另一面是A),則其既非正例又非反例(因為它根本不是一面標有D的卡片),因此,無論3卡片的另一面是什麼,對確定此全稱命題的真假均無貢獻。而7卡片的另一面如果是D,它就構成了命題的一個反例,否則與命題無關。最後,不管K卡片的另一面是什麼數字,都和此命題的真值無關。
綜上所述,此問題的正確答案(根據一階謂詞邏輯)是選擇翻動標有D和7的卡片——以檢查它們是否構成所考察命題的反例,找到一個就夠了,而不動那兩張標有K和3的卡片。
你答對了嗎?
一般而言,普遍性結論在一階謂詞邏輯中被表述成全稱命題,其真值完全取決於是否存在反例,而與正例的存在與否或多寡無關。
但是,在面對此類問題時,人們往往對正例更關注,卻不那麼關注反例,這是 “不合邏輯的”,自然也就被判定為 “非理性行為” 了。
心理學家Peter Wason(1924-2003)在倫敦海格特公墓(Highgate Cemetery)的墓碑。墓碑下方刻着他設計的選擇任務,也稱為“四卡問題”。來源:wikipedia
“合取謬誤”
當結論不是非真即假,而是有不同程度的不確定性(或者説正確性、可能性)時,目前公認的規範性推理和決策模型是基於概率論的。這是因為,在很多實際問題的解決過程中,概率論已經大顯身手,更重要的是,人們已經證明,違反概率論會導致不良後果(比如陷入必輸的賭局)。
不過,心理學家們多年來進行了大量的實驗,取得的結果已經充分説明,人類的推理和判斷顯著不同於(不符合)概率論的要求。在這些研究中,影響最大的當推Amos Tversky 和 Daniel Kahneman的研究。下面就是他們給出的一個例子:
琳達是個31歲的單身女性。她説話直率而且非常聰明。她在大學時主修哲學,那時她就對歧視和社會公正等問題深感關切,而且參加了反核遊行。
下面哪句話成立的可能性更大:
(A)琳達是個銀行櫃員。
(B)琳達是個銀行櫃員,而且還是個女權運動積極分子。
實驗結果表明,大部分人會選B,但B要求琳達同時符合兩個條件(邏輯上叫做“合取”),而A只要求其中之一。根據概率論,任何東西同時符合兩個條件的概率不可能大於只符合其中一個的概率。這就是説,大部分人在這類問題上都違反了概率論。既然概率論代表着理性,人的這種選擇就是非理性的了。這就是所謂 “合取謬誤”, 又稱 “琳達問題”。
Tversky 和 Kahneman提出的解釋是,人們常常把 “代表性” 誤認為概率(即事件的發生可能)。當對琳達的描述符合人們對 “女權運動積極分子” 的印象時,人們就傾向於斷言她不僅僅是個銀行櫃員,而沒有考慮到增加了一個條件反而會降低結論的成立可能。
誰錯了?
既然有確切證據表明人類思維活動在某些方面不符合作為理性標準的規範性模型,那我們似乎就應該承認這種缺陷,並儘量設法避免其不良後果,這是目前學術界的主流意見,Kahneman也因相關工作獲得了2002年的諾貝爾經濟學獎(Tversky已於1996年去世)。
但也有少數人不認同這個結論。既然人類思維規律是長期進化的結果,怎麼會有這麼大的缺陷?會不會是那些規範性模型錯了?
這聽上去像是諱疾忌醫,因為用邏輯和概率論推出的結論應該比人的直觀判斷可靠多了。但這事還真沒這麼簡單。像我在《面對複雜現象,怎樣找個靠譜的解釋?| AI那廝》一文中所説的,對同一個現象往往可以找到多種解釋。有些研究者不認為上述心理實驗結果能説明“人是非理性的”,因為他們對這些結果給出了不同的解釋。在本文中,我不打算逐個介紹這些解釋(因為實在太多了),而只想談談我的看法。
我曾説過,每個規範性模型都是以某些 “公理” 或 “公設” 為前提條件的(詳見《能否用數學確定美國大選是否舞弊?| AI那廝》)。
但是,這些前提儘管看起來很有道理,卻不是對任何情景都適用的。如果在前提條件未被滿足的情況下使用一個模型,其結論就失去了其規範性,也就未必是理性的了。
一階謂詞邏輯作為數理邏輯的核心,是按照數學中定理證明的要求所設計的,而一個命題被證明為定理的必要條件之一,就是不能有反例。因此,在這種邏輯中,把 “真“ 看作 ”沒有反例” 是完全合理的,而是否有正例完全不影響一個全稱命題的真值。
比如説在華生選擇任務中,命題 “如果卡片的一面是空白的,則另一面是3” 就是真的,因為所有卡片都不滿足條件,因此這個 “規律” 就沒有反例。這個結果與很多人的直覺相反(這是所謂 “藴涵怪論” 的體現,在此不細談)。
在經驗科學和日常生活中,當我們評價一個結論的真假時,通常正、反例都是要考慮的,而一個 “正確” 的結論應該正例多而反例少(當然沒有反例更好),也就是説起碼要 “在通常情況下成立”。此時,人們通常不會因個別反例的存在而拋棄一個理論,而是會去尋找“化解” 反例的方法(比如重新解釋觀察,添加輔助假設等等)——這和在數學中的情形截然不同。
這就是我對華生選擇任務的解釋:大部分被試表現出尋找正例的傾向,因為在他們的日常推理活動中,結論是否正確,與正、反例都相關,而且正例比反例更容易識別。當然,這不是説在這類問題上人就不會犯錯誤。在選擇任務的某些版本中,題目擺明了是要找反例,比如説,如果要確定一間酒吧中是否有未達到法定年齡的飲酒者,那麼該查的是一個少年在喝什麼和一個飲酒者的年齡,而非一位老人在喝什麼或一個喝果汁的人的年齡。
“琳達問題” 則涉及概念的刻畫方式。概率論的通常用法是把一個概念看成一個集合,比如 “銀行櫃員” A和 “女權運動積極分子” B都是 “人” 這個集合C的子集,而 “琳達” (作為一個人)屬於A或B的概率分別是A和B相對於C的大小。“是銀行櫃員又是女權運動積極分子的人” (下圖中的深紫色部分)顯然是 A 和 B 的公共子集,因此 “琳達” 在其中的概率不可能大於在A中的概率。
示意圖:ABC三個集合的關係丨作者作圖
這個常見論證有兩個前提:(1)一個概念是完全由其外延來界定的,比如説 “銀行櫃員” 的含義僅僅由這個羣體所包含的個體來確定;(2)一個個體屬於一個概念的程度是概率,取決於概念外延在個體域中的相對大小。
儘管上述用法在這類問題上司空見慣,但從認知科學的角度來看,還是頗有可以商榷之處的。
在人類的認知中,一個日常概念的意義往往由其內涵來界定。比如説, “女權運動積極分子” 的內涵就是這個概念的成員的共同屬性,這些屬性可以為概念中大多數成員或典型成員所具有,而不必是每個成員都有。
當我們使用一個概念的內涵來判斷某對象是否屬於此概念時,其中的屬性為這個隸屬關係提供了(正、反面)證據,以此確定隸屬關係的成立程度。比如説,對琳達的描述和 “銀行櫃員” 的吻合程度就低於和 “女權運動積極分子” 的吻合程度,而這個吻合程度就是 Tversky 和 Kahneman 所説的 “代表性”。人們常常用這個“代表性”來判斷 “琳達是銀行櫃員” 的真實程度。
由於內涵和外延的反比關係,琳達和 “是銀行櫃員又是女權運動積極分子” 的吻合程度會高於和 “銀行櫃員” 的吻合程度,這就解釋了這類實驗的結果:在判斷隸屬關係時,概率論用的是概念的外延,而人們往往用概念的內涵。儘管前者的確是更加成熟的規範性模型,但也沒有理由把後者判為 “非理性”,因為內涵性判斷自有其認知價值。
“那廝”何去何從
根據以上分析,人類推理、判斷的行為不完全符合傳統規範性模型(一階謂詞邏輯和概率論)的要求,其間的很多差異都不該簡單歸咎於人的 “非理性行為”,更主要的因素是,模型的前提條件和人類思維活動的現實環境不符。心理學家在從其他領域引進規範性模型時,常常只注意到這些模型在原有領域中的成功,並崇尚其為權威,而沒有認真考慮其適用範圍。
本文的主要目的不是跨界挑心理學的毛病,而是想説明人工智能研究中存在類似的問題。一階謂詞邏輯、概率論、計算理論等規範性理論模型始終在人工智能中起着重要作用,違背這些理論的設計往往被看作離經叛道。問題是,這些理論都不是為了解釋能、認知、思維、意識等現象而建立的,為什麼要理所當然地把它們作為普適的規範性模型——或者説 “理性”—— 的一般標準呢?
這並不是一個新問題。人工智能的奠基人之一 Herbert Simon(司馬賀)就提出了 “有限理性” 的概念,指出不能忽略人在推理和判斷活動中所受的現實約束。儘管如此,由於缺乏成熟的替代品,傳統的規範性模型仍常常被用在其適用範圍之外。很多人只注重為自己的工作找個可靠的理論基礎,而不考慮這個理論的前提條件和適用範圍。在這個方面,人工智能領域的問題並不比心理學領域少。
我多次撰文介紹過的 “納思” 系統就是一個建立在更為現實的前提條件下的規範性模型。納思力圖在系統知識和資源不足的情況下適應環境,或者説在 “不知道” 和 “沒想到”的時候,仍能找到、構建出最好的應對方案。
因此,納思體現了一種 “相對理性“ 的原則,就是説, ”理性“ 是相對於系統現有的知識和資源而言的。納思設計中的具體選擇都是在這個原則的指導下做出的。
回到上文的兩個例子。納思中陳述的真值同時取決於正例和反例(詳見《證實、證偽、證明、證據:何以為“證”?》),而概念的意義同時取決於外延和內涵(詳見《“意思”是什麼意思?》)。
這就是説,納思在面對 “四卡片問題” 和 “琳達問題” 時,其行為也可能像一般人那樣不符合一階謂詞邏輯和概率論的要求。這不是因為我們成心要讓納思犯 “類人” 的錯誤,以使得它更容易冒充人類,而是因為 “相對理性“ 的原則比傳統規範性模型背後的 “絕對理性” 更接近進化過程為人類選擇的思維規律。由於納思的有關性質在前面已經寫過(見《你這是什麼邏輯?》和參考文獻),這裏就不再重複了。本文的新內容是顯示:納思除了作為一個人工智能模型之外,也可以解釋很多人類心理現象,儘管它的設計目標是成為一個智能(不管是人還是計算機)的規範性模型,而非人類智能的描述性模型。
本文並不是要説人類就沒有 “非理性“ 的時候,更不是説納思就不會犯錯誤,而是説, “對錯” 的標準不像初看起來那麼簡單。
由於知識和資源不足,納思的很多預測都會被後來的觀察證明是錯的,但這些預測在當時的確又是最合理的(相對於系統的知識和資源現狀而言)。這麼説來,在納思內部,“存在的就是合理的”。即使考慮到情感的作用,也不是“理性”和 “非理性” 在 “輪流執政”(詳見《人工智能,讓機器也會“感情用事” | AI那廝》)。
當然,“理性程度” 的差別依然存在。有些決策過程相對穩定,可重複,而且事後可以解釋;而另一些則是特殊情景下的臨機反應,以至於事後無法準確解釋當時的推理和判斷,只好説 “我當時不知怎麼想的就那樣做了”。後一種情況一般被當成説“非理性”的,雖然系統可能並不是“搭錯了線”(不管是電線還是神經),也沒有修改自身的思維規律。在納思這樣的系統中,這兩種情況都會出現,只是二者間的差異是程度上的,而不是“理性”和“非理性”兩套機制。
總而言之,“理性”和”非理性“ 的實際區分取決於是否(或者説在多大程度上)可以為行為找到理由。即,行為是系統為達到某個目的所採取的手段。這種分析通常會以某個(明確定義的或模糊默認的)規範性模型為依據,但這個模型未必就是經典邏輯或概率論。因此,以往關於人類 “非理性行為” 的很多結論有必要被重新評價,而人工智能系統的設計也應當建立在切實適用的基礎之上。
參考文獻
[1] Pei Wang, “Heuristics and normative models of judgment under uncertainty”, International Journal of Approximate Reasoning, 14(4):221-235, 1996
[2] Pei Wang, “Wason’s cards: what is wrong?”, Proceedings of the Third International Conference on Cognitive Science, Beijing, August 2001
[3] Pei Wang, “The Assumption on Knowledge and Resources in Models of Rationality”, International Journal of Machine Consciousness, 3:193–218, 2011
[4] Ahmed Abdel-Fattah, Tarek R. Besold, Helmar Gust, Ulf Krumnack, Martin Schmidt, Kai-Uwe Kuhnberger, and Pei Wang, “Rationality-guided AGI as cognitive systems”, Proceedings of the Annual Meeting of the Cognitive Science Society, Sapporo, August 2012
注:本文所提到之作者其他文章,可進入“返樸”公眾號底部菜單“精品專欄-AI那廝”查閲。點擊https://cis.temple.edu/~wangp/Chinese.html,可查閲作者所有科普文章和科普視頻。