新理論該怎麼為概念下定義?| AI 那廝_風聞
返朴-返朴官方账号-关注返朴(ID:fanpu2019),阅读更多!2019-04-17 09:36
一個好的工作定義的終極標準是在其基礎上建立的理論所能達到的高度。
撰文 | 王培(美國天普大學計算機與信息科學系)

人工智能的定義是一個已經被説到倒胃口但又常常不得不重拾的話題。在1950年,圖靈的文章《計算機與智能》建議通過行為來界定“思維”和“智能”,就此拉開了人工智能的序幕。後面幾十年各路人物輪番登台,但至今就這場大戲的主題尚欠共識。時至去年,一個德國研究中心還收集了幾百個對“智能”的定義。由於誰也説服不了誰,大部分人已經覺得這種討論純屬浪費時間。但在另一方面,這個領域中幾乎所有重大分歧最後都會歸結到對“人工智能”的不同理解,所以這個問題又無法被忽視。如果説這以前還基本是個理論問題,現在可是要成為社會問題了。比如説,現在各國政府都在籌劃對人工智能的應對方案,但如果連對象是什麼都説不清,政策就很難搞對路了。
既然如此,為什麼不先把定義搞清楚呢?這就要從“定義”是怎麼回事説起了。這事還真不像乍看上去這麼容易。不服氣的讀者可以看下去,如果後面的問題您都有高招,再嘲笑我們低能不遲。
靠“實力”反抗定義
從小學開始我們就知道一個詞的“定義”確定了它的意義,因此為其使用提供了標準。這些定義都在字典和詞典裏列出來了,大家背下來就是了,照着用就是了。但字典定義又是哪裏來的呢?據説是按照字詞的當前使用習慣整理的。這豈不是“雞生蛋還是蛋生雞”的問題又來了。
從認知科學的角度看,詞語的主要功能是在通訊交流中表達概念,所以詞語的意義還是來自概念的意義。我在《“意思”是什麼意思?》裏面介紹過幾種意義理論,這裏就不重複了。簡單説來,由於概念的意義依賴於經驗,同一個詞語(及它所表達的概念)在不同的人的心目中有不同的意義就是必然和正常的了。我們的思想和語言都是在不斷發展的,而這種發展的一個重要方面就是意義的變化。現在還時不時有人用某個詞的“古義”來貶損其“今義”,這就是對語言的本性缺乏瞭解了。即使是同一個人使用同一個詞,在不同時刻也會有意義變化,就更不必説不同的人了。
但這個問題自然還有另一方面。既然語言的首要功能是通訊,那麼參與的各方要對所用的詞語意義有大致的共識或約定,否則就成了雞對鴨講了。下定義、編字典都是建立這種約定的努力。在交流過程中,人們也會根據交流對象選擇詞彙,並澄清它們的意義,以達到預想的交流效果。總的説來,定義當然是個好東西,但這不是説沒有公認定義的詞語就沒有意義,或者説背離字典定義的用法都是不合理性的。
詞義的變化總是從某個人開始的,而如果一個“新意”得到越來越多的人的接受,它就會逐漸流傳開來,以至於最終代替“原意”。在交流過程中,這類“發明”有導致誤解或不解的風險,因此大多數不會廣泛流傳以至於成為普遍標準的一部分,而是成為一個小圈子的內部約定,儘管這種約定的實際力量往往比字典定義還要強大。魯迅在《阿Q正傳》就提到了這種現象:“加以進了幾回城,阿Q自然更自負,然而他又很鄙薄城裏人,譬如用三尺三寸寬的木板做成的凳子,未莊人叫“長凳”,他也叫“長凳”,城裏人卻叫“條凳”,他想:這是錯的,可笑!”。不難想象,某些城裏人也會在同一個問題上嘲笑未莊人。
在人工智能的定義上也有這種“相互鄙視”。業外人士常常嘲笑人工智能專家們吹牛甚至説謊:“就你們做的那個東西還算有智能?”;而業內人士則認為外行們在自曝無知:“人工智能就是我們説的這個意思,你們不瞭解就別亂説!”雙方都理直氣壯。劉易斯·卡羅爾在《愛麗絲鏡中奇遇記》中描述了一個矮胖子Humpty Dumpty,他曾自得地宣稱“當我用一個詞的時候,它總是正好表達我要表達的意思,既不多也不少。”這種人在很多爭論的雙方都能見到,他們總覺得自己是在使用某詞的“正確的意思”,而很少考慮為什麼對方不這麼看。
其實在和定義有關的對抗中,“造反”(違反或修改定義)和“鎮壓”(確立和維護定義)都具有合理性,而最後就是“成王敗寇”。這樣説不是簡單地各打五十大板以示公平,而是説對一個具體的“違規”的賞罰最後實際上是雙方角力的結果,沒有一方有天然的正確性。“尊重傳統”和“與時俱進”都有個限度問題。
聊天機器不會“聊天”
雖然上面的話像是常識,但若依此考量在自然語言理解方面的工作,仍能看出不少問題來。在早期“基於規則”的方案中,大多是想通過給每個詞下定義來掌握其意義,儘管很多定義是隱含的,即是通過系統對有關詞彙的處理體現的。這類方案的問題是很多詞極難定義,即使在字典裏也往往是羅列了其若干不同意義,而沒有説怎麼在具體情境下消除歧義。近年來這個領域轉向依賴於統計各個詞彙的具體使用方式,因此不再要求事先給出定義。這樣做更加簡單實用,但詞彙的“定義”其實還在,只是表現為該詞彙在所用的訓練數據集中的統計特徵。
從應用的角度來看,這種做法對很多產品來説已經足夠好。以機器翻譯為例,如果只是要將旅遊者“附近有中餐館嗎?”之類的句子譯成不同的語言,我們大可以認為每個句子有一個特定的意義,而翻譯程序只是需要把這個意義在其它語言中表達出來就是了。但對另外一些應用來説,字句的意義不再是固定的,而是隨時間、地點等而變。這就超出統計方案的能力範圍了(即使加上條件概率也遠遠不夠)。從根本上説,應該把字句的意義看成可變的,而“定義”(包括統計性的)只是其中相對穩定和基本的成分。
與此相關的是對話的生成和理解。現在的“聊天機器人”都是基於統計學習的,其目標是“聽上去像人”,所以在產生每句話時的設計目標是“大部分人在這種情況下會説什麼”。我不否認我們都有“為了聊天而聊天”的時候,但這畢竟不是對話的主要功能。在絕大多數時候,我們的對話都是服務於某些特定目的。由於每個具體的對話在原則上都是獨一無二的,往往要求對語言的創造性使用,包括在一定程度上突破字詞的定義。如果你知道你的對話對象所説的永遠是老生常談,你得多無聊才要把這個對話進行下去啊。所以説即使現在的聊天程序確實有市場,它們也不代表對話的典型情境。
真人與聊天機器人(綠色)的對話(截圖來自網絡)
新理論該怎麼為概念命名
科學概念的定義和日常詞語的定義相比又有更多的要求。尤其一個科學理論的核心概念需要嚴格和確定,並對整個理論的發展提供基礎和導向。一個新理論往往是以若干新概念為標誌的。為一個新概念命名時無非是兩個辦法,一個是造個新詞,而另一個是改造一個老詞。在兩種情況下都需要用一個定義來界定這個詞(以及其命名的概念)在這個理論中的意義。這兩個辦法各有麻煩:新詞容易讓人不知所云,而老詞容易讓人望文生義,所以為新概念挑個恰當的名字絕不是個容易的事。
很多科學概念來自對日常詞語的改造。這時一方面要基本忠實於這些詞語的原意,但又要將其裁剪成滿足理論要求的模樣,所以不能完全遷就其日常用法。這種定義常被稱為“工作定義”,以區別於字典定義。哲學家卡爾納普在歸納邏輯的研究中試圖給“概率”一個工作定義。他不是簡單地陳述他的看法,而是先仔細地討論了一個“元問題”:什麼樣的定義是個好定義?他提出了四條標準:
1.相似性:新定義和該詞語的日常意義接近;
2. 精確性:新定義能避免模稜兩可的使用;
3.有效性:新定義應為建立在其上的理論貢獻成果;
4.簡單性:新定義要儘可能簡單。
這四條標準往往是會互相沖突的,比如説甲定義比乙定義簡單,但沒有後者精確。這時候就要綜合平衡了。儘管如此,這組標準仍有相當大的普適指導性。如果一個工作定義在其中某一方面有重大缺陷,它在其它方面再理想也很難彌補其“短板”所造成的後果。
定義AI是理論問題
下面讓我們以“人工智能”這個概念為例,分析一下工作定義中常見的問題。這裏“人工”問題不大,公認就是指計算機及機器人這類人造器械,而“智能”就不這麼好説了。這個概念自然是對人類精神能力的某種概括,但概括的程度或角度可能很不一樣。
首先,“智能”的工作定義仍需要保有該詞彙字典定義的某些核心成分,否則不如換個別的詞了。比如説如果把“智能”定義成“完美解決一切問題的能力”,那就連普通人都不夠格了。這顯然和這個詞的一般用法的相似性太差,因為智能一直是被看作人的屬性,而非神的屬性。
好的工作定義應當避免模稜兩可的説法,從而為概念刻畫一個相對清晰的邊界。因為這個原因,用“認知”“思維”“意識”等概念來定義“智能”就不合適了,因為這些概念的邊界並不比“智能”更清晰,儘管它們的意義和智能的確有相當大的重合。對一個概念的正確描述並不一定適合於被用作定義。
“智能”的工作定義與其字典定義不是一回事,因為它不是要描寫這個詞目前的約定性用法,而是把它設定成一個研究目標。也就是説明你自己要創建的人工智能是什麼樣的,不管別人怎麼看。所以一個好的工作定義的終極標準是在其基礎上建立的理論所能達到的高度,儘管在開始時這個標準無法直接被使用。儘管如此,以此標準來剔除掉壞定義還是夠用的。比如説目前有一種“泛智能”的看法,認為萬物(至少所有計算機系統)均有智能,只是高低不同。這種看法能夠自圓其説,但這樣一來“人工智能”就成為“計算機科學技術”的同義詞了,而沒有多少新貢獻。
最後,科學家都喜歡簡單概念,儘管理由不一。有人認為簡單的更可能是正確的,有人覺得簡單的更美,而有人認為簡單的無非是更易用而已。這個話題這次不展開説。要提一下的是,有人斷言智能不可能有一個簡單定義,這就成問題了。和智能有關的現象的確看上去及其複雜,但這本身不能説明在其背後不可能找到一個相對簡單的核心概念。其實在其他領域也是類似,而幾乎每個科學理論都是在為看上去龐雜的現象提供簡單、統一的解釋的。
關於人工智能的主要工作定義,我在《當你談論人工智能時,到底在談論什麼?》裏面有個簡單綜述,而我自己的觀點在《人工智能:何為“智”?》裏也已經介紹了。我這次要論證的是下列觀點:
“定義”是刻畫語詞及概念意義的重要方式,但不是唯一方式,也不總是最恰當的方式。這不僅僅是僅就人工智能而言。人們常常用“人工智能”這個“筐”裝若干種不同類型的“貨”。這樣一個“字典定義”的確説明了這個詞的當前用法,但在此基礎上所得出的結論都常常只適用於其中某些工作,而完全不適用於另一些。對“智能”這個概念不存在唯一“天然正確”的定義,因為其意義是隨歷史時期、科學發展、應用領域、關注焦點等因素而變的。當然其中仍有相對穩定的成分。“智能”的一般用法(字典定義)和在一個研究項目中的用法(工作定義)不是一回事,儘管二者有聯繫。後者在很大程度上決定了其後工作的研究方向和範圍,因此絕不簡單是遣詞造句的問題。沒有一個公認的工作定義不説明人工智能不能成為科學研究的對象,而僅説明這個領域仍處在“獨尊某術”之前的“百家爭鳴”時期。目前對“人工智能”的不同工作定義是對一個複雜現象的不同抽象概括,各有價值。它們之間的關係是“見仁見智”,而非“誰對誰錯”。由於其間的差別是根本性的,它們最終會演化成不同的研究領域。説不同的工作定義“都有價值”,並不是説它們都有相同的價值。這就好比是説登香山、泰山、黃山、珠峯“都有價值”一樣。這要看你到底想要什麼了。
注:本文中所提到之作者其他文章,可進入**《返樸》公眾號**(微信號:返樸2019)底部菜單**“精品專欄-AI那廝”**查閲。
參考文獻
1. Pei Wang, What Do You Mean by “AI”? Proceedings of the First Conference on Artificial General Intelligence, pages 362-373, Memphis, March 2008
2. Rudolf Carnap, Logical Foundations of Probability, University of Chicago Press, Chicago, 1950
版權聲明:本文由科技工作者之家—科界App子欄目《返樸》原創,歡迎個人轉發,嚴禁任何形式的媒體未經授權轉載和摘編。《返樸》,致力好科普。國際著名物理學家文小剛與生物學家顏寧聯袂擔任總編,與幾十位學者組成的編委會一起,與你共同求索。關注《返樸》(微信號:fanpu2019)參與更多討論。二次轉載或合作請聯繫[email protected]。