ChatGPT不是一個聊天機器人,是以自然語言為界面的機器人,這是兩件事_風聞
国服最坑赵信-02-08 09:23
來源:微博@木遙
雖然這個話題已經有點過熱了,但我覺得還是值得寫一下為什麼 ChatGPT (確切説是以它為代表的大語言模型的進展)是重要的。(順便説一句,幾個小時前 Google 宣佈即將推出自家競品 Bard,白熱化的競爭指日可待)。
ChatGPT 不是一個聊天機器人。ChatGPT 是一個以自然語言為界面的機器人。這是不同的兩件事。
「作為一種服務的自然語言界面」並不是一個常見的概念,雖然這件事每天都在發生。一個人從最早接受教育的時刻就在訓練自己把書本上的內容翻譯成自己心裏可以理解的自然語言,並且也許你腦海中想象過這樣的場景:在看書的時候有一個精靈浮現在書本上對你説:「我瞭解這本書的全部內容,你有什麼問題可以問我。我是這本書裏的結構化知識的對話界面。」這是件很誘人的事,但你極少聽到人們談論這個需求,因為就像大多數新事物一樣,在它誕生之前人們甚至沒有意識到這是可以被需求的。這怎麼可能呢?
作為一種服務的自然語言界面是極為昂貴的,為了給教材一個這樣的界面,人們發明了教師。為了給財報一個這樣的界面,人們發明了基金經理。為了給法律文書一個這樣的界面,人們發明了律師。事實上,幾乎所有現代經濟中的「professionals」本質上都是這樣的一種服務。它把結構化的信息轉譯成自然語言,可以被討論、被詰問、被辯難,然後再被對手方轉譯回結構化的信息。
以 ChatGPT 為代表的語言模型宣告説:這件事是可以被機器做到的。不是無中生有的創造信息,而是對它的歸納、總結、舉例、在不同結構之間切換。——這就是為什麼上個月微軟董事長 Nadella 説這是新的工業革命(我傾向於同意他),因為信息流通轉譯的服務(不是信息本身,但這種服務是現代經濟的血脈)的價格在一夜之間被徹底改變了。
有許多人不認為大語言模型有智能。最有代表性的可能是圖靈獎得主 Yann Lecun,每天咆哮痛斥 ChatGPT 已經成了他最近的每日功課。就在昨天他發推説「任何一隻貓所掌握的常識都比任何今天的大語言模型更多。」有人在評論裏弱弱地問:「你家的貓也能寫 Python 嗎?」他回覆説:「寫 Python 算個狗屁智能。」
我不會説貓的任何壞話(也不會説 Python 的任何好話),所以我只能説他説得對,但這是沒什麼意義的正確。半拉子智能也可以有實際的用處。語言模型並不需要「在本質上了解世界」,只要裝做了解並且能夠侃侃而談就可以了。畢竟很多大V(以及麥肯錫和德勤的諮詢師們)能做的也不過如此。
下面是我這兩個月來看到的比較有趣的語言模型應用(不一定是 ChatGPT,有些和它是競爭關係),在這些例子裏,你可以明顯看到它們是怎樣搭建在兩種信息結構之間形成橋樑的:
網頁鏈接 訓練在生物醫學文獻上,和你討論文獻內容。
網頁鏈接 訓練在美國哲學家 Daniel Dennett 的著作上,可以偽裝成這個哲學家本人和你討論哲學問題。
網頁鏈接 一個建立在 Wolfram Alpha 上的接口,讓你可以用自然語言(甚至使用話筒)問數學問題(它背後是 Wolfram Alpha,不是 ChatGPT 那種二把刀數學)。
當你急於指出 ChatGPT 的弱點(太多了,我自己在過去兩個月裏寫過不少)的時候,有必要想到的是:首先,這裏有些是 ChatGPT 這個特定產品的問題而未必是大語言模型的問題(比如很多人不喜歡 ChatGPT 不給出參考文獻,但它的一個競品 網頁鏈接 就會給)。
其次,也是更重要的是,這個領域在接下來的幾個月和幾年裏會因為大量資金的投入突飛猛進。AlphaGo 剛推出的時候也有人嘲笑説它連歐洲圍棋冠軍都下不贏,但重點在於「它竟然有資格跟歐洲圍棋冠軍下棋了」。同樣的,當你抱怨 ChatGPT 鬼話連篇滿嘴跑火車的時候,這可能有點像你看到一隻猴子在沙灘上用石頭寫下1+1=3。它確實算錯了,但這不是重點。它有一天會算對的。
