餘亮:“AI+經濟學”是什麼?舉幾個栗子
我今年跑人工智能的場子比去年少多了,泛泛而談的都不去,因為基本都沒我談的好。真要深入學習,就在家看書或者報個在線學習班。不過這次鈦媒體和杉數科技做的"AI大師圓桌會"對我有吸引力,因為邀請到在德州撲克牌大戰中問鼎的冷撲大師主創者Tuomas Sandholm。
之前名揚四海的阿爾法GO,代表的是在完全信息和疆界封閉世界稱王的機器智能。圍棋棋局雖變數極多,但一切都在“桌面”上。撲克牌則是非完全信息博弈,對手手中有什麼牌,在桌面以下,不確定因素太多,彼此要靠猜。卡耐基梅隆大學計算機系教授、冷撲大師Tuomas Sandholm就認為,在現實生活中幾乎不存在圍棋這樣具有完全信息的場景,所以阿爾法GO的算法在現實世界很難直接派上用場,無論是商業談判中的對方底牌還是股票交易中的內部消息等都更像德撲,德撲AI打開了人工智能應付隨機事件和隱藏信息的大門。
阿爾法GO的算法包括局面判斷和蒙特卡洛樹,而冷撲AI的算法思想包括:基於納什均衡的博弈論、虛擬遺憾最小化算法(Counterfactual Regret Minimization ,CFR)和決策樹等。我對冷撲的算法機制還不太瞭解,就冒着40度酷暑跑去聽,結果聽到了別的有意思的事情。

納什把博弈論引入經濟學
會場在上海財大的豪生酒店,小範圍討論,全場就50來號人。主辦方之一杉數科技的主要人員也來自財大,所以這裏的算法就有了一種財大的氣息。
幾位科學家都比PPT上的照片呆萌不少,趙何娟則比照片中年輕很多。對,鈦媒體的創始人趙何娟也親自來致辭,可見重視。她馬尾辮連衣裙像個學生,説好希望當年有這麼有趣的教師教自己。
兩位中國科學家唐平中與何斯邁的演講題目,看上去比較枯燥,一個叫《應用機制設計:水權市場,淘寶刷單與百度廣告拍賣》,一個叫《收益與庫存管理中的博弈行為》。但聽起來很有意思。
他們都強調“AI+經濟學”。西方經濟學認為所謂經濟學就是研究資源的稀缺性並解決資源匹配問題。我以為,“AI+經濟學”是指算法介入資源匹配的過程,借鑑經濟學對各種經濟模型的思考研究,可以平衡以往AI算法的短視(如算法推薦新聞造成的信息繭房)和經濟學模型的慢速(不能大規模實施處理數據)。
唐平中是清華大學交叉信息研究院青年千人助理教授,也是Tuomas Sandholm在卡耐基梅隆大學計算機系的博士後。他先講甘肅省石羊河流域的水權交易市場。

西北地區乾旱缺水,政府就設計了二級水權市場,有點類似碳排放量交易市場,政府首先根據往年用水狀況給各村莊配給用水量(前提是供水基礎設施發達,沒有水渠管線,分配水量是不可想象的)。到了年中,各村根據實際用水情況變化,有用不完的水量可以拿去二級市場交易,類似於高校裏各院系年中調預算。但是這個買賣匹配過程比較麻煩,一開始是工作人員手動匹配各村莊的買賣申請單,基本不可行。算法專家就來想辦法,促成交易匹配,提升交易意願。他們正在與清華經管系與水利系合作,落實這個機制。所以甘肅偏遠地區有些機制還是蠻現代的。

搜了一下,這方面論文好多,好可怕……
我覺得,聽下來這更是個市場博弈論的例子,和AI有點遠。不過,如果能通過有效算法促進交易機制,又能夠利用機制運行中產生的數據反饋不斷優化,就有了數據AI的雛形。

舉個例子
唐中平表示,講完了社會主義例子要講資本主義例子,就開始講淘寶和百度的用户匹配與防刷單機制。嗯,資本主義的AI需求高呀。淘寶每時每刻要把用户的瀏覽與無數商品進行匹配,為每個用户生成商品列表頁面。之前的匹配機制就是根據各種數據比如地區、年齡、價格、銷量、網絡狀況等做判斷。然而商家用户洞悉規律之後,就會採取刷單辦法。比如猛降價格以求得銷量暴增,這樣下個月在推薦界面就會獲得高位。算法專家提出的解決辦法是讓機器模擬人的行為,預測到用户這樣做會帶來的新狀況,然後調試基準,更新博弈環境,獲取動態平衡。

如果説這是AI+經濟學,我看這裏的經濟學有一點點像“理性預期理論”。這個理論大意是説政府不要搞宏觀調控,因為今天的市場即使不公平、不均衡,但各個市場主體自己會去適應,會根據現在的情況去預期下一階段的狀況,並提前做好準備。而你一搞調控,等於把各項參數改變了,市場主體們的預期就不準了。這個理論當然有點一廂情願,比如無法克服馬太效應,為了反對宏觀調控而一味神化市場機制無視市場失靈等等。而唐中平提到的這個算法有點反其道行之,就是用神經網絡模擬用户,去預測用户的預測,然後調試機器,抵消用户的預測。這是一種基於博弈論的方法,所以淘寶店主們與淘寶系統的鬥智鬥勇又要邁向新的台階啦。
何斯邁教授,他不是一個人,他是那些少年時代就獲得國際奧數金牌羣體中的一個。1990年代赴美之後,經歷過文化差異造成的挫折,最終在平淡而不平凡中歸來,繼續鑽研一般人不感興趣的數學問題。

他講的也是資源匹配問題,標題很乾巴,例子很生猛,首先是腎臟匹配。一般而言,全球病人的換腎需求只有10%得到滿足。算法專家努力發明新的匹配方式。比如“同時法”:大家互換,你家親友願意捐腎但是不匹配,他家親友願意捐腎也不匹配,但你們換過來可能就匹配了,人數越多越可能匹配。這種方法要求所有參與者必須同時做手術,目的是防止有人反悔,就像足球小組賽最後一場必須同時舉行一樣。

(我就覺得這小人的示意圖畫的有點戳心)
算法專家還想了另一個辦法,鏈式法:一圈患者都找不到合適的腎臟,這時需要引入一個“第一推動者”,就是找來一個腎,只要匹配其中一個,這個人的親友的腎就能拿出來匹配別人,救活了一圈人。不過這個“第一腎”可能原本已經匹配好另一個人了,這就遇到一個倫理問題:救了一連串患者,卻讓一個孤獨的患者失去了生存機會。也就是那個常見的交通倫理問題,前方突然出現一個人,要是打方向盤就會撞到一羣人,司機選哪個?
用計算機算法來讓經濟學模型經受檢驗並落地!何斯邁講電商定價機制,涉及到好多因素,還要用爬蟲偵測友商定價策略,隨時調整,算法複雜。要做好這個,真不是文科出身的媒體經濟學家講講市場至上什麼就行了,幾乎是一門工科學問。何斯邁出身中國科技大學,那正是一所充滿工程和鑽研精神的大學。

唐平中説要把AI的算法和經濟學的算法結合起來,前者對我比較好認知,什麼邏輯迴歸、最近鄰算法、支持向量機,乃至深度森林等等。但印象中經濟學一般不説“算法”這個詞,所以AI科學家這裏的經濟學算法指什麼?我問了唐平中老師,他給我舉了個例子:拍賣,這就是一種經濟學算法機制。不過結合AI算法,是要解決高頻交易中的算法,時時處理海量計算,否則就不需要AI了。
會後,上海財大交叉科學研究院院長、杉數科技首席科學家葛鼕鼕批評國內公司熱衷跟風,看到亞馬遜做無人超市,幾個月後也紛紛推出無人超市,沒有好好去做研究。
當下最大的產業風口還是人工智能,就在這個圓桌會的當天,國務院印發了《新一代人工智能發展規劃》。現在是個互聯網公司都要宣稱自己是做AI的,比如滴滴也宣稱自己做AI。當然,滴滴有數據,就可能做AI。在唐平中那裏我也終於聽到了滴滴的算法。他説滴滴的拼車遇到一個難題,就是一口價,司機找到第一個乘客之後,即使找不到第二個乘客也只能按照拼車價來交易。於是司機受損,當然乘客很願意。他在幫滴滴做一個“兩口價算法”,具體怎麼做沒有展開説,估計也是個博弈論的問題。
冷撲大師最後出來。但是很遺憾,全英文講座,我基本聽不懂,所以本文到這裏終於可以結束了。Sandholm演講時,在座的不少聽眾不時發出會心的微笑。所以以後他們和機器智能關係更近,我就等着機器先來收拾我好了。

Tuomas Sandholm在演講
會間還注意到一個小細節,唐平中在舉淘寶賣家例子的時候,截圖用了錘子手機的銷售做例子。他選擇了錘子手機做例子,這個選擇機制是怎麼產生的我還不知道呢~。

錘子~
AI遍地開花,找準自己的切入點很重要。這批科學家倒也不特別強調自己是AI,而是就從業務問題入手,用數學來解決。鈦媒體也不愧是“財經”系出身,在搭乘AI列車的時候,切入點落在了經濟學上。希望AI科學家可以借鑑經濟學的思維並幫助經濟學升級,向兼具理論與實踐能力的科學方向發展而不是向巫術傾斜。
(本文轉自微信公眾號“智能國”,觀察者網已獲作者授權轉載)