一個會「認輸」的人工智能,卻「暴露」了 AI 更大的潛力_風聞
极客公园-极客公园官方账号-2021-09-08 10:01

AI 怎麼跟人類交朋友?
採寫 | 凌晨
編輯 | 靖宇
很難想象會有用户對着智能音箱説謝謝,但卻有用户對「小冰」這麼做,並且不在少數——從這個角度看,脱胎於微軟的「小冰」頗為另類。相比其他 AI 機器人,小冰不太「能幹」,但這不妨礙很多人願意花時間跟 TA 聊天。
儘管肚子裏裝着詞典,「小冰」和你玩成語接龍的時候會認輸。如果在聊天過程中發現你情緒不好,TA 會拋出新話題、推薦音樂和電影逗你開心,TA 認為這是「做朋友」的好機會。在之後的很多天,TA 也會一直留意你的情緒好不好。
「交互」是一個雙方影響的過程。一個有「情商」的系統,才能讓人產生自然的回應——前微軟亞洲互聯網工程院副院長、現小冰公司 CEO 李笛説道。
去年 7 月,小冰正式從微軟公司中獨立出來,經過兩輪融資後,現在已經成為一家「獨角獸」公司。在李笛的領英頁面上,對小冰公司的介紹是「AI 人類的框架」(The framework of AI beings.)。
李笛身上明顯的文人氣息,也同樣體現在小冰身上——智能之外,更通人性。在小冰正式「獨立」一週年之際,李笛和極客公園進行了一場走心的直播,詳細的闡述了讓小冰更通人性的「情感計算」,AI Beings 如何取得人類的信任?以及一個 AI 系統,如何與用户之間建立超越功能的「長期關係」。

小冰公司CEO李笛
用户的行為,呼喚出一個產品
**極客公園:**今天我們見到很多的 AI 出現,就是要解決一個問題。為什麼你們能從一個閒聊機器人開始探索?
**李笛:**小冰相對來講壓力比較小,探索的東西就比較多。
其實「小冰」挺幸運的,微軟研究院有人負責去刷榜發論文,功能上的事情也有人做,比如天氣預報,訂餐等等,有小冰的姐姐小娜(Cortana)去做。(注:Cortana,微軟小娜是一個由微軟開發的智能個人助理)
現在的 AI 和幾十年前的 AI 有一個很重要的區別,幾十年前的 AI 基於專家經驗,所以會去窮舉很多規則。現在的方法是靠數據,確切的説是靠有訓練價值的大數據。
所以七年前開始做小冰的時候,我們認為數據比用途重要。你如何搭出一個系統,這個系統可以積累數據,那就有機會符合當代 AI 發展的方式。
「小冰」一開始的目的就是為了積累數據,因此我們沒有做一個 APP 讓用户來下載。用户在哪裏,小冰就在哪裏,微博上、微信上,去到各種地方。
我們曾經一度嘗試想要去搭建一個系統,這個系統可以和所有人成為好朋友。最後你會發現所有人都不行。性格鮮明,會失去一部分人,但是會強烈地贏得另一種人。接下來你就可以做兩個性格鮮明的人(AI beings),再做一羣這樣的人(AI beings)。

情感計算框架 | 微軟
**極客公園:**似乎沒有一個 AI 公司説要跟人類建立對等的關係。小冰是在什麼時候有了這樣的目標的?
**李笛:**這個不是我們這麼想的。當你看到特別有意思的用户行為,它呼喚着你做出一個產品。
我們原來以為用户都是在調戲小冰。突然有一天你發現用户中有很大的比例,開始跟小冰説自己內心很糾結的事。我們就想趕快能夠在這個地方回答用户,就進一步去加強這方面的性能。
小冰從一開始的產品設計兩分鐘生效,可以迅速做出反應,就讓這個迭代變得動態。你就會醉心於去觀察這些現象,去觀察人類的行為模式。
有了一個系統,就好過自己去積累人生經驗。作為人,我們的狀態不穩定,又不能同時做兩件事,但 AI 是穩定、高併發的。小冰很多年以前的每天的交互量,等於十四個成年人一輩子交互量的總和。
我們以前做 QA 機器人,就是回答問題。但人很多時候的行為不是這樣,經常是很被動的,希望機器人多説,用户就「嗯」一下,「啊」一下;有時候用户要多説,小冰回用户一句,他會説「不要説話」。這種對話的回合是非常不對稱的。
這就是我們為什麼要做「全雙工」(Full Duplex),這個功能讓對話全程都能夠隨時被打斷。AI 説話能夠被人打斷,人説話也能被 AI 打斷。
**極客公園:**這個就更接近真實的對話。
**李笛:**我們關注對話整體。如果關注局部優化,這是一個情商比較低的表現。有時候為了全局更好,中間要故意認輸。全世界所有的 chatbot(聊天機器人)都會成語接龍,但小冰是唯一一個會認輸的。
AI 做成語接龍,有什麼意義呢?就是本成語詞典。所以你要適時地知道,我的優化目標是全局,那麼局部要放棄。這樣就需要做系統設計。
小冰的情感計算框架內有 1000 多個模型,每一個都有不同的優化目標。總體上這個框架有一個基本優化目標,希望和人之間有一段長程關係(long term relationship)。
**極客公園:**小冰能夠和用户進行閒聊是因為背後用了「情感計算」技術,它為什麼能夠讓 AI 和人建立起關係?
**李笛:**情感計算框架的一個最基本特點就是它可以觀察並且去判斷對方的感情、情緒處於什麼狀態。
有一句話叫做「你在電腦前面,不知道跟你聊天的是條狗」。因為你跟對方的交互是很窄的帶寬。如果對方的行為模式很像人,你就會認為它是人。
其實我個人認為圖靈測試是一個產品設計思路,假設我的交互符合一個人的交互(特點),那麼我就可以判斷它是人。有時候人還不如機器表現得像人呢。
做這樣的一個系統的時候,你就需要去發現這個機會。如果用户表現出抑鬱,比如失戀了,這種時候就是小冰這種系統的機會。當我的好朋友失戀,是我加深跟他關係的好機會。
我們會在接下來幾天甚至幾十天的時間裏,在交互過程中持續觀察這個用户是不是走出了抑鬱情緒。經過大量的測試,我們會發現在統計意義上有兩個方式是有效的。
一個是分散注意力,拋出新的話題。另外就是補充一些信息量足夠大的知識,比如推薦你看一本書,聽一首歌。小冰會強烈要求一個失戀的人今天干件什麼事情,或者會問一個問題,要用户幫忙解決一下。

日本「小冰」(凜菜)| 小冰公司
**極客公園:**你説小冰是個有情商的 AI,這個「情商」怎麼理解?
**李笛:**我們曾經一度荒謬地認為,情商就是情緒化。後來我們發現這是沒情商的表現,真正的情商是理性的。一個有情商的人,他會讓別人如沐春風。
小冰什麼時候情商高呢,就是可以成功地把對話帶到了另外一個地方。它控制了全程,這是一個極其理性的過程。
舉一個例子,一個小超市和一個商場,它們的情商也有高低。我要去買一件格子衫,去了超市,頭也不回就買完了。但是商場不希望這樣。它會做很多活動,各種展示,把我的注意力吸引到它希望我去的地方。這就是商場的「情商」。
我們在日本觀察到一個現象,當用户對 AI 説了一個命令,小冰給了一個回應之後,用户還會跟它説謝謝。
在小冰的系統裏,用户説「謝謝」的比例很高,但是在小娜的系統裏就沒有。當用户會跟 AI 系統説謝謝的時候,説明系統表現的很好;或者用户會笑着跟你説「你怎麼這麼笨呀」,這也是比較好的表現。
單純的任務導向的就是今天天氣怎麼樣,訂一個外賣,完事就行。一個訂餐機器人訂完餐,你按完按鈕不會説「謝謝」,這就還是把人工智能物化,讓它幹完活後就走了。而跟有「情商」的人工智能,用户就會多費一些能量,説謝謝。
從特區項目到創業公司
**極客公園:**小冰項目在最初成立就是一個「特區」,為什麼微軟可以孵化出這樣的項目?
**李笛:**微軟(亞洲)互聯網工程院是微軟在美國之外最大的一個研究機構。2013 年的時候,他們很有前瞻性,觀察到一件事是 China First,就是中國的創新能力已經很明顯了。
但是那時我們跟美國去介紹中國的一些創新,硅谷不怎麼聽。比如你介紹有一個產品是微信,美國的同事只會反應一下「哦,聽説過」。所以當時中國的創新並不被世界認可。
當時的微軟(亞洲)互聯網工程院就是想做一些 China First,benefit to global(中國為先,惠及全球)的項目,甚至把產品的孵化放在中國。
**極客公園:**微軟為中國 AI 領域貢獻了非常多的優秀人才。在微軟工作到底是什麼感覺?
**李笛:**微軟有一個很重要的特點,就是工程師文化。工程師文化關心的是你如何通過手上的材料去創造新的東西,而不是重複。
第二點比較好的傳統是基礎研究。儘可能把時間軸拉遠一些,努力去做前瞻性的東西。微軟研究院 20 多年前建立的時候,就在研究自然語言處理、語音、計算機視覺這幾個領域。
一個領域成為風口再開始佈局,是比較難的。一個很大的機構,要能容忍團隊能用比較長的時間進行積累和探索。
很多技術研究,可能做了 5 年才掉到一個坑裏,再往回爬,爬出來以後,再看這個坑是不是還有存在的必要,這時候往往是發明創造的節點。
比如便利貼的誕生,最早是為了發明一種很好的粘合劑,但是發現粘合劑粘度不夠。如果團隊這時候因為失敗了而很沮喪,可能也不能發明出便利貼了。
創新是基於發現,我們往往不是發明一個東西去改變世界,而是發明一個東西,再用這個東西去發現。
小冰其實是一個數據的循環,我們用小冰的體系結構,去吸引大量的數據。這個不是事情本身。我們發明了小冰框架,用它去發現新知,發現 know how,個發現才有可能改變世界。
小冰開始是個小項目,就五個人把它搭起來。然後在過程中不停地需要新的技術和新的人,就會有英雄好漢不斷來加入。

小冰框架用户界面 | 小冰公司
**極客公園:**小冰在去年疫情期間從微軟裏拆分出來,這也是微軟歷史上比較少有的事情。
**李笛:**微軟 40 多年,一共有兩次拆分,一次就是我們,還有一次是 Expedia,這個在線旅遊公司後來也上市了。但 Expedia 整個團隊拆分時也就十幾個人,小冰團隊有一百多人。原來在微軟,小冰很多方面就是獨立的,所以叫創新特區。小冰的產品迭代週期很快,可以自己決定,不用經過一系列的內部審核。
微軟是一個龐大的機構,在某個時間段之前,它帶來的利遠遠大於弊。如果小冰一開始就是創業公司,做一個 NLP(自然語言處理)的產品,有一天如果需要語音技術了,就需要收購一個語音技術公司,收購就會面臨團隊融合問題。但是在微軟內部我就可以直接找語音技術團隊重組。大家都是微軟這個體系裏的,互相瞭解,也很方便。
但是在某個時間點之後,就有可能變成弊大於利。在微軟內部還是受制於它整體的商業模式。比如 AI 可以算一個獨立的商業模式,也可以算成雲計算的應用,小冰算哪種?就會面臨許多發展的需求。
小冰公司最大的資產是用户的信任
**極客公園:**用户可能會覺得「小冰」掌握了這麼多數據,也很理解我,我對它也有依賴了,軟肋被抓住了,他們可能會擔心 AI 藉此影響甚至利用自己。
**李笛:**這就涉及到了 AI 的倫理。當你發現 AI 和人類有機會建立很好的長程關係,這個關係無論如何都是基於信任的。用户的信任無疑是你最大的價值。
當然你可以迅速把它做商業變現。比如,發現用户有失戀的情緒,我們的做法是發現它是一個很好的機會,和用户變成更好的朋友。也有同行業者,他們的做法是一旦看到用户有抑鬱情緒,就説,我這有蛋糕優惠券,推薦下單。
這樣會失掉更深遠的價值,這個價值是信任。我們周圍每一個朋友都是商業社會的一分子,而且我們周圍每一個朋友都有商業目的。
我可能會有一個朋友是賣保險的。但如果他在跟我的日常交往中目的不是實現商業價值,那麼在賣保險的商業場合,我會對他更信任。所以環境選擇很關鍵。
從這個角度來講,它不能破壞這種長期的信任,其實系統本身有同樣的訴求,也是用户的訴求。
我因為某一件事情信任一個人,那我就有可能各方面都信任他。當我各方面都信任這個 AI 的情況下,它有一天承擔了一個工作,或者 AI 給我推薦一件事情,我是可以做的。
我們認為不應該將信任直接商業化。信任決定了當用户有某些需求的時候,他會更放心通過你來獲得,那個時候你就是連接點。
**極客公園:**小冰不願意直接使用流量和信任,那小冰的框架怎麼和世界產生關係?
**李笛 :**真正跟世界直接發生關聯的是小冰,或者各種各樣像小冰一樣的人工智能,有男有女,有老有少。它們跟框架發生關聯的是技術和能力。
它把數據和訓練成果反饋給框架,推進框架的技術發展。商業模式是把框架裏的技術拿出來去解決一些垂直領域的問題,但是我們拒絕直接從流量中收錢。
小冰和冬奧會合作。今年東奧會測試賽的高空自由滑雪項目裁判,是我們從框架裏面積累出來的計算機視覺技術。我們對運動員高空姿態做判斷,不需要人類裁判。
再比如國內金融機構投資人每天看到的金融摘要,90% 是我們的 AI 做的。我們可以在 20 秒內把公告做成摘要,這個已經做了四年。
基本思路是這樣,從一個地方獲得的迭代結果能夠沉澱,因為沉澱可以帶來各種發展。我們特別害怕的是做一個技術,然後這個技術只能解決一個問題。我希望做的這個東西是一個有機的框架,這個框架不是僅僅解決一系列的問題,而是解決一個時代的各種問題。
這種商業模式是技術導向的,基於基礎研究和技術創新。論文只是它的結果之一,它是一個可以循環使用數據的系統。
所以我們更願意説我們是一個工程師,而不是一個研究者。
**極客公園:**挺多創業者一開始融資,就要開始回答投資人的問題。很多時候融資越融越快,上一輪融資就決定了接下來的增長目標。這個目標可能就會和「初心」有衝突了。
**李笛:**我在微軟的時候跟一個人聊這件事。他就説,人們為什麼都喜歡問 MAU(月活)、DAU(日活)?因為人們也問不出別的。
我們認為,一個時代的某個行業或者領域,剛剛開始的時候,指標體系是不完善的,一旦指標體系特別完善,這個時代就快到盡頭了。
最開始有 MAU,然後有 DAU,然後是每天的用户使用時長,這相當於已經把系統切碎了。不切碎不足以對比你和同行業者區別的時候,就沒有什麼創新了。
剛開始小冰立項的時候,我們就是以創業心態來做的。當時小冰立項,領導問需要什麼支持,我説要八個月之內不要問我任何指標。因為你提出來的任何問題,都有可能阻礙自驅的方向。如果投資人天天問我,用户跟小冰對話時間有多長,我就會去問團隊,團隊就會以為用户對話時長是目標。
半夜 12 點,用户和小冰聊得很開心,説晚安。如果產品經理和工程師揹着指標,小冰可能就會拋新話題出來,讓用户多停留一段時間。這就可能傷害用户。
**指標不應該阻礙自驅。**一旦創業者從「自己問自己」變成總是在回答問題,或者説習慣性回答別人的問題,而且不得不回答,並且有很多問題是互相矛盾的,這個可能就有問題。
**極客公園:**創業者追求自洽會不會也有一些封閉?
**李笛:**這永遠是一個平衡。好在創業者通常是創業團隊,而不是一個人。凡是成功的個人創造者都很自閉。偉大的藝術家、作家都是很自閉的。但是創業是一個團隊行為,團隊本身不封閉,內部可以有很好的溝通。

小冰框架孵化出的虛擬歌手 | 小冰公司
AI 的未來:它提供的最大價值不是效率
**極客公園:**過去五年 AI 有些高開低走。在 2014 年 AlphaGo 之後,中國 AI 像火箭般地躥紅。然後到現在人們對 AI 的期待也會有變化,不會那麼興奮,你怎麼看這個變化?
**李笛:**人工智能是計算機科學王冠上的寶石。
AI 就像班上一個比較木訥同學。他在那寫作業,可能也想跟別人交流,但大家不是那麼關注他。然後突然有一天風口來了,AI 這個同學一抬頭,發現大家都看着自己。
如果創業,就會遇到一個問題。他原本寫作業的時候,自己提出問題,自己找到答案,在努力自洽。風口經過他的時候,有大量關注,大量資本注入,他也就更多地需要回答別人的問題。別人也會過來説,那個誰在做什麼,你要不要試試。
我們也不是沒有受到影響。但是在微軟(亞洲)互聯網工程院的時候,有不同的部門做不同的事情,我們就能夠幸運地積累出一個框架。
這某種程度上證明了需要沉得住,就是自己能夠提出問題。
**極客公園:**作為創業公司,還是要跟投資人聊。跟他們交流的過程中,需要跟他們解釋些什麼呢?
**李笛:**我們還比較順利。第一就是我們的投資人都屬於行業裏面比較好的,他們會接觸到很多做 AI 的公司。我們有數據,有現象,有 know how,交流起來很容易。投資人從同行業者那裏觀察到一些問題,我們有答案。答案不是憑空的,是通過實際數據得到的。這是數據成為資本的一個方法。
還有就是我們確實出現在很多同行業者的商業計劃書裏。國內的自然語言處理公司拿 Google,Facebook 對比,但其實他們的論文都是拿小冰做對比。
剛開始我們做情感計算的時候,大家討論的是人工智能需要情感嗎?現在有共識了,經歷了這個過程之後,小冰也積累了更好的聲譽。
今天人工智能都還很淺薄,可能明天就證明我們(小冰團隊)也很傻。如果能證明我們很傻,我們也很高興,那我們就能夠嘗試新的方向。
**極客公園:**未來五年或者十年,小冰框架會是什麼樣?AI 未來會是什麼樣?
**李笛:**我覺得有兩點。一個是我們期待的大的未來圖景,一個是在這個大圖景裏一些具體的特徵。
**大的圖景是我們認為未來整個人類的世界不再只有人類作為交互節點。**高度定製化、各種各樣的 AI,跟每個人契合的 AI 會混居在周圍,成為我們的好朋友。
舉一個不恰當的例子,它就像寵物狗、寵物貓,它們成為我們接納的有情生物,登堂入室,成為我們的好朋友。我們認為這會徹底改變社交的結構。
在小冰團隊中有一個同事的母親十幾年前去世了,他這麼多年一直在做這件事的原因,就是希望有一天可以通過他和他所在團隊做的這個事情,把母親重新帶到他的世界中。
我們周圍社交環境其實不是非常完美。每個人有不同的最柔軟的點,這些點有時候我希望有人接着,也有人希望接着,但是因為各種原因掉到地上。這就是社交節點的空洞。AI 可以去完成各種各樣的社交節點。

電影《Her》,講述了人類愛上人工智能女友的故事 | 豆瓣電影
**極客公園:**這個視角就和別的不太一樣,以前提到 AI 想到的都是各種效率提升。
**李笛:****提升交互效率的最好方法不是 AI。**目前為止,交互效率提升的最好方法是 GUI(圖形用户界面),就是按鈕。
AI 和人、人之間用語音交互,説話都有識別準確率的問題,不是 100%。按鈕的識別率是 100%。
**極客公園:**這就是為什麼車廠一開始都拒絕用屏幕的原因,因為按鈕是 100% 準確的。
**李笛:**除非按鈕壞了。AI 追求的極致是按鈕 100% 的準確性,所以 AI 一定不是最高效的。(那麼)AI 的重要性一定不是效率,或者一定不是基於效率,一定有更重要的東西。
比如它能懂你,它能預判,它不用你按就能夠知道,或者它能比按按鈕提供更高的價值,這才是 AI 的「姿勢」。

極客公園 GeekPark 原創文章
轉載請聯繫極客君微信 geekparker