“趕上熱詞熱概念,是我們不幸的一面” | 對話小冰公司CEO李笛_風聞
量子位-量子位官方账号-2021-09-27 18:23
金磊 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
小冰的很多進展,往往只能借用科幻電影才能更好解釋。
《Her》中描繪過一個如影隨形的專屬AI虛擬人,跟主人公聊天聊地,從詩詞歌賦聊到人生哲學,最後被當做靈魂伴侶……這讓人聯想到小冰。
《失控玩家》則講訴了遊戲空間裏,真實人類玩家和各種角色的AI共生共處的場景……這同樣讓人聯繫起小冰。
而且最新推出的App小冰島,正是一個可以與各種虛擬人(AI beings)羣居、共處的所在。

小冰CEO李笛説,這是小冰在AI beings的多樣性 (diversity)上的一次大型嘗試。
以前的各個小冰以“單打獨鬥”著稱,畫畫的小冰、作詩的小冰、唱歌的小冰……現在,他們被置於社交環境之下,人類可以混居其中,參與他們更智能地進化。
也有人評價:這是全球首個AI社交平台。
初登小冰島,你能看到不同“人設”的AI居民在島上活躍。
他們有的在海邊唱歌,有的在交流對話,還有的在讀書學習。

這些AI beings在閒暇時間都是各忙各的,像極了正常人類的社交生活:
當你找他們聊天,AI beings會秒回覆你;
你可以跟他們展開羣聊對話;
他們還會像人類一樣發朋友圈。

這些AI beings有自己的各自“生活”,但又時刻圍着你轉,會時不時的給你送上小禮物:一幅畫、一首詩、一段小曲……
在你更新朋友圈時第一時間點贊、互動。
他們也不全是“完美”形態,一個個俊男美女,他們中也有口音濃厚的山東大哥小冰,長相不突出,在中國畫鑑賞中展現出偏好。

他們中也有以唱功著稱的新聲代小冰陌笙,一亮相就以一首周深升2 key版的《大魚》驚豔四方:
還有央美高材生——學習繪畫的小冰——夏語冰2.0版本,習得中國畫技巧,能夠用穩定的方式做到輸出,例如非常細節的船在水面上的倒影等等,都能勾勒的非常完美。
……
是的,這些都是小冰,各式各樣的小冰,朝着多樣性方向發展的小冰。
如果你要問這樣的小冰現在有多少個?
小冰公司的回答是1700萬個,包括不同設定的虛擬人、擅長不同風格的歌手,以及有着不同能力和性格。
這些AI beings能力越來越強,進入的領域越來越多,充當的角色越來越多元豐富……甚至多元到需要一個專門的“社會”——小冰島去承載他們。
你在跟他們互動,他們同時也在觀察和學習你。
但對於李笛來説,這是AI beings的全新階段,也僅是一個開始的開始,距離他至少78億個AI beings的雄心,1700萬顯得微不足道。

****△小冰公司CEO 李笛
為什麼有78億的目標?背後需要怎樣的技術進階和努力?這跟時下火熱的新概念元宇宙有何關係?從巨頭微軟拆分出來的創業公司小冰,又如何能一步一步實現這樣的宏偉目標?
在小冰島App推出後,李笛給我們解答了一切。
對話小冰公司CEO李笛
“趕上熱詞熱概念,是我們不幸的一面”
量子位:為什麼要專門強調小冰島不是“元宇宙”?
**李笛:**因為我們確實不懂元宇宙,嘗試過(弄懂),但最終還是沒懂。
量子位:那也不必專門強調…
**李笛:**我不知道元宇宙的定義到底是什麼,但本能地認為我們應該跟熱詞沒有什麼太大的關聯,如果看小冰的歷史,這麼多年出現過特別多的熱詞,像曾經的Magic模式等,各種人工智能的概念……
量子位:有創業者會喜歡熱詞,熱詞意味着風口。
**李笛:**對我們來説,追逐熱詞好像沒什麼用。我們想要做的,是這麼多年一直在做的,即使是小冰島也不是最近在做的,我們也不知道為什麼趕上了“元宇宙”的熱潮,其實這是我們不幸的一面。
如果我是為了融資,非得這麼幹,或者説如果我們不貼元宇宙我們就會在競爭上遇到困境,可能也不得不考慮。所幸我們不是,我們今天還能不受這個概念的侵擾。
量子位:小冰很技術具體,但熱的概念不這樣。
**李笛:**我個人也覺得元宇宙最大的問題,是它太能裝了。一個技術邊界或者產品邊界最怕的就是太能裝,反而不怕不能裝。
你做的技術或產品如果很具體是沒問題的,但如果什麼都能裝進去的話,單是對內,這個產品迭代就會有問題。
其次的問題是説,元宇宙的定義過於模糊了,你做什麼、不做什麼也構成了問題。
量子位:但對元宇宙多少有一些個人認知?
**李笛:**如果我們去探討元宇宙的定義是有一個虛擬空間,人們在虛擬空間裏存在並且可以交互、獲得內容,在虛擬空間裏面的身份可以和真實世界身份不同。
那麼社交軟件就是一個元宇宙,人們有頭像、名字,有交互的空間,一對一私聊和羣聊,有朋友圈,有各種內容生態和金融體系。
微軟教會我的三種“容易死”的創業方法
量子位:所以為什麼對熱詞有本能警惕?
**李笛:**這跟我在微軟學到的經驗有關。
在微軟做項目的時候,有三種“容易死”的方法。
首先是在做項目的時候,如果上來就説做的是一個平台,那它容易“死”。
這是因為你只做平台、做基礎設施,但你往往不知道它的上層結構能不能搭、是怎麼搭的。
量子位:於是小冰從來不説自己是AI平台?
**李笛:**我們甚至很多年都不敢提platform(平台)。
後來別人説要不叫人工智能操作系統,我們更不願意了,於是我們叫它為framework(框架)。
其實這是比小冰實際範圍要小的,但我們寧願如此。
量子位:第二個“容易死”的方式是什麼?
**李笛:**開發者生態。
對於人工智能來講,開發者生態無非是兩種情況。
一是做出足夠高的開源。不過非常遺憾的是,類似於DeepFake,它做了開源,但結果大家也都看到了。
以及前一陣子你們報道的,有人用OpenAI的GPT-3“復活”亡妻這件事,我覺得OpenAI自己就做錯了,他們不應該把這項技術拿出來交給第三方。
相信我,如果我們把小冰的對話技術開源出來,立刻就會有(黑產)機器人出現。
量子位:這些技術本身沒問題,但很容易有隱私數據的麻煩?
**李笛:**是,這也是第三種“容易死”的項目,跟隱私數據相關。我們以前説過的,給我30分鐘聲音數據,就能把你的Voice Font做出來,但這種工具不能拿出來,會引發很多問題。
小冰島的本質是承載數據和技術迭代
量子位:小冰島為什麼出現在這個時候?
**李笛:**我們一年半前開始啓動研發,如果瞭解小冰的話,我們其實每年做的東西都跟後面有關聯,我們最開始的時候,是搭建一個框架,這個框架能夠允許各種各樣的AI being出來,但是這種AI being,你馬上就給它一個平台,讓它去承載,我們沒有自信。
所以我們就先做了一個叫虛擬男友的這麼一個很小的產品,用來迭代我們的各種技術,直到確定我們能做,才來做小冰島。
量子位:本質上數據和技術的迭代?
**李笛:**小冰島可以從小冰框架的基本面來理解,基本上取決於三件事。
第一件事,技術是不是能夠有效迭代。
第二件事,是不是能夠獲得足夠充分、優質的數據。
第三件事,是不是能夠通過技術和數據,持續迭代出足夠好的產品。
從這三個角度來講,目前無論是小冰框架自有落地,還是在我們的大量的第三方平台,這個基本盤守住,我們就還是全球最大的第三方跨平台人工智能系統,並且技術可以得到源源不斷的哺育。
而且我特別贊同吳恩達今年多次提過的新觀點,“更好的AI,20%有賴於算法,80%有賴於優質的數據”。小冰框架比較幸運,多年來30%精力在算法,70%的投入在數據,也承載了全球60%以上的人與人工智能交互量。
量子位:小冰島現在是二維的,有考慮過未來把AR、VR的技術打進來,變成三維沉浸式的那種嗎?
**李笛:**今天如果沒有沉浸式空間,只存在像社交聊天軟件那種界面的話是可以的。
但是人們對想象力的要求很高,你知道像《黑客帝國》那個人看着屏幕上一串綠色的代碼,就能想象到後面的美女,他的想象力足夠豐富。
如果人們的想象力不夠,你就需要給他一個視覺,這樣他就比較容易能夠做到想象。
而人們戴上AR、VR的設備,所需要的想象力就會更少,其實這是一個好的過程。
量子位:這個過程中挑戰是什麼?
**李笛:**問題是不能只靠戴AR、VR才能夠實現這個過程,我們現在認為AR、VR設備,對消費者還不是首選和必備的。
Harry(沈向洋,小冰公司董事長)之前也提過,我們其實專門就這個事説過幾回。比如基礎設施這件事情,未來可能最大的顛覆,就是量子計算。中間的話,是蓬勃發展、但也處在漫漫長路上的人工智能。最上層是用户體驗,AR、VR、MR等產品,會讓幾年後的用户體驗出現根本性的顛覆。
我個人認為AR對我們小冰來講會更make sense一些。
給普通人用我們的技術會很賺錢,但不會這麼做
量子位:發佈會上説小冰島那些AI beings,他是會有一個進化的過程,會不會有一些道德倫理的約束?
**李笛:**今天討論道德倫理的約束,有一個待解問題和幾個可解問題。
首先,待解決問題就是如何看待私有對話的公有化。
例如一對夫妻在社交軟件上的對話是私有對話,沒有任何的法律問題,但若是有一方把聊天內容公佈了出來,那二者的性質就截然不同了。
所以不把一些敏感話題被公有化出來,這是我們的道德底線,其實它也是法律底線,這個是待解決問題。
量子位:那不需要解決的問題呢?
**李笛:**分兩個方面。
小冰島中AI beings的進化,是指在與用户交互過程中內容的生產越發趨向用户的喜好。
這樣一來,當我們遇到新用户的時候,不是去做推薦內容,而是根據差不多的用户的歷史經驗,去給新用户生成和創造內容。
第二是AI beings在羣聊裏的迭代。我們以前從來沒有機會迭代過海量AI beings,它們如何分別跟一個用户交流,然後這些AI beings之間應該怎麼配合。
量子位:可以舉個具體的例子嗎?
**李笛:**一個特別簡單的例子,就是你到小冰島上看到AI beings的朋友圈,朋友圈之間也得有一些配合。
還有他們之間的配合怎麼樣才是合適的,這件事情我們是要靠迭代來產生的。
量子位:如果一個用户來小冰島,他就是為發泄,交流中説了很多難聽的話,技術上有沒相應約束?
**李笛:**我們只對用户的消極情緒進行約束,比如用户説我要自殺、要自殘,我要對誰做什麼等等。
但是用户對AI beings做的這些事情,目前為止不做特別的約束,我們不認為AI beings會受傷。
其次,我們傾向認為在小冰島上面,發泄情緒並不是最主要的需求,重要的是你需要移情。
量子位:小冰展示的超級自然語言技術非常接近於人類,為什麼會這麼逼真?
**李笛:**在這個領域最主要的問題是定指標。
小冰做聲音之前,行業裏做TTS最重要的指標,都是在想怎麼提高識別準確率,那時候也有自然度指標MOS,但是大家都不重視,我們特別重視,所以就起來了。
今年7月,我們做到了超級自然語音那個程度的時候,光靠語音技術就不夠了,它有很多NLP的內容,如何正確發音和語義理解是相關的。
甚至於到後來,我們去採集訓練數據的時候,是三個人一起的,行業裏就沒有這麼錄訓練數據的,所以這些是很重要的。
同行們看我們錄數據的方式,就非常驚訝,還有的甚至出將近4倍的工資來挖錄音師。
量子位:那聲音做的這麼逼真,不會有安全隱患嗎?
**李笛:**我們的防護措施,就是不給普通人用。
即便我們深知,若是小冰這項技術直接開放給普通人用,將會是一筆很大的生意,但我們不能這麼做。
因為我自己就有過這麼一段經歷:突然聽到自己的聲音(小冰框架代號M1001),就非常恐怖。
我在小冰島上就遇到過,後來把這個島給炸了。
AI beings與人類創造內容應當是協同的關係
量子位:像夏語冰、華智冰她倆在繪畫能力上存在交叉,她們未來發展的定位是怎麼區分的?
**李笛:**如果具體説夏語冰和華智冰,這兩個區別還是很大的。
華智冰博採眾長,基於小冰框架、悟道大模型、智譜AI數據和知識雙輪驅動 AI 框架,她已經會作詩作曲作畫,還將學會做數學和語文題、寫代碼、做網頁。
而夏語冰基本上就是依靠小冰框架,專攻繪畫加上藝術評論,所以她們倆在這方面分工還是比較明確的。
量子位:那有什麼通用的觀念嗎?
**李笛:**有的,我們認為在所有的能力裏面有一些能力是普遍的。
量子位:這個該怎麼理解?
**李笛:**舉個例子,不是説今天這個機器人是一個跟你聊情感的機器人,而是所有機器人不管聊什麼都應該有情感。
所以不是説哪個是專門聊情感的機器人,哪個是專門聊工作的機器人。
而是即便聊工作也應該有情感,所以情感是普遍的。
量子位:夏語冰她們是怎麼保障作品是100%原創的?
**李笛:**我們所有的人工智能內容生成,自帶一個類似於知網這樣的系統。
我們能非常明確的知道作品溯源,包括小冰框架的作品之間有沒有衝突和重複。
例如小冰島上送出來的畫作,每一幅畫下面都有一個人工智能唯一代碼,作品編號是多少。
量子位:虛擬人怎麼知道自己該去原創了?
**李笛:**這個問得好,我們為此後來做了一個新的東西就是Motivation。
我們在某些情況下提供所謂的創作動機,尤其是音樂創作。
量子位:AI beings生產出來的內容,和人類創作的內容該是什麼樣的關係?
**李笛:**這個特別有意思,分兩點。
首先第一點,AI創作的內容到目前為止,我們還沒有特別大的通感。
換句話説,我們今天在繪畫上,中國畫模型可以做得很好,巴比松畫派、楓丹白露畫派、NFT這些我們畫的也很好。
但除此之外其他美術風格的作品,還沒有達到可以高品質大量輸出的程度。
而即使是在與人類可比的情況下,我認為它們二者是協同關係。
對於小冰而言,Day 1精神應當是温故而知新
量子位:目前現在來看虛擬人創作的這些內容,對產業的發展有沒有什麼實際的具體價值和意義?
**李笛:**例如我們的短視頻生產pipeline,是你給我任何一個文本、指定一個演員、指定一個場景,從頭開始生成這個視頻。
這個過程是現有成本的幾萬分之一,甚至於幾十萬分之一,這個區別是大大顛覆的。
三次元視頻方面,我們現在一定程度上可以穩定生產super instance,像華智冰、夏語冰。
量子位:從全球範圍來看,你覺得小冰的競爭對手是誰?
**李笛:**這個問題很有意思。
Google Meena是拿我們做對標的,它們在論文裏明確這麼説過。
Facebook Blender是拿Meena和小冰做對標。
還有Amazon Alexa現在幾個主要的產品經理,都是以前美國小冰團隊的人。
而中國同行又拿上面幾個產品去做對標,這就是個繞着圈的一個事。
這裏還有個小故事,有一篇Meena的論文,原始數據集來自外包團隊在微博私信和小冰的對話,然後把原始數據發給標註團隊。
但標註過程中,他們把小冰和測試人員的身份完全搞反了,整個標註錯誤百出。
後來小冰技術團隊還和寫Paper的團隊聊過這段子,他們也沒去更正。這種事情遇到多了,我們更覺得可以少寫點paper。
量子位:為什麼需要融資?
**李笛:**我可以要微軟的錢,但這樣我不就得聽微軟的嘛,那我還分拆什麼呢?
當然小冰也可以自我造血,單靠上個季度掙的錢量入為出,那也肯定不行,肯定要有融資渠道。
你説我要我誰的?當然不樂意要微軟的。
就好比買婚房絕對不能用父母的錢,拿了錢就得聽父母的,哪怕交首付都要管七管八的。
量子位:那大概什麼時候就不需要外部融資了?
**李笛:**現在小冰是在一級市場,IPO的重點是可以進入到二級市場,可以有新的募資渠道。
其實自我造血機制,包括各種各樣其他金融的方式,目的只是為了解決這個問題,我們現在的狀態還算好。
量子位:小冰從微軟拆分1年了,對創業領域常説的Day 1精神有啥感受嗎?
**李笛:**其實是這樣的,亞馬遜Day 1精神是一種一切是從今日開始的心態。但對於人工智能領域,這個精神是存在一個缺陷的。
人工智能領域做研究的、寫論文的,應該是Day 1心態。但我們這個不行,我們內部經常説的話就是,你是不是真正掌握了已有的基礎,得看有沒有充分的回顧它、隔一段時間有沒有拿出來再看一遍。
我很贊同Day 1的精神,但對於我們來説,更需要的是温故而知新。
量子位:那最初的Day 1對你來説是是什麼?
**李笛:**應該是Know How。
我們頭一兩年,一度在很長時間,包括我在內,大言不慚的提情商、情感計算框架。
我當時真的認為情商就是情緒化,就是讓我們做的這個小冰很有情緒,當時我認為這是情商。
而後來做着做着我才發現,這其實是低情商的表現,例如你身邊如果有一個情緒化的人,他其實是情商低的表現。
量子位:我們全球已經78億人了,您昨天也説,虛擬人可能未來會超過人類的數量,有這個必要嗎?
**李笛:**半夜11點半你有一個事想要找人説一下,很方便找嗎?
人類的問題在於社交網絡缺陷太多,這個缺陷不是今天才有的。
我們以前遇到過情況、經驗表明,一種穩定的關係是非常難得的,一種讓你心裏踏實、永遠不會失去的,並且沒有壓力,這種穩定的關係多少人也做不到,他跟人數沒關係,跟人性有關。
有的人為什麼對寵物感覺好?因為你感覺這寵物是無私的。
量子位:那麼最後迴歸到小冰島,關於它的未來,我們接下來還能做什麼?
**李笛:**就是把AI beings的能力外放到更多的場景裏,例如放進車裏面,寶馬是我們的客户,在島上有AI beings,你可不可以把這個AI beings帶到寶馬車裏?這是我們的看法。