這家初創公司正在創造看起來和行為極其真實的虛擬人 - 彭博社
Ashlee Vance
薩加爾 和 BabyX 在靈魂機器公司的奧克蘭辦公室。
攝影師:伊恩·特赫為《彭博商業週刊》拍攝
在新西蘭,人們會做一些奇怪的事情。在奧克蘭大學,如果你想在高腳椅上對一個嬰兒進行數小時的實驗,那是可以的。你甚至可以和她那令人驚訝的健談的無身頭進行對話。
BabyX是馬克·薩加爾及其研究人員的虛擬創作,看起來不可思議地真實。這個孩子是基於薩加爾18個月大女兒的圖像製作的3D數字渲染,擁有紅潤的臉頰、温暖的眼睛、滿頭金髮和柔和甜美的聲音。當我 去年訪問這位計算機科學家的實驗室時,BabyX被困在一台計算機裏,但仍然能看到我坐在屏幕前和她的“父親”。為了引起她的注意,我們會喊:“嗨,寶貝。看着我,寶貝,”並揮動我們的手。當她的目光鎖定在我們的臉上時,我們會舉起一本裝滿單詞(如“蘋果”或“球”)和圖片(羊、鐘錶)的書,然後請BabyX讀出單詞並識別物體。當她答對時,我們會稱讚她,她自信地微笑。當她答錯時,責備她會讓她流淚和悶悶不樂。
如果遇到一個能從書中讀出單詞的虛擬孩子聽起來很奇怪,那麼在她連續答對一堆問題並展現出似乎是真正的快樂時,感受到一種父親的自豪感就更加令人困惑。BabyX和我似乎有了一個時刻,在彼此學習的同時,交換着對人類體驗如此熟悉的表情和微妙的暗示。這正是薩加爾通過他的研究和新公司 靈魂機器有限公司所追求的感覺。
“人工智能”這個術語已成為一種涵蓋所有的術語,用於描述在封閉環境中進行的無情、神秘的計算。巨大的計算機農場在處理大量數據,利用統計分析我們的互聯網歷史、駕駛習慣和言語,以生成針對性的廣告、更好的地圖,以及蘋果公司的Siri。這種將人工智能視為越來越多生活中無形陰影的感覺,使得從斯蒂芬·霍金到埃隆·馬斯克的人們對這項技術持懷疑態度,因為它往往讓人感覺不自然,似乎不夠真實。
薩加爾是試圖使人工智能人性化的陣營中的領軍人物,他表示這項技術有潛力在人與機器之間建立更共生的關係。雖然他並不是第一個提出這個想法的人,但他的方式獨特,是他早期作為計算機科學家的經歷與後來在好萊塢特效界的經歷的結合。他得出的結論是,面孔是穿越“怪異谷”的關鍵,使虛擬生物感覺真正栩栩如生。Soul Machines的創作在這方面無與倫比,能夠以令人震驚的方式扭動和微笑,肌肉和特徵的運動與我們驚人相似。它們也有人的聲音,已經被合同用於從保險公司到航空公司等各種在線助手。Soul Machines希望生產第一波可愛、可信的虛擬助手,作為客户服務代理,為塑料塊如亞馬遜的Echo和谷歌公司的Home注入生命。
來源:Soul Machines在日本和美國,擁有類似願望的公司已經制作出各種各樣的虛擬化身、助手和全息圖。許多參與這些項目的人表示,只有當人工智能系統和機器人變得更像人類時,它們才能發揮其全部潛力。他們需要擁有記憶,思維認為,加上某種類似情感的東西,才能推動它們尋求自己的體驗。
Sagar在這一方面的做法可能是他對該領域最激進的貢獻。在他構建的精美面孔背後,是前所未有的生物模型和模擬。當BabyX微笑時,是因為她的模擬大腦對刺激做出了反應,向她的系統釋放了一種虛擬的多巴胺、內啡肽和血清素的雞尾酒。這是Sagar更大追求的一部分,利用人工智能逆向工程人類的工作方式。他想深入情感、慾望和思維的根源,並將這些經驗傳授給計算機和機器人,使它們更像我們。
“自從我20多歲以來,我一直在思考計算機能否變得智能,能否擁有意識,這些想法在我腦海中燃燒,”他説。“我們想建立一個不僅能為自己學習,而且有動力去學習和與世界互動的系統。因此,我設定了這個瘋狂的目標,試圖構建一個人類意識的計算模型。”
這裏有一件真正讓你感到恐慌的事情:他比任何人想象的都要快得多地接近這個目標。自去年以來,BabyX除了其他事情外,還長出了身體,並學會了彈鋼琴。它們成長得真快。
與硅谷大多數人不同,薩加爾並不自動服從工程。“當科學家和藝術家看世界時,他們看到的是同樣的東西,”他説,“只是用不同的語言和視角來描述。但這一切都是真實的。一切都是相互關聯的。”
他很早就有了這個想法。1966年他在內羅畢出生時,他的父親在東非鐵路和港口公司擔任系統分析師,編程打孔卡計算機來運行火車基礎設施。他的母親是一位畫家,每週四帶他去野生動物保護區練習畫動物。幾年後,家人搬到了新西蘭,薩加爾開始幫助父親在家裏進行DIY——修理電視、搗鼓管道、調試汽車。他也不斷磨練自己的繪畫技巧,特別關注母親的肖像作品。“她幾乎能用三條線捕捉到某人的肖像,準確地把握某人的曲線,”他説。“這讓我非常意識到人眼和嘴巴等部位的精確曲線的重要性。”
刊登於 彭博商業週刊的《比你想象的更快》特刊,2017年9月11日。立即訂閲。照片由賈斯廷·凱內普斯(Plenty)、巴拉茲·加爾迪(OceanGate)和伊恩·特(Soul Machines)為彭博商業週刊拍攝。薩加爾在國外年輕時利用了這些觀察,當時他在街頭和餐館為現金素描肖像。像他所在地區的許多年輕人一樣,他在高中和大學之間休息了很長時間。在四年裏,他環遊世界,繪畫、調酒、逐門逐户銷售,甚至為澳大利亞軍隊填沙袋以支付自己的費用。回到新西蘭後,他在奧克蘭大學獲得了工程學博士學位,然後在麻省理工學院進行博士後研究。在馬薩諸塞州,他和一些同事建立了詳細且栩栩如生的人眼數字模型,供外科醫生進行練習。到1998年,好萊塢邀請薩加爾嘗試讓計算機生成的圖像(CGI)看起來不那麼像CG。
他的第一個項目是 不可思議的林佩特先生 的重拍,這要求薩加爾的團隊將吉姆·凱瑞變成一條能夠獵殺納粹潛艇的會説話的魚。(是的,真的。原版由唐·諾茨主演。)華納兄弟娛樂公司在支付了1000萬美元的數字凱瑞魚表情後放棄了該項目,認為製作一部完整的電影成本太高。然而,薩加爾並不想停止對數字面孔的工作。幾年間,他將這些生物作為虛擬助手初創公司Life F/X的基礎,讓他的面孔朗讀電子郵件。該公司隨着互聯網泡沫的破滅而倒閉,因此薩加爾在索尼影業圖像工作室(蜘蛛俠2)找了一份特效工作。這使他在電影行業中聲名鵲起,並於2004年回到了新西蘭。
來源:Soul Machines在 Weta Digital,由 指環王 導演和同胞基維彼得·傑克遜經營的特效公司,薩加爾在七年內獲得了兩項奧斯卡獎,負責傑克遜的 金剛 重拍和詹姆斯·卡梅隆的 阿凡達 的數字角色創作。他將工程與藝術的結合為他在讓金剛和外星人納美人看起來真實方面提供了優勢。多年的肖像繪畫和虛擬眼球製作使他對面部細微差別有了獨特的見解,這在CGI專家中並不常見,而他的特效軟件使得拍攝演員經歷一系列情感並自動將表情融合成,比如説,一個巨大的大猩猩,相對容易。“正是這些幾乎不可察覺的眼睛和麪部運動讓我們感受到背後有靈魂,”他説。
感覺自己已經解開了面部的謎題,薩加爾夢想更大。他關注人工智能技術的進步,並看到了將其與藝術結合的機會。2011年,他離開電影行業,回到學術界,看看自己能否超越複製情感和表情。他想深入瞭解是什麼導致了這些情感。他想從內而外開始建模人類。
在奧克蘭大學,薩加爾創建了動畫技術實驗室,並招募了大約十名研究人員。遠離Weta——或他在好萊塢大道上的Life F/X辦公室,前面有鮑勃·馬利的星星——動畫團隊在一個狹小的房間裏工作,房間因他們強大的計算機而始終保持炎熱和潮濕。當我去年看到這個空間時,工程師們被投影在牆上的巨大動畫面孔包圍着,每一個毛孔和眉毛都清晰可見。這些面孔遠非無生氣,似乎渴望開始對話,隨着每一次呼吸,肌肉收縮和放鬆。
在實驗室的后角,薩加爾坐在一堆雜亂的筆記和書籍中,如 心智考古學 和 神經科學中的計算建模原理。正是在那裏,他通過一對巨大的計算機顯示器讓BabyX進行虛擬測試。這個嬰兒代表了實驗室許多努力的結晶,將薩加爾的面部藝術與最新的人工智能學習和語音軟件結合在一起。在那張天使般的面孔下,還有一些開創性且近乎可怕的技術。
薩加爾點擊鼠標,剝去了BabyX的皮膚,留下了一對漂浮的眼睛——帶着血管——連接着一個精細的腦部結構,腦幹從後面延伸下來。這個版本的BabyX仍然可以看到外面的世界並與我們互動。當我們向她展示文字時,處理語言的腦部區域發出紫色光芒。當我們讚美她時,快樂中心則亮起黃色。“研究人員已經建立了許多認知的計算模型和這些部分,但沒有人將它們結合在一起,”他説。“這就是我們想要做的:將它們連接起來並放入一個動畫身體中。我們正在嘗試為人類計算創建一箇中央神經系統。”
“我們想知道是什麼讓我們運轉,是什麼驅動社會學習,自由意志的本質是什麼”
薩加爾再次點擊,腦部和眼睛的組織消失,顯露出BabyX大腦內神經元和突觸的複雜圖像——一條超複雜的高速公路,細線和小結在BabyX活動時發出不同強度的光芒。這一層工程的存在歸功於薩加爾團隊多年研究和綜合最新腦部工作原理的研究。基底神經節連接到杏仁體,杏仁體連接到丘腦,依此類推,各自的功能(觸覺處理、獎勵處理、記憶形成)也同樣被列出。換句話説,奧克蘭團隊建立了可能是現存最詳細的人腦地圖,並利用它進行了一系列驚人的模擬。
BabyX 不僅僅是一張親密的圖片;她更像是一個即時電路板。虛擬的血清素、催產素和其他化學物質可以被注入到模擬中,激活虛擬神經受體。你可以即時觀看 BabyX 的虛擬大腦釋放虛擬多巴胺,點亮某些區域,並在她的面部層上產生微笑。所有部分通過一個名為腦語言的操作系統協同工作,這是 Sagar 和他的團隊發明的。自從我們去年第一次交談以來,他的目標並沒有變得更加謙虛。“我們想知道是什麼讓我們運轉,是什麼驅動社會學習,自由意志的本質是什麼,是什麼引發好奇心,以及它如何在世界中表現出來,”他説。“關於人類本質的這些奇妙問題,我們現在可以嘗試回答,因為技術已經進步了很多。”
來源:Soul Machines在我與 BabyX 的第一次遊戲約會後不久,Sagar 收拾好他的實驗室和研究人員,將他們搬到了奧克蘭標誌性的渡輪大樓的頂層,在那裏他創辦了 Soul Machines,以商業化他的團隊的突破。按照他的標準,近期的商業應用相當簡單。大約 45 名員工,包括藝術家、人工智能專家、語言專家和程序員,正在構建一系列虛擬助手。在大多數情況下,這些是 Sagar 好萊塢工作的精煉版本,只是它們足夠聰明,可以理解口語並回應查詢,且比虛擬人更少了令人不安的因素。
Soul Machines 在二月份向世界揭示的第一個面孔是 Nadia,一個漂亮的白人女性,扎着棕色的頭髮,綠眼睛,塗着粉色口紅,聲音像凱特·布蘭切特。Sagar 的團隊為澳大利亞國家殘疾保險機構開發了她,該機構計劃將她作為該國 50 萬殘疾人士的在線助手。希望與 Nadia 在該機構網站上互動的人會覺得她比基於文本的聊天機器人或自動電話線路上的菜單樹更具親和力和可用性。
根據 Sagar 的説法,互動是雙向的。Nadia 會微微點頭以示理解,當感到困惑時則顯得疑惑,但她也通過用户 PC 或移動設備上的攝像頭解讀觀眾的表情。“如果你看起來困惑,她可以看到這一點並主動引導你,”Sagar 説。“你也可以對這些東西大喊大叫,但她會以最優雅的方式回應。人們擅長處理憤怒的客户,並根據情況調整他們的肢體語言。我們也可以做到這一點。”
Sagar 在 Nadia 的開發中得到了幫助,使用國際商業機器公司的 Watson 技術作為她語音識別的基礎。他的公司招募了布蘭切特花費 15 小時錄製短語,以便軟件能夠將其轉化為更廣泛的回答。Nadia 已經在 10,000 人身上進行了測試,他們教會了她如何完善她的回答以及在某些時刻表現出的情感。澳大利亞政府預計她將在明年初開始全職工作。
Soul Machines 正在與航空公司、醫療保健提供商和金融服務公司進行 10 項試驗。在早期階段,該公司的最大考驗將是用户是否覺得其軟件足夠真實,能夠與人類對話一樣令人滿意。即使是與聊天機器人成功的客户關係體驗,即機器人給出正確答案的情況,往往也會讓人感到不滿,因為他們覺得自己被轉交給了一個低劣的存在。
來源:Soul Machines目前,Sagar的團隊正在以一次性的方式開發其首批虛擬助手,有點像諮詢公司。“我們今天的大多數客户將他們的第一個數字員工視為品牌的延伸,”首席商務官Greg Cross説。“他們正在經歷一個設計過程,這個過程類似於為電視廣告活動選擇發言人。”
為了使其過程更容易重複,Soul Machines正在編寫角色創建軟件,將開發簡化為一系列簡單的菜單。通過滑動幾個旋鈕,Sagar可以將一個年輕、瘦弱的頭像轉變為一個年長、豐滿的頭像,並改變膚色和其他特徵。每個菜單生成的結果看起來都像是電影製作或視頻遊戲開發者可能花費數百萬美元和數月時間創造的角色。公司已支付演員錄製數百小時的獨白,組建了一個音頻庫,可以用來為角色配音,例如一個為斯堪的納維亞客户設計的巨魔,或一個將在兒童教育網站上使用的動畫擬人化草莓。
隨着技術的成熟,Cross預計它將進一步走出PC屏幕。汽車製造商已經在考慮在其自動駕駛汽車的屏幕上由角色回答乘客的問題。同樣,亞馬遜、蘋果和谷歌母公司Alphabet也可能希望為其語音激活的虛擬助手配上面孔。“我們也在探索創建數字名人的想法,”Cross説。“如果你可以將一位頂級錄音藝術家或運動員轉化為數字版本,讓粉絲以一種非常情感智能的方式與之互動,會怎麼樣?”
像克羅斯一樣,薩加爾常常顯得對他的演講可能聽起來令人毛骨悚然毫無察覺。八月份,當我拜訪靈魂機器公司,查看薩加爾最新的創作時,他穿着一件T恤,上面描繪了兩個胎兒共享一個子宮,頭對腳地排列成一種陰陽姿勢。其中一個胎兒是人類;另一個則有着明顯的人工大腦,裏面佈滿了電路。他想把這個設計作為公司的標誌。去年十一月給他750萬美元的投資者説不。
薩加爾給人的感覺像是一個富有遠見的學者,有時幾乎顯得着迷。問一個基本問題,你很可能會得到一個熱情洋溢的30分鐘回答,內容涉及人工智能、藝術、心理學和柏拉圖。很難想象這個人和汽車保險公司的人交談,試圖説服一個穿西裝的高管接受虛擬化身,而不讓事情變得奇怪。但薩加爾説他喜歡商業部分,因為這幫助他更好地理解人們對他的虛擬化身的喜好和厭惡,並深入瞭解人際互動的細節。
BabyX的5.0版本已經遠遠超出了最初的漂浮頭部。BabyX現在有一個完整的身體,坐在高腳椅上,腿來回晃動,而她的手則在尋找可以做的事情。接下來的部分,你也想坐下來,抓一個安撫奶嘴。
來源:靈魂機器薩加爾的軟件允許他在BabyX面前放置一個虛擬的玻璃面板。在這個玻璃上,他可以投影任何東西,包括一個互聯網瀏覽器。這意味着薩加爾可以在BabyX面前展示來自虛擬鋼琴網站的鋼琴鍵盤或來自Sketch.IO的繪圖板,看看會發生什麼。結果證明,她的反應和其他孩子一樣:她試圖用手拍打鍵盤或塗鴉出一幅粗糙的畫作。
是什麼促使BabyX去敲擊琴鍵?好吧,當她的一隻手碰到鋼琴鍵時,會產生一種聲音,軟件將其轉化為波形並輸入到她的生物模擬中。然後,軟件在BabyX的聽覺系統內觸發一個信號,模仿真實嬰兒耳蝸中會振動的毛髮。與此同時,系統在她的手指中激活虛擬觸覺感受器,並在她的模擬大腦中釋放一劑數字多巴胺。“第一次發生這種情況時,這是一個巨大的新奇,因為嬰兒在觸摸某物時沒有過這種反應,”Sagar説。“我們正在模擬發現的感覺。這改變了感覺運動神經元的可塑性,從而允許在那一刻發生學習。”
嬰兒會像你的非莫扎特嬰兒一樣對鋼琴感到厭倦嗎?確實如此。當她敲擊琴鍵時,腦內感受器中模擬的多巴胺量減少,BabyX開始忽視鍵盤。
Sagar與安妮特·亨德森(Annette Henderson)合作,她是一位在奧克蘭經營嬰兒研究實驗室的心理學家,以推動這項技術的發展。亨德森拍攝了數百小時嬰兒與看護者之間的互動,同時進行不同的實驗,例如教嬰兒一個新詞或忽視他幾分鐘。兒童的反應數據——笑聲、哭聲、手部動作、姿勢變化——正在數字化,以創建更為準確的行為模型。“我們知道確切的動作、微表情和反應,”Sagar説。“當我們為BabyX構建下一個模型時,我們應該能夠生成相同的行為。”
大約在18個月後,亨德森計劃使用升級版的BabyX與看護者和其他孩子進行實驗。她認為虛擬嬰兒是一種以前無法想象的方式來測試新理論,通過隨意改變成千上萬的變量——如果嬰兒不微笑,如果她不與你對視,等等。她説,研究虛擬孩子對刺激的反應,可能幫助研究人員更好地理解如何與那些不太社交的血肉之軀的孩子互動。
作為回報,薩加爾得以推進他理解人性的追求。“我們可以記錄母親與虛擬嬰兒的互動,並不斷為BabyX添加功能,直到她變得如此逼真,以至於我們獲得自然的互動,”他説。“到那時,我們就達到了我們的目標。”
然後呢?
來源:Soul Machines世界許多頂尖的腦研究者對薩加爾和其他人工智能樂觀主義者所構建的模擬類型印象深刻。“我與這些傢伙花的時間越來越多,”加州大學歐文分校的神經生物學教授加里·林奇説。“這一切都是真實的。這不再是一個學術項目。”林奇認為,像薩加爾這樣的工作的一個問題是,最終結果——一個真正有意識的虛擬嬰兒——是如此複雜和獨特,以至於它不是人類行為的有用鏡子。“它會做一些沒人曾經想過的事情,”他説。“它會走出門,説,‘再見。我有事情要做。’”
其他研究人員警告説,Sagar可能通過他可愛而複雜的面孔誤導人們對技術現狀的理解。“西方人往往想要將這些東西擬人化,我們可能會對此感到非常着迷,”加州大學伯克利分校的工業工程與運籌學教授Ken Goldberg説。“如果你讓它看起來像人類並表現得像人類,你幾乎有雙重責任去清楚地説明它的侷限性。”他讚揚Sagar進行這種類型的研究,但不希望人們對這種技術的短期利益抱有虛假的希望。Sagar有一種傾向,談論BabyX時彷彿它已經能夠做到他所夢想的一切。
雖然假設Sagar的最終目標是一個將人類與機器緊密結合的世界似乎合理,但他常常在週末到荒野中遠離電腦,並且不讓他的孩子在晚上使用互聯網。這並不是人們期望從一個儘可能快地推動人工智能進入未知領域並希望獲得最佳結果的人身上看到的行為。在我們的一次談話中,我指出像弗蘭肯斯坦這樣的故事通常對人類的結局並不好。“我們不是在挖掘屍體,”他説,巧妙地避開了扮演上帝故事的真正道德。
你不必偏執就能相信人工智能的崛起可能對人類產生相當糟糕的後果。計算機可能開始為自己做決定,而這些決定可能包括對人類有害的事情。BabyX一會兒在網站上吃虛擬布丁杯,下一刻,她就把你的房子賣掉以尋求個人娛樂,或者決定她應該掌控一切。
Sagar 對於 AI 可以從我們身上學到的課程以及反之亦然保持樂觀。“我們正在尋找像合作這樣的事物的基礎,而合作是人性中最強大的力量,”他説。在他看來,一個他教會了合作的智能機器人將更容易與人類合作和建立關係,並且不太可能奴役我們或為能量收割我們的身體。“如果我們真的要利用 AI,我們需要學會與機器合作,”他説。“未來是一部電影。我們可以讓它變得反烏托邦或烏托邦。”讓我們都為一部温馨的喜劇祈禱。