Lux Capital的Josh Wolfe談投資機器人技術 - 彭博社
Tracy Alloway, Joe Weisenthal
與華為技術有限公司展台上的Unitree Go2機器狗互動的參會者。
來源:彭博社/彭博社 在過去的一年左右,可能每個風險投資家都對人工智能產生了興趣。因此,人們仍在摸索哪種商業模式實際上有效,誰最終會在這個領域賺錢。喬什·沃爾夫(Josh Wolfe)已經從事這項工作很長時間了。作為Lux Capital的聯合創始人兼董事合夥人,他參與了該領域的許多交易,並且已經在ChatGPT發佈以來的聊天機器人熱潮之後看向了下一個目標。在這一集中,我們與喬什談論了他目前感興趣的事物,包括機器人技術、生物技術和維護。他告訴我們,就像ChatGPT讓每個人都看到了聊天機器人的力量一樣,類似的時刻即將到來,將在機器人領域展現出來。本文已經經過輕微編輯以提高清晰度。

收聽 • 52分鐘2秒
Odd Lots:喬什·沃爾夫:機器人領域的ChatGPT即將到來(播客)
52:02
**播客中的關鍵見解:**迄今為止的生成式人工智能使用情況 — 4:10聊天機器人的日益失敗 — 7:04機器人模型與文本生成模型 — 9:24機器人領域的關鍵人員風險 — 13:19開源和機器人技術 — 17:11人工智能的盡職調查 — 21:02機器人臂 — 23:41機器人的遷移學習 — 26:21其他類型的機器人學習 — 28:02現有企業和機器人開發 — 33:18聊天機器人的護城河 — 35:50能源消耗和人工智能投資 — 40:56擴大上下文窗口 — 44:15---
**喬·韋斯坦(00:20):**大家好,歡迎收聽另一期Odd Lots播客。我是喬·韋斯坦。
**特蕾西·阿洛維(00:25):**我是特蕾西·阿洛維。
**喬(00:26):**特蕾西,讓我們再談談人工智能。
**特蕾西(00:29):**好的。我們可以讓人工智能為我們寫劇本,省點時間。
**喬(00:34):**不,我認為技術還沒有達到那個水平。你知道嗎?所以我不能説是誰,最近我和一位教授交談,她對我説了一些非常有趣的事情。我不確定[我能不能説],沒關係,我想我
**特蕾西(00:46):**説吧。
**喬(00:47):**她説,人們對孩子們作弊寫作文或讓ChatGPT為他們寫作文感到焦慮,據説教授們正在絞盡腦汁想要解決這個問題。
而人工智能檢測器實際上並不是特別有效,但顯然解決方案似乎是無論如何都將它們評為普通的作文。目前看來,所有的ChatGPT作文基本上都是C級作文,所以即使你認為它們可能是由人工智能生成的,至少目前看來,對於大學生來説,好好寫作文似乎還不是一種方法。
**特蕾西(01:25):**那我們的基準線,我們的平均水平,現在是ChatGPT了嗎?
**喬(01:30):**是的,基本上就是這樣,你能打敗這個機器人嗎?
**特蕾西(01:32):**你看到有人在推特上發的那個東西了嗎?AI生成的文字的一個線索是使用‘深入’這個詞。
**喬(01:40):**是的,我看到了。
**特蕾西(01:41):**作為一個我確定在這個播客和我的寫作中多次使用‘深入’這個詞的人,我覺得有點不公平。
**喬(01:48):**有點不公平。
**特蕾西(01:49):**這是一個陳詞濫調,但這並不意味着它來自AI。
**喬(01:52):**所有這些都説,AI不僅僅是ChatGPT,顯然還有聊天機器人——最近在幾集中有提到過,但只是非常間接地——人們談論AI在工業應用中的使用,我看到了很多東西。
有幾篇Bloomberg文章談到了一些初創公司,他們説‘好吧,如果我們像訓練大型語言模型那樣訓練機器人,你只需向它們提供大量真實世界數據’,那麼,是的,當然,你仍然需要解決機械工程的部分,但如果這樣的訓練數據使它們能夠做更高級的工業事務,比如,我不知道,製作比薩或者成為一個更強大的人類裝配線,或者類似的事情,就像我們看到所有這些令人印象深刻的機器人和視頻,比如波士頓動力,但我從來不知道其中任何一項是否已經具有其價值。
**Tracy (02:49):**是的,人工智能的機器人技術對我來説非常有趣。這讓我想到了我們想要看到的世界。如果我們有能夠打掃房子或照顧老年家庭成員等工作的物理機器人,那將是很棒的。如果我們所有的技術實力都用來寫ChatGPT的諷刺歌詞,那就不太好了。那很有趣,我自己也可以做到,但我真正需要的是有人來吸塵或擦拭房子。
**Joe (03:23):**洗衣服,會很不錯。好了,我想直接開始,因為我們真的有完美的嘉賓。我們將與一位長期投資於人工智能的人進行交談。顯然,去年很多風險投資商開始投資於人工智能,但這位嘉賓在人工智能領域投資了相當長的時間,早在它成為熱門話題之前。
我們上次七月份與他交談,談話很棒,討論了他在這個領域看到的東西。所以我很高興再次歡迎他來到節目。我們將與Lux Capital的聯合創始人兼董事總經理Josh Wolf進行交談。Josh,非常感謝您再次出現在Odd Lots節目中。
**Josh Wolfe (04:00):**很高興能參與。我覺得我應該用機器人的聲音説‘你好’。
**Joe (04:06):**那麼,您最近發現有趣的事情是什麼?您看到了什麼讓您興奮的東西?
**Josh (04:10):**嗯,你知道,你們開始談論人工智能,而在人工智能領域,我們已經有了一些可能有點貶低、有點粗俗的東西,我們有芯片,每個人都知道。我們上次談到了英偉達和AMD。
我們有聊天機器人。你們已經有一些這樣的傢伙開始失敗了。他們已經籌集了數十億美元,在某些情況下只是相對缺乏差異化,開源和大型私有模型之間存在着一場大辯論,這種開源模型正在接近大型私有模型的成就極限。
然後再説一點粗俗的,你們有女孩。我是什麼意思呢?人工智能中的大多數應用都是單調乏味的,一方面是像客户服務和基本呼叫中心的補充或替代,另一方面是有些人每個月在AI女友身上花費數萬美元,以及那些通常會用技術來滿足色情興趣的人。
所以對我來説,人工智能中的兩個極端是賺錢和利潤的地方,為了滿足基本的人類本能和需求。這對我來説沒那麼有趣。總的來説,你會看到從計算部分到能源部分的巨大轉變,這意味着人們現在意識到人工智能的瓶頸不會主要是芯片。
我們幾個月前也談到過這一點,我們説,看,你不一定需要這些英偉達芯片來進行推理——當人們查詢所有這些模型時,他們大多數時間都在做這個,你需要它們來進行訓練,但這些東西的功耗水平實在是巨大。
戴爾的財報電話中透露出這款 Nvidia B100 Blackwell 芯片將消耗一千瓦的功率,比這些 H100 芯片多了40%,50%。為什麼這很重要?因為現在你得想辦法如何為它供電。
有一個有趣的小道消息是亞馬遜在賓夕法尼亞州收購了一個核動力數據中心。他們花了6.5億美元,獲得了大約一吉瓦的電力,我認為這將成為一個趨勢。我認為這實際上將引領一波我稱之為元素能源的浪潮,但需求核能來為這些大型人工智能數據中心供電。
**特蕾西 (06:16):**是的,當你想到這一點時,有點有趣。我想沒有人預料到鈾最終會成為人工智能的一部分,但現在我們就在這裏。我想回到你説的一些事情,你上次我們去年談話時提到過,那就是一些更具公共面向的人工智能項目的新穎性。
我記得你去年指出過,使用一些這樣的東西真的很有趣,比如生成一堆你自己的卡通版本之類的,但這可能不是一個可持續的商業模式,最終可能會被整合到另一個平台或不同的項目中。你看到有沒有更具公共面向的新奇人工智能開始消失的例子?我記得你最近提到了一些失敗案例。
**喬希 (07:04):**是的。有很多公司基本上拿了 ChatGPT、GPT-3 或 -4,然後在其周圍加了一層包裝,基本上是為那些不知道如何使用這些或甚至不知道如何提出提示的普通用户提供一些與之交互的手段。
這些事情籌集了大量資金,使這些事情變得可獲得,並且它們已經逐漸消失了。支撐所有這一切的基金會模型本身也開始被相對地商品化,其中一些事情有着傑出的人物,籌集了大量資金,但我認為它們是失敗的。
以Inflection為例。你有穆斯塔法·蘇萊曼,非常聰明的傢伙,DeepMind的聯合創始人,為那家公司籌集了我認為是15億美元。你知道,我要小心謹慎,因為微軟可能是這整個遊戲中最精明的參與者,他們發現可以通過巧妙的方式收購東西,規避聯邦貿易委員會和司法部的監督,他們實際上控制了OpenAI,正如我們之前討論過的,尤其是去年年底圍繞OpenAI發生的所有爭議。
薩蒂亞説‘看,如果OpenAI破產了,我們擁有它,控制它。我們擁有所有關於他們的數據,左右中心周圍都是。’對於這家公司Inflection也是一樣。他們為這項技術做了我認為是6.5億、6.75億美元的許可,基本上是對風險投資者所做投資之上的一筆付款。
風險投資者賺了一點錢,但不多。關鍵管理層轉到了微軟,但微軟非常聰明。所以回到你的問題,我認為大公司會變得更大,並且會成為這裏的大多數受益者。微軟、Adobe、亞馬遜--亞馬遜本身即將迎來Bedrock一週年紀念,他們將宣佈他們擁有最佳表現模型Anthropic,他們已經在這個模型上投資了數十億美元,現在成為OpenAI ChatGPT的競爭對手。
他們還將宣佈與我們的一家公司之一在生物學領域尚未公開披露的事情。這將是兩大浪潮之一:生物學和你開始對話時提到的機器人技術。
以機器人技術為例,我認為在我們的一家公司Hugging Face中,這是所有這些開源模型的主要存儲庫之一,大約有6萬個文本生成模型。大約是59,700個左右,但只是一個龐大的文本生成模型數量。
這不是兩三個。這是每個人都在做這個,每個人都在嘗試做這個。基本上是基於前一個單詞來預測下一個單詞。這就是谷歌發明的轉換技術最終演變成的東西。猜猜有多少機器人模型?在文本生成中有59,000個。猜猜有多少機器人模型?
**特蕾西(09:22):**59,000的一小部分。
**喬什(09:24):**顯然我正在用我的手機領先,但是有19個機器人模型,所以你有--對我作為一名風險投資者來説,我們總是在尋找哪裏有豐富,哪裏有稀缺?機器人模型稀缺?為什麼呢?
嗯,相對來説在開放互聯網上進行訓練相對容易。你有維基百科,你有YouTube視頻,你知道,無論你是否應該這樣做。就像在Sora問到的那位女士“嘿,你是怎麼訓練這些東西的?是在YouTube上嗎?”你可能看到了。
所以在那方面會有各種版權問題。機器人很難,為什麼?世界上大部分已經存在的機器人技術,就像你在介紹中提到的那樣,都受到製造設施、工作單元、裝配線的限制,非常具體地受到參數約束,所以它們實際上所做的事情的自由度非常有限。
這些機器人本身可能有多軸夾持和控制器,但它們並不自由移動。像亞馬遜收購Kiva,將倉庫庫存物品移動的例外,但同樣,相對來説是X、Y、Z軸的訪問。不是無結構的環境。你我和我們的聽眾,每天都在無結構的環境中茁壯成長。
這就是你需要大量的訓練數據的地方。你不能在互聯網上搜索到這些。那麼你該怎麼做呢?出現了一些方法,你提到了一些文章。我們資助了一家最近從隱秘狀態中走出來的公司,叫做Physical Intelligence,而不是人工智能,是物理智能,這是來自斯坦福和伯克利的精英團隊。
你有一些OpenAI的人員,有Google DeepMind的人員。他們接受了來自OpenAI、我們和其他一些風險投資公司的投資,他們全天候訓練機器人做各種瘋狂的事情,比如疊衣服、倒阻尼液,但是讓這些機器人遇到無結構的環境,然後能夠在其中茁壯成長,你將看到的下一步是視覺模型,你實際上給出了一個宜家的草圖或者你畫了什麼東西,然後能夠指導機器人具有對世界如何運作以及事物如何相互連接的直覺物理感,並從中學習。
然後我們還用簡單的口頭提示來訓練這些機器人。所以有一個視頻可以在線看到,一些研究人員正在挑選堅果和M&Ms,並將它們分開,這只是一個能夠精確和靈巧地進行分類和過濾的任務。如果它們挑選了錯誤的物品,你實際上可以不用物理抓取物品,而是説‘停下,拿M&Ms,不是堅果。’現在它知道了。
所以我認為我們即將在機器人領域釋放出一種類似於ChatGPT的時刻,人們已經習慣看到機器人,他們看到了機械臂,看過《西部世界》之類的東西,突然間發生了一些事情,讓你大吃一驚。我認為這很快就會發生。
**Joe (12:27):**這非常令人興奮。因為就像我説的,至少有十年時間我一直在網上看那些波士頓的視頻,那些YouTube視頻,而且我現在有點相信它基本上是一個內容生成器。因為似乎從來沒有像瘋狂的機器狗之類的東西變成商業產品,但也許這就是缺失的環節,但你提出了三種不同的方向,我們可以探討其中任何一個。
這裏有一個具體的問題,然後我們也許可以回到機器人領域。這種情況是這樣的,高級前沿人才短缺,真正懂得如何做這些事情的人才。你提到了那個被微軟從其他公司挖來的傢伙,作為人工智能或機器人初創公司的投資者,這種情況是否與其他軟件或其他科技投資有所不同?基本上這種高技能技術關鍵人員風險,是嗎?
**Josh (13:19):**是的,你總是在尋找稀缺的東西,你想要稀缺的人才。如果任何人都能做到這一點,那就不那麼有價值。公司會得到資金支持,風險投資公司會資助,你知道,同時可能會有40家或者400家。
與那些非常基於網絡的或者昨天的團購網站形成鮮明對比,這是高度技術化的,通常是博士科學家。我們支持的公司,比如Covariant或Formic或這家新公司Physical Intelligence的創始團隊絕大多數都是來自斯坦福、卡內基梅隆、麻省理工等世界頂尖機器人項目的博士。
而且有這些偉大教授的傳承,其中許多人已經去世,但例如,有這個人,漢斯·莫拉維克,曾經在卡內基梅隆大學。我在他還活着的時候見過他,他是機器人領域的早期先驅之一,他提出了這個被機器人界內部人士稱為莫拉維克悖論,這是一個奇怪的反直覺現象,基本上是我們認為非常困難的事情對於人工智能來説實際上相當容易,而我們認為完全直覺和容易的事情,比如騎自行車,對機器人來説卻非常困難。
所以有這個偉大的悖論,一些最傑出的研究人員正在研究的問題是,我們如何用這些非常複雜昂貴的機器來做一個4歲孩子可以非常直觀地做到的事情?
然後還有各種考慮。我們可以談談這些機械臂是從哪裏來的?中國從歷史上許多德國公司收購的裝備,我的意思是機械臂,可以移動東西。
然後還有這場偉大的哲學辯論,尚未浮出水面,但我相信會出現的,投資者們正在排隊。我和一些人站在對立面;有人在資助人形機器人。
我説我站在對立面的原因是我並不真的相信它們。是的,你可能希望有人幫助照顧你的奶奶,也許提供一些陪伴,但這種電影中的想法,這些具有人類形態的 Ex Machina 類型的機器人,我們知道工程比進化更好。
如果我們明天要發明一輛汽車,用弗雷德·弗林斯通(Fred Flintstone)的腳來驅動這些石輪是一個糟糕的主意。我們知道致動器、軸和發動機只是更好的選擇,進化並沒有創造這些。為什麼我們要創造這些人形手,如果我要擰開瓶蓋,你知道,我必須轉動手七次才能做到。而如果我只是設計一個完美的機器人,它會有一個小吸盤,它會放在頂部,它會有一個鑽頭機制,它會快速擰開瓶蓋,然後它會像瑞士軍刀一樣更換下一個技術夾持器功能。
所以我認為人們被誤導了,他們基本上最終會為假肢或類似《西部世界》的東西做事。但我認為我們將在家中使用的實用機器人看起來與這些人形機器人完全不同。
**Tracy (16:05):**這很有趣,這讓我很想起我曾經和我爸爸有過的一段奇怪對話。他對外星人手的形狀有點固執,他説‘為什麼它們總是被描繪成有着類似人類手或者有時甚至只有三根手指的形象?為什麼它們不會進化到下一個非常高效的生理水平呢?’
無論如何,有一件事我想問,我在思考如何提出這個問題或者正確的詞彙是什麼,但是在機器人領域,開源有多廣泛,技術有多可共享或可複製?因為我覺得一個原因,你之前也提到過,但我們看到人工智能蓬勃發展的原因之一是因為你可以去像 Hugging Face 這樣的地方下載大量開源代碼並在此基礎上構建,然後這種技術會自我複製。但在機器人領域是否有這方面的任何情況,還是更多的是專有的?
**Josh (17:11):**硬件部分歷來非常專有,儘管有很多仿製品。有一家中國公司越來越主導這個領域。很多人不知道這個名字,[它]叫 Unitree,U-N-I Tree,Unitree,他們在模仿 Joe 談到的波士頓動力機器人,以及你在黑鏡劇集和其他類似節目中看到的機器人。
在軟件方面,實際上,因為它有着與許多導致大型語言模型產生的人工智能軟件相同的內核,起源於變形金剛,學術根源--學術界喜歡分享和發表。當然你可以對某些東西申請專利,但總的來説早期系統--一種叫做 ROS 的東西,你可能猜到,機器人操作系統,那些在做一種叫做 Arduino 的東西的人,這對於硬件和軟件交叉的業餘程序員來説,Poppy,還有一些這樣的東西。
但現在,你處於一種模式中,需要找到訓練數據,需要付出時間和精力,這需要花錢。因此,你將會有一些開放和封閉模型的混合,如果以物理智能這樣的公司為例,他們的動機是我們想要構建一個操作系統,任何機器人基本上都可以用來導航世界。他們想要為機器人構建大腦,而不是機器人本身。
還有一個有趣的哲學和科學的分支,巴巴拉·茨維爾斯基,她是一位朋友,曾是現在已故的丹尼·卡內曼的伴侶,他也是一位朋友,她的工作雖然不那麼出名,但我認為實際上更重要,她的工作主要是關於運動功能,她的假設是大腦存在的唯一目的實際上是產生運動,向食物或伴侶移動,或者逃離獵物或捕食者,而這反過來也在做同樣的事情。
我認為一些關於意識和記憶、空間感知、具身認知、手勢等最有趣的哲學問題,我的意思是,我現在説話時用手狂揮,這只是一種與生俱來的東西。當我們考慮人類大腦和機器大腦融合時,能夠進行心理模擬,我實際上認為這將會非常具有啓發性,隨着這些機器人系統的進步,我們將更好地理解思維和智力實際上只是關於運動。因此,我認為這是我們在資助這些事物的商業和投機風險中所做的一些事情中將會產生的一個相當酷的副作用。
**喬(19:42):**你總是説一些讓我想到我本來想問你的其他事情的話,但你提到學者喜歡分享他們的工作,這讓我想起有人告訴我的一些事情,所以你知道,我確定你經常在這個網站上,但對於聽眾來説,有一個網站archive.org,人們在那裏以某種開放源代碼的方式發佈各種科學和計算機方面的研究。
就在今天,在人工智能頁面上,有大約15篇新論文,它們的標題像是“數字代理的自主評估和改進”或者“用於衡量進展和改進LLM代理的模塊化基準框架”,我和一個人談話時,他聲稱所有這些東西都在被髮布,而投資者,很多風險投資者實際上並沒有足夠的技術能力來評判這些研究。
他們就像是那個‘拿去我的錢’的表情包。我很好奇你在這個領域看到了什麼,就像你這樣的投資者肯定會被博士們做各種事情所折服。就像‘哦,我們通過以不同方式訓練模型,使這個Nvidia芯片的能效提高了100倍。’你是如何評估這些科學內容的,對於這種看似不斷出現的突破,對投資者來説有多大風險?
**喬希(21:02):**嗯,你説得對,這是無窮無盡的,我是説這就是為什麼從範納瓦爾·布什的意義上來説,這是一個無盡的前沿,總是非常令人興奮,你需要對這些事情有一個很高的過濾器。並不是所有的東西都是商業化的。
有時候只是有一個突破,但也許這個突破可以被授權給一家公司,所以那些真正在商業化這一切並考慮資本配置和招募團隊,然後決定這是我們的前三個重點,即使有其他40個非常令人興奮的事情,我們可能也應該去做,但現在我們就不會去做
這才是公司建設的真正意義。因此,我們可能會有一位傑出的科學家,但也許這個人只是不是一個好的推銷員。他們無法講述一個故事,無法説服人們搬到另一個國家加入他們。他們無法籌集資金,因此他們不會成為一個偉大的企業家,他們可能更適合做科學家,但當我們做評估時,關鍵是在多長時間內能完成多少工作,誰會在乎?
就像你在玩撲克牌一樣,你在看你的牌,你在計算你必須為下一輪下多少賭注,然後外部因素是什麼,市場會怎麼説,他們會在乎嗎?這就是為什麼我很懷疑人們現在在資助其他領域,比如聚變或量子計算。
我對它們非常懷疑,部分原因是20年來人們向我們推銷的東西總是關於不可破解的密碼學和飛秒,我就在想,那又怎樣?人們承諾的大多數事情,比如不可破解的密碼學或分子建模,人們正在做,只是他們沒有使用量子計算機。他們使用GPU,他們使用英偉達芯片,他們使用新算法。
所以我一直對這個持懷疑態度。同樣,我對聚變也持懷疑態度,原因是,正如你所説,人們利用這種無知套利。他們利用投資者並不完全理解某件事情,它很熱門,出現在報紙或雜誌的頭版。這是一個熱點,他們想參與其中,所以他們投資,這就是欺詐產生的方式。
所以我們一直在尋找,並且基本上試圖説,這個學術從業者是否商業頭腦?他們可能不會辭職,所以我們只能得到他們20%的時間。知識產權是真實的嗎?而且正如你所説關於論文,論文的引用率很高。一篇被引用很多次的論文更具可信度,因為你有其他科學家的虛榮錯誤檢測和糾正,他們試圖打倒那個因為做了這件事而享有名聲的人,試圖奪取那個地位。
所以科學家並不是一羣仁慈的人,他們和調查記者、投資者或音樂樂隊的A&R代表一樣具有競爭性,都試圖在其他人之前揭露故事或到達目的地,我們也不例外。他們也一樣,但這就是所有這些事情的進展方式。
**特蕾西(23:37):**跟我們談談關於機械臂的事情。我要上鈎了。
**喬什(23:41):**我要説的第一點是,我不相信那些有手指和高靈巧度的類人機器臂。我認為這是一個很酷的把戲,但我認為我們應該有更像瑞士軍刀的機械臂,可以交換和移動東西,你可以在網上看到很多這樣的東西,你知道,不同的工具用於不同的任務,並且能夠立即完成。
當您將視野放在行業結構上時,您會看到FANUC,這是一個重要的日本參與者。他們從事工業機器人。他們進行工廠自動化,但他們是一個關鍵參與者,可能是一個價值250億至300億美元的企業。您還有ABB,這是一家瑞士-瑞典跨國工業機器人臂公司。這些是您在特斯拉超級工廠或其他地方看到的大部分設備,埃隆談論的所有自動化設備,其中一些就是ABB機械臂。
另一個是庫卡,KU-K-A,這是一家德國公司,他們是偉大的領導者之一。他們被一家中國公司收購,我想是在2016年或2017年。中國進行了一系列我認為非常明智的投資,收購了一些技術,這些技術有點超前,我認為這引發了一些地緣政治問題,也許在五到十年後,我們會看到並説‘天啊,為什麼(這家)是主要的機器人臂供應商或機器人主體供應商(一家中國公司)?’類似於,依賴TSMC一樣。”所以我認為會有國家機器人公司以同樣的方式形成,就像您開始看到國家人工智能公司形成一樣。
**Joe (25:07):**像Physical Intelligence這樣的公司是如何解決數據問題的?因為正如您所説,沒有類似於機器人互聯網的東西,可以觀看數百萬小時的機器人臂嘗試做某事或人類做某事或其他事情。解決令牌問題的方法是什麼?
**Josh (25:26):**我會稱之為簡單的方法,實際上相當瑣碎和困難,就是做人們最初在機器人手術中所做的事情。所以我們有一家叫做Auris Surgical Robotics的公司。我們以60億美元的價格將其賣給了強生公司。它起初是由外科醫生操作這些東西,就像是通過遠程機器人操作,所以他們的手指上有小夾子,你知道,從五英尺遠的地方或者在一個完全乾淨的手術室裏,他們在操作,但實際上是他們的手傳輸到設備上。
所以這是第一種方式,就是想出一百種不同的任務,也許是最頻繁的事情,比如洗碗、疊衣服——再次,無結構的環境,能夠在多個不同的房子裏做這些事情,不同的高度,不同的濕衣服,乾衣服,能夠倒咖啡,有靈巧打開K-cup的能力。我實際上不喝那些。我覺得它們很噁心,但是把它放進咖啡機裏。
**喬(26:18):**我不喝那些糊狀物
**喬什(26:21):**在這裏,是一名工程師在操作它們。對於重力的補償運動,需要多少力量,多少張力,多少壓力,這都是信息。這是歷史上沒有被捕捉到的信息,其中一部分是可擴展的——這是一件非常酷的事情。
你可以看到一些這樣的機器人,你可能有五種不同的機器人,但它們有一個叫做遷移學習的神奇功能。你教一個機器人一件事,突然之間另一個機器人,雖然是分開的,你知道,或者是通過互聯網連接的,但它實際上可以學會剛剛那個機器人學到的東西並執行任務。
所以這實際上相當神秘和很酷。這就像如果我有一個機器人看到我在房間裏扔球的地方,但其他三個機器人不知道,它們會立刻知道,因為它們有第一個機器人的眼睛。所以有各種各樣的訓練。
然後是圖表和圖紙。所以我之前提到過這一點,[用]宜家的圖紙,但一旦你可以拿圖表和圖紙,並實際使用視覺語言模型,這是OpenAI與Physical Intelligence合作的一個項目,他們在這方面取得了一些突破。這也將是瘋狂的,你可以簡單地展示一個宜家的圖紙,機器人就會根據一組有限的零件,一組螺絲和扳手等,完全組裝出任何一個嬰兒用品或傢俱或書桌,我認為這對人們來説也將是相當瘋狂的。
**Tracy (27:43):**那實際上將是一項重大的生活質量改善,非常重要,不必再組裝宜家傢俱。那將是令人驚歎的。
你能談談機器人是如何學習的,以及你認為最有前景的學習類型或不同的學習模式是什麼嗎?
**Josh (28:02):**你有兩個主要類別,或者也許有三個。你有監督學習。在那裏,你有輸入數據。機器人正在學習,它正在被糾正,在某些情況下,就像我之前描述的那樣,無論是聲音還是手勢或輕推。
然後你有無監督學習,機器人基本上是在非結構化數據上進行訓練。它們可以發現模式,它們遇到世界,遇到邊界,重力,那些東西。在這種情況下可能會慢一些,但它們正在減少錯誤的維度。我創造了一個術語,我稱之為MBTFU,即錯誤之間的平均時間,但你希望這個時間儘可能長。
如果回顧早期的Roombas,Roomba不會知道它是在清理巧克力牛奶的溢出還是你的狗搞砸了並把它弄得像榛子醬一樣弄髒了你的地板,對吧?你希望儘可能延長錯誤減少的平均時間。
然後你有強化學習,模仿學習,你可能在控制機器人或讓它模仿你。還有這個轉移學習的概念,一個單獨的機器人學會了某些東西,但它可以將其轉移到來自不同領域的不同機器人。
人們正在嘗試許多不同的方法,擁有更多不同的機制,人們將會找出哪種數據消耗最小,哪種延遲最低且最快?或者哪種是最適合訓練機器人的系統,你可以將其放在完全無結構的環境中而不需要任何訓練,這就是他們所説的零-shot學習,它能夠從先前的知識中找出‘我知道我不能穿過那把椅子,我知道它可以旋轉,我必須這樣轉動它。我知道我需要多大的力量來拿起一個普通的可樂罐’,以及那些東西。
我認為,再次強調,當我們在生活中度過任何一分鐘時,我們是多麼理所當然地利用我們對物理世界的直覺性默契知識。實際上,我們在移動時有一種直覺性的物理學。機器人將會學會這一點
**Joe (30:12):**只是一個非常簡單的問題,在接下來的五年裏,我是否有可能在家裏有一個機器人,我可以把所有衣服從烘乾機裏拿出來,放到某個地方,然後變成疊好的衣服?或者如果不是這樣,那麼什麼可能是就在眼前的機器人的ChatGPT呢?
**Josh (30:31):**有一件事情,我向團隊提出了一個設想,因為我正在考慮這個問題,你知道,什麼會是一個非常酷的東西,我總是在我們的公寓裏丟東西。我們有很多不同的房間。我會很高興地説‘有人看到了嗎’,這通常是我對我的妻子和三個孩子説的話,‘有人看到了我的錢包嗎?有人看到了我的眼鏡嗎?’
好的,只是宣佈你可以看到一個機器人在你家裏有一系列的東西,它會有視覺識別和視覺學習,機器學習能夠在視頻幀中識別物體,可以説‘是的,喬什,我知道它們在哪裏,去找到它們。所以對我來説,在家裏找到並取回物品是一件相當酷的事情。‘我把遙控器放在哪裏了?’或其他。
而且機器人基本上知道,因為它們可以查看家裏的DVR,他們基本上知道在哪裏,他們可以用正確的物理學去找到並取回它。疊衣服,我不知道如何去評價。我們現在可以相當粗糙地做到這一點…
**喬(31:24):**那是我想要的。因為我住在一個小的紐約公寓。我不會像太多人那樣丟東西。基本上我需要那個疊衣服的機器人。
**喬什(31:32):**但你願意為此付費嗎?我不知道。你會為一個疊衣服的機器人付五千美元,一萬美元嗎?可能不會。這就是為什麼大多數這些東西首先被用於工業用途。隨着時間的推移,它們會變得越來越便宜,越來越好。
但是看,我是為數不多的擁有亞馬遜Astro的人之一。這是一個可以在房子裏滾動的機器人,你可以讓它進入一個房間,你可以把東西放在它的後面,它可以為我的家人進行面部識別。所以我可以説‘奎恩或博迪在哪裏?’然後他們就會找到我的小孩,我可以發送消息。這讓我妻子很煩惱。但我覺得這有點酷,是的,每一個新出現的機器人,我都會是早期採用者。是的,我們喜歡發現這些東西。
**Tracy (32:33):**當前科技週期和所有對人工智能的熱情中有一個有趣的事情是,到目前為止,似乎是那些大型老牌企業在這裏獲勝,部分原因是因為所需的資本投資如此巨大,所需的數據量也如此龐大。
當涉及到機器人技術時,你是否期望看到類似的情況,然後再加上,如果你是一家大型製造商,或者可能是一家擁有大量專有數據的公司,比如保險公司或金融公司之類的,你是否可以開發自己的機器人?這會是你的優勢嗎?你是否有可能自己完成這個任務?
**Josh (33:18):**在第一個案例中,如果我看看當前的情況,那麼在那個大七巨頭中的一家公司將會是亞馬遜。因為他們已經投資了很長時間。傑夫·貝索斯對機器人非常熱衷。所以我認為在那裏有一種基因,使他們能夠做到傑夫歷史上喜歡做的三件事情,即增加選擇和可用性,為客户提供更多便利,降低價格以及工廠自動化、倉庫、交付。
即使當他們以一點多過10億美元收購了我們的公司Zoox,該公司正在進行自動駕駛,他們長期打算能夠24/7地進行右轉車道導航穿越城市,有一個人基本上在進行最後一英里的交付。所以我可以看到亞馬遜會這樣做。
微軟,我並沒有真正看到他們會在機器人領域有顯著進展。他們有一些研發工作,谷歌,我們談到了這種現象,但他們是第三或第四個我們從大科技公司中招攬團隊的公司。我們曾與谷歌合作,與一家名為Osmo的公司合作,基本上創建了一種用於嗅覺的Shazam。我們還與一家名為Evolutionary Scale的生物人工智能公司合作,這家公司屬於Meta,很快將會有更多公開的宣佈。
然後我們與谷歌的這個團隊合作,他們成為了谷歌、DeepMind、OpenAI以及斯坦福大學和伯克利大學之間的Physical Intelligence。所以我認為這將更多地成為初創公司,資金的受益者仍將是英偉達和一些芯片廠商,一些硬件供應商。
我們需要硬件來訓練機器人。但我真的認為這是一個開放的領域,再次回到那個關於聊天機器人有多少大型語言模型,以及為機器人準備了多少模型的統計數據。我認為這是一個巨大的機會。現在,五年後,我們可能會看到機器人領域的泡沫,但今天我認為這是一個非常令人興奮的領域。
**Joe (35:05):**關於現有人工智能和競爭優勢。所以當我第一次在2000年左右遇到谷歌時,我使用它,我覺得‘這比雅虎或其他任何東西都要好得多。’從那以後,我再也沒有停下來。
對於聊天機器人,現在甚至談論機器人,就好像我早期獲得了ChatGPT Pro賬户或其他東西,我覺得它很酷,我用它做了一些事情,然後Anthropic推出了新版本的Claude,我覺得‘哦,這實際上很酷,我有點更喜歡它。’我不太清楚為什麼我更喜歡它,但出於某種原因,我更喜歡它,並且我毫不猶豫地轉換了。一些核心模型可能不像人們期望的那樣具有粘性或深壕渠嗎?
**Josh (35:50):**完全正確。他們推出的語調,叫做 Pi,實際上並不是很好。他們現在已經轉向微軟。Anthropic 起初有點落後。他們是最具表現力的模型。它們是表現最好的。它們是我和你都最常使用的,因為它速度最快。它有一點點更多…
**Joe (36:08):**它似乎説話更好一些。
**Josh (36:11):**是的。但是關於你提到的關於壕溝和谷歌早期的一點,谷歌大部分搜索,記住谷歌的 2800 億美元廣告收入,你知道,巨大。谷歌,其中大部分是五到十個詞的搜索。所以你輸入一些東西,比如,‘西村的餐廳’,或者其他什麼的。
Perplexity,我不知道你是否用過,我們早期見過創始人,最終我們沒有投資,這可能是我們的一個失誤。但是那裏的創始人專注於‘你知道嗎?我要做那 0.2% 的搜索或者那 1% 的搜索,那些更長的形式,人們真的想要問一個完整的問題。’ 我看到很多人在使用它,它並不會給出一些覺醒的答案或者一些簡潔的,你知道,像 Grok 那樣的回答。
它實際上是一個經過良好研究、註腳齊全、引用來源的回答。所以對我來説,目前在聊天機器人方面我最常使用的兩個東西是 Anthropic 的 Claude 和 Perplexity。但是六個月後可能會有完全不同的東西,開源上可用的模型數量龐大,誰知道蘋果最終會在這裏做些什麼並將其整合。你知道,Siri 很爛,但 Alexa 也是。亞馬遜在採取行動。蘋果也會。
但你可以稍微放大視野。風險投資領域正在經歷低迷,唯一一個估值非常高、資金流動充裕、人才輩出的領域是人工智能,因此這些領域的未來回報將會較低。
這就是為什麼我們在Lux決定,你知道,我們將專注於人工智能在現實世界中的應用。在過去的五年裏做了所有這些事情之後,我總是説有這種五年心理偏見。每個人都希望今天投資在五年前應該投資的地方。所以Hugging Face和Mosaic,我們將其賣給了Databricks,我們五年前就參與其中了。如今,我們對生物學、機器人技術以及人工智能在這些領域的應用非常感興趣。
然後我有一個非常奇怪的主題,對我來説很性感,因為對我和其他人來説並不性感。你瞭解會計,絕大多數風險投資者和許多初創企業的人並不瞭解。但你看CapEx,CapEx由兩部分組成:增長和維護。每個人一直在資助增長、增長、增長、增長、增長和風險增長。
所以我對維護產生了興趣。為什麼?因為你有數萬億美元的資產,基礎設施、醫院系統、能源系統、建築物需要維護和發電,每個新創企業和每個新投資者總是想做新的事情。這就是為什麼我們有新音樂、新食物和新時尚,但所有這些被忽視的資產,我認為你可以應用新技術來維護這些系統。因此,我對這個不性感的維護主題着迷,我認為在未來幾年這將成為一個熱門領域。
**Tracy (38:55):**等等,你的意思是維護物理基礎設施嗎?所以你是説你可以有一個小機器人在你的工廠周圍或一堆高速公路上巡視,尋找裂縫或需要修復的東西?
**Josh (39:08):**完全正確。它可以是交通基礎設施。它可以是在醫院內部進行例行事務。而且很奇怪的是,我知道你們已經報道過這個,但AI實際上正在針對白領工人。你知道,你開玩笑説你可以談論AI並基於AI生成腳本…
**Tracy (39:28):**哦不,這不是笑話。非常認真。
**Josh (39:31):**是的,他們總是認為他們相對獨立,只有藍領工人會受到影響。但讓我告訴你,讓我創業的那個人,卡萊爾集團的創始人比爾·康威,他把所有的慈善基金,或者説其中相當大一部分,用於資助護士學校。為什麼?因為他確定了一個非常高的影響程度,因為我們在這個國家缺乏護士。
這是一個機會,機器人和技術可以發揮作用的維護領域。如何增強和幫助護士。水管工,我們在這個國家有大量的水管工短缺。所以我實際上認為,由技術賦能的藍領工人並維護我們周圍所有這些系統實際上將是一個成功的組合。
**喬(40:09):**我想談談我認為AI投資的另一個方面,那就是在我猜測的SaaS浪潮,2010年代,計算變得非常便宜。所以基本上你可以插入AWS,這種情況下,是的,我知道這可能要花一些錢,但對於很多公司來説,這不是一個很大的支出項目。
這會如何改變?在2024年,當你在處理一個AI公司時,電費存在或硬件積累,取決於他們在堆棧中的位置,作為一名投資者,你如何考慮這種變化,我猜人們會談論轉變,不得不在資本支出和運營支出之間花費更多,相對於前一代科技初創公司。你如何選擇投資時,這會如何發揮作用?
**喬希(40:56):**這是一個很好的問題。在AI世界中,然後我會給你生物學世界的例子,在AI方面,以OpenAI為例,這些都是傳言中的數字,沒有完全確認,但大約20億美元,也許30億美元的收入。我認為大約有1000萬人每月支付20美元左右,或者大約有一億用户。我不知道其中有多少是獨特的,但他們在這方面沒有賺錢。
今天他們損失了數十億美元,因為你有這些前期成本,大量的資本支出,很多培訓,然後你可能嘗試做一些大型企業交易。像Hugging Face這樣的公司是盈利的,因為他們不是在做,他們只是託管它,讓人們運行推理,然後收費並在這類事務上獲利。對我來説,有趣的是那些花了大筆錢的人,他們必須賺回來。
你能通過將每月的價格從20美元提高到30美元來獲得定價權嗎?也許你可以做到這一點,因為現在你有了Open AI高級版,你可以訪問Sora進行視頻生成或類似的功能。
所以這將是一個重要問題,這些是否是有利可圖的投資?不是‘它們是否很酷?’不是‘它們是否改變世界?’當然,它們是。但它們是否是有利可圖的投資?而且,市場可能並不在乎它們是否有利可圖。市場資助各種他們相信敍事、故事的無利可圖的事物。
但是考慮到基本業務和資本支出與運營支出之間的經濟變化,我認為在人工智能領域,如果你正在建設數據中心,嘗試進行自己的訓練、推理,託管這些模型,這是非常困難的。
在生物學領域,我們將看到一個AWS時刻,而不是你必須成為一家開設自己濕實驗室的生物技術公司,或者搬進專門託管生物技術公司的亞歷山大房地產公司在所有這些不同地區靠近學術研究中心的地方,你只需將你的實驗上傳到雲端,在那裏有基於雲的機器人實驗室。
我們資助了其中一些。有一家名為Stradios的公司。還有很多即將湧現。這是令人興奮的,因為你可以是巴哈馬的海灘上的科學家,拿起你的iPad,運行一個實驗。機器人執行90%的活動,比如從一個燒杯中倒入另一個燒杯,運行離心機。
然後從中得到的數據,這才是真正酷的部分,然後機器人和機器實際上會對你説‘嘿,你想運行這個實驗,但更改這四個參數或這些變量嗎?’然後你只需點擊一個‘是’的按鈕,就像是它在反向提示你一樣,然後你運行另一個實驗。
所以這裏的含義是,對於科學的生產力提升,對於真理、新信息、新知識的生成,對我來説是最令人興奮的事情。而捕捉到這一點的公司——別提社會紅利了——我認為會賺很多錢。
**特蕾西(43:29):**這實際上讓我想起了我們之前討論過的話題關於零食創新,以及你可以使用類似Factorio的模擬來運行新的工廠流程,看看它們實際上會如何運作以及供應鏈可能會是什麼樣子。
但是,不要太過於偏袒我的五年偏見並過分關注ChatGPT,但在上下文窗口擴展方面我們處於什麼位置?這是我們去年與您討論過的事情,我認為對於很多人來説,這可能是像ChatGPT這樣的東西最令人惱火的地方之一,事實上你不能真正複製和粘貼太多文本到其中,而且在輸出方面受到限制。自上次與您交談以來有重大進展嗎?
**喬希(44:15):**嗯,克勞德3是最大的之一。然後你有各種有趣的合作。你有英偉達和微軟做了一個帶有大量標記的項目。你有A121實驗室有一個叫做侏羅紀的東西。
再次,很多人在這裏取得了進展,但我認為我們還有一年的時間,你就能夠上傳數百份PDF,數千本書,如果它們還沒有立即可引用,並且能夠檢測文檔之間的模式變化,總結並揭示關鍵概念的全部內容。
然後我認為最有價值的事情將是促使你説‘這是你剛剛上傳的所有這些文件中你沒有問到的問題。’ 所以是的,我認為我們將繼續增加上下文窗口。但是話雖如此,創新的大部分歷史就是不斷增加這個因素,然後另外有人會出現併發明出一些東西。
就像這個因素不再重要一樣。我最喜歡的標誌性例子是帆船。你會發現那些古老的帆船,它們不斷地增加更多的帆。這些東西開始看起來荒謬,然後有人發明了電動機,你就有了摩托艇。
所以我認為我們會有同樣的情況,然後人們會發現,嘿,這裏有一個比不斷增加上下文窗口更好的架構。其中一些可能涉及到記憶檢索,能夠參考其他模型並進入他們所擁有的檔案。所以是的,這將不斷擴展。
**喬(45:48):**Josh Wolf,Lux Capital的Josh Wolf,非常感謝你再次出現在Odd Lots。總是很高興瞭解你感興趣的事情的最新動態。
Josh(45:55):<以機器人的聲音> 能和你們在一起很棒。
**喬(45:58):**好。你已經開始準備融入並與人類融為一體。非常感謝。太棒了。
首先,Tracy,我真的很喜歡和Josh交談,也總是很喜歡瞭解最新動態。不過我真的想要那個疊衣服的機器人。我實際上認為那是一件很重要的事情,如果人們不必擔心疊衣服,幾乎每個人的生活都會變得更好。
**Tracy (46:37):**我同意,有一個能夠做家務任務,比如疊衣服的東西會更有用,而不是告訴你你的丟失的錢包在家裏的哪裏。
**Joe (46:46):**那就是我想要的。我需要那個疊衣服的機器人。
**Tracy (46:48):**我是説,我知道每個人都喜歡取笑Alexa,但我們家,我們已經裝備了所有的燈 -- 它們都是智能燈泡,因為我們沒有任何頂燈線路,所以一切都必須是燈。所以如果你沒有一個能夠一次性打開房間裏所有電器的機器人,那將會非常惱人,因為你將會從一盞燈到另一盞燈再到另一盞燈。
所以至少對我的日常生活有所影響。我的意思是,從中可以得出很多東西。我認為從產業政策的角度來看,Josh討論的一些在中國等地正在發展的機器人能力的想法很有趣,我們可能會遇到另一個芯片、半導體類似的情況,即在10年後我們會意識到機器人的一個主要組件正在其他地方以更高效、更便宜的方式被建造,而不是在美國或西方。
然後我認為有趣的另一件事是躍遷的概念,對吧?所以我認為很多人,包括我自己,在思考技術進步時,會想到這個東西能否稍微快一點?它能否在稍微更大的規模上運行 -- 關於上下文窗口和擴展的問題?
但是正如喬希所説,你可以在技術上實現飛躍,你可以從帆船轉變為摩托艇,或者你可以繞過人類的進化。例如,你可以擁有一個類似於剪刀手愛德華的東西,手臂末端帶有瑞士軍刀。
**喬(48:27):**是的,這對我來説很有道理,如果你從零開始,顯然通過數百萬年的進化形成的人類形態並不一定是你想要創造或重新創造來執行你需要的各種任務的東西。
我喜歡其中的很多內容。他在最後談到的那件事,聽起來有點像雲廚房,但用於生物實驗室。所以如果你讓所有機器人來做,然後它們可以提示你其他想法。這很有趣。
這個想法似乎令人興奮,可以積累這些訓練數據的方式,就像,你知道的,也許可以解決機械工程問題,但是沒有等同於Reddit或維基百科或Google圖書或YouTube上的所有文本。因此,必須重新創造這些內容作為建造機器人的瓶頸是非常有趣的。
我喜歡他使用的術語,我想那是“無知套利”,這是一個非常好的術語。所以,是的,在很多純科學領域,你會得到願意向那些只是在紙上有一個非常好的想法的人投錢的投資者,那個人很聰明。
**特蕾西(49:35):**嗯,我認為這也是這一特定週期的非同尋常之處,即現有企業的主導地位以及一方面你確實有一堆開源軟件,在某種程度上你可以從存儲庫中獲取一些東西,然後向投資者推銷並説“這是下一個大事件”,而他們可能沒有技術專長來實際評估那個東西。
但是當涉及到像機器人技術這樣的實際進展時,似乎你必須在某個方面有優勢。你要麼必須有資本來部署,要麼必須能夠訪問那些數據。所以我不知道,我猜我們會看到事情如何發展。
**喬(50:16):**我猜明年我們會再次見到喬什。是的,
**特蕾西(50:18):**是的,明年,
**喬(50:19):**明年春天或夏天看看下一個大事件是什麼。
**特蕾西(50:22)**希望他能帶着某種機器人一起來。
**喬(50:24):**一個可摺疊的機器人。
**特蕾西(50:25):**好的。好了,我們結束吧?
**喬(50:28)**就到這裏吧。
你可以在Twitter上關注喬什·沃爾夫@wolfejosh。