對話王晟:AI投資,認知要早_風聞
树龙谈-1小时前
2021年下半年,英諾天使基金合夥人王晟開始認真研究大模型,想找一個大模型項目投點錢。
當時美國硅谷出現了一批大模型相關的項目,發展很迅猛。比如年初成立的Jasper,在市場上非常火爆,它只需一個簡單提示,就能生成各種風格的營銷文案,當年就賺了3000萬美元。而Jasper的底層系統,來自於OpenAI在一年前推出的大語言模型GPT-3。
王晟留意到了GPT-3,覺得這個方向或許隱藏着大機會。雖然當時生成式AI的質量還不太理想,但他覺得對於投資而言,或許到了一個合適的時點。
但當時國內做大模型的創業團隊不多。2021年底,英諾天使基金在清華大學設立了一個獎學金項目,支持計算機系的學生做研究,2017級博士豈凡超申請了這個項目。王晟意外發現,豈凡超正在做的大模型項目,正好就是他想投的方向。
2022年4月,臨近畢業,豈凡超對王晟透露了想創業的想法,王晟果斷決定投資,深言科技成立了。
天使輪之後,豈凡超開始為下一輪融資做準備,三個月內談了四五十家VC,沒有一家願意投資。“大家都看不懂,不知道什麼是大模型。”王晟對我回憶。
9月下旬的一個週五,王晟拉着豈凡超跟紅杉資本的一個合夥人吃了頓飯,三天後就收到了詳談的邀約,豈凡超聊完拿到了紅杉的TS(投資意向)。
英諾天使基金合夥人 王晟
行業看起來一切如常,但一些嗅覺敏鋭的投資人,已經提前感受到了大模型行業即將到來的波濤洶湧。
2個月後的11月底,OpenAI正式推出ChatGPT,因為效果驚豔,整個科技圈大為震撼。一時間,AI大模型爆火,科技公司紛紛跟進,整個投資圈一蜂窩衝上去看大模型項目。深言科技在隨後又拿到了騰訊、好未來、春華資本、三七互娛等機構的投資。
2023年的“百模大戰”中,VC對着20來家創業公司猛投,項目估值一時被拉到很高,很多投資機構陷入迷茫。按照王晟的話説,“大家第一看不懂,第二不敢投,第三投不到。對於絕大多數早期投資機構而言,已經沒法玩了。”
英諾天使基金通過提前佈局,拿到了這波大模型競賽的船票。此外,英諾天使基金還投資了一些做基礎設施和應用的項目。王晟告訴我,投資一年多時間,深言科技的估值漲了十幾倍。
如今,大模型熱潮還在繼續。前不久,我跟王晟進行了一次深聊,他對我講了投資大模型的歷程、經驗和感受,也分享了他對大模型創業投資的一些觀察和見解。以下是正文:
01
大模型估值有泡沫,比的是“市夢率”
問:英諾什麼時候將AIGC確定為一個重要的投資方向?
王晟:我們其實投AI不算晚,之前就在AI賽道花了很多時間。國內第一波AI浪潮差不多從2013年開始,誕生了AI四小龍(商湯、曠視、依圖、雲從),我們從2016年開始投資,投中了文遠知行、智行者、中科原動力等項目,後來投了一些圖像視頻類的AI公司,再就是這一波大模型。
問:大模型項目估值很高,動輒幾十億人民幣,這是不是對關注早期投資的基金不太友好?
王晟:早期基金就得投的早。2022年11月底OpenAI推出ChatGPT之後,很多VC才去學習,提升認知,開始找項目。實際上你今天看到的項目,絕大多數都是在那之後出現的,而我們在那之前就開始佈局了。
問:在ChatGPT出現之後,還有哪些項目是適合早期投資的?
王晟:幾乎沒有。
問:為什麼?
王晟:我覺得市場跟大家看到的情況不一樣。2023年整個AI投資是兩端收斂,資金端20多家VC投資很活躍,資產端就幾十個項目融了很多錢,兩邊都沒有泛化,這個市場還不夠繁榮。
中基協統計全市場VC有1.2萬家,實際出手的可能連200家都不到,活躍的也就20來家,剩下的都是在看熱鬧,跟着搖旗吶喊。因為大家第一看不懂,第二不敢投,第三投不到。一堆創業者各種鼓吹項目多厲害,其實根本沒人投。
問:為什麼會呈現兩端收斂的格局?
王晟:創新有周期,當多個方面的基礎科學研究達到一個閾值,就會出現天才企業家把科研成果轉化成技術創新,帶動一個新的技術範式。
一個新的技術範式出現之後,首先要做infra(基礎設施),就像建一個商場,先得通水通電有電梯,但做infra不會泛化,因為需要大筆投資,能玩得起的玩家不多。如果infra本身還不完善,去做應用毫無意義,會被基礎設施的升級碾壓掉。
另外,今天能做的所有創新都是受限的,湧現出優秀的創業者和產品經理還需要時間。2007年iPhone出現,移動互聯網浪潮開啓,但很多重要的應用隔了好幾年才出現,拼多多是2015年,抖音是2016年,而ChatGPT從推出到現在也就一年時間,沒人知道它的能力邊界在哪裏。
問:所以要在恰當的時間段內做恰當的事。
王晟:是的。過去兩年行業在大力構建infra,還沒到大量做創新項目的時間點,今年會有一些能夠迅速提升生產力的應用湧現出來,目前一個共識是,2023年是大模型元年,2024年是Agent元年,但還不是AI應用的元年。所有投資人都是在這種規律週期裏做符合週期的事情。
問:你説的拿到投資的幾十家創業公司,是以大模型為主嗎?
王晟:大模型可能佔了接近一半,另外有一些是infra,比如芯片算力、無損網絡、光模塊。我們也投了端側的算力芯片,但我們不太相信在數據中心這種通用的GPU上,能跑出來一個初創公司,因為硬件特別不適合VC投很多錢。
問:所以投大模型的主要還是資金實力雄厚的大機構和巨頭公司?
王晟:目前看來是這樣,除非你投的早,因為對天使投資來講投的早很重要。
問:現在市場上號稱有200多個大模型,你認為有水分嗎?
王晟:我認為能屬於頭部的也就十幾家。
問:頭部的幾個項目估值飛漲,有的高達百億人民幣,你覺得是否存在高估?
王晟:肯定是高估了。商湯現在是300多億港幣,而曾經有3000億。現在大模型的估值拉到這麼高,都是市夢率,可能未來會拉到更高,但最終還是要看如何落地,能不能避免上一波AI在落地上無法找到特別有效的商業場景的情況。
問:現在行業裏怎麼估值?
王晟:大家會基於未來的收入,給十幾倍二十倍的PS(市銷率),現在實際給到的都是大幾十倍甚至上百倍的PS。沒收入的就拍腦袋給個數。
問:作為早期投資人,面對這種局面會不會焦慮?
王晟:沒什麼可焦慮的,因為我們投了深言科技。這是目前為止,所有大模型項目中收益率最高的投資。這些大模型公司我們想投都能投的進去,只不過有些我們選擇沒出手。
問:為什麼不出手?
王晟:我們的單筆投資跟項目的估值匹配度不好,這不是説我們投不進去。其實對於絕大多數早期投資機構而言,已經沒法玩了,大量的VC首先不知道該往哪個方向投,其次大家一窩蜂都上的時候,他也不知道誰厲害,然後他也找不到這些人,即便找到了人家可能沒興趣讓他投,他也投不進去。我們沒有這些問題。
問:王小川的百川智能之前很火,你們有接觸嗎?
王晟:2022年4月初,我跟王小川一起吃過一頓飯,他歡迎我們投資,但確實太貴了。當時是親友輪,估值5億美金,英諾的典型投資一般是1000萬人民幣,這在5億美金的盤子裏確實不太匹配。
所以我覺得早期投資機構需要認知早,做判斷早,不能在VC一哄而上的時候才反應過來,那就已經不是早期投資人能參與的了。在市場達成共識之前出手,價格就會可控,共識達成後價格會上漲很快。
02
投資大模型,最核心還是看人
問:你們怎麼判斷哪個項目能跑出來?
王晟:核心看團隊做大模型的能力。中國跟美國有一個很大的差異,投資人往往會迫切要求項目落地到具體的應用場景,拿到訂單獲得收益,只講商業模式是不被認可的,但另一方面中國的用户和企業都不願意付費,很少能像OpenAI那樣獲得很高的年收入。但是投資人可以認可一個團隊做好大模型的能力,我們相信大模型跟某些行業深度結合之後,可能會創造出巨大價值。
問:所以投資人看的不是現在的商業模式,而是一種能力和可能性。
王晟:對,你可以理解2022年投的大模型項目都沒有商業模式,大家也説不清楚怎麼賺錢。
問:哪些方面的能力對一個大模型團隊至關重要?
王晟:最核心的還是人,所有公司都是如此。你有了最好的人才,就能夠吸引投資,有錢了就能買算力,再去吸引更好的人才,飛輪就能滾動起來。
問:什麼背景或者類型的人才是最被看好的?
王晟:我覺得這是動態的。一開始學術水平高的團隊更有優勢,大家比的是科研能力,LLaMA開源之後,大家對大模型的認知迅速被拉齊,這個時候擁有更強工程能力、融資能力的團隊更容易贏。
問:中國創業者從LLaMA開源學到了什麼?
王晟:如果自己從零到一練大模型,過去累積的經驗、科研能力、方法是非常重要的,或許某些方面在技術上不難,但它是一個綜合的、涉及到很多技巧和方法的事情,一旦有個點被卡住了,靠自己可能需要花一兩年時間才能解決。Meta過去這些年積累的大模型技術,本來都是不傳之秘,結果一開源,迅速把很多認知拉平了,這意味着很多坑不用再踩,那些在大廠做過巨大系統工程的人,優勢就體現出來了。
問:接下來可能會怎麼演變?
王晟:我認為LLaMA接下來應該也是開源的,可能是多模態,仍然保持很高的水準。當再過幾年,開源大模型能力封頂的時候,更大的挑戰就來自於做產品的能力。那時對一個團隊最大的挑戰不是科研,也不是工程,而是整個系統的運營能力,那可能就是王慧文的時代。
問:這麼説的話,王慧文入場太早了?
王晟:我覺得王慧文有一點做錯了,他角色錯了。他下場的階段是拼技術、科研、工程,他的優勢在後期的市場和運營,未來對他更友好。
問:有些大模型企業是在開源模型上做創新,還有一些是套殼,你認為這兩種有沒有機會?
王晟:有這麼三類企業:第一類是真正有能力做大模型的企業,第二類是基於開源大模型做微調、部署,第三類是調用外部大模型的API接口。後兩種屬於大模型應用公司,要特別專注於應用場景,側重於發現需求,做好產品,因為它的價值在於把模型用好,把需求滿足好,我覺得機會也不小。
Infra完善之後,就會出現很多應用。但受限於我們的想象力,這些應用都是基於過去的,現在用新技術來做遷移,把新的技術範式當成做創新轉變的手段,所以幾百個大模型,很多都是大公司甚至上市公司在做,他們實際上是試圖用大模型賦能原有業務,優化業務鏈、工具鏈、工作流。
問:但有些公司似乎只吆喝不行動。
王晟:有些上市公司口號喊得響,可能是為了拉股價。實打實做大模型的企業,在二級市場很少。技術範式遷移的過程中,其實沒有創業公司太多機會,因為大廠佔據了場景、客户、數據,創業公司只能等創新,需要時間去湧現。
問:之前大家都説要做中國的OpenAI,你覺得現在有公司能配得上這個稱號嗎?
王晟:我覺得目前還沒有。
問:差距有多大?
王晟:現在國內頭部的大模型差不多都在GPT-3.5的水平,最頂尖的距離GPT-4和Gemini可能還有兩年的差距。一方面在語言能力,另外在多模態方面差距挺遠。差距能否縮小,就要看這一次大模型技術範式的天花板有多高,包括多模態能不能也變成生成式,我覺得未來會變成生成式多模態大語言模型。假如LLaMA不開源,我們今天的水平可能比現在還要差,會被國外的大模型公司大幅甩下。
問:現在很多大模型會説自己在某個指標上超越了GPT,在一些排行榜奪冠,這能代表模型的真實水平嗎?
王晟:現在的榜單多而雜,基本原理是給AI出題,但我們發現有些榜單的題目和答案都是錯的,所以打分越高,可能意味着模型能力越差。對於投資機構而言,刷榜的得分不重要,什麼樣的團隊能做什麼事,其實大家都知道,重點還是看人。
03
大廠做大模型沒有優勢,機會屬於創新者
問:行業裏一種觀點,認為基礎大模型交給大廠做就好了,沒必要重複造輪子,你怎麼看?
王晟:這是屁股決定腦袋。我認為大力度的顛覆式創新,應該由初創企業來做,而不是由某些業務上的壟斷者來做,因為作為既得利益者,第一它做不好,第二不利於整個創新的生態。
問:表面看起來,大廠有很多優勢。
王晟:我覺得沒有什麼優勢。
問:他們會講,有云計算、人才、資源。
王晟:熊彼特講創新,其實不是顛覆式創新,而是創造性破壞。創新會對舊勢力造成沉重打擊,所有不創新的企業都會被破壞掉,而大廠就代表舊勢力、舊的生產力、舊的範式,創新本身就是要顛覆他們的。大廠願意做的都是當一個東西看起來成熟時,跳出來搶奪勝利果實。漸進式創新、無法形成特定壁壘的項目,很容易被大廠打擊,爆發式創新、具有飛輪效應的項目,只要飛輪轉動起來,大廠就很難將它幹掉。
問:你覺得這一波AI跟上一輪最大的區別是什麼?
王晟:大模型。過去的小模型不會帶來泛化的智能,只能在特定場景表現不錯,現在我們已經看到了大模型的湧現,而且過去的語言任務是理解式,現在是生成式,它能做的事情會更多。
問:差異怎麼體現?
王晟:我們經常開玩笑,人類能感知,動物也能,而且不比我們差,但動物能做的事就很少。只有是生成式,才會像人類產生巨大的、更復雜、更多元化的經濟活動。
問:垂直模型是偽命題嗎?有人認為數據太少就不會有智能湧現。
王晟:其實大語言模型已經有很多數據了,再給它很少的數據也能湧現,就像一個受過非常多教育的人能觸類旁通,因為底座太強大。更重要的其實是,大模型應該深入到工作流中去,讓AI變成工作的人,而不只是一個聊天機器人。只有AI進入工作流,它才在行業裏有價值,這就是Agent要做的事。
問:大模型的競爭,是不是已經不再可能會有新的團隊出現並擠進頭部陣營?
王晟:目前看不太可能。
問:現有的玩家你更看好誰?
王晟:現有的幾家各有特色,而他們其實代表了不同的探索方向,現在贏就變成了一個更復雜的事兒,長期還是要看誰真正挖到了需求。
問:黃仁勳和馬斯克都提到,會在2029年之前看到AGI(通用人工智能)。你的預測偏樂觀還是偏保守?
王晟:我覺得沒戲。從大的範式上來看,有人相信基於transformer就能實現AGI,但transformer存在一個悖論,它做複雜的事情容易,做簡單的事情有時候很困難。我覺得有一些其他範式也有機會,比如基於強化學習的具身智能,以及全腦計算。
問:接下來你覺得哪些領域可能會出現爆款應用?
王晟:多模態大模型、生成式視頻、Agent。
問:現在這一波AI創業,創業者如果不懂技術,是不是就沒什麼機會?
王晟:那就等幾年。現在這個新舊範式轉移的階段是屬於技術高手的,等底層的創新都做完了,創新做成平台化,會需要產品高手和運營高手,那才是新一波大眾可以參與的時候。
問:作為投資人你是怎麼學習的?如何獲取信息?
王晟:除了常規的信息渠道,我覺得還是得跟厲害的人交流,這樣能提升認知。另外投資是一個非常複雜的綜合性的系統,不是説我投AI就只學AI,它還涉及到很多交叉學科的知識,比如我會看腦科學、行為學的東西,一個廣泛的知識體系還是挺重要的。
編輯 / 黎明
—— end ——