C.AI賣身真相:好技術,好方向,「壞」產品_風聞
极客公园-极客公园官方账号-56分钟前

Character.AI 創始人Noam,用技術發現了一個產品新大陸,但沒有好的產品團隊,就無法佔領這個新大陸。
整理 | 宛辰
編輯| 靖宇****
去年 AI 領域的注意力在大模型,今年變成了 AI 應用,Character.AI(下稱 C.AI)是最出圈的 AI 應用,甚至沒有之一。
在 AI 陪聊這個賽道,C.AI 跑得最快、最早,今年 7 月份最新日活數據是 600 萬,平均用户時長在 2 個小時。即便是放在整個社交陪伴賽道,有這麼長用户時長的應用,也不多,放在 AI 應用裏,更是寥寥。
意外的是,8 月 3 日,Character.AI 在官方博客文章中,宣佈與 Google 達成協議,包括兩位創始人在內的 30 位員工加入 Google,剩餘大部分團隊留在 C.AI,繼續打造產品。作為條件,Google 以 C.AI 此前 10 億美元估值的 2.5 倍,向 C.AI 投資方兑現投資回報。
近日,極客公園視頻號「今夜科技談」直播欄目,邀請硅基流動聯合創始人&CEO 袁進輝、創新工場聯合首席執行官&管理合夥人汪華,與極客公園創始人&總裁張鵬對這一話題進行了探討,細緻拆解了從 C.AI 到近一年來 AI 創業圈的熱點案例與未來走向。

以下為本次直播沉澱,由極客公園整理:
01
25 億美金買一個
「Jeff Dean」回來,不貴
張鵬:進輝是最早投身 AGI 浪潮的創業者,不管是之前的「光年之外」,還是現在的創業項目「硅基流動」。我相信 Character.AI(下稱 C.AI)推出時,你肯定研究過。那時,你對 C.AI 這家公司、對創始人,有哪些觀察和理解?
**袁進輝:**我關注 Character.AI 確實比較早,因為創始人 Noam Shazeer 既是學界大咖,在 Google 的聲望也很厚,所以一直有研究這個公司的走向。
最早關注到,引起 Transformer 革命的這樣一個科學家,為什麼不在大廠裏追尋科學的制高點,而是要出去創業做產品,做一個通用人工智能(AGI)的公司。一定程度上,他的出發點是對 Google 的產品動作、節奏的不滿,希望有更好的自主性、靈活性。
Noam 團隊做出的 Character.AI,應該是最早有比較大流量的 To C 產品,非常接地氣。我們做光年之外的那個階段(2023 年),很多人在研究「怎麼做 AI 時代的 Super App」,當時相當多人看好、相信、研究 Character.AI 的方向,它的確是一個標杆。
張鵬:一個這麼有影響力的創始人,做出給創投界很多信心和希望的標杆型AI應用。突然,就被「併購」了。你當時聽到後的「內心戲」是怎樣的?
**袁進輝:**我確實懵了一會兒。其實今年 3 月去參加英偉達 GTC 大會的時候,就聽到 C.AI 有尋求被收購的想法,但是靴子一直沒落地,當真正發生的時候,是有點意外。因為這對我們這個行業的從業者肯定會有所影響,比如,我覺得會影響「行業大氣候」,像融資、大家的創業方向之類的。
後來琢磨了一會,我覺得它確實反映了一些比較底層的邏輯變化。比如更早的時候,很多公司在講模型和應用的雙輪驅動、產模一體等等。這個變化是,同時想搞好模型和應用是有一些挑戰的。另外,C.AI 公開信裏面也認為開源模型已經可用了,能滿足他們未來的產品需求,這也會對很多應用從業者有所啓發。
但是從長期來説,我還是覺得整個行業處在非常早期的階段。從很長的週期來看的話,這件事也是一個正常的波動。
張鵬:汪華怎麼看 Character.AI 被「併購」?最早 C.AI 給你們留下什麼印象和啓發?
**汪華:**我相對熟悉 C.AI,因為我跟開復之前都在 Google 工作,很多朋友也都認識 Noam Shazeer。
Noam 當時選擇出來做 C.AI,是當時 Google 不讓他發佈大模型產品——LaMDA。
其實 Google 做出 LaMDA 要比 ChatGPT 早很多,至少一年。當時 Noam 就想發佈 LaMDA,因為他想到真實用户裏看這個東西的反饋,因為沒有人類反饋,永遠做不好。但是 Google 不讓,所以有了 Noam 出走創業。
C.AI 處於非常擰巴的狀態已經有一段時間了,Character.AI 做出了一個很好的產品,但其實是因為它的模型很強。去年 4 月份,我跟 C.AI 的同學有很多交流。那時候我就覺得有一些比較神奇的地方。比如去年 4 月,C.AI 一共有 21 個人,其中 20 個都是算法和工程,沒有產品經理、沒有運營,剩下的一名員工相當於是行政之類的角色。
張鵬 :似乎C.AI 在今年4 月份之前,都沒有真正做產品的團隊。
**汪華:**對,他們當時做產品,是由工程和算法來做。你會發現這個產品的迭代基本上是靠模型驅動的,並沒有在產品的交互層面迭代,包括用户新的社交模式、用户需求等,其實沒有做太多。即便有一些升級也是常規動作,比如加各種語音、做商業化。所以它雖然是一個產品公司,但實際上並沒有像一個產品公司那樣運作。
第二,Noam 其實對 AGI 很有興趣,但他當時並沒有趁去年的 AI 熱潮、以模型公司的身份去融足夠多的錢。
在 C.AI 這波變動之前,我有一些預感,這樣做下去不對。如果做一個產品公司,C.AI 沒有按照,比如當年字節那樣正兒八經的產品公司來做推薦算法。同時,Noam 有非常強的意願做 AGI,手裏又沒有足夠資源去做。

當地時間 2022 年 10 月 6 日,美國加州,Noam Shazeer 與前谷歌工程師 Daniel De Freitas 共同創立 Character.AI。|圖片來源:視覺中國
張鵬:很少能看到一個創業者,做了一個讓世界驚豔的產品,但其實他並不是要做這個產品,C.AI 是他通向 AGI 的一個實驗品,Noam 真正的興趣點在 AGI。所以 Noam 是個什麼樣的人?
**汪華:**C.AI 有兩個創始人,但實話説,我覺得 Google 收購只是為了 Noam Shazeer 一個人,雖然 Daniel De Freitas 也很厲害。當年 Transformer 論文的作者有 8 個人,但在我看來,實際上真正重要的就兩位,一個是最原始提 self-attention(自注意力機制)的 Jakob Uszkoreit,另一個就是 Noam,如果沒有 Noam 進來,Transformer 後來根本就做不出來。
他是超級工程師,既懂 research(研究)又懂 engineering(工程)。純粹從他的實力來講,他完全可以是 AI 時代的 Jeff Dean。所以 Google 花 25 億美金買一個「Jeff Dean」回來,你覺得貴嗎?
(備註:Jeff Dean,Google 首席科學家,領導了 Google 多項關鍵技術的研發)
張鵬:貧窮限制了我的想象(哈哈)。
**汪華:**我個人覺得這裏最大的疑問是,Noam 回到 Google 後到底有沒有空間?Google 到底有沒有把之前讓 Noam 走,或者讓 Noam 沒法發揮空間的問題解決掉?如果沒有,就算 Noam 回來了,他在 Google 體系裏面做不了什麼事,也是白搭。
其實他也是一個很有遠見的人。當時做完 Transformer 之後,他就提出要把搜索、把整個互聯網全部向量化、模型化。當時被認為過於極端,但現在大家再看這個問題,是不是覺得這是必然的?
張鵬:Google 裏邊確實就有能看到未來的人,但是看起來,一個龐大的組織卻讓這些人沒能充分發揮,最終還是要出走,再請回來。你覺得 Google 能改變嗎?給 Noam 一個充分的發揮的空間。
**汪華:**其實你跟 Google 一線的同學聊,哪怕到現在為止,每個人都是「槽多無口」的狀態。
在我看來,這個問題只有創始人能解決,但是實話説,我不是特別確認 Larry Page 和 Sergey Brin(Google 兩位聯合創始人)處在這樣的人生狀態。如果能有 Elon Musk 當年的那種,卷着鋪蓋直接睡到 Tesla 的流水線上,完全從底層、第一性原理,去再造公司,我覺得是有可能的。
張鵬:前段時間我在硅谷期間聽到的消息是馬斯克要買 C.AI,律所已經開始介入交易談判了,但是回來沒兩天,馬斯克在 X.com 上闢謠了,大概率是真談過,但沒談攏。進輝,你怎麼看這筆交易,如果馬斯克想買,它會用來幹嘛?
**袁進輝:**對,我也聽聞 Elon Musk 要買 C.AI,但最後為什麼 Google 達成交易,我同意剛才汪華的觀點,Noam 畢竟在那邊工作過、聲望卓著,而 Google 在眼下這個階段也需要一個有威望的人,來鼓舞士氣。
我聽 Google 的朋友説,Google 創始人在內部表達過,一直在想辦法讓 Noam 再回來,在做技術的人眼裏,還是比較欽佩 Noam,所以如果 Noam 回來,整個團隊的士氣可能會不一樣。從這個角度來看,Google 是願意支付溢價的。但是其他潛在買家 Meta 或者是 X.ai,可能給不了這麼好的 offer。可能他們是以抄底的想法來談的,Google 的姿態會更尊重一些。
張鵬:一個叫回家,一個叫抄底。單就 Google25 億美元帶走 C.AI30 位員工,這筆交易對各方的利益是什麼樣的?
**汪華:**我沒有仔細看這個交易的結構,但整體上,投資人應該都被溢價買回來了。對投資人來講,一個一年多的投資項目,哪怕你是在 10 億美金估值的時候投的,ROI 和回報都相當不錯,更不用説更早投的 VC 了。對投資人來講無論如何都是一個勝利。
員工裏有兩部分,一部分加入 Google,Google 的股票也相當於現金了;另一部分留在 C.AI 繼續做,但是員工激勵也獲得了現金兑換。
所以 Google 真的是把各方的回報都滿足了,非常體面。我更好奇的是,裏面一些紙面下的東西。Noam 拿到了一些什麼樣的承諾?他回到 Google,到底有多大的權限?能幹多少事情?
張鵬:Google 當年收購 DeepMind 也就花了 5.4 億美金,現在花 25 億美金請回 Noam。對 Google 來説,值嗎?
**汪華:**其實我個人覺得 Google 未必吃虧了,一是要看將來怎麼執行這筆交易,另一個,我個人覺得 Google 這麼做可不只是為了做 AGI。
在幾家大公司裏,我覺得 Google 的搜索和廣告業務基礎是最危險的。當年移動互聯網時代,搜索和廣告其實已經被大大削弱一次了。你看今天的百度就知道了,很多搜索推薦引擎把搜索在手機上、移動設備上淡化了。但 Google 當時很有遠見,一開始就收購、控制了 Android,所以在移動互聯網時代,它沒有受影響,甚至還增強了。
但AI時代會更進一步地削弱搜索,因為搜索是為了用户做下一步任務,但將來 AI 是直奔結果、直接幫用户完成任務了,所以 AI 對搜索的削弱比移動互聯網還狠,廣告也是一樣。在新一代的商業模式上,廣告是不是還會像以前一樣長得這麼大?
所以 Google 這筆交易可不只是為了做 AGI。在我看來,Google 出這個非常體面的價格,一定也是要花大決心重構它的搜索和廣告,甚至重構整個業務基礎。這就是我剛為什麼把 Noam 比成 Jeff Dean,Google 花 25 億美金,萬一又買回來一個「Jeff Dean」,這個角度來看未必就貴了。**袁進輝:**對,我也非常同意,這個人才值這個價。況且這裏面可能要再細分一點,25 億美金是 C.AI 這個公司的估價,裏面根據投資人股權,給投資人兑現的現金可能也不超過 10 億美元。另外一部分就好像僱傭一批人才,通過 Google 的 package(權益組合)——現金加股票。
所以對 Google 來説,實際上是可控的,讓投資人賺一筆,對團隊來説,應該主要是用未來的薪資來支付。
**汪華:**其實要僱這樣一批人,本來就要支付股份、期權。
張鵬:歸根結底並不是因為 Google 缺 C.AI 這麼一個產品,真正有價值的是人**。**
02
OpenAI 人才流失背後,Sam Altman 其實挺難的
張鵬:前兩天OpenAI又有核心團隊離開去創業了。過去一年,OpenAI 當年那個黃金團隊也被瓦解得挺多,走了不少人。你怎麼看 OpenAI 不斷流失人才這件事?
**汪華:**我覺得應該還是 OpenAI 去年 11 月份(Sam Altman 被解僱又召回)的餘波,這事還沒完。
其實拋開是不是安全、與人類價值觀對齊之類,OpenAI****還有另一條線——想做 AGI 的人跟做商業化的人之間的矛盾衝突,實話説 Sam Altman 也挺難的。在 OpenAI 做研究和想做 AGI 的人眼裏,商業化團隊做的那些事純粹是浪費卡、浪費資源,「你們在那裏搞什麼?浪費寶貴的研究時間」。
所以其實 OpenAI 最原始的這波人離開,無論是出於「對齊」、安全,還是想實現 AGI,對 Sam Altman 的商業化、產品化路線都挺有想法的。
但是問題是,原來的 OpenAI、原來最核心的人都是在第一種思想下,做到現在這個狀態的。對他們來説,OpenAI 現在不説 180 度大轉彎,也至少是 90 度。

OpenAI 首席執行官 Sam Altman|圖片來源:視覺中國
張鵬:現在業界也在積累壓力——「GPT 5 怎麼還不出來」,既擔心 GPT-5 出來,現在做的事情就沒意義了,又擔心 GPT-5 出來不及預期**。**
**袁進輝:**你説的這兩種矛盾心態很真實。但站在從業者角度來説,還是希望 GPT-5 有突破,因為它關係到整個行業、整個社會對 AI 的信心。
但是客觀來説肯定是,從 90 分再往上提難度越大,越往後難度越大。
同時,技術突破有一定的偶然性,前面整個行業的進展我覺得似乎太高歌猛進、太理想化了,實際上應該有一個客觀清醒的認識,在這個過程中肯定有反覆、有波動,會遇到困難。
03
把 Character.AI 交給張小龍,可能就沒有今天的困境了
張鵬:回到 Character.AI 產品本身,已經做到賽道頭部,但創始人無奈把它放棄。除了創始人志不在此,還應該怎麼理解這件事?
**汪華:**C.AI 其實「生」得有點早,賬算不過來。如果到了明年,整個推理優化得更好、成本更低,賬可能會算得過來。
實話説,現在推出 C.AI 還不如 AI 搜索。AI 搜索,一天撐死搜十次;當年我在 Google 的時候,一個用户平均搜索不超過 7 次。所以 AI 搜索消耗的 token 數是有限的,哪怕你加堆一大堆 RAG(檢索增強)。但是社交娛樂產品的邏輯是,一個產品的用户時長越長,產品越好。可是 C.AI 這個產品動不動就是兩個小時的用户時長、上百輪的對話,如果再加上語音等其他東西,一個日活用户輕輕鬆鬆就需要消耗掉幾十萬、上百萬 token。
所以用户增長對 C.AI 來説是一把雙刃劍。要想產品好,用户時長要越長越好,但是對於算賬來説,用户時長越長,越算不過帳。C.AI 最近為了降成本,已經在跟用户體驗做博弈了,比如把模型拼命往小壓縮,所以前段時間有很多用户反饋「模型怎麼變笨了」,「我的體驗不好了」。
所以從推理、多模態等各方面的發展來説,其實都有點早。當然這只是時間問題,他如果融到足夠多的錢,捱到推理成本降低,比如明年又降低到 1/ 10 了。
張鵬:如果去年他再拿 10 億美金,按照今天的現狀即便算不過賬,也可以繼續往前跑。
**汪華:**對。C.AI 在沒有仔細做產品的情況下,都能吸引那麼多日活,而且平均用户時長那麼長,反而更説明了這個領域的用户需求很強。要知道,C.AI 的用户時長是超過一個小時的。超過一個小時用户時長的應用其實不多。
除了推理成本,C.AI 的第二個問題,是產品。即便不考慮算力成本、大規模做用户增長,C.AI 的產品在我看來也是一個非常重度的、非常核心向的一個產品。
一小部分重度用户的忠實度特別高、時長特別長,但輕度用户其實不太玩得進去。原因其實很簡單,拋開荷爾蒙需求的玩家不説,C.AI 裏面的一些核心玩法,比如角色扮演、名人對話,或者互動小説,其實是需要用户大量輸入文字。用户要想在角色扮演的過程中有很好的體驗,對他/她自己的要求首先很高,因為跟 bot 聊就是這樣,你聊得越好,bot 才能跟你聊得越好。

Character.AI 應用程序|圖片來源:視覺中國
**張鵬:如果用户你很無聊,bot 那邊也很難跟你一起演出很好的戲。**這是個「雙人舞」。
**汪華:**對。但你要知道,現在的普通人的娛樂是什麼,我舉個極端例子,抖音。你只要劃一劃就行了。
其實為什麼現在 C.AI 很多的核心用户是二次元?他們真的是重度用户,有點像當年互聯網的天涯用户,他們有很好的表達能力,能輸出、能接受非常深度和複雜的設定,也能享受到很多樂趣。
他們也很像當年玩魔獸世界的那波玩家,公會、上班式地玩,重度地玩,但現在大部分普通的輕度玩家,其實更像原神的用户,看看劇情、刷刷任務就行了,你要讓他們回去像當年魔獸世界一樣,重社交、公會式地,一天幾個小時像上班一樣玩遊戲,他們根本承受不了。
更不用説現在因為模態的限制,還只是以文字為主。
所以從產品形態的角度來講,它沒有真正花很多時間打磨產品,把產品去做擴圈下沉。在這一點上,我對 C.AI 也有點失望,因為 C.AI 其實挺好的,把重度用户羣都佔了,但是作為領袖產品,卻沒有好好打磨產品。
作為領袖,應該為整個同類產品開闢前路,否則,當一個領域裏面排名第一的產品,在產品角度、用户擴張角度、體驗擴張角度不思進取的時候,你明白我的意思,整個領域都會受損。
而且這個情況不光是 C.AI,所有類似產品都有這個問題,侷限於重度用户,重度用户之外的輕度用户效果不好,而且對普通用户來講,長留存很差。其他的類似產品也是如此,哪怕是比較著名的產品像 Talkie,根據外部的可跟蹤到的數據,它的長留存也很低。C.AI 的留存好一點,因為 C.AI 第一個推出產品,把那些最核心的重度用户全都聚攏過去了,所以 C.AI 整體的長留存還可以,但是這個賽道所有其他產品的長留存都不太好。
因為這本質上是一個社交產品,核心的模型只是一小塊要素。情緒價值、包括人的社交模式有很多種,一對多、多對多,人和 bot,bot 跟 bot 等等。
張鵬:讓 Transformer 的大神來琢磨人性和人間的邏輯,太難為 Noam 了,這事可能還是,比如張小龍這樣的產品人比較合適。進輝,你怎麼看 C.AI 產品的困境?
**袁進輝:**我聽到的消息是,C.AI 重度用户基數可能有幾千萬,但是再擴展的話比較困難。C.AI 有一個特殊的羣體,比如説愛玩遊戲的,還有愛和虛擬角色交流的,而且有個專門的術語叫「乙女」,二次元等等,這個羣體她特別享受 C.AI 這個產品,但是問題是有更多人不是這個羣體。
按理説做好這個羣體,讓這部分羣體有幾千萬人喜歡,也非常難得。但是最主要的還是,創始人志不在此。
C.AI 這個用户底子,如果讓中國的創業者去做,無論從產品還是商業化,可能會做得更好。國內的創業者去做類似的東西,可以想出讓玩家氪金、抽卡什麼的各種玩法。
張鵬:Noam 缺一箇中國合夥人,一箇中國產品合夥人。
**汪華:**如果把 Character.AI 交給米哈遊,把 Character.AI 交給張小龍,這個肯定會有不同的故事了。
04
AI 陪伴,比 AI 搜索市場大多了
張鵬:反過來説,從 C.AI 身上,我們看到了哪些有意義的東西?情緒價值這個賽道,以前是用什麼樣的產品在被滿足,C.AI 到底帶來了什麼樣新的改變?
**袁進輝:**大模型出來之後,發現語言對話能力比以前更加自然、流暢,還有對常識的理解,這些都是過去做聊天機器人,想盡各種辦法打破頭都無法攻克的。但現在用大模型解決了語言的流暢問題,解決了一部分常識問題,過程中還有 Fine-Tune(微調)機器人説話的風格,能更好地滿足情緒價值。
而且不一定是在單純解決情緒價值、陪聊的場景,但凡需要語言能力、常識、對話能力的場景,一定程度上都被解鎖了,這是對行業的啓發。

Character.AI 允許人們創建自己的定製聊天機器人,模仿任何有生命、死亡或無生命的人或物。|圖片來源:C.AI 官網
**汪華:**其實 Character.AI 證明的事情還挺多。一是證明了廣義的社交和情緒,這部分價值能被模型解決和滿足。第二,它還證明了新一代的內容消費方式。
Character.AI 裏面,很多人在做角色扮演、互動小説,它是新時代裏情緒價值的內容消費的一個雛形。很多人在裏面扮演角色、玩虛擬遊戲,但這個遊戲的世界或者虛擬的世界實際上完全為「他/她」定製。
過去無論是 TikTok 這樣的推薦引擎,還是玩遊戲,它只是把做好的內容,千人千面地推薦給你而已。
比如玩原神的人很多也只是為了內容消費,原神本質上是一個內容提供商,而不是傳統的遊戲廠商,它提供的是帶情緒價值的內容消費。哪怕在原神裏,理論上你可以在裏面互動,但這種互動其實是基於固定腳本的。
張鵬:真正的沙盒並不是一個預設好的空間,它是為你而實時渲染、生成的一個世界。
**汪華:**對,Character.AI 起碼證明了基於文字的,一個新時代的、完全互動的內容消費和娛樂形態的賽道。
所以現在看似乙女或者二次元玩家好像比較集中,但實際上,無論是情緒價值的可能性,還是新時代的全新內容形態、帶情緒價值的互動內容形態,可比乙女和二次元要大得多得多。
現在的 Character.AI 其實有點像 2012 年我們剛剛開始做移動視頻的時代,把 YouTube 直接往手機上搬。C.AI 把 AI 直接搬到聊天機器人的形態,但實際上可能要到兩三年之後,最終的產品形態才會展現出來,而且可能還不止一個方向。我覺得 Character.AI 將來可以分叉出兩三個不同的方向。
張鵬:C.AI 給我一個很重要的啓發是智能的供給,因為情緒價值背後需要一些智能的能力來實現,這種智能能力的供給在今天準備好,並且可以批量提供的時候,這種智能供給的終點就是支持我們這麼多年在商業體系裏一直要追求的——大規模個性化。
就像剛才汪華説的,世界為你而創造、為你而閃耀,在這一個時空裏跟你的對話,只為你,不是為任何人,不是被設定好有無數人來消費的東西,它只因為你存在,且因為你在此刻時空切面的這句話而去生成新東西。
這是歷史上不管遊戲、內容消費等等所有東西里,從未出現過的東西,這是它真正的變化。而它背後的原因,是智能的供給獲得了突破。
**汪華:**對,之前的推薦引擎其實已經改變了很多東西,比如抖音、頭條,電商裏的阿里、京東、拼多多。所以移動互聯網的輝煌,一半是因為移動互聯網,另一半是因為推薦引擎。否則,幾千個小二,幾千個新浪小編,支撐不起來這代東西。
但是你剛説的這一點,我覺得比當年的推薦引擎還要大的多得多。
張鵬:沒錯,我特別認同,從整個經濟學的角度來看,供給、需求、連接這三者之間是關聯的。
剛才你説的,今天我們看到二次元、乙女這樣的人羣,對這事很喜歡。但如果這種供給的成本不斷地下降,也有打磨得很好的產品,最後本質解決的,是**「情緒價值上的大規模個性化服務」****。而充分的供給出現之後,需求就會改變,需求如果變了,連接就會改變,這幾個東西其實是一種連鎖反應。**
所以 C.AI 雖然沒有完成這個閉環,但是開啓了對這一點的思考。未來不同的產品形態,不同的場景,遊戲、內容消費、心理、健康等很多領域,都會有一樣的主旋律——智能的供給,在這個過程中可能會改變需求**——**把原來的窄需求變成廣泛的需求。但 Noam 他們還沒有把這個窄需求拓寬,最後停留在這個點上了,再加上今天智能供給的成本還是太高,算不過賬。
**汪華:**其實張一鳴做到了這一點,他把推薦算法無限擴張。
張鵬:我覺得那個時代的智能也是不足的,但是他通過交互的設計,單列、劃一下,彌補了這件事。我可以劃三下都不滿意,我還能接受。那個時候的智能有限,內容也有限,但我通過交互仍然能夠有更大的用户兼容性,看起來也蠻個性化的。
**汪華:**最早他的推薦算法只是用在今日頭條上,後來擴充到視頻、廣告算法、電商等等其他業務上。現在的 Noam 有點像止步於第一個產品,而且是還沒有做完今日頭條,就放棄了,而沒有後面的抖音、直播,也沒有後面的實現商業化。
但張一鳴打造了甚至比百度更厲害的廣告引擎,本質上都是基於同一套算法,搜廣推這套算法,當年張一鳴把搜廣推這套算法一直延伸到現在,完成了整個閉環。
張鵬:這個類比我覺得挺到位。但這一次我覺得是真的改變了供給,在供給這一側,它為你而生成,針對的是真正的個性化。
**汪華:**對,如果能把這件事做對,堅持往下做,肯定比當年的字節會更大。搜廣推我只是類比它的發展歷程,但是這次智能的革命性是比當年的搜廣推要大得多得多。
05
推理成本再降兩個數量級,C.AI 就會生逢其時
張鵬:剛才我們還聊到一個話題,「C.AI 算不過賬」,所以這個賬****要怎麼算?
**袁進輝:**以前互聯網產品邊際成本趨於零,只要獲客成本能算得過賬,可以放心大膽地做增長。但現在一方面要算獲客成本,另一方面每增加一個用户、日活,每天消耗的計算資源成本也在持續增長,GPU 比較貴。如果服務單個客户的成本不變,成本是線性增長的。
所以對於 AI 產品,必須算兩個賬,一個是獲客成本、一個叫運營成本。當運營成本或者計算成本進一步降低,比如 10 倍、100 倍時,可能會像移動互聯網產品的成本那樣,用户增長的邊際成本為零。
具體到 Character.AI,它除了在預訓練模型上持續投入,每增加一個用户,推理成本也有比較高的支出。數據顯示,它每天日活是幾百萬,付費是幾萬訂閲用户,每個月收入大幾十萬、上百萬美元。每個月的算力支出、光推理成本可能就四五百萬美元,確實入不敷出。
如果推理成本再降 10 倍到 100 倍的話,Character.AI 的運營成本就和過去移動互聯網的產品非常接近了。

2024 年 6 月 20 日,C.AI 創始人 Noam 在社交平台分享了 C.AI 近期在優化推理成本上的進展|截圖來源:X.com
張鵬:聽他們團隊説,過去一段時間非常努力地在優化產品的推理成本,降了不少了。
**汪華:**但即使降了那麼多,還是要繼續降。因為要提高用户體驗,可能得用更好的模型,只是文字不夠,得上多模態。理想狀況,要能給用户 GPT-4o 一樣的語音體驗。
其實這有點像當年的英特爾和微軟,需要像硅基流動這樣的公司把推理成本不斷地降低,然後 AI 產品這邊再把用户體驗做起來,又把降下來的成本再升上去的過程。
張鵬:智能密度提升,同時單位智能的成本下降。算得過賬未來有什麼好的解法?未來一段時間應該關注哪些要點?
**袁進輝:**我覺得成本下降是一個必然趨勢,可以作為 AI 創業的一個基本假設,比如未來一段時間成本會下降 10 倍到 100 倍,基於此來做產品和商業的設計。
降低成本,其實有很多種辦法,基本上可以分成幾類:
從模型角度,現在有辦法把模型變得更小,比如小 10 倍,同時它的能力和原先模型的能力差不多。模型上也有投機採樣、大小模型的配合這種方法。
Infra 層,比如我們常聽到的量化、調度,基於 MOE 的結構等方法。
芯片角度現在也有一些辦法,除了通用芯片,國內外一些創業公司瞄準了 Transformer 的專有芯片,比如基於類似 Llama 這種結構去設計芯片,這種芯片有望帶來一個數量級的提升。
從雲計算規模效應的角度也有很多辦法,比如説潮汐現象,怎麼把白天和晚上的流量能夠都用滿,比如把計算放在電價更便宜的地方,立刻就能降低一倍等辦法。
所以推理成本下降是一個確定性的事情,而且是不用擔心的一個問題。
張鵬:一邊是 Scaling Up 模型能力要往上走,一邊是邊際成本要無限向下,因為追求無限供給的智能,才能解鎖新的時代。
在成本優化的目標上,要降幾個數量級,就到了「讓 C.AI 生逢其實」的狀態?
**汪華:**我當時做過一個簡單的計算,如果是大用户量的工具類產品,我個人覺得基本只要降 10 倍就能算得過帳。
張鵬:類似於 AI 搜索這樣的產品,降 10 倍就可以。
**汪華:**對,工具類不只是搜索了,寫作或者其他的東西也是。
但如果是長時長,甚至是要加上多模態,基本上要兩個數量級。因為長時長本身(成本增加)就將近 10 倍,而且多模態都不説視頻,像語音和圖片的 token 都挺耗成本的。
當然還有剛才説的模型調度,如果端側模型再能承載一些壓力的話,我覺得雲側只要提升兩個數量級就可以。因為很多編碼、解碼和一些前端的工作可以在端側挖一層。所以我的假定是,如果要實現完整的兩個數量級的雲側推理成本降低,基本上可以開啓這個新時代(智能供給自由)了。
張鵬:推理成本降低兩個數量級,靠今天在工程上的努力,是否就是確定可以實現的?還是仍然需要一些技術上的創新,有新的方法才有可能實現?
**袁進輝:**未來肯定還有創新,但如果把現在的手段都用上,應該是可以實現的。比如説,100 萬 token 今天是幾塊錢,但是優化以後能做到幾毛錢或者是一毛錢的這種價格。
剛才説的那些模型手段,把模型變得更小、把 MOE 做得更好,大、小模型的路由做得更好,比如説 Apple Intelligence 那樣,有在端側推理的、有云側推理的,這種把模型任務之間的路由做得好的話,也能解決非常多問題。
軟件基礎設施這層還在往前推進,用更低精度、更好地調度。芯片的潛力還沒出來,因為芯片設計生產的週期長,現在都還在用之前設計的芯片架構去做。
**汪華:**我再補充一個,如果產品本身是確定的,除了通用成本降低的方法以外,針對產品去額外做優化,無論是在模型推理階段對產品和硬件架構去做專門的互相設計,還是可以在裏面加很多 kv cache,甚至是結果 cache 的緩存層之類的特定產品場景的優化,又可以再降低好幾倍。
06
先把應用做好,有錢了再抓大模型
張鵬:這麼一看,Noam 確實壓力大,剛分析的是降推理成本的空間,還沒説訓練模型的成本。因為 C.AI 就拿了 2 億美金,手裏似乎有 8000 張卡,萬卡都到不了。
同時,這也帶來另一個話題,創業公司要不要去做大模型,走雙輪驅動、產模一體的路線?
**袁進輝:**如果能夠像 OpenAI 和 Anthropic 融那麼多錢的話,可以做。
如果沒有那麼雄厚資金的話,更現實、更理性的做法是,不把錢花在訓模型上,因為現在有很多,比如 Meta 開源的 Llama405B 模型是可用的,國內也有一些開源模型接近 GPT-4 水平。
對於一些 AI 應用,比如説像 C.AI 這種應用,目前開源模型的能力應該夠做產品初期的 PMF 等等需求,這也是更理性的做法。
張鵬:從創業者的角度,手裏有多少錢會讓你願意選擇用雙輪驅動的方式走?
**袁進輝:**我覺得幾億美元到 10 億美元肯定都夠,不一定像 OpenAI 要追求 10 萬卡或者是幾十萬卡這種級別。
因為現在訓模型的技術更加成熟了,同樣的數據,有技術手段能夠訓出水平更高的模型。
實際上今天有很多接近 GPT-4 水平的模型在預訓練時沒有用那麼多卡,可能 2000 張卡就交付了接近 GPT-4,或者在某些方面比 GPT 4 還好的模型。
所以從算賬角度來説,按照每 1000 台 H100,租金 1 億美元一年,有幾億美金可以選擇雙輪驅動。
**汪華:**我首先説,如果做雙輪驅動的應用公司,指的是要做大用户體量的應用公司,如果去做一箇中小用户體量的應用,根本不需要。
張鵬:至少目標得瞄着千萬日活的應用。
**汪華:**對,瞄準這種量級的應用去,才值得雙輪驅動。
第二,產品的 PMF 階段不用自己的模型都沒關係,用市面上最好的模型就可以。但是如果產品想要上量的話,一定要用自己的模型。
這麼做一是因為成本,二是因為要跟競爭對手之間產生差異化優勢。真的要把一個產品做得便宜,做出差異化優勢,其實是要按產品需求去做一系列模型的,哪怕看上去比較簡單的 AI 搜索,如果想降低成本、效果又特別好的話,其實需要做一堆模型。比如用户的意圖偵測、分類的模型、re-rank 的模型,包括 summary 的模型也要專門定製,這樣效果才能做得好。因為如果都用通用的模型、參數量大的模型,哪怕是開源的,其實效率也並不高。

圖片來源:視覺中國
就像 Google 做搜索,要支撐這麼大規模用户量的搜索,裏面的很多技術棧都不能用開源的現有技術產品,就得自己來做。這些模型也不一定是特別大,反而都做得特別小,或者説是針對產品特定任務的模型。
另外,跟競爭對手做出差異化,肯定要做出自己的特色功能,依靠開源模型做特色功能不一定行,至少也得基於開源模型進行大體量地魔改 config 串。但實際上,一個開源模型如果加足夠多的數據 config 串,其實消耗的算力也跟訓一個新模型差不多量級,大概相當於訓新模型 1/3 的計算量了。
所以在我看來,驗證產品要多快好省,但如果一旦產品驗證了,而且你是要做大用户量的應用,往上 scaling(規模化)跟競爭對手打出差異,既能做大體量又能算得過來賬,就得雙輪驅動。
其實哪怕移動互聯網時代也是這樣的,一開始大家都用開源的東西隨便搭個東西。但一旦做大了,你成了一個大互聯網公司開始有大應用了,都在搭自己的技術棧。
張鵬:最終如果用户量做起來了,鐵定需要雙輪驅動,如果瞄準的用户體量不大或者最終沒做成大體量的應用,玩雙輪驅動只能「死」得更快。
07
AI 投資依舊火熱,但是邏輯變了
張鵬:最近半年,硅谷幾家最被看好的幾家 AI 應用都以某種形式併入大廠,你們覺得這反應了什麼趨勢?
**袁進輝:**從 Adept 加入亞馬遜、Inflection 加入微軟、還有 C.AI 加入 Google 這幾個例子來看,我個人覺得是創業者高位套現的階段勝利。他們可能在行業發展衝動期、泡沫期出現,但並不一定真正有耐心。
後面的階段其實更考驗耐心,這裏有一個短期的波動,比如原來的判斷失誤、行業模型或者開源模型的進步、融資的節奏,應該説,還是會有更長期主義、更有耐心、更熱愛的人繼續往前跑,解決行業更細節的問題。

圖片來源:視覺中國
**汪華:**這段時間的收購合併我覺得是必然的。
去年 AI 領域投了很多錢,但實際上大部分錢並沒有投在應用上,而是投在 Infra、模型、底層架構、技術上,而且投得蠻多,所以這波投資本身到了要開始收斂的階段,因為不需要那麼多底層模型、算力平台。
像 Coreweave 之類的算力平台,包括做推理的公司、做中間件的公司,本來在經過那麼多投資之後,也到了要收斂的時候,所以會看到各種收斂的形式,無論是併購、互相合並、消失,或者是一些頭部公司的確立。
另一方面,你會發現今年拿到錢的公司,實際上是廣義的應用公司。最近基礎模型拿到錢的公司少了,因為大家覺得基礎模型差不多了,但你會看到像做音樂的模型,像 Eleven Labs 做語音的模型,各種各樣應用模型的公司,還在持續不斷地融到錢,融到越來越多錢。
包括 To B 領域各種各樣的應用,像 DevOPS,或者各種垂直商業應用,最近幾個月的融資事件實際上越來越多,所以實際上是投資的趨向和階段變了。
所以之前階段的項目現在到了該整合清算、清盤的階段,同時現在轉移到了第二個階段。
另外,現在的投資,哪怕是投應用,海外投 To B 的項目比 To C 還要多一點,即便投 To C 大家也會投一些確定性比較高的項目。比如 C.AI 今年沒有拿到融資,但 Perplexity 拿到了,因為 Perplexity 的創始人不做 AGI,正兒八經要一直要做產品,商業模式和用户增長也比較紮實。
但是投資人,的確也是要等你產品跑出來才給錢。像國內出海的 HeyGen 拿到了不少錢,它是屬於收入已經被驗證了。
張鵬:整個投資的心態跟移動互聯網時候不同。
汪華:對,移動互聯網時代畢竟是量化寬鬆,錢太多了,而且整個世界處於經濟上行期,資金成本又特別低,錢沒地方走,所以那個時代裏,投資人整個的風險偏好非常強,投資主題基本上是願景和增長。
這個時代,投資人依然還是願意投,但實際上要更多的確定性。這就是為什麼去年大家一股腦地投算力、投底層大模型,因為去年這些底層基礎設施是確定性更高的。
今年大家看 To B 應用多、看 To C 應用少,也是這個原因。To B 的商業模式一開始就是定下來的,東西做對了收入總是有的。To C 其實有點 hit-driven(熱門產品驅動的),像電影一樣,不一定能爆。
所以投資人的心態,本來就跟之前移動互聯網不一樣,更追求確定性,偏謹慎。
投資人還有一個心態,就是等待。千萬不要聽投資人説,「我是投資未來」,我自己也是投資人,我自黑一下,投資人説投資未來、創業週期、投資價值,這是信仰上的,但是身體很誠實。身體是跟着當前的傾向、趨勢,本質上是跟風的。投資人都認為 To C 如果能跑出來會比 To B 大得多。但大家在等一個、兩個、甚至是一批成功的案例和模式出來,我再開始。
你説最近明星公司加入大廠會不會影響 AI 投資,其實現在的問題是,對投資人心態影響的東西太多了,我説實話,這件事的影響不一定有美聯儲降息或者美股科技股暴跌這事,對投資人心態的影響大。
張鵬:最近一段時間,兩位看到什麼覺得有意思、有啓發的 AI 應用?
**袁進輝:**隨着 AI 基礎設施,比如大模型開源、 Infra 雲服務的完善,我最近關注到一些「超級個體」,全棧工程師一個人能搞定一個很有意思的應用。比如説「艾逗比」,一個個人開發者做了一個 AI 搜索——「thinkany」。還有像之前做哄哄模擬器的王登科,也是個人開發者,現在也在創業。還有像胡修涵他們做的「捏 Ta」,AI 驅動的角色幻想創作平台等等。
**汪華:**有意思的東西其實挺多,包括硅谷那邊一些技術性的進展。
我分享一些接地氣的方向,第一個是做出海工具,我看到有不少公司已經實現正循環了,比如大家之前都知道的 HeyGen。海外的競爭對手其實不是特別強。並且,很多出海工具可以同時做 To B 和 To C。一開始先從中小業主、專業用户起步,做到一定規模再向 ToB 客户擴展。
第二,對規模小的新創業公司來説,我個人覺得就別在國內做 AI 搜索了,太捲了。如果出海能找到自己的獨特定位,還可以考慮。
第三,現在多模態技術發展很快,無論是開源模型還是閉源模型的 API。如果你能成為第一波嚐鮮者,比如把一些美國多模態公司新出的 AI API,第一波產品化、工具化,也可能會取得很好的增長紅利。
我還有一個感覺,有時候大家去做 AI 應用,把關注點都放在 AI 上了,忘了應用是主語,AI 只是定語。不要為了 AI 做 AI,還是要想辦法發揮自己原來積累多年的專長,看 AI 如何在裏面起作用。
另外,因為現在 AI 技術棧還沒有收斂,大家似乎太關注 AI 本身的變化,追是追不過來的,還是想辦法找一些不變的東西,和自己特別擅長的東西,比如特別擅長做社交、做狼人殺,特別擅長有渠道、有資源、有理解的東西,求助於內,再去找 AI 的結合點,不契合可以算了。
*頭圖來源:視覺中國
本文為極客公園原創文章,轉載請聯繫極客君微信 geekparkGO