一年20萬台出貨,AI玩具公司Haivivi剛拿了2億新融資,我們和創始人聊了聊_風聞
极客公园-极客公园官方账号-53分钟前

和融資、出貨量都是最多的公司,覆盤「AI 玩具」這一年。
作者|蘇子華
編輯|靖宇
剛剛,AI****玩具公司躍然創新(Haivivi)宣佈完成 2 億元 A 輪系列融資,中金資本旗下基金、紅杉中國、華山資本、愉悦資本、招銀國際、Brizan Ventures 等一線投資機構共同參投。
Haivivi 在過去一年時間裏,出貨量超過 20 萬台(去除了退貨量),成為全球出貨最多的AI玩具公司。同時,他們也成為了這個賽道里,被一線投資機構押注最多的公司。
然而,Haivivi 創始人李勇對極客公園坦言,實際過程並不如聽起來這麼順利,Haivivi 的資金曾一度緊張到差點關門清算。
在他們的第一代產品 BubblePal 上市前,公司已經在清算邊緣。最終,在產品設計的極限取捨當中,銷量「意外」爆發,公司起死回生。
回到 2024 年 6 月,他們將大模型引入玩具領域,率先推出了全球首款 AI 玩具 BubblePal。該產品支持角色扮演、多語言對話、AI 故事共創、長期記憶等一系列功能,還原了數十個經典 IP 角色。

Haivivi第一代產品 BubblePal,以掛墜的形式掛在毛絨玩具上,按壓進行對話|圖片來源:Haivivi
後來,市面上開始出現大量的相似產品。
產品發佈後,一些科技互聯網從業者、投資機構不免會質疑 AI 玩具「硬件沒壁壘」、「為什麼需要 IP」、陪伴是否為偽命題。
李勇曾是天貓精靈合夥人,主導了天貓精靈從 0 到 3000 萬銷量的增長。李勇覺得,很多注重「情緒價值」的AI產品,無法用「硬件壁壘」「技術壁壘」等傳統標準衡量。經過過去一段時間的摸索,Haivivi 已經逐漸形成了自己的 AI 玩具方法論,並即將推出旗下第二代 AI 玩具產品——CocoMate 系列,全球首款搭載端到端語音模型的 AI 玩具。
新產品採用可嵌入玩偶本體且支持拆卸的形態,同時,也是支持遠程喚醒,以及主題卡遊戲、聊天室等多種模式。
藉此契機,8 月初,極客公園在 Haivivi 北京辦公室與李勇做了一次訪談,他坦誠分享了團隊在提供情緒價值、打造有生命感的 AI 夥伴、與頂級 IP 共創,以及面對商業的殘酷現實,如何做取捨的實踐和思考。問題涵蓋了:
AI 玩具公司存活下來的關鍵是什麼?
兒童與成人對 AI 陪伴的需求差異,產品如何在不同人羣中找到切入口?
AI 玩具是否有必要會説話?
為成年人提供情緒價值的關鍵是什麼?
如何賦予 AI 玩具「生命感」?
如何衡量 AI 玩具所提供的「陪伴感」和「情緒價值」?
大廠會如何入局「AI 陪伴」賽道?
AI 玩具賽道下一個增長點在哪?
訪談中提到的部分精彩觀點:
如果相信 AGI 時代會到來,就會相信未來每個人都需要一個 AI 朋友。
過去的 AI 玩具,所有輸入都來自用户,這不符合朋友的定義;「AI 朋友」需要能夠在沒有和人類交互式時,自主學習和成長。
現實中的朋友不會記住你所有事情,人類大腦有遺忘機制,AI 朋友也需要學會選擇性遺忘;AI 玩具產品,所有功能、算法的取捨,都必須服務於「生命感」這一核心。
很多人説 AI 玩具「沒有技術壁壘」,但情緒價值本身就是壁壘。
AI 陪伴產品為成年人提供情緒價值的關鍵是控制預期。
有用户表示,孩子因為佩奇的勸説而乖乖喝水,這樣的反饋比銷量更重要。
如果端側 AI 玩具能實現無需聯網,且零售價控制在 1000 元以內,將成為全球市場的巨大機會。
以下為對話內容,經極客公園編輯整理:

Haivivi 的第二代 AI 玩具產品——CocoMate 系列,奧特曼聯名產品|圖片來源:Haivivi
01
在差點清算的邊緣,最後一搏
極客公園:新的融資進來,對你們意味着什麼?
李勇:我們公司在產品上市並取得兩個月銷量之前,資金一直非常緊張——不管是我個人給公司墊錢,還是後來從銀行貸款。去年融資環境差,投資人對AI玩具賽道很謹慎。
對我們而言,有了這筆資金,就能推進 2023 年就規劃的事了。Haivivi 品牌從 2023 年成立,當時我們對 AI 玩具的規劃有很多,但受限於資金和資源,很多想法沒能落地。
今年就能從容地推進佈局了,尤其是到今年 Q4,我們的產品矩陣、全渠道佈局以及 IP 合作佈局都會比較完整。
極客公園:你之前是天貓精靈合夥人,團隊背景也不錯,按理説融資應該更順利?
**李勇:**並不是,我們公司註冊至今已經 4 年,前兩年創業的時候還沒有大模型,當時也想做 AI 玩具,只能用上一代 AI 技術和玩具做融合,所以產品的用户體驗不夠好,走了些彎路。
直到 2023 年初大模型出現,我們才確定做 BubblePal 這款產品。但當時融資環境緊張,很多機構都很謹慎,大家都要求有實際產品、驗證 PMF(Product-Market Fit)。
之所以能拿到高秉強(「中國芯片之父」香港科技大學高秉強教授)老師的投資,是因為他以個人名義給了我們第一筆錢,大概 100 萬美金,我們才有資金投入研發。
到 2024 年 8 月產品真正上市時,高老師的這輪天使輪的錢已經基本花完了,研發太燒錢了。就像我剛才説的,後來我們還從銀行貸款、我個人墊錢,那段時間資金一直很緊張,發工資都困難。
極客公園:你們是第一批做AI玩具的團隊,過去一年來,最常聽到的評價是什麼?
**李勇:**最痛苦的是產品發售前後,聽到的更多是質疑。沒人看好這個賽道:硬件從業者覺得「已做爛」,他們經歷過故事機、兒童手錶、耳機、手機的紅海時代,認為 AI 玩具硬件方案成熟(第一代產品方案與當年天貓精靈無本質區別),無創新空間;AI 從業者也不看好,認為「只是搭載大模型,不如 ChatGPT 智能,情商、智商有限」。
但我們更看重長遠——如果相信 AGI 時代會到來,就會相信,未來無論孩子還是成年人,都需要有AI能力的陪伴載體。AI 能力持續提升後,人們會需要現實中的「AI 朋友」,形態可能是毛絨玩具、機器人等各種樣子。
**因為AI的發展不僅體現在「智商」層面,還涉及「情商」領域。**所以我們堅定看好這個賽道。不過當時我們也不確定自身能否脱穎而出,公司能否堅持到行業爆發的那一天。短期來看,很多人對該領域持悲觀態度。
正如我剛才提到的,2023 年初公司險些清算,當時錢已經不夠了。我個人還有一些積蓄,當時我們團隊有十幾個人,我就和大家説,我可以用個人資金為大家發放 N+1 補償金——那時公司剛成立約一年。
但如果大家認為,ChatGPT 的出現會給我們計劃研發的AI玩具帶來新機遇,那我們就再堅持 6 個月,看看能否成功融資。若能融到資,我們就繼續推進項目;若融不到,屆時我可能連 N+1 補償金都無法承擔了,因為我個人的現金儲備也十分有限。
讓我欣慰的是,這十幾人的核心團隊最終都選擇了堅持。團隊成員對我們所做的事是堅信不疑的。但當時融資確實異常艱難,和合作夥伴的合作也多是「刷臉」——因為我們沒錢讓他們幫忙製作 Demo,好在我之前在硬件領域深耕多年,有一些合作伙伴願意幫忙提供 Demo 樣品。
極客公園:你們現在融資和之前有什麼變化?
**李勇:**到了去年第四季度,我們的產品量產,在市場上有了數據表現後,融資就相對容易了。投資人能看到用户在小紅書、抖音的評論和視頻,通過訪談、盡調也能瞭解真實反饋,銷量也一直在漲。
而且,春節後 DeepSeek 火了,給用户做了一波市場教育,很多寶媽由此瞭解 AI 玩具,甚至認為「帶 DeepSeek 的玩具就是 AI 玩具」,我們也算趕上了這波趨勢。
不過也有一些投資人始終持懷疑態度,他們認為我們的產品缺乏核心技術壁壘——畢竟當時泡泡瑪特還沒有現在這麼火爆。那時我們就一直在提 Jellycat 和泡泡瑪特的模式,只是大家對「情緒價值+AI」的組合仍有疑慮。
極客公園:DeepSeek 那波熱度給你們帶來了多少新增銷量?
**李勇:**從營銷層面看,它主要起到了用户教育的作用。科技行業內可能沒這種感受,但普通用户對 AI 的認知仍有限——2017 年天貓精靈量產時,那波智能硬件的用户體驗還比較勉強,包括天貓精靈、小度、小愛等智能音箱的活躍與留存率都低。
因此,我們推廣 AI 玩具時,本來需大量市場教育。而 DeepSeek 的熱度,一方面讓部分用户建立了對 AI 的信心;另一方面,也消除了部分用户對生成式 AI 的恐懼,比如擔心它教壞孩子,畢竟內容可控性存疑。但 DeepSeek 已上升到國家戰略層面,用户對 AI 的恐懼會因此減輕。如果僅靠我們這樣的創業公司去宣傳,説「用了開源技術、做了內容審核」,力度遠不如國家層面的重視。**具體到銷量,今年 3 月銷量較之前增長了 2-3 倍,**這也讓我們很開心。
極客公園:第一代產品賣了 20 多萬台,這在預期之內嗎?
**李勇:**不在。我們最初認為能賣幾千台,最多 1-2 萬台。第一代產品做了很多取捨,並非我們最初設想的樣子,核心是為了測試 PMF、收集用户反饋,最初備貨也只備了 2000 台。
但實際反饋很好,我們後來反思,這可能是「知識陷阱」——我們從 2022 年底接觸大模型,到 2024 年 8 月產品上市,已習慣大模型的連續對話、角色扮演功能;但用户此前從未接觸過能角色扮演、連續對話、有長期記憶的AI玩具,他們對比的仍是傳統故事機、小天才兒童手錶、小度/小愛智能音箱。有大模型的 AI 玩具與幾年前的智能硬件相比,體驗上確實有革命性提升。
極客公園:打磨AI玩具產品,資金主要花在哪些方面?
李勇:最多的是研發,團隊研發成本開銷佔比最大;其次是 IP 合作費用,我們已簽約不少知名 IP;此外還有渠道建設、日常運營管理的費用。
極客公園:網上説AI玩具退貨率高的問題,你怎麼看?
**李勇:**前段時間我們實際銷量已超 25 萬台,但我們對外宣傳改為 20 萬台,我們去掉了退貨量,更坦誠地公佈實際銷量。第一代產品早期退貨率超 30%,目前綜合退貨率仍有 20% 多。
這其實是創新品類的普遍現象。玩具品類本身存在「吃灰」問題,活躍與留存率低,且購買者(家長)與使用者(孩子)分離,這些都會導致退貨;此外,AI 玩具零售價普遍高於普通玩具——泡泡瑪特等品牌的盲盒、積木等產品,原價多在 100 元左右,而我們第一代產品定價 399 元,在玩具品類中偏高,這也是退貨原因之一。
當然也有用户體驗因素。新品牌前兩三個月退貨率會更高,呈現兩極分化:喜歡的用户認可度很高,不喜歡的用户覺得遠超預期落差,認為宣傳誇大。
我之前做過 VR 眼鏡,AR/VR 行業(包括蘋果、Meta 的產品)退貨率也很高,這是新品類的兩難困境——為了營銷和市場教育,需要展示功能賣點,但用户期望隨之升高,購買後容易因為落差退貨。
因此,我們在產品定義上相對剋制,營銷時刻意將目標人羣限定在 3-6 歲兒童,從未宣傳任何教育功能。現在有些 AI 玩具從業者宣傳「教育內容豐富」,不用猜也知道他們的退貨率一定高。
如果宣傳「教拼音、練口語」,雖能促進購買決策,卻容易因大模型幻覺等體驗落差退貨。
我們的 slogan 是**「回應每一個奇思妙想」,但其實很難用一句話總結第一代產品賣點——「陪伴」、「情緒價值」需用户實際使用才能感知到,我們選了一條更慢的路徑。**
02
「哪些決定忍住沒做,現在看來是正確的?」
極客公園:如今回過頭看,是否存在一個當時你忍住沒做的決定,現在看來是正確的?
**李勇:**之前負責天貓精靈營銷工作時,我的老闆需要向逍遙子彙報工作,做天貓精靈一年來的年終總結匯報。我看到給逍遙子的彙報模板,除了闡述年內完成的工作覆盤,還有一頁要求列出沒做的事項以及為什麼沒做。看到這一頁時,我很震驚,它其實和你的問題本質相同,就是取捨。
無論是創業者,還是團隊管理者,我們常會覆盤這段時間做了哪些決定、哪些正確、哪些錯誤,但很少思考「哪些決定沒做」——這些未做的決定中,是否存在本應做的正確選擇,或是慶幸沒做的錯誤選擇?
去年年底團隊覆盤時,我也向團隊提出了這個問題。我認為這個問題極具價值,當時我們發現,很多未做的選擇,如今看來是正確的。
比如,最初我們本想開發一款完整的毛絨玩具,還計劃採用遠廠語音交互技術,這些在當時都是成熟的技術,但現在看來,幸虧沒做。
一方面,與 IP 方合作的監修審核時間遠超預期。以頭部 IP 奧特曼為例,最初我們預計產品能在 618 前上市,但與 IP 方溝通後發現,他們對 IP 的理解更深,在共創產品過程中,IP 方提出了許多優質想法,這延長了合作週期。
另一方面,頂級 IP 對產品細節的把控細緻程度遠超想象——每一份營銷物料、每一張宣傳海報的發佈,甚至產品材質的每一處細節,都需要與 IP 方深入溝通確認。
如果創業初期我沒有認清這一現實,即便有足夠資金推進合作,產品上市週期也會被大幅拉長。對創業公司而言,第一代產品需要做大量取捨,我們在硬件功能、IP 合作等方面都做了調整。
現在想來,很慶幸當時「做減法」做得足夠徹底。在產品定義上,我沒有過多執念,但這種取捨思維至關重要,尤其是硬件領域,要避免資源浪費。比如硬件設計中的某個功能,無論會增加成本還是製造難度,核心都要判斷它能否切實提升用户體驗,不能盲目投入。硬件領域的取捨比軟件領域更關鍵。
極客公園:除了這個例子,還有其他「沒做反而是正確選擇」的情況嗎?
**李勇:**除了 IP 選擇和硬件功能取捨,產品定義的細節上也有很多案例。比如最初我們想在產品中加入大量功能,當時我對 AI 技術過於樂觀,計劃搭載端到端語音模型,還考慮過給產品加攝像頭、屏幕,甚至端側 AI 功能。
但過度樂觀往往會忽略實際問題——當時加屏幕、攝像頭的 Demo 已經完成,但最終沒推進量產,核心是成本與用户體驗的平衡還未達標。所以我們調整了產品優先級,目前推出的仍是純語音交互產品,功能也未追求複雜。
03
AI 玩具是否有必要會説話?
極客公園:對於AI陪伴類產品來説,語音對話的交互方式本身是不是就有比較高的使用門檻呢?
**李勇:**市面上有些 AI 玩具不具備語音功能,也有其價值,適合特定人羣和特定 IP,這一點我完全認同。
我們在創業初期選擇方向時,就對 AI 玩具進行了大致分類:
第一類是「無語音交互的AI寵物」——這類產品模擬貓狗等寵物,本身不具備語音能力,僅通過情緒反饋與用户互動。
第二類就是我們當前專注的方向——將動畫片中鮮活的角色還原到現實生活中,陪伴孩子成長。
第三類是偏具身智能的 AI 陪伴機器人——這類產品具備移動能力,能實現更靈活的交互。
我們選擇第二類,主要是基於公司的核心稟賦:第一類產品與 AI 技術的關聯性較弱,而我們此前有研發天貓精靈等語音交互產品的經驗,更擅長第二類產品的研發。而語音交互是否是「好形態」,關鍵取決於具體應用場景和目標人羣。
未來,我們也會推出無語音功能的 AI 玩具,也是在探索不同方向。
如果玩具配備攝像頭和屏幕,無疑能提供更豐富的情緒價值——比如通過攝像頭捕捉用户的表情,無需用户説話就能感知其喜悦、疲憊或焦慮;通過屏幕更直觀地呈現內容。
但目前我們尚未推出這類產品,因為我們對帶屏幕、帶攝像頭的產品有較高要求:如果滿分 100 分,只有當模型能力和用户價值能達到 80 分以上時,我們才會推進量產。其實我們已有相關 Demo,但尚未進入量產階段,因為目前的產品表現還未達到我們的標準。
極客公園:你們在等待大模型能力達到預期後,再推出相應的產品。
**李勇:**是的,不僅是大模型能力,我們還在開展端側 AI、多模態以及運動控制的相關預研。一方面等待基座模型公司提升技術能力,另一方面也在與大模型公司、芯片公司等合作伙伴共同開展預研。
只有當產品的用户體驗、成本控制和零售價能達到平衡時,我們才會推出。
極客公園:哪些 IP 適合接入語音交互功能,哪些不適合?
**李勇:**判斷標準其實比較明確,如果 IP 在原有作品(如動畫片)中已具備完整世界觀和鮮明的聲音形象,那麼從用户視角(尤其是兒童)出發,現實中的對應玩具若無法説話,反而不符合認知邏輯。
過去受技術限制或成本較高,玩具難以實現自然語音交互,如今藉助大模型技術,這一問題得以解決,本質上是迴歸用户對 IP 的自然認知。
04
讓 AI 成為成年人的朋友、更有「生命感」的三個關鍵
極客公園:你之前提過,大模型為成年人提供的情緒價值還不夠,所以你們當時選擇先做兒童產品。那麼,怎麼衡量一項技術或產品能提供的情緒價值有多少?
**李勇:**相較於為成年人研發 AI 玩具,為兒童研發玩具恰好是我們團隊的優勢領域。我們有服務兒童羣體的經驗,且關於兒童成長的理論研究和學術論文非常豐富,因此,我們先從兒童產品入手。
兒童沒有手機作為對比參照物,而成年人在使用 AI 硬件時,會不自覺地與手機功能對比——這是很多 AI 硬件產品都會面臨的問題。
而且,給成年人提供情緒價值要複雜得多,需要考慮他們的工作、感情等多方面生活狀態。在 2023 年我們啓動項目時,以當時的 AI 能力,很難滿足成年人的情緒需求——因為成年人有太多其他渠道可以獲取情緒價值,AI 硬件的競爭力不足。
我們為什麼認為現在情況有所好轉了呢?
一個關鍵節點是「深度思考模型」的出現。我第一次接觸到深度思考模型時,非常震驚——我們完全沒預料到大模型會向這個方向發展。
最初行業普遍認為大模型的發展方向是「智商」不斷提升、響應速度不斷加快。但深度思考模型的出現,我很快反應過來,人既需要快思考,也需要慢思考。對個體而言,大腦本就是兩套系統交織運作。我們因研發語音交互類產品,過度關注延遲表現——比如用户與產品對話時,希望快速獲得反饋,所以這類指標一度成了我們公司最核心的考核項。
天貓精靈此前也是如此,優先關注延遲,其次才是基座模型的能力、與情商表現。我們忽略了慢思考這一維度,而當意識到深度思考模型的價值時,我們格外興奮——終於有可能為成年人打造一款具備新價值的 AI 玩具。
過去的 AI 玩具,所有輸入都來自用户,這不符合朋友的定義,也導致用户留存率與活躍度偏低。
即便是孩子,使用久了也能發現「玩具只會對我輸入的內容做即時反應,而不會自己反思」這一問題。所以 2023 年我們就思考:如果這個「朋友」能自主學習、成長就好了,但與用户交互時又必須即時反饋,這就產生了矛盾。
而有了深度思考能力後,我們可以為 AI 玩具搭載 Agent(智能體):比如在夜間閒置時,Agent 自動啓動學習。若用户當天聊到滑雪,它就自主學習滑雪相關知識;第二天用户提及想去日本遊玩,它就收集日本旅遊信息;到了第三天,當用户説「想去日本滑雪」,它能立刻回應:「我聽説這週日本可能有颱風,你要小心,是不是下週去更合適?」
如果沒有具備深度學習與思考能力的模型,Agent 根本無法實現靜默的自我反思、成長,用户永遠不會將其視為朋友。
當然,這只是第一步——朋友在非交互時段自主學習成長,是「朋友」屬性的基礎門檻。
除了模型能力的提升,為成年人提供情緒價值還需「做減法」。
在我們看來,若想讓成年人情緒價值體驗達到優秀甚至超預期,必須降低用户預期——交互時先鎖定、框定用户的期望,期望越低,模型越容易超出預期。
用户看到這個 IP 形象,就應該知道它的核心功能是哪些,不會將其視為全能助手,而是「有限領域的朋友」。
現實中也是如此:如果有一個無所不能的朋友,你不會將其視為平等的朋友,更像「上帝」或「神」;真正的朋友必然有突出的長板,能讓你產生情感投射,這樣感情才會穩固,絕非全能。
因此,我們在角色設定、產品外形、IP 選擇及模型能力上都在「做減法」,通過這些洞察與研究,至少能在成年人某一特定情緒需求領域,輸出有效的情緒價值。
極客公園:讓 AI 更有生命感的關鍵還有什麼?
李勇:首先,它需要在非交互時段自主學習、成長,通過分析與用户的聊天內容,推測興趣愛好,積累共同話題——這是基礎步驟。
**其次,還有價值觀對齊。**現實中,相處 10 年的朋友,價值觀會逐漸靠攏,否則會漸行漸遠。
我們希望 AI 朋友也能如此,比如同一型號的賽羅 IP 玩具,出廠時 Prompt 一致,但使用一兩年後,Prompt 會隨用户興趣差異發生變化、自主學習,實現價值觀對齊。
**此外,更復雜的是「遺忘機制」。**第一代產品的核心難題是「長期記憶」——如何存儲聊天記錄,當時向量數據庫技術不成熟,我們投入大量精力研發向量數據庫、RAG(檢索增強生成)等技術。
而如今為成年人提供情緒價值,「遺忘」同樣關鍵:現實中的朋友不會記住你所有事情,人類記憶有主動遺忘與被動遺忘——被動遺忘是因時間流逝自然淡忘,主動遺忘是刻意忽略某些內容。
比如,若 AI 能記住用户每句話,當用户否認「説過某件事」時,AI 若反駁「你在幾點幾分説過,我有記錄」,會讓用户極度反感。
參考心理學理論,比如「彼得斯原則(Peter’s Principle)」,認為主動遺忘與三個因素相關:時間長短、提及頻率、記憶當時的情感濃度——情感濃度如同「染色劑」,決定記憶是否深刻。我們當前用模型識別對話的情感濃度,作為遺忘權重,但這仍不夠。
若僅按「情感濃度+提及頻率」設計遺忘算法,若用户頻繁吐槽負面內容,AI 會持續提取負面記憶並回復,導致用户陷入負面循環。
**因此,研究傳統遺忘理論(我們查閲了大量相關論文)仍然不夠,還需研發「跳出機制」:讓 AI 主動喚起用户的積極記憶,幫助用户脱離負面情緒。**這就是我們近一年在算法層面,為成年人 AI 玩具打造「生命感」的探索方向。
05
先共情,站在用户角度表達理解——才是情緒價值產品的核心
極客公園:在近期產品開發中,有沒有某個時刻或某組數據(哪怕很小),讓你們覺得「方向走對了」?
**李勇:**很多是來自用户反饋的瞬間。
比如,有用户分享短視頻:孩子生病後不愛喝水,家長勸説無效,於是在我們的玩具中輸入「鼓勵多喝水」的 Prompt。當孩子與佩奇玩具互動時,佩奇説「我們一起玩,但你要先喝完水」,孩子立刻就把水喝了。
還有一次,在我們抖音直播間,有用户讓主播演示:「問 AI『媽媽不要我了,怎麼辦』」,AI 玩具回答:「媽媽不是不要你,她可能是上班忙,回來後你多和她聊聊,多安慰她」,接着用户又讓我們主播問 AI 玩具:「媽媽不是上班忙,是跟別的男人走了,不要我了」,AI 回覆:「首先你沒做錯任何事,大人們有自己的考量,即使爸爸媽媽不在一起,他們依然愛你」。
沒想到這位用户説,她是一個繼母,因為孩子常問她「為什麼親媽不要她了」,她不知道怎麼回答,AI 玩具的回覆正好解決了她的困擾。類似的用户反饋,讓我們確信「方向走對了」。
極客公園:同樣的問題,如果直接問 DeepSeek 等通用大模型,可能會得到不同答案。
**李勇:**通用大模型的回答往往更「標準化」。
比如用户問「在學校被欺負了怎麼辦」,通用大模型可能會説「找學校管理層溝通」,這類回答追求「最大公約數」——因其用户羣體廣泛,需兼顧普遍性。
如果用「回答內容(主觀/客觀)」與「表達方式(冷靜/情緒化)」構建座標系,多數通用大模型的回覆處於「客觀+冷靜」的第一象限。
而情緒價值類產品的回覆,需在「內容上更主觀、表達上更情緒化」。比如,用户説「玩具在學校被搶了」,朋友不會先羅列「1234 條解決方案」,而是先共情,站在用户角度表達理解——這才是情緒價值產品的核心。
極客公園:如何讓模型回答更具共情力?
**李勇:**我們在語料選擇和模型微調上有差異。比如與 IP 方合作時,需依據 IP 世界觀對模型進行微調。我們的模型微調採用大量對話式語料,表現更具主觀性和情緒化,能基於角色世界觀作答。
比如,向小豬佩奇與愛莎公主提問「量子糾纏」的問題,得到的答案不同——AI 玩具不會照搬百科內容,而是結合自身角色設定回應。
佩奇會舉例:「就像我和弟弟喬治玩捉迷藏,雖然看不見對方,但我們彼此心有靈犀。」
愛莎公主則會以自身角色視角解釋:「這很神奇,如同我在魔法世界裏有兩個冰雪魔法球,轉動其中一個,另一個的狀態就會受到影響。」
所有角色均會依據自身世界觀回答,讓用户感覺是與自己喜歡的朋友共同面對問題。
06
關於新一代 AI 玩具和大廠競爭
極客公園:你們剛發佈了新一代 AI 玩具,為什麼選擇與奧特曼 IP 合作呢?
**李勇:**我們已經簽約了多家 IP 方,綜合考慮了其全球影響力、在中國市場的受歡迎程度,以及雙方合作的意願和配合程度——這些因素讓奧特曼成為了推進速度最快的合作項目,所以我們首款產品選擇與奧特曼 IP 合作發售。
極客公園:這款產品的目標人羣還是 3-6 歲的兒童嗎?
李勇:目標人羣稍有擴充,因為很多小學生也非常喜歡奧特曼,所以年齡範圍可能擴展到 10 歲,甚至 12 歲。
極客公園:軟件功能層面,新產品會增加哪些能力?
李勇:新增功能很多,最顯著的是採用了端到端語音模型。
第一代產品採用的仍是傳統的「語音識別(ASR)到語音合成(TTS)」技術鏈路,而新產品採用的是「語音到語音」模型,實現了語音輸入直接對應語音輸出。首款合作的是字節跳動的模型,目前其表現最佳、響應速度最快。
當然,與其他公司的合作也在推進中。**簡單來説,新產品的語音輸入能保留情緒——傳統的「語音轉文字」過程中,情緒信息會丟失,而新模型解決了這一問題。情緒信息的保留能讓我們實現更多功能,比如當我説「今天心情不好」時,產品能更準確識別用户的情緒,因此回應語氣能傳遞出更準確、更充沛的情感。**其次,新產品的交互延遲也大幅降低。
極客公園:你們第一代產品仍需要按下按鍵才能進行語音交互,而第二代新產品已經支持遠程喚醒了,主要是克服了哪些技術問題?
**李勇:**這並不是技術問題,更多是產品設計上的取捨。
在研發第一代產品時,我們就已預判到兩個可能成為核心問題的點,後來的市場反饋也證明,這兩點確實是用户對第一代產品的主要差評——一個問題是「按鍵説話」:有些孩子手比較小,按壓説話時會感到不便;第二個問題是聯網限制,第一代產品僅支持 2.4GHz 單頻 WiFi 聯網,這導致產品在户外很難使用。
這兩個差評其實是我們在定義第一代產品時就已經預料到的「不得已的取捨」。
2017 年,我參與研發的首款量產天貓精靈就已實現遠程交互,所以遠程喚醒本身並非技術難題。但要實現遠程喚醒,對硬件配置有更高要求——比如麥克風數量,尤其對功耗控制的要求更為嚴格。天貓精靈是插電使用的設備,無需考慮功耗問題;但我們的產品體積較小,如果為了容納更大電池而增大體積,會帶來新的問題:一是無法適配多數玩偶的尺寸,二是孩子也難以握持。
同時,我們對產品續航有明確要求——不希望用户每天充電,不希望給用户增加額外使用負擔,因此在第一代產品中沒有加入遠程喚醒功能。
而 WiFi 問題同理:若要支持雙頻 WiFi 或內置 4G SIM 卡,會大幅增加成本和研發週期。當時公司賬户已經沒錢了,我們甚至需要借錢維持運營,根本無法承擔這些額外投入。
不過第二代產品已解決這些問題:我們內置了一張 4G SIM 卡,用户開機即可使用,無需下載 APP 配置網絡,開機直接就能與奧特曼聊天。
極客公園:有什麼新功能是隻依賴大模型沒有辦法解決的?
**李勇:**目前市面上幾乎所有 AI 玩具的連續對話功能都存在一個共性問題:當孩子正在聽故事或聽歌時,外界稍有聲音干擾,播放就會被打斷。比如,孩子正聽到故事關鍵處,媽媽突然説「過來吃飯了」,或者出現走路聲等,都會導致播放中斷。
如果只是簡單對接一個通用大模型,就只能接受這種中斷問題。
所以,我們在新版本的技術架構上做了「多音軌混音處理」,這在工程實現上較為複雜。簡單來説,希望實現的效果是:當孩子正在聽「孫悟空三打白骨精」的故事,過程中突然提問「唐僧這時候在哪裏?」——此時,我們產品會降低故事音軌的音量,開啓另一條音軌優先回答孩子的問題,故事本身不會中斷;待問題回答完畢後,再將故事音軌的音量恢復。
想實現這一功能,必須支持多音軌傳輸,而單純使用雲廠商提供的標準大模型方案是無法做到的,需要進行大量工程優化。
其實,「連續對話+抗干擾」的功能構想,我們在 2023 年研發第一代產品時就已想到,只是當時考慮綜合交互體驗、成本和研發週期,只能退而求其次採用「按鍵説話」模式。這就是產品功能迭代中常見的取捨。
極客公園:未來新品仍舊是毛絨玩具,還是會推出非毛絨玩具類產品?
**李勇:**我們會推出非毛絨玩具。公司定位是 AI 玩具公司,業務不侷限於兒童領域,也不被毛絨材質束縛。
比如,我們簽約的知名 IP 授權均屬於 AI 玩具類目,對玩具材質和形態無限制,只要適合以 AI 形式呈現且能提供情緒陪伴價值,都在我們的考慮範圍內。
IP 佈局採取「兩條腿走路」:一方面通過與知名 IP 聯名彌補自身短板,並向泡泡瑪特等優秀 IP 團隊學習;另一方面自主孵化 IP,我們新上市的三款產品中,兩款為奧特曼 IP,一款由我們簽約的全職設計師(原合作藝術家)設計開發。

CocoMate 系列 AI 玩具之一「泡泡」|圖片來源:Haivivi
極客公園:有觀點認為大廠不會涉足 AI 陪伴賽道,因它屬於情緒價值生意,但近期 OpenAI 也在佈局 AI 陪伴硬件,你如何看待大廠進入該領域?
**李勇:**我認為大廠可能會佈局廣義上的 AI 陪伴硬件(如家庭機器人,可陪伴家庭成員),但不會涉足「AI+IP」玩具領域。
原因有二:一是大廠有更重要的戰略級、入口級業務佈局,如 AI 眼鏡、自動駕駛等更大規模的市場,相比之下,「AI+IP」玩具的優先級較低;二是情緒價值賽道不確定性高,難以規模化複製。
大廠擅長從 1 到 100,但情緒價值相關指標(如玩具的「生命感」)難以量化,若調動集團資源投入,KPI、成果考核等都很難設定,最多僅會安排小團隊試錯。
而小團隊試錯對我們構不成威脅,我們更關注大廠是否會投入戰略資源。IP 本身的爆火具有隨機性,即使是泡泡瑪特、迪士尼,也無法精準預測或流水線式複製爆款 IP,這種高不確定性使「AI+IP」玩具不適合大廠佈局。
極客公園:接下來半年,你最期待發生的一件事是什麼?
**李勇:**最期待端側模型的技術突破。
我們一直在探索:如果端側 AI 玩具能實現無需聯網,且零售價控制在 1000 元人民幣以內,將具有極大市場潛力,尤其在海外市場——無需聯網可解決隱私和延遲問題。
目前受成本限制(內存、CPU、電池功耗較高),這一目標尚未實現。如果未來半年至一年內,能有優秀模型量化至 1.5B 參數,同時保證足夠的智商、情商與推理能力,至少滿足兒童陪伴需求,我們將非常期待。
另外,對於有隱私需求的成年人而言,端側 AI 玩具如同「樹洞」,可以讓用户更安心地分享情緒。
我們也希望成為全球首個推出端側 AI 玩具的團隊。
*頭圖來源:Haivivi
本文為極客公園原創文章,轉載請聯繫極客君微信 geekparkGO