火山引擎打通了「AI+硬件」的最後一納米_風聞
温度纪-昨天 22:49

文 | 闌夕
1939年,一台會説話的機器人,震驚了造訪紐約世博會的每一個遊客。
機器人名叫Elektro,造型酷似「綠野仙蹤」裏的鐵皮人,不過覆滿全身的是鋁板,且被塗成了古銅色,它由西屋電氣生產,在設計上帶有典型的工程師風格。

在展台上,Elektro口齒清晰的發表自我介紹:「女士們,先生們,我很榮幸見到各位,我是一個聰明的傢伙,因為我的大腦裏有48個繼電器。」
Elektro甚至能夠表現出幽默感,當有遊客停下來打量它時,它就會冷不防的來上一句:「我的大腦比你大」。
這也是實話,因為那48個繼電器加起來重達25公斤,遠非人類可以比擬。
興奮的媒體很快就把Elektro當成未來已至的造物,用盡一切溢美之詞讚美這個時代的科技奇觀,但不出意外的,意外還是雖遲必到。
西屋電氣很快承認,Elektro其實並不是真的會説話,所有的語音指令,都是提前錄製好的,由操作員控制播放,那些充滿機鋒的對話,也只是經過編排的劇本。
雖然好萊塢還挺喜歡Elektro的——它客串了不少電影,多少也啓發了C-3PO的造型——但在市場噱頭幻滅之後,Elektro還是被扔進了報廢倉庫,成為歷史長河裏數不清的過客之一。
不過人類還是不曾放棄創造智能物種的念想,近一個世紀以來,人工智能的探索曲折蜿蜒,終於在這幾年的大模型浪潮裏,第一次接近了為無機物賦予生命並和「它們」平等對話的可能。
而看着哆啦A夢長大的一代人,也開始有機會製造下一代人的哆啦A夢了。
· · ·
2024年的最後一個月,火山引擎在上海舉辦了Force原動力大會,AI繼續擔當主角並不讓人感到意外,但AI落地到硬件的場景嶄露頭角,還是有些科幻走進現實的味道。
想象一下,未來的潮玩和手辦,將不再只能放在展示櫃裏觀賞,而是每一個都內置「人格」,可以隨時響應用户的召喚,和他們對答如流的暢談詩與遠方,這會帶來怎樣顛覆性的產業變革?
越來越聰明的大模型看上去已經能夠勝任這樣的角色了,但真實的工業生產,從來不是把軟件裝在硬件裏,就能解決一切需要,在火山引擎參與「組局」之前,對話式AI+硬件最大的問題其實在於——AI感的無法消除。
在日常的使用場景裏,普通人大概體會不到主流智能手機的計算性能和操作系統有多強大,然而一旦將同樣的大模型置於千元以內的硬件終端裏,那種交互上的違和感很快就會出現。
比如反應變慢,一句話問完要等好幾秒後才有回應,或是無法像自然對話那樣隨時打斷,往往用户插嘴後AI還在滔滔不絕的輸出既有內容,再就是對弱網場景支持不足,在接收指令時丟失了關鍵信息,以致於已讀亂回的情況時常發生。
加上在多模態的環境裏,人與AI之間的交互,不僅有低帶寬的文本和語音,還會包含高帶寬的視覺影像,以及情緒模擬的個性化適配,這就更加考驗端側音視頻處理的能力了。

理解了將AI和硬件組合在一起的難度,也就理解了為什麼火山引擎要來推出解決方案,就商業邏輯而言,讓硬件公司專注於消費製造,讓軟件平台專注於模型開發,是效率最高的最優解,而中間的粘合環節,恰好就是火山引擎的擅長領域。
畢竟,在即時音視頻RTC配合AI接入的這條技術線上,火山引擎可能是雲計算廠商裏,走得最遠的那一家。
· · ·
火山引擎對於RTC技術的長期投入,讓它同樣成為對話式AI的方案供應商,昔年的深耕穿越至今結出碩果,倒是有些「養兵千日,用兵一時」的意思。
世界盃的多人觀賽、抖音的直播連麥、飛書的多人會議……從規模負載來看,火山引擎RTC的實戰積累,也是全球領先的,所以當AI交互的新場景出現後,火山引擎並不需要重新造輪子,而是可以直接站在先進經驗的山頭,另起青雲。
於是,不到半年時間,火山引擎就從發佈即時對話式AI方案、向着行業喊話的試探性角色,上升到了聯合IoT領域的國產龍頭樂鑫科技正式支持硬件製造商們入局的核心圈玩家,同時火山引擎也和這幾家廠商聯合發佈「硬件+對話式AI」智躍計劃。

樂鑫科技是做IoT芯片的,全球出貨量累計超過了10億顆,是這個細分市場的頭部公司,在大會專場上做了30分鐘的演講。

其中有一個比喻非常通俗:在這一輪AI潮玩造物的產業分工裏,硬件生產商,相當於是在製造「肉體」,樂鑫這類集成電路設計企業,負責構建「大腦和神經」,而接進來的各種大模型,則承擔着賦予「靈魂」的使命。
以此類推,火山引擎作為雲服務平台的價值,就是為上述器官提供一套「生命系統」,從消化到代謝,從呼吸到知覺,確保智能的平穩運行。
具體來説,樂鑫專為AIoT市場供應的的ESP32-S3芯片,將會集成火山引擎的RTC能力,內置一套「即插即用」的大模型語音交互模組,把端到端的響應延遲壓到可在1s以內,還能靈敏識別用户的打斷意圖,還原人機(大模型)之間的真人感對話。
直接調用豆包大模型後,還能獲得最新的多模態交互技術,讓潮玩等AI硬件可以「看到」甚至「察覺」用户的情緒,可以持續與AI持續對話,不用「一按一問」。
隨着前沿技術的溢出,硬件消費品可能到了最合適的下場時機,互聯網產業上游都在致力於提供一站式保姆服務,萬事俱備,只欠產品。
· · ·
加入這場「硬件+對話式AI」盛宴的潮玩品牌ToyCity,是一家典型的製造業廠商,前身曾是東莞數千家玩具代工廠裏的一員,為高達、米老鼠、變形金剛等一線玩具品牌生產組件。
2020年,創始人鄭波決定開創自己的設計師玩具品牌,這也是過去十幾年來並不少見的,從中國製造到中國智造的產業升級敍事。
在分享環節,鄭波拿出了ToyCity旗下最成功的原創IP「耙老師」,認為這隻在潮玩圈裏家喻户曉的熊貓非常適合成為公司史上第一代AI潮玩的形象,可愛無害,柔軟可捏,情緒價值拉滿。

在鄭波看來,他看好AI潮玩迎來普及化的機會,是基於專業,而這裏的專業,指的不只是ToyCity的設計能力,還包括專業的芯片、模型和對話技術,一切的水到渠成,都取決於各方都把自己的專業打磨到了可以直面市場的程度。
和ToyCity一起「入夥」的,還有新興的潮玩品牌FoloToy,曾以對兒童玩具火火兔的AI化改造一夜成名,以及面向年輕女性市場的珞博智能、為普通人打造賽博夥伴的魂伴科技,它們的共同點在於,相信潮玩的陪伴價值,會在原子化的未來社會里被無限放大。
比如要想實現魂伴科技的願景,就對交互技術有着極高要求,AI不應該止步於有問必答的工具人,更應該充當打破次元壁的個人CP,它甚至可以笨一點,需要人的關懷和陪伴,雙向輸出情緒價值,讓AI和人性一起成長。
在魂伴科技的使命裏,「復活」人們耳熟能詳的那些經典IP,是最有價值的鏈條所在,讓分院帽、寶可夢、紅小豆這些可被抱在懷裏的柔軟玩具,成為像影視劇裏表現出來的,可以不分晝夜的陪在用户身邊,隨時回應情感需求,在這樣的時刻,市場對於玩具的估值和期待,將得到徹底改寫。
為了證明自身的存在不是孤獨的,人類可以製作出經過10億年都不會腐朽的金唱片,讓旅行者號探測器帶着它飛向宇宙深空,而在不需要遠離地球的另一條技術線上,以造物主的身份創造出數字化的同類,也能抵達同樣的終岸。
而且,這也不是局部的認知,而是全球的共識。
今年8月,OpenAI投資了一家不起眼的初創公司Heeyo,其產品就是利用大模型打造兒童的數字玩伴,由哈佛和斯坦福的心理學家參與設計,可以提供早期教育的定製化服務。
即使是在「少子化」的日本,玩具市場在過去一年的增長,依然保持在7.1%的高位,無論是兒童還是成人,都在對抗孤獨這件事情上,有着強烈的需求意志。
玩具的AI化,是在功能性和娛樂性的基礎上,把那些「無用之物」變成了賽博時代的生命體,並將另一個數量級的陪伴市場嫁接過來,雖然很難估量交叉之後的產值,但讓從業者燃起興奮,是毋庸置疑的。
· · ·
就像Google Pixel的存在意義是給各家Android手機廠商「打樣」,火山引擎今年中秋定製的毛絨玩具「顯眼包」,也給AI+硬件這條賽道,做了一次很有意思的啓蒙示範。
在二手平台,「顯眼包」的交易價格已經上漲到了300-500塊錢不等,這個萌翻眾人的火山擬人玩偶,以其「體形雖小,智慧俱全」的對話體驗,在沒有量產計劃的情況下,依然火出圈了。

或者説,卷模型的事情,就交給大廠們去砸錢,站在製造業大國的路徑上,高度成熟的供應鏈資源,是不應該被浪費的,最難的技術鏈打通之後,壓力就來到了最需要創意和情感的消費級市場。
根據第三方招聘平台的數據,AI的大浪襲來,再度復興了產品經理這個古典職業,在國內新經濟行業今年的新發崗位數量上排名第一,新聞裏的AI隔三差五就出王炸,普通人的感知卻長期偏弱,中間橫亙的深邃鴻溝,需要更多的大眾向產品來填平。
不只是玩具,在廣義的AIoT市場裏,萬物的感知系統一定會越來越強,未來所有的生活場景都離不開軟件,而軟件則生長在雲設施上,從支持人和物的對話開始,火山引擎的歷史使命,也是從萬物的IT化,到萬物的AI化。
俄亥俄州的曼斯菲爾德紀念館後來收藏了Elektro的遺骸,配上的文字充滿深意:「每天都有改變歷史的發明被扔進垃圾桶裏。」
而在今天,所有投身AI賽道的建造者,都有機會親手把科幻電影裏的未來實現在近在咫尺的前方,怎麼看,這都是一件高燃的事情。