時空壺發佈W4:用“硬核”技術,打贏一場AI翻譯的“標準”之戰_風聞
极客公园-极客公园官方账号-09-08 08:04

翻譯耳機這個新賽道,當巨頭還在做「功能」,這家公司已在定義「體驗」。
作者|張勇毅
編輯|鄭玄
科幻小説中的「巴別魚」一直是人類對跨語言溝通的終極想象,一個能塞入耳中、即時消弭語言鴻溝的生命體。而在現實世界,將這一夢想變為現實的漫長征途,早在 2017 年便由一家名為時空壺的公司開啓。
那一年,當整個行業還未將目光聚焦於此時,時空壺就發佈了全球第一款翻譯耳機,率先向這個看似遙不可及的目標發起了衝擊。他們的核心理念從始至終都無比清晰:要讓機器翻譯普及,關鍵在於打破專業同傳的交互壁壘,讓技術服務於人類最自然、最無感的交流方式。
這種開創性的思路,不僅定義了時空壺此後多年的產品路徑,也讓這家公司在全球市場悄然佔據了「隱形冠軍」的位置。自 2019 年第一代產品在海外發售至今,時空壺已在這條專用賽道上深耕了超過六年。從最初的拓荒者變成如今定義產品功能與形態的獨角獸。

在 2025 年 9 月,德國柏林的 IFA 展會期間,時空壺攜其最新旗艦 W4 AI 同傳翻譯耳機登場亮相,再次用一種極致的務實主義,回應了那個最初的夢想——「AI 翻譯,首先得讓對方聽清你説什麼」。同時也藉此直指行業最核心,也最容易被忽視的痛點:在真實世界的嘈雜與混亂中,如何保證輸入信號的純淨無暇。
01
硬件優先
時空壺的創始人兼 CEO 田力在介紹 W4 的過程中,並未將重點放在描繪遙遠的 AI 未來,而是選擇直面那個最基礎卻也最致命的行業難題:噪音干擾下的語音識別。面對展會現場鼎沸的人聲與背景音樂,大多數音頻設備束手無策,而 W4 卻能實現驚人的清晰度。
其秘密武器,並非複雜的軟件算法,而是一項看似「返璞歸真」的硬件創新——一套被命名為「骨聲紋傳感器捕捉技術」的多麥克風融合系統。
這套系統的核心,是一顆定製的骨傳導傳感器,它不依賴空氣作為介質,而是通過捕捉用户説話時頭骨的振動來拾取聲音。這意味着,無論周圍環境多麼嘈雜,無論是地鐵的轟鳴、餐廳的喧囂,還是展會的吵嚷,這些通過空氣傳播的噪聲都無法干擾到信號的採集。
與此同時,W4 的每隻耳機還配備了兩顆傳統的氣導麥克風,用於收集聲音中的環境信息和部分細節。最終,通過時空壺自研的融合算法,將來自骨骼振動和空氣傳導的兩種信號進行整合,精準地提取出佩戴者最純粹的人聲,從物理源頭就「保護」了一個乾淨的音頻信號。

這種理念與主流的軟件降噪有着本質區別。傳統的降噪技術是一種「減法」,它首先錄製一個混雜了人聲和噪音的音頻,再試圖通過算法將噪音「減去」,這個過程不可避免地會損傷人聲的細節,甚至產生失真。
而時空壺的方案則更像是一種「加法」或「保護」,它從一開始就獲得了一個幾乎不受污染的人聲音源,保證了後續翻譯環節的輸入質量。田力對此解釋道:「我們很多的東西其實是在硬件和一些算法上,而它不是一個大家意義上的這種 AI 的純粹的雲端的翻譯。真正決定用户那個交互體驗的東西,不光是翻譯引擎那一刻,而是前面的很多環節。」

這款 W4 耳機在外觀設計上也貫徹了這種務實的哲學。它看上去與普通的 TWS 耳機差別不大,沒有誇張的科技元素。其設計語言低調而優雅,充電盒手感温潤,耳機本體則通過人體工學設計,確保了長時間佩戴的舒適性。將所有核心的智能模塊、電池都收納於小巧的機身之中,體現了對用户日常使用體驗的深刻理解。
02
「隱形冠軍」的專注與耐心
推出這款產品的時空壺,早已不是一家初出茅廬的創業公司。但他們的成長路徑,在中國硬件公司中顯得頗為「非典型」。
早在眾多企業將「出海」作為戰略口號之前,時空壺就已經在海外市場默默耕耘。他們選擇先在美國市場發力,初期海外與國內的銷量佔比一度達到懸殊的 9:1。這種策略讓他們得以在最成熟、競爭最激烈的市場中打磨產品,並直接服務於那些對跨語言溝通有着最迫切需求的用户——遊客、商務人士以及跨國生活的家庭。
時空壺將自己的核心用户定義為「專業型消費者 Prosumer」,田力認為這與大疆無人機的早期用户畫像頗為相似。他們購買產品並非為了嚐鮮,而是為了解決一個專業且剛性的需求。如今,隨着全球用户累計突破 100 萬,國內市場的認知度也逐漸打開,時空壺的銷售比例也調整至更為均衡的「七三開」。
這種穩健風格的背後,是田力對公司經營原則的堅持。他本人並非典型的硅谷式創業者,公司不依賴一輪又一輪的融資維持生命線,團隊規模也保持着剋制,從 2023 年的幾十人穩步增長至如今的一百多人。
**「我們早已實現淨利潤為正」**田力在專訪中坦言,「我們不是那種等着救命錢來幹活的公司」因此他們更願意將資源和精力投入到產品本身的迭代與打磨中,保持着一種在當下創投環境中略顯「緩慢」的節奏。
03
Babel OS:打造全棧AI**引擎**
隨着用户量突破百萬,在真實嘈雜環境中進行清晰、流暢跨語言對話的需求已清晰可見,W4 項目應運而生。除了在收音清晰度上的硬件突破,時空壺更是在系統和算法層面構築了堅實的核心壁壘。這套自研的系統被命名為「巴別系統」(Babel OS),它集成了時空壺多年來在翻譯領域的經驗與技術沉澱。
Babel OS 的第一個支柱,是解決同傳中「速度」與「準確」矛盾的關鍵技術——「AI語義切分」。田力解釋道,同傳領域有一個經典難題:傳統的機器翻譯同樣需要等待一個完整的句子或語義單元,延遲因此產生。而時空壺的技術,能通過大模型即時分析語義,判斷一個意羣是否完整,從而做出預判性的翻譯,先把主幹意思傳遞出去,後續再快速修正。這正是用技術去無限逼近一個優秀同傳譯員的判斷力。
田力補充道,「行業標準裏,真人同傳譯員的準確率也並非 100%,大約是 80% 多,因為他們追求的是快和流暢。我們做的,就是用技術實現這種平衡。」
Babel OS 的第二個支柱,則是利用大語言模型(LLM)實現「語境感知翻譯」。這是解決翻譯準確性,尤其是處理多義詞和近音詞的關鍵。例如,在英語中,「to, too, two」或「there, their, they’re」等詞語,如果脱離上下文,機器很難準確判斷。時空壺通過其自研的「TurboFast AI 翻譯引擎」和 LLM 的強大能力,讓系統能夠理解對話的整體語境,從而在這些細微之處做出精準的判斷,極大地提升了翻譯的自然度和準確性。
**「我們最開始也用谷歌、微軟的引擎,但很快發現,要達到理想的用户體驗,必須親自動手去改造模型,」**田力説。如今,無論是谷歌還是三星,都選擇將翻譯作為其旗艦耳機的一項附加功能。而時空壺的全棧自研模式,則展現了截然不同的決心。田力指出,大廠的翻譯引擎在很多小語種上表現不佳,例如阿拉伯語、越南語等,存在大量未被解決的「角落案例」。
對此,時空壺的結論是:只有自研才能實現端雲一體的深度優化,例如通過前端對聲音進行特殊編解碼,再餵給雲端專門訓練過的模型,從而極大提升速度和魯棒性。這種覆蓋硬件、固件、系統到 AI 模型的全棧能力,讓時空壺更像一家專注的通信設備公司,而非純粹的 AI 軟件公司。
04
定義同傳翻譯標準
在時空壺內部,他們用一個 L1 到 L5 的框架來定義「好的跨語言交流」,本次隨着 W4 發佈,這一類似自動駕駛行業標準的「同傳翻譯行業標準」也一併向外界揭曉。
L1,是電子詞典級別的「詞對詞」翻譯。
L2,是谷歌翻譯 App 式的「句對句」翻譯,交互是斷續的。
田力認為,市面上大部分產品,包括巨頭們推出的功能,其交互方式——例如兩人輪流對着手機講話——決定了體驗只做到了 L2.5,這並非人類自然的交流方式。
而時空壺努力做到的,是 L3——自由對話。為了實現這一目標,W4 提供了多種精心設計的翻譯模式。核心的「雙語對話」模式,允許兩個人各佩戴一隻耳機,進行近乎即時的、面對面的自然交流,翻譯結果會直接在各自的耳機中播放。此外,還有適用於聽講座的「聽譯模式」,以及為問路等快速場景設計的「問答模式」。這些模式覆蓋了用户在旅途和商務中最常見的使用場景,真正讓「邊走邊聊」的跨語言溝通成為可能。
但 L3 也並非他們設想中、AI 同傳耳機的終點。**「我們的目標是 L4,達到高級同傳譯員的水平,」**田力這樣介紹時空壺對同傳翻譯耳機場景的規劃。

在採訪中,田力還與作者分享了一個現實中土耳其高級譯員的故事:在一次同傳中,官員即興講了個本土笑話,譯員知道直譯國外聽眾無法理解,便在電光火石間對着麥克風説:「現在,領導講了一個笑話,請大家笑一下。」全場爆笑,效果絕佳。「你看,這已經超越了語言本身,是對意圖、情緒和氛圍的理解。這是 AI 目前最難做到的,需要多模態的感知,也是我們努力的方向。」
05
做同傳耳機賽道里的「大疆」
正是基於這種對專業體驗的極致追求,時空壺選擇了耳機這一產品形態,併為其設定了 349 美元的專業級定價。面對外界關於「憑什麼賣這麼貴」的質疑,田力顯得很自信,在對話中,田力將時空壺的產品邏輯比作大疆的無人機,而非智能音箱。
「你買大疆的無人機,不是因為它也能當風扇,而是因為它在航拍這個專業領域做到了極致。我們的用户選擇 W4,是因為它在跨語言溝通這個特定場景下,提供了遠超通用設備的卓越體驗。」
這或許也是時空壺為何並未急於像其他 AI 硬件一樣,採用訂閲制收費的原因。田力認為,在行業整體成熟度僅在「及格線」徘徊時,首要任務是把基礎體驗從 70 分做到 100 分,而不是過早推出一個 100 分產品才需要的高級商業模式。
在談及與科技巨頭的競爭時,田力認為小公司永遠有機會。「谷歌做硬件,恕我直言,一直有種『玩票性質』,」他回憶,「我 2019 年在灣區見過他們項目的人,他們覺得這個功能很酷,就做出來了,但用户用得好不好,不是最在意的。所以谷歌硬件總是『起個大早,趕個晚集』。」對巨頭來説,翻譯只是其龐大生態中的一項附加功能;而對於時空壺,「這是我們的『命根子』。小公司跟大公司比,本質上比的還是認真和專注。」
為了更加直觀地展示機器翻譯的真實水平,時空壺此前曾使用自家產品,參與過一場「人機大戰」,讓其產品與真人同傳譯員同台競技。這不僅是一次營銷,更是向頂級譯員學習的方式。「通過這種極限對比,我們能更清楚地看到自己的差距和努力的方向,」田力説。
關於 AI 硬件乃至時空壺本身的未來,田力聊到驅動着他和團隊前行的樸素願景。他相信,人類作為社會性動物,天生渴望交流與連接,而語言的壁壘所帶來的,是真實存在的不安與孤立。
而在他看來,時空壺的使命,是要打造一把鑰匙,去開啓那扇因語言而緊鎖的溝通之門,賦予人們跨越鴻溝的勇氣——那種可以跟任何人交流,去連接的從容。這才是他們最大的成就感來源。
「人類是社會性動物,天生渴望交流和連接,」在採訪的最後,田力迴歸到了創業的初心,「當你去到一個陌生的國家,語言不通時,那種不安全感是真實存在的。我們希望通過產品,賦予人們勇氣,讓他們可以很爽地去跟任何人交流,去連接,去成為朋友」
因此從某種程度上,W4 不僅僅是一款追逐 AI 浪潮的硬件。更是時空壺對這種願景的載體,是這家公司用近十年的專注與積累,為消除人類的隔閡所獻上的最新答案。
「消除語言障礙,可能不是一百年內能完成的事,」田力坦言,「但我們正走在這條路上。」
*頭圖來源:極客公園
本文為極客公園原創文章,轉載請聯繫極客君微信 geekparkGO