當AI從“炫技”走向實用,自主可控才真正站得住腳
史岱君

**導語:**當全球大模型浪潮洶湧而至,中國科技企業面臨的不只是技術競速,更是產業落地、用户體驗與國際競爭的多重博弈。當大模型的敍事被逐漸拉回現實,一場關於技術主權、國產替代與真實需求的深層次較量悄然展開。
作為中國人工智能“國家隊”的代表,科大訊飛正在用自己的路徑給出另一種回答:堅持全國產算力,在翻譯、數學、推理等核心領域構建大模型能力;將產品嵌入學習機、翻譯機、智能辦公本等具體場景,以“高頻剛需”對抗空泛熱潮;在韓國眾籌平台成為銷冠、日本市場試水硬件出海,跳出國內內卷的價格戰,驗證中國技術能否真正走出去。
從“看得見的技術突破”到“用得上的用户體驗”,從“實驗室模型”到“市場反饋”,訊飛試圖把AI重新拉回生產一線和出海前沿。這不僅是一個企業的突圍路線,更是中國AI在國際秩序重構中自我定位的一次投射。以下是在2025世界人工智能大會上與科大訊飛副總裁趙翔的對話實錄:
Q:訊飛大模型的特色是什麼?
**趙翔:**人工智能的發展潮起潮落,現在是第四次人工智能浪潮。科大訊飛是一家科技公司,從1999年至今,我們一直專注於此事,研究人工智能,經過這些年的努力,我們已經積累了一定的經驗和技術。
我們是認知性的全國重點實驗室,同時也是語音和語言處理的國家工程中心,可以説,我們是帶有國字號的國家隊。去年6月份,我們的“多語種智能語音關鍵技術及產業化項目”獲得2023年度國家科學技術進步獎一等獎,這是人工智能領域的唯一獎項,我認為它非常重要。這給我們帶來了很大的信心。
2022年,OpenAI發佈ChatGPT3.5之後,全世界的科技公司和大模型公司都開始一路狂奔,各項技術均有所突破,各種技術流派百花齊放。我們科大訊飛的大模型是基於長思維鏈進行深度推理,本次升級後,不僅在文本,而且在翻譯、數學、邏輯推理等重要方面表現非常優異。

目前我們的產品基於100%的全國產算力。科大訊飛作為一家中國企業,有這樣的使命。我們將與中國其他主要從事算力的公司,如華為公司合作,共同發展業務,而這關係到我國未來在關鍵領域的核心技術發展,是非常重要的。目前,我們的大大模型全中國唯一基於全國產算力的大模型。
訊飛目前的業務應用場景非常廣闊,而僅憑技術是不夠的。我認為,改變世界的不僅僅是技術本身,更重要的是能夠落地應用到產品。只有將其落地到我們的產業中,才能讓消費者體驗到我們所發揮的價值,這樣才能夠正帶動中國經濟發展。
在本次上海世界人工智能大會上,我們的翻譯、企業辦公以及各行各業的各方面,不僅是我自己。科大訊飛負責智能硬件,包括許多行業的解決方案,都運用到了AI的許多領域,這個能力能夠應用於真實場景,解決社會上老百姓的高頻剛需問題。
因此,我認為從三個方面來看,訊飛的特色首先是自主核心技術,其次是全國產化,第三個特點是豐富的應用場景。
Q:目前終端產品聽起來很棒,但用户體驗並不好,有雷聲大雨點小的感覺,您認為未來突破口在哪裏?
**趙翔:**智能硬件產品,隨着技術大模型的發展,入場的玩家會越來越多。我將智能硬件終端產品分為三類。
第一類是大家比較熟悉的基礎設備。最典型的代表是我們的電腦和手機。第二類是可穿戴設備,目前最熱門的可穿戴設備是智能眼鏡。其他的,耳機、智能手環也都屬於此列。第三類是一些是新的形態。其中包括家庭機器人、外骨骼機器人和具身智能機器人等。
我認為最核心的問題在於,這些設備沒有基於我們的技術和軟硬件結合來解決問題,許多產品尚不成熟。為了解決客户場景問題,我們得搞清楚,哪些產品是消費者不需要?這類客羣的特點是什麼?。對一個產品,用户只有發自內心的喜愛它,並且離不開它,那它才具有生命力和持續發展的能力。
我們目前從事技術和產品工作。訊飛已經開發了幾項產品,當然,整體規模與大型手機廠商還無法相比,但我們仍處於不斷進步的階段。我們推出的幾款產品非常受消費者喜愛,例如我們的學習機、翻譯機和智能辦公本等設備,是引領行業的。

Q:現如今科技企業內卷嚴重,大打價格戰,如何解決這個問題?
**趙翔:**首先我們需要提高技術應用成效。技術並非掛在實驗室裏的空話,而是要真正地為用户帶來體驗、效果。
以我們的翻譯為例,我們這次發佈的端到端同傳大模型的升級,優勢主要體現在以下幾個方面。首先,我們的語音翻譯效果具體比1月份發佈的版本有20%的提升,滿分100分的測試,可以拿到90分,這其中包括翻譯語句的完整性、翻譯的準確性和語言質量等指標。這是我們與中國翻譯協會合作的結果。
其次是翻譯速度加快。我們希望能達到真人同傳以及翻譯員的速度,因此在中英翻譯中,我們從開口説話到機器翻譯開始播報,中間接延遲僅為兩秒。如果用户有速度上的需要,我們可以立即開始翻譯。
第三是翻譯結果的播報不能有機器播報聲音。我們是根據自然語言來理解的,理解被翻譯對象在講什麼。根據對文字的理解,讓得機器如同真人一樣,在哪些地方停頓、延續,怎麼讓表達更加鏗鏘有力或者稍加婉轉,然後自適應,通過調節語速和語氣,讓整個播報過程更像真人在講話。
第四個是行業翻譯,正常且簡單的輕翻譯在日常溝通是可行的,能解決用户的一部分問題。但我們很多用户是商務人士,有商務談判的需求,那在使用我們的翻譯機時,就會更看重行業術語翻譯的嚴謹性。
舉個例子,你在國外去到一家本地醫院,非醫療行業的人未必能夠熟練掌握行業專有名詞。
但是我們不一樣,我們是機器翻譯,通過大量學習,在我們的大模型當中儲備有8萬個專業詞彙,涵蓋了各行各業,像醫療、金融和製造等領域。

Q:目前各大訊飛出海的情況如何?
**趙翔:**目前科大訊飛正全力出海。我認為出海業務對中國企業來説是非常好機會。
首先,我今天查看了今年一季度掃地機全球市場份額排名。前五名中有四個是中國品牌,位列第一到第四,第五名才是國外品牌。而且這四個中國品牌的所佔市場份額超過50%,可以説是半壁江山,在全球範圍內的影響非常大。
我們目前也在出海,最初我們嘗試推廣在中國市場已經取得成功的產品,例如現在的智能辦公本,計劃進入韓國市場。硬件產品本身與我們在中國銷售的產品是相同的,同時我們進行了一些優化,首先是在語言上,基於大語言模型製作韓語版本。
其次,我們根據韓國用户的需求,在軟件層面的交互上進行改進。但韓國人的使用方式與我們與預期不一樣,仍需適應。起初我們還有點兒擔心自己能力不足,因此沒有選擇大型電商平台、線下量販店或者連鎖店等渠道。為了能大規模鋪開,我們決定利用韓國眾籌平台進行試水,反饋回的效果非常好。
在韓國,第一大眾籌平台是Wadiz,它佔據韓國眾籌市場的80%份額。我們在Wadiz平台上進行眾籌後,竟成功成為單品銷售額第一的冠軍。我們的產品廣受韓國消費者的好評。雖然仍有部分問題亟需改進,但這給我們帶來很大啓發,增強了訊飛出海的信心。

韓國第一大眾籌平台是Wadiz
Q:在出海過程中,科大訊飛有遇到哪些需求,又解決了哪些問題?
**趙翔:**我們目前的出海情況是剛剛起步。中國企業都在做出海,我們需要賦能大家出海,不僅僅是自己出海,要反內卷。除了剛才提到的技術,為了提高用户使用體驗,我們需要採取一整套方法,即走出去賺錢。開拓國際市場。
這是我的真實經歷,有一次在用户調研時,我結識了一位浙江的飲水機銷售人員。他沒有讀過大學,從0開始,將飲水機的年銷售額做到2億元。當然,他賣的飲水機不是面向普通消費者的家庭飲水機,而是面向機構的商用飲水機。法國戴高樂機場,阿聯酋迪拜國際機場。還有美國洛杉磯和紐約機場的飲水機都是從他那裏買的。
哪怕是今天的大學生,英語也未必好,特別是口語不行,沒法準確表達。我的這位用户,他根本沒有讀過大學,也不會説英語,但他不僅在英文國家,而且在南美國家,尤其是講西班牙語的國家都能做生意。他就説了因為他在用訊飛的翻譯機,帶着我們的翻譯機一起走天下。

大阪世博會中國館,日本主持人帶着科大訊飛翻譯機在街上對中國遊客進行採訪 圖源:視頻截圖
我們的翻譯機就是他依靠的依靠,他是浙江人,有那種敢打敢拼精神,如果產品質量不好,那麼在國外不就用不上,沒法做好自己的事。目前在語言溝通上沒遇到什麼障礙,不僅是英文,我們的翻譯機支持80多個語種。像許多一帶一路國家的官方語言都不是英文。
還有一個例子,就是智能錄音筆在日本的銷售情況非常不錯。不錯到什麼程度呢?在日本有一家專門從事辦公品類的公司主動找到我們,説他們突然發現科大訊飛的翻譯機在他的平台上已經排名第一,用户非常認可我們。
在解釋原因的時候,我們告訴他日本人對用户隱私特別關注,所以我們為日本提供了一款完全離線的產品,不需要聯網使用。這款產品是完全離線且在無網絡情況下,將本地運算錄音轉換為文字的。這款產品在日本銷售得非常好,而以前市面上並沒有這種產品。科大訊飛在日本這兩年的表現非常好,就是因為我們能夠滿足本地用户們實際的需要。

日本個人情報保護委員會 圖源:pixabay
Q:在人工智能大會的開幕式上使用了科大訊飛的同聲傳譯,科大訊飛剛剛發佈了同傳大模型,如何將賦能到現有翻譯產品中,用户能感受到哪些最直接的變化又有哪些?
**趙翔:**訊飛在翻譯領域是什麼地位呢?首先,我們擁有全棧技術能力,也就是同傳技術,其次,我們是實現全場景覆蓋最多的公司。
廣泛場景覆蓋:我們致力於將核心技術賦能於多樣化的設備和業務場景,是目前翻譯場景和產品覆蓋最廣的公司之一。我們希望在擁有核心技術之後將其賦能到不同場景的設備中。
在近期世界人工智能大會上,我們成功提供了現場同傳服務,實現了演講者母語與目標語言文字及聲音的同步呈現,對翻譯效果和嚴謹性的要求極高。

在WAIC2025,雙獎得主傑弗裏·辛頓作為今年的重磅嘉賓在主論壇發表演講,在這背後,科大訊飛為其同傳提供即時翻譯支持。
在10人或者20人的中小型會議室中,我們的翻譯機完全可以實現類似同傳效果。演講者在台上拿一個領夾麥,通過藍牙連接翻譯機在上面進行講解,其他聽眾便可以在屏幕上看到翻譯文字。
我們現在開發了一個功能,看大屏文字可能會累,那就直接掃碼,用手機或其他外部設備鏈接,直接看到演講者的內容,體驗就會很舒服。我也可以配備耳機將其形成翻譯的聲音播報給演講者。
如果台下的人需要與台上的人互動怎麼辦?按我可以給大家再發一個領夾麥,誰發言誰就拿着。台下人與台上人進行互動時,翻譯機就能對方也能理解我在講什麼,因此在中小型會議上表現很好。通過全向360度角的收音和翻譯,即在一個會議室裏,只要將翻譯機在中間,整個會議室的人都會參與其中。
訊飛已經開發翻譯APP,用於簡單的輕翻譯應用,目前尚未進行大規模宣傳。等上線時,我們會根據用户需求進行調整。我們提供SAAS服務,用户可以通過線上開會解決問題。如果需要進行線上會議或者觀看視頻,,我們在線上也能提供相應的同傳服務,根據用户需求配備不同的產品和服務,解決各種翻譯問題。
Q:未來大模型與硬件結合的規劃是什麼?是否有新的爆發點?
**趙翔:**這是一個與時俱進並慢慢發生變化的過程,有些硬件產品的形態可能沒太有改變,仍屬於同類產品,但實現的功能與原來會有所不同。
一方面,我覺得,未來可穿戴設備可能是個非常大的發展方向,例如眼鏡,這是業界最看好的項目。目前,眼鏡的主要問題在於鏡片,它的生態等各方面也存在問題。今年我注意到一些廠商在世界上發佈了新的智能眼鏡,包括智能眼鏡和耳機,我們訊飛也有一款名為科大訊飛的會議耳機,具備翻譯和一些其他功能,總之這是一個非常大的方向。
那另一個方面是智能硬件在工業領域的應用。在工業領域替代人,輔助完成簡單的重複性勞動,例如具身智能的外骨骼機器人,目前的發展就是這樣。
本文系觀察者網獨家稿件,未經授權,不得轉載。