訊飛語音同傳大模型升級!2 秒響應堪比人類高階譯員,國際交流再也不卡殼了
guancha
7月25日,科大訊飛宣佈基於全國產算力訓練的深度推理大模型訊飛星火X1再次升級。新版本綜合能力大幅提升,在翻譯、推理、文本生成、數學等核心能力上,已能對標OpenAI o3等國際一流大模型最新版本效果;多語言能力更是擴展至130餘種。針對幻覺問題,星火X1升級後的處理效果顯著領先業界同行,讓大模型用起來更可靠、可信。
與此同時,基於星火X1的語音同傳大模型也迎來全面升級,教育、醫療、企業應用、代碼、科研等行業大模型和智能體均取得新突破,在複雜行業場景任務上進一步滿足用户核心需求。
底座能力全面躍升:破解“幻覺”難題,支持130+語種
此次升級讓星火X1在多項關鍵指標上實現質的飛躍,在翻譯、推理、文本生成、多語言、數學等任務上表現亮眼。
隨着大模型競爭日趨激烈,單純的參數堆疊已難以形成差異化優勢。星火X1此次升級的亮點,更多體現在對實用痛點的精準攻克上——比如讓業界頭疼的幻覺問題。
大模型“一本正經地胡説八道”一直是制約其產業化應用的關鍵瓶頸。在這一行業難題上,星火X1取得了顯著突破:無論是對自身生成內容真實性的把控(事實性幻覺治理),還是在參考外部資料時對原文的忠實程度(忠實性幻覺治理),都有顯著改善,大大提升了大模型在行業應用中的可靠性。

*測試集合來源:基礎能力測試集來自真實的大模型請求任務數據,來源分佈包括訊飛星火APP、星火大模型API真實開發者場景、業界主流任務數據等進行滾動更新;公開測試集以數學、答題、推理、代碼等外部典型Benchmarks為主;忠實性幻覺測試集由Vectara推出的大模型排行榜Hallucination Leaderboard中公開的測試集,事實性幻覺測試集來自計算機、法律、歷史等30多個領域的真實知識問答數據組成。
多語言能力一直是訊飛的強項,此次升級將這一優勢進一步放大。目前,星火X1已支持130+語種的交互問答、數學解題、文本生成、翻譯等任務,為全球用户提供了真正意義上的“第二選擇”。強大的多語言能力也讓訊飛的同傳會議服務、SaaS產品,以及翻譯機、錄音筆等智能設備的翻譯效果和用户體驗都邁上了新台階。
數學能力方面同樣表現驚豔。今年6月,星火X1(0420版本)就在多項高考數學評測中突破140分高分。此次升級後,面對1個月前難倒各路主流大模型的2025年全國高考數學一卷壓軸題,星火X1(0720版本)成功給出了正確答案。
語音同傳新突破:2秒極速響應,達人類高階同傳標準
想象這樣的場景:跨國會議上,你剛説完中文,對方耳邊就響起精準的英文翻譯;商務談判時,中英文隨意切換也無需手動操作,AI自動識別處理;就連專業的醫療術語、金融術語都能翻譯得比普通譯員更準確。現在,伴隨着訊飛語音同傳技術的突破,這些需求都不在話下。
時隔半年,基於星火X1底座的語音同傳大模型迎來全面升級,在翻譯效果、即時響應、語音聽感、專業精深四大維度實現了顯著進步,並且新增語種免切換能力。


*測試集合來源:測試集合是根據訊飛翻譯機、訊飛同傳等真實業務場景隨機採樣構建的測試集;測試指標為翻譯綜合質量得分(分值0~100分)
最令人驚喜的是首字響應速度的突破。過去使用翻譯工具,總需要等對方説完半句話才開始翻譯,現在中英同傳首字響應快至2秒,已達到人類高階同傳的行業標準線。即使在複雜會議或專業研討等高難度場景中,系統也能在保證準確性的同時維持穩定的即時響應。
模型還具備智能雙語識別能力,可自動識別中英文混合發言並即時切換翻譯方向。在雙邊會議、國際商務洽談等場景中,參會者可隨時用母語發言,有效避免因語言切換造成的交流中斷。
不只是快,翻譯質量也肉眼可見地變好了。對比半年前的版本,新模型的綜合翻譯質量提升 20%,傳統同傳翻譯中“斷斷續續”等問題也較好解決,翻譯流暢度幾乎與母語交流無異。
聽覺體驗方面,訊飛首創的基於文本自適應調度的“流式語音合成技術”,讓AI 翻譯出來的聲音自然度和擬人感媲美真人。在醫療、製造業、金融這些 “術語重災區”,星火語音同傳大模型覆蓋了 8 萬 + 垂直領域專業詞彙,專業內容翻譯得分破 90 分,在專業度和完整性上已超越一般同傳譯員。

目前,新版語音同傳大模型已經在訊飛雙屏翻譯機2.0、訊飛AI錄音筆、訊飛同傳等產品中全面上線。即將舉行的WAIC 2025是創辦以來國際化程度最高的一屆全球AI盛會,作為2025世界人工智能大會唯一翻譯合作伙伴,科大訊飛的系列AI翻譯產品,將為大會提供AI翻譯無障礙溝通服務。
深耕行業場景,推動AI從“能用”到“好用”
“能用”和“好用”之間,差的是技術深度與應用廣度。升級後的星火X1,已全面賦能教育、醫療、企業應用、代碼、科研等行業大模型和智能體,在複雜行業場景任務上進一步滿足用户核心需求。
教育:多項能力顯著提升,領先優勢持續擴大
升級版星火X1,作業批改、個性化推薦、答疑輔學、科普問答及口語學習等多項能力顯著提升,進一步擴大了科大訊飛在教育領域的領先優勢。
在C端學習市場,科大訊飛AI學習機的AI 1對1精準學、AI 1對1答疑輔導等多個輔學功能持續進化,通過個性化、啓發式互動教學,提高孩子學習興趣和效率,智能生成個性化學習方案,進一步鞏固高端AI學習機市場地位。
面向B端教育市場,星火教師助手進一步升級,教案和課件生成的合理性與適切性大幅提升,更接近優秀教師水平,還能提供更具創見性的教學思路與活動設計;星火智能批閲機實現“即掃即批即留痕”,在數學主觀題步驟批改、英語作文評分批改及個性化評語方面效果顯著;面向英語口語學習的E聽説,率先實現“檢錯-評分-反饋-指導-提升”的完整學習閉環。
醫療:模型準確性和專業性,達三甲醫院主治醫師水平
藉助星火X1的升級賦能,訊飛醫療各項核心能力實現全面躍升。在全科輔助診斷、體檢報告解讀、健康諮詢、導醫導診等通用醫療任務上,星火醫療大模型持續保持業界大幅領先。
在居民健康管理方面,星火醫療大模型出色的體檢報告解讀和健康諮詢能力,已成功應用至AI健康助手“訊飛曉醫”APP上,幫助用户從傳統的“被動諮詢”模式轉向“主動干預”的健康管理新模式。
在出院康復管理上,基於星火醫療大模型的全程患者管理平台,通過人機協同輔助醫生進行患者管理,效率相比傳統管理方式提升超過10倍,顯著優化了患者康復體驗。
醫生輔助診療方面,星火應用範圍不斷擴大,已覆蓋從基層全科到三甲專科、從門診到住院的完整診療鏈條。目前在四川大學華西醫院、北京安貞醫院、中國科學技術大學附屬第一醫院等多家知名醫院開展試點,核心效果表現保持行業領先水平。
值得一提的是,通過與三甲醫院主治醫師的雙盲對比評測,星火醫療大模型在心血管內科、兒科、呼吸內科三個重點科室的綜合診療能力整體達到主治醫師水平。特別在病因分析和診斷推薦方面,模型的準確性和專業性已超越主治醫師,同時在表達的可讀性和完整性上表現更加出色,有效提升了患者對診療建議的依從性。
企業:讓知識獲取更智能,讓場景應用更深入
眾所周知,企業要想用好大模型,將自身多年積累的知識、經驗,轉化為大模型能夠理解和使用的數據甚為關鍵。升級後的星火X1,通過巧妙整合員工個人知識庫、企業知識庫和互聯網信息,研究人員就能更輕鬆地做政策分析、市場調研和行業研判,進而大幅提升企業經營決策。
具體而言,這次升級主要在知識工程、智能體和代碼開發三個方面取得了重大突破。
知識處理能力更強了:升級後的多模態知識零採編系統,能夠自動分析複雜的長篇文檔,並構建出清晰的知識關係圖。這帶來了明顯的性能提升:行業分析推理能力提高15%,圖文結合的問答能力提升30%。在處理企業規章制度分析、金融產品推理等複雜場景時,任務成功率也提高了10%以上。
行業分析更專業了:新推出的“星火行業大師”智能體,採用混域檢索生成技術,能夠快速整合多方面的信息資源。它內置了宏觀經濟分析、產業鏈診斷、競爭預測等多個專業分析模塊,這些模塊可以協同工作,自動生成專業的研究報告。目前在產業趨勢預測方面,其核心觀點的採用率已超過70%。在金融、能源、製造等行業的實際運用中,配合有經驗的分析師,1小時就能完成以往需要很長時間的複雜行業分析工作。
編程開發更高效了:星火代碼大模型專門針對開發中的難點問題,在項目代碼理解與生成、自動化測試、WEB應用對話式編程等方面表現出色。目前已為金融、製造、能源、科技等行業的100多家重要客户提供服務,在典型應用中幫助企業開發效率提升超過50%,為企業數字化轉型提供了強有力的技術支持。
自主創新構築護城河,打造大模型的“訊飛樣本”
訊飛星火X1此次全面躍升,背後是一系列原創性技術突破的集成。
在強化學習技術上,科大訊飛將評語模型與細粒度反饋的強化學習技術結合起來,讓原本簡單粗糙的數值獎勵變成了詳細的文本指導,就像給AI配了一位耐心的老師,能在解題的每個環節給出具體建議。這種做法讓複雜的數學推理訓練變得更加高效,也解決了強化學習訓練中“獎勵太少”的痛點問題。
在數據層面,科大訊飛更是開創性地提出了基於人類專家數據的通用認知任務數據反寫技術,有效地解決了SFT高質量數據獲取困難、人工標註費時費力等現實挑戰,實現了主觀語言類任務文筆和風格化的顯著提升。
面對大模型容易“胡説八道”的通病,科大訊飛提出基於多路徑採樣驗證及事實性約束強化學習的幻覺治理技術,在大模型思考過程及回覆生成階段,實現客觀問題與標準答案的深度強對齊,大幅減少了在慢思考下的幻覺率,讓大模型回覆通用常識及專業知識問題更加可靠。
從技術追趕到需求引領,訊飛星火X1展現了一條務實的發展路徑:既要在核心技術上不斷攀登新高度,也要在實際應用中解決真問題,讓AI技術真正服務於各行各業的發展需要。在大模型競爭日趨激烈的今天,那些既有技術實力又能滿足用户真實需求的企業,往往更容易脱穎而出。從這個角度看,訊飛星火X1的升級路徑,為國內AI企業的發展提供了一個值得參考的樣本。