科大訊飛:聯手華為攻克難題,底座模型對標GPT-4o
guancha

1月15日,科大訊飛宣佈推出當前全國產算力平台上唯一的深度推理大模型——訊飛星火X1。該模型中文數學能力國內第一,並率先應用於教育、醫療等剛需場景。
同時,訊飛星火4.0 Turbo底座能力再次迎來全新升級,圖文、數學和長文本能力顯著提升,並首發混域知識搜索技術,進一步解決行業、企業痛點。此外,科大訊飛還推出了業界首個具備端到端語音到語音同傳能力的大模型——星火語音同傳大模型,最快語音同傳時延小於5秒。
聯手華為
一直以來,訊飛星火堅持走全國產化路線。該公司表示,儘管在全國產算力平台上訓練深度推理模型遭遇了諸多挑戰,但科大訊飛攜手華為,成功攻克了訓練推理強交互、高吞吐推理優化以及國產算子優化等一系列難題,最終成功訓練出我國首個基於全國產算力訓練的具備深度思考和推理能力的大模型——訊飛星火X1。
發佈會上,科大訊飛研究院的研究員們依次展示了訊飛星火X1解答高考題、AIME競賽題以及高中奧賽題的表現。訊飛星火X1不僅準確給出了這些題目的答案,還對解題思路和步驟進行了詳細拆解。與通用大模型相比,其解題過程更接近人類的“慢思考”方式。
過程中,訊飛星火X1充分展現深度推理模型的三大典型特徵:化繁為簡,將複雜問題分步拆解簡化;進行自我探索和反思驗證;基於答案正確與否的優質反饋信息進行強化訓練。
值得一提的是,訊飛星火X1在近期參加的小初高(含競賽)、大學(含競賽)、AIME、MATH 500等多項“考試”中成績十分亮眼,用更少的算力,實現了業界一流的效果,多項指標國內第一。

科大訊飛表示,目前訊飛星火X1率先在教育等真實場景中實現了應用落地。去年1024,科大訊飛聯合中國教育科學研究院發佈了基於“問題鏈”的高中數學智能教師助手。同時也正面向全國百個試點區域、聯合千名優秀教研員和老師打造上萬個優秀案例。
醫療領域,訊飛星火X1的模型策略已取得初步驗證成效,可使得專科輔助診斷和複雜病歷內涵質控的準確率均達90%。發佈會上,科大訊飛宣佈將在今年上半年正式發佈基於訊飛星火X1的醫療大模型升級版。
底座能力對標GPT-4o
此次發佈會,訊飛星火4.0 Turbo底座能力實現了全新升級,七大核心能力全面提升,全面對標OpenAI最新版的GPT-4o。此次升級最重要的特點,是針對行業、企業的痛點問題,在數學能力、行業知識、圖文識別、長文本能力等能力上實現提升。

數學能力一直是訊飛星火的強項,此次基於訊飛星火X1的高質量合成數據,訊飛星火4.0 Turbo的數學能力變得更強,可以在數學教學、金融分析和科研推演等工作中更好的幫助用户。
圖文識別能力直接關乎着企業能否高效的採編和利用行業、私域數據,是大模型“學習”的基礎。在各行各業的實際工作中,經常面臨圖文識別的“疑難雜症”:如醫療的體檢報告、法院的文書、學術論文、企業合同等,還有複雜長表格、雜亂板式、手寫公式、印章手寫合同、傾斜少線等情況,訊飛星火4.0 Turbo圖文識別能力升級,使得通用文檔版面分析、文字識別的準確率相對提升了40%,複雜表格結構、潦草手寫文字等方面的準確率相對提升了60%。
此次升級還針對性地提升了文檔要素檢測能力,在知識切分和構建的粒度上更加精細、準確,能有效防止大模型幻覺,同時發佈了掃描文檔解析的極速版本,文檔理解速度提升了10倍以上。對於一份500頁的項目文件,從掃描、識別到解析的全過程,僅需2分鐘即可全部完成。
大模型的長文本能力一直是用户關注的重點,特別是在企業知識問答這類嚴謹的應用場景中,用户對大模型幻覺的容忍度幾乎為零。因此,訊飛星火推出了基於智能體的全新長文本框架,並行業首發了句子級溯源功能。這一新框架優化了超長注意力機制,同時利用大規模網頁和書籍數據進行知識關聯式合成,使得知識回覆的錯誤率降低了40%,句子級溯源效果更是超越了GPT-4o,顯著緩解了問答搜索服務中因大模型幻覺而需要反覆溯源確認的應用落地難題。
考慮到不少用户在寫報告、做調研這類工作時,往往需要花費大量時間蒐集信息、整理資料,基於圖文、長文本能力的提升和行業應用能力的積累,訊飛星火行業首發了混域知識搜索技術。該技術能夠實現對個人知識、企業知識、業務系統數據、精品行業數據以及互聯網信息的綜合搜索,用户只需一次提問,即可獲得綜合搜索後的結果,大大提升信息搜索效率。
根據第三方數據,2024年,訊飛星火在大模型中標數量和中標金額上取得“雙第一”,尤其是在能源、金融、汽車、運營商等行業,與客户共同打磨了近百個智能體應用。

基於“技術+應用”的不斷正向循環,科大訊飛表示,訊飛星火4.0 Turbo的行業能力全面提升,金融、油氣、能源、電力、鋼鐵、 航司等領域綜合能力的絕對提升全部超過10%。
首發星火語音同傳大模型
發佈會上,科大訊飛帶來了在智能翻譯領域又一突破:針對日常對話、商務交流、行業翻譯等國際交流場景中的高難度同傳翻譯需求,發佈了國內首個具備端到端語音同傳能力的大模型——星火語音同傳大模型。該模型通過模仿人類同傳譯員的思維鏈路進行訓練,具備即時意羣理解和切分、上下文語境精準選詞以及碎片化信息重組的能力,這一特性使得星火語音同傳大模型在處理複雜句式和語境時表現出色,能夠迅速準確地傳達原意。

技術測試結果顯示,即便將訊飛的語音同傳技術和國外最優競品的交傳技術對比,訊飛語音同傳在內容完整度、信息準確度以及語言質量上都處於領先水平,同時星火語音同傳大模型還可以最快實現僅5秒的同傳時延,達到人類專家譯員的水平。
除了端到端的語音同傳能力,星火語音同傳大模型還促進了語音到文字翻譯效果的提升,在日常對話、單人演講、影視節目,包括場景更復雜、翻譯難度更高的多人會議等場景以及醫療等專業領域,為各種國際交流場景提供高質量翻譯服務。
本文系觀察者網獨家稿件,未經授權,不得轉載。