國產之光,科大訊飛挺進大模型“無人區”
guancha
距離上個大版本更新僅僅4個月,訊飛星火大模型再次迎來升級。
10月24日,科大訊飛發佈全新的訊飛星火4.0 Turbo大模型,數學能力、代碼能力超過GPT-4o,並預計今年底可實現類o1的高難度數學能力顯著提升。
同時,科大訊飛、華為、合肥市大數據資產運營有限公司三方聯合打造的國產超大規模智算平台“飛星二號”也正式啓動。
作為國內唯一採用全國產芯片進行訓練的基座大模型企業,科大訊飛在挑戰自主可控“無人區”的同時,性能上也緊緊追趕國際頂尖水平,這樣的答卷已經足夠優秀。
而憑藉自主可控的獨特生態位,星火大模型也成為央國企大模型合作的首選,讓科大訊飛走通了一條可持續的商業落地道路。
訊飛+華為,走了一條沒人走的路
早在去年1024開發者節上,科大訊飛就推出了聯合華為打造的萬卡規模國產算力平台“飛星一號”。今年,“飛星二號”又迎來了正式啓動。
在英偉達壟斷全球90%以上AI算力芯片份額的背景下,採用華為昇騰芯片、從硬件開始打造完全自主可控算力平台的科大訊飛,可謂是穩步邁入進入了大模型的“無人區”。
採用國產芯片架構,究竟難在哪?
一方面,國產芯片在單卡算力上同英偉達旗艦芯片仍存在差距,但考慮到性價比,這樣的差距並非不可克服。事實上,同閹割版英偉達芯片相比,國產芯片的市場接受程度正越來越高。
但是更大的困難在於軟硬件適配。
對於預訓練大模型這樣規模龐大的任務來説,硬件從來都不是即插即用,為了讓算法更高效在硬件上運行,仍然需要做大量的開發工作。
因此,芯片國產化並不止取決於只靠芯片企業自身的努力,有沒有下游企業使用成為關鍵所在。
飛星一號”的成功離不開科大訊飛和華為雙方的共同努力,時隔一年,“飛星二號”相比於“飛星一號”, 從萬卡算力到萬P(PFLOPS,算力計算單位)算力,不斷地引領國產大模型底座的發展,實現了質的跨越。
算力提升來自模型和硬件的更好適配。劉慶峯指出,在昇騰910B的基礎上,一年來攻克了諸多疑難雜症,解決了500多次基礎軟硬件問題、模型適配問題等,使得大模型訓練從對標A100/A800的20%~30%提升到90%以上。
得益於算力的持續提升,星火大模型也能夠保持對OpenAI緊追不捨的追趕態勢。
訊飛星火4.0 Turbo此次全新升級後,數學能力、代碼能力超過GPT-4o。在數學能力上,訊飛星火4.0 Turbo已完成超長思維鏈、樹搜索和自我反思評價等算法驗證,預計今年底可實現類o1的高難度數學能力顯著提升。
與GPT 4o、Claude 3.5 Sonnet、Genmini1.5 pro等美國三大主流大模型對比,星火4.0 Turbo在國內外中英文14項主流測試集上,實現了9項超越。
“主權大模型”,不止中國人需要
除了硬件上的自主可控,訊飛在大模型應用層面的探索,也離不開“自主”二字。
事實上,科大訊飛自1999年成立以來,一直致力於解決中文智能語音技術的自主可控。
歷史上相當長的一段時間裏,多語種智能語音技術一直掌握在谷歌、微軟、Nuance等一眾美國科技巨頭手中,其中Nuance正是蘋果語音助手Siri的語音技術供應商。
而到了2010年前後,以第一個推出中文語音輸入法為標誌,訊飛開始實現在中文語音技術上對西方的反超,並在多語種翻譯上逐步達到世界領先水平。
而在星火大模型上,訊飛也體現出智能語音技術和翻譯技術上的獨特優勢。
發佈會上,科大訊飛首次發佈星火多語言大模型,除中英文外,可支持俄、日、阿、法等8個語種,在汽車、家電、辦公、翻譯等行業的任務場景應用效果超過了GPT-4o。
大模型的多語種能力,不僅能夠為普通人的日常生活提供便利,對於中國企業的出海更是意義重大。
深耕海外市場的奇瑞汽車,已於今年1月開始搭載訊飛車載語音系統,覆蓋23個主要語種,相關車型銷往亞洲、歐洲、中東、南美等地的60多個國家與地區。
不僅是中國,世界其它國家也對大模型的“自主可控”有着強烈需求。
“現在,很多國家和地區都希望在大模型上至少有一個備份,甚至能夠擁有自己的主權大模型。”劉慶峯表示,訊飛星火底座能力要不斷提升,對標全球最好水平,同時還要針對真實應用場景做到全球最好,不斷擴大多語種範圍,“我們一定要代表中國給世界第二種選擇。”
AI for Science,大模型成為科技新引擎
在大模型能力不斷提升的同時,科大訊飛還有另一個好消息,是財報層面重新盈利了。
科大訊飛近日發佈的三季報顯示,其三季度歸母淨利潤為5696.14萬元,同比上升120.87%,實現了當季度利潤轉正。
三季度,科大訊飛營業總支出進一步同比增長17.33%至155.17億元,年內研發費用總計達到30.371億。
在這樣的投入強度下,科大訊飛能夠迅速扭虧為盈,説明在大模型的落地應用上確有過人之處。
在三季報溝通會上,訊飛這樣描述自己的商業化路徑:一是在提升公司既有業務相關優勢加快規模化落地;二是對外尤其是與央國企深度合作賦能,在越來越多剛需領域落地;三是面向企業打造大模型標準化產品,持續推廣運營。
“自主可控”的獨特站位,顯然讓科大訊飛在央國企市場具有了顯著優勢。根據智能超參數統計報道,2024年1-9月份,科大訊飛中標項目達到38個,中標金額達21607萬元,在大模型市場的中標數量、中標金額位列第一。
垂直領域的深度賦能,是科大訊飛在大模型落地的另一個特點。此次開發者節上,科大訊飛面向教育、醫療、司法、政務服務、企業辦公等多個行業場景發佈了最新的產品應用。
近期,科大訊飛與中石油合作的“崑崙大模型”、與中海油合作的“海能”人工智能模型先後發佈,核心功能包括“員工助手”、“行業大家”等,在日常辦公和專業場景下都能給員工提供AI支持。
在醫療行業,基於訊飛星火醫學影像大模型打造的智能醫學影像助手也正式發佈,在智能質控環節,可幫助影像技師快速評估圖像質量,及時糾正檢查問題;在智能診斷環節,可幫助影像醫師快速生成診斷報告,解釋溯源並多期對比;在智能讀片環節,可接入醫學影像大模型,通過相關問答,幫助臨牀醫師制定診療方案。
訊飛星火也在持續為高校提供基礎科研提效服務,AI for Science成為重點賦能方向。
“今年的諾貝爾物理學獎、化學獎,都頒發給了與AI強相關的科學家,一個是AI for Science ,一個是Science for AI”,劉慶峯表示,AI for Science帶來科研範式的根本變革,正在成為科技發展的新引擎。“AI for Science決定了中國科技發展的速度,賦能科研是訊飛星火的重要使命。”
科大訊飛正在大模型+科研領域進行諸多探索,如聯合中國科學技術大學劉海燕教授團隊,成功設計了48個自然界不存在的全新蛋白質;聯合中科院動物研究所李鑫團隊,研究單細胞基因表達課題;聯合中科院等離子體物理研究所李建剛院士團隊,研究託卡馬克等離子體控制。
從軟硬件的全棧自研,到科研和產業一線的深度應用,自主可控大模型的“無人區”,正在由訊飛和華為等企業聯手征服。