科大訊飛持續深入大模型國產化“無人區”_風聞
新眸-1小时前
作者|李小東
很少有一個行業能像大模型一樣,在短短兩年內就完成了劇烈的分化。
這種分化,很大程度上是由行業極高的資源稟賦門檻導致的,企業的資金、技術、耐力,無不即時影響着一家大模型公司的存續空間。類似半導體行業,大量的投入也無法規避流片的損耗,隨着頭部公司崛起,一大批中小企業順勢消弭,這種現象在國內的大模型市場體現得尤為明顯。
在基礎大模型與AI產品應用之間,一家公司是否必然要面臨取捨,這個話題被討論的越來越多。底層模型能力往往決定應用層上限,但前提是需要足夠的算力來支撐,這正是當下制約多數公司發展的關鍵因素。
縱觀國內的行業格局,其中以百度、阿里等為代表的互聯網大廠,憑藉自身的資源優勢和對技術生態系統的判斷,仍專注於通用大模型的研發;一些企業則基於對商業化的考量,將重心轉向了應用層工具,例如包含智譜AI、月之暗面等在內的五小虎新生派。
但很長一段時間,行業裏對算力的追求,具像化後其實是對英偉達GPU的一片難求,甚至Meta和xAI的開源模型,已經被當作決定國內底層基座模型的下限。聯想到多年前在芯片領域長期被國外卡脖子的窘境,國產大模型需要解決的是極其類似的問題。
隨着行業進入深水區,算力資源面臨缺乏國產化方案的現實難題,以及對自主可控的迫切需求,在這種情況下,一直探討國產化解決方案的華為和科大訊飛,作為自主創新派逐漸進入了主流視野。
01
訊飛星火再度進化
技術領域自主創新的重要性不必贅述,但毫無疑問這是個相當艱鉅的過程。
華為與科大訊飛的合作淵源已久,具體來看,從早期在語音識別、自然語言處理等AI技術領域展開合作,推進軟硬件整合,如今在大模型領域,為了實現完全的國產化,兩家公司又開始自研算力底座。
這也是兩家公司聯合攻堅的重點發力方向:華為為星火大模型提供昇騰算力,支撐其訓練和推理過程;訊飛則憑藉AI 算法的優勢,與華為的硬件進行適配和優化。
然而,要打造國產算力底座,過程絕非易事。最簡單的例子,大模型訓練以多機多卡任務為主,故障頻率高,企業怎麼去保障GPU的利用率?還有系統架構與並行訓練的難題,一般來説,大模型的研發需要能支撐千億參數規模訓練的算力和框架,以及幾千張卡同時連續運行,這對系統架構以及並行訓練的集羣能力要求也非常高。
據瞭解,在推出國產算力基座“飛星一號”的前後,訊飛走過了“敢用-真用-會用-用好”的四個階段,從邁出嘗試使用昇騰AI的第一步,到開始基於昇騰AI進行模型訓練和推理,後續基於昇騰硬件的親和特性,重新設計了星火大模型結構,進一步提升集羣性能和推理性能等問題。
“星火大模型的持續迭代升級基礎,是自主可控的算力平台,不會受制於人。”也就是在這段經歷之後,作為首個支撐萬億參數大模型訓練的萬卡國產算力平台,去年發佈的“飛星一號”,在硬件和軟件上都實現了自主可控,引發了全行業遊戲規則的震動。
例如,基於“飛星一號”訓練的訊飛星火能力也在快速提升,在語言理解、文本生成、多模態等方面超過了GPT-4 Turbo。隨着星火大模型性能的提升,應用場景在教育、醫療、金融、交通等領域不斷拓展。
時間來到今年的科大訊飛1024全球開發者大會,“飛星二號”啓動,由訊飛、合肥市大數據資產運營有限公司、華為三方聯合打造,並在原先存、算、網全棧國產化的上一代基礎上,完成再次躍遷。
具體體現在:智算集羣規模擴大,整體的能效比提升,在提供相同算力的情況下,新的算力底座消耗的能源更少;以及數據處理流程優化,帶來更好的運行效率和響應速度等方面。
值得一提的是,最新發布的訊飛星火4.0 Turbo,不僅性能更強,而且效率更高。首發8個語種的多語言大模型,為世界提供了第二種選擇;尤其在多模態及超擬人數字人交互方面,現在你不僅能夠通過語音和大模型對話,還可以與數字人更流暢地面對面即時交流。
02
更適合國產大模型的算力底座
相比過去的人工智能,比如人臉識別,是在較為封閉的體系內追求確定的答案,但大模型給出的是更加開放式的智能,想象力很多,因此即使AI已經火了這麼久,真正的時代大幕也才剛剛拉開一角。
然而,越來越多的人也會提及,現在的國產大模型多如牛毛,雖然可選的大模型產品很多,但同質化、高分低能、實用性差、專業性不足的問題也很普遍,就連ChatGPT、Gemini這樣的玩家也會存在這種情況。
為什麼會這樣?
一方面,開源框架和預訓練模型的普及,讓開發一個基礎的大模型越來越容易。然而,大模型後續的投入門檻並不低,需要源源不斷的數據和多樣化的應用場景。並且目前對於大模型的評估標準尚不統一,很多企業的產品定位也不明確,應用場景不清晰,都在使局面變得更加混亂。
從這個角度來看,行業正處在一個去泡沫的階段,這並不是壞事。但對於一個良性發展的市場來説,需要有更多具備潛力的選手有能力繼續發展,這就要先去解決能夠解決的問題,算力就是其中最重要的一環。
前面提到,來自國外的開源模型被當作決定國內底層基座模型的下限,來自國外的芯片,也在從性能、數量等方面也在制約國產大模型發展。就不難理解,訊飛與華為的國產化解決方案,不僅僅是為了解決自身發展的難題,更重要的是像他們説的那樣:“給行業帶來第二種選擇。”
前段時間,據媒體報道,OpenAI關停了中國地區的API服務後,訊飛星火的API調用量出現了大幅度的增長。
官方認為,這件突發事件進一步驗證了自主可控通用大模型底座的重要性,並在之後推出API普惠政策,面向受到波及的開發者和創業團隊推出免費或優惠服務。
全國產算力底座提供的高性能算力資源,使得開發者能夠訓練和部署更大規模的AI模型,帶來更多AI應用的落地可能。如今訊飛的開發者生態裏,聚集了700多萬實名認證的開發者團隊,形成了活躍的開發者社區。
在劉慶峯看來,中美AI的激烈博弈下,國產大模型底座下的自主可控的繁榮生態,決定了能在這條路上走多遠,也直接影響到國內技術開發者是否能在浪潮中享受更多紅利。某種程度上説,這是個極高的戰略構想,甚至能夠支撐起訊飛在大模型行業裏的未來想象。
03
大模型的走向更加務實
兩百多年前,法拉第發現了電磁感應現象,為發電機的發明奠定了基礎,但真正讓電力走入千家萬户的是麥克斯韋,他的電磁理論預言了電磁波的存在,並在未來廣泛應用到通信、雷達、電視等領域。
類似的情節也發生在大模型。劉聰是科大訊飛的研究院院長,他並不認為一個通用的大模型,可以解決所有問題。尤其在當前國內市場,基礎大模型更多的意義在於構建生態,而模型的價值更在於應用。
在他看來,尤其是面對B端市場,通用大模型往往並不奏效,這意味着模型需要越來越多,有越來越可收斂的場景,而不是一個萬能的技術去適配所有場景。據信通院發佈數據,當前近65%的AI大模型是垂直大模型,融合行業核心數據和業務生產數據,在相應行業解決問題更高效。
但在這個過程中,尤其是面對央國企這類對數據技術安全、業務穩定要求更高的行業,他們對業務場景和需求往往更傾向定製能力,因此大模型的運用又是一件阻礙重重的生意。
這也是訊飛能在國內一眾大模型公司中脱穎而出的原因。
早在2019年,訊飛已經開展國產化移植優化工作,承擔了國家多個AI國產化攻關項目。如今,基於飛星一號的國產底座能力,星火大模型可以説是完全國產:無論是自研的算法設計、模型結構,還是數據資源,包括被稱為“無人區”的國產算力,都確保了大模型自主可控。
如今,在中標數、金額上,星火大模型已經成為央國企大模型首選。劉慶峯強調,AI應用正在日益進入到場景化的深水區,科大訊飛將針對行業痛點和場景,打造行業大模型,並且和多個行業合作伙伴探索大模型在實體產業中的落地。截至2024 年10月,與頭部企業共建20多個行業大模型,覆蓋300多個應用場景。
具體來看,例如在醫療行業,面對醫療資源的分佈不均,訊飛星火醫療大模型應運而生,並在多學科知識問答、多形式語言理解、多環節輔助診療、多模態支持等方面的技術能力均排名第一。隨着訊飛星火醫療大模型2.0的發佈,其在海量知識問答、複雜語言理解等核心場景的能力實現升級。
針對實體產業,在汽車行業,訊飛星火智能座艙已在奇瑞、廣汽、長城等六大車企的量產車型中落地,多款搭載端側大模型的車型將在今年第四季度陸續上市。
除此以外,訊飛智能車載語音系統支持23個主要語種,搭載的車型遠銷60多個國家和地區,為中國汽車的出海提供智能化支撐選項,聯想到前不久的數據泄露事件,全國產的解決方案給汽車廠商帶來更加安心的解決方案。
大模型未來發展趨勢如何?劉聰認為,大模型在開放之後,將會對普通人的工作和生活產生深遠影響。在未來的幾年裏,可以預見,通用認知智能技術會飛速進步,帶來一系列重大的創新和產業變革。
典型的例子,如在教育領域,大模型的加持不僅優化了AI學習機硬件,基於訊飛星火教育大模型,推出了基於“問題鏈”的高中數學智能教師系統,推動教育行業的智能化發展。更值得關注的是,技術的人文關懷也在此刻體現,比如為殘疾人藝術團提供技術支持,幫助聽障人士還原聲音。
放眼全球,類似的成功案例也在逐漸湧現。隨着技術的不斷進步和應用場景的不斷拓展,AI大模型正成為推動各行各業智能化轉型的重要引擎。人工智能的未來充滿了無限可能,而訊飛正站在這個新時代的門檻上。