科大訊飛:星火大模型快進入Next-level了_風聞
松果财经-39分钟前
OpenAI一紙禁令,挑動了大模型行業的神經。但沒有什麼阻礙,可以抵擋技術向上的決心。在不少大模型廠商開出優惠價格,試圖從OpenAI禁令中截流用户的同時,國產大模型的代表企業科大訊飛,拿出了直面技術挑戰的勇氣。
6月27日,科大訊飛在北京國家會議中心舉行訊飛星火4.0發佈會。在“懂你的AI助手”這個主題下,訊飛星火大模型不但在8個國際主流測試集中排名第一,實現了對GPT-4 Turbo的全面對標,還對商業化落地、生產力探索做出了更全面的闡釋,前瞻了行業的“Next-level”。
這一次,星火大模型掀起了新的巨浪。
自力更生,星火大模型成國產力量代言人
在國內外總共覆蓋中英文的12項主流測試集,訊飛星火大模型V4.0在其中8項全面超越了GPT-4 Turbo、Claude 3 Opus、Gemini 1.5 Pro。後面這三位,正是目前英文世界大模型的戰力天花板選手。
換一個指標,去年,科大訊飛參與設計了國產通用認知智能大模型測評體系,包含由481個測試項組成的7個方面。而如今,星火大模型V4.0在其中的文本生成、語言理解、知識問答、邏輯推理、數學能力五個方面超越了GPT-4 Turbo,僅在代碼能力和多模態能力上仍有一定差距。
不過從數據來看,文本生成(80.2%)、語言理解(82.3%)、知識問答(85.7%)、邏輯推理(82.2%)、數學能力(86.5%)、代碼能力(81.2%)、多模態能力(78.4%)這組數據放在一起,星火大模型V4.0總體已然算是國產大模型的能力代表。
具體來看,GPT-4 Turbo、Claude 3 Opus和星火大模型V4.0,重點都放在多維度信息組成的複雜指令、更考驗邏輯任務能力的空間推理等高階能力上。根據科大訊飛發佈會現場的介紹,星火大模型V4.0不僅在長文本等通用能力上整體打平GPT-4 Turbo,而且更加擅長利用已有資料進行聯繫推理——比如解讀幾張有聯繫的圖片的關係,為其補全內容情節,並減少“幻覺”的出現。
有趣的地方在於,星火大模型V4.0其實在多模態能力方面,實現了對GPT4-Turbo的部分超越,比如科研、金融、醫療、司法和辦公等專業領域的圖文識別能力。這代表星火大模型V4.0的側重點明顯不同於普通的通用大模型。它更側重於某些垂直領域的應用潛力。
對此,科大訊飛董事長劉慶峯在演講中做了一些闡述:“大模型不僅可以寫詩、作畫,在改變工業、改變科研範式等方面已經實實在在發揮作用,包括我們和中國科學技術大學做的合成類的科學創新,比如説化學;還有與合肥綜合性國家科學中心能源研究院合作,在推進大模型賦能核聚變整個過程中更快地預測、更好地應對各種各樣的異常情況。”
應用,已經成為星火大模型V4.0的重頭戲。只有真正用起來,能力才會有價值。
以訊飛星火APP為例,自2023年9月全面開放以來,訊飛星火APP在安卓公開市場累計下載量達1.31億次。現在,全新升級的訊飛星火APP,允許消費者用自己的知識庫打造“更懂你的AI助手”。換句話説,專屬於個體的智能體。
按照劉慶峯在演講中透露的信息,訊飛星火APP使用的高峯期是工作日的工作時間段,意味着它真的變成了不少用户的剛需。這是對“AI只能用來玩玩”的刻板印象的有力回擊,也是星火大模型價值的體現。
但更讓人激動的應用,其實還在蓄力。個人能從星火大模型中找到助手,企業乃至社會,將從中汲取更大的力量。這就是整個大模型產業的“Next-level”,它的亮點就在落地的最後一公里,以及那些暫時還是暢想的形式。
真正的Next-level,藏在最後一公里
幾個簡單的問題,可以讓我們對星火大模型V4.0的未來進化更有數。
首先,智能體為什麼值得期待?九合創投在近日召開的年會上發佈了《不朽的計算:比特連接世界,詞元生成未來》報告。其中提到,“模型是能夠沉澱智慧的計算形態”。傳統算法是數學結果,一次使用不具備普及性。但模型可以持續進化,適應多維度的使用需求。而封裝為智能體之後的超級模型,已經是特定領域的智慧結晶。它具有不可估量的複用價值。
以星火企業智能體平台為例,科大訊飛已經首批創建了32個企業智能體,可以深入業務流程,滿足企業的需求。而這個過程其實非常輕鬆,企業只需要提出需求就可以開始創建智能體,經過功能驗證後,就可以真實上馬,並可以和企業內部辦公平台打通。
從市場價值來看,訊飛星火大模型從去年發佈到現在,已經和國家能源集團、中國石油、中國移動、交通銀行、大眾汽車、海爾集團、美的集團等行業領軍企業建立合作,證明其使用價值得到一線認可。
其次,為什麼是訊飛?因為企業智能的底層除了大模型技術,還有對企業業務的理解,對分門別類的場景的認知,這不是坐在辦公室裏就能拍腦袋想出來的。訊飛建立這些認知,花費了數十年的時間和遍佈各行各業的具體嘗試。所以,智能體是新物種,但在訊飛和星火大模型的共同支持下,它會很快和現有生態相融。
換句話説,訊飛的領先,是星火大模型的技術領先和自身To B和To G業務領先的複合結果。2024年6月,訊飛剛剛榮獲國家科學技術進步獎一等獎,獲獎項目名為“多語種智能語音關鍵技術及產業化”,技術和產業化的雙劍合璧,成為一塊勳章。上半場的技術較量,訊飛能和OpenAI掰手腕。下半場的應用較量,訊飛更懂中國市場。
最後,星火大模型V4.0背後的進化,對智能體概念的探索,遠期價值恐怕會遠超普通人的想象。目前,還只是這個概念的蓄力階段。
一個很關鍵的問題是,從GPT-4 Turbo到星火大模型V4.0,我們越來越關注大模型的多模態能力、空間和邏輯推理能力、對複雜指令的理解和執行能力等等。這種需求引導下發展的大模型和智能體,註定用於和現實世界融合交互。
現代機器人之父羅德尼·布魯克斯(Rodney Brooks)在1991年發表的《沒有表徵的智能》論文中提出,傳統智能基於複雜算法和內部數據模型是錯誤和片面的,真正的智能行為要從自主機器與環境的物理交互中產生。這個想法更加適合今天大模型和智能體的發展,或者説“具身智能”的概念——能理解和推理物理世界,並且產生互動。
“AI教母”李飛飛選擇的創業方向就是與之類似的“空間智能”。她曾在TED的演講上舉過一個例子——一張貓伸出爪子將玻璃杯推向桌子邊緣的圖片。她説,人類大腦可以評估“這個玻璃杯的幾何形狀,它在三維空間中的位置,它與桌子、貓和所有其他東西的關係”,所有推理都基於這些認知。
無疑,星火大模型V4.0也好,GPT-4 Turbo也罷,都是在朝着這種意義上的智能發展。
劉慶峯曾提出星火大模型的四條商業化路徑,其中一條就是基於“超腦2030計劃”推動機器人走進千家萬户,重頭戲在於全棧機器人能力,而這又源於大模型的多模感知和多維表達。
對科大訊飛來説,好消息是它所掌握的應用經驗,很有可能讓星火大模型在向空間智能、具身智能的發展過程中步步領先。比如現在,星火個人智能體和企業智能體的落地,其實已經在調動現實要素對大模型和智能體進行完善。只不過,目前的應用停留在數字空間,還沒有深入現實進行交互。
但我們相信,這一天會比想象的更早到來。畢竟,從去年的星火大模型1.0版本到如今的4.0版本,科大訊飛從無到有,創造出世界一流的大模型能力和應用,已然是一個奇蹟。
而在當下這個世界中,地緣層面的割裂已經影響到大模型世界的完整性。當OpenAI發出斷供宣言,有星火大模型這樣的一線玩家能夠頂上,不得不説是中國大模型產業的幸運。在這一年,中國人工智能領域的實力,正在這些領先者身上,閃耀着新的光芒。
來源:松果財經