科大訊飛：星火大模型快進入Next-level了_風聞

松果财经-39分钟前

2024-07-02

OpenAI一紙禁令，挑動了大模型行業的神經。但沒有什麼阻礙，可以抵擋技術向上的決心。在不少大模型廠商開出優惠價格，試圖從OpenAI禁令中截流用户的同時，國產大模型的代表企業科大訊飛，拿出了直面技術挑戰的勇氣。

6月27日，科大訊飛在北京國家會議中心舉行訊飛星火4.0發佈會。在“懂你的AI助手”這個主題下，訊飛星火大模型不但在8個國際主流測試集中排名第一，實現了對GPT-4 Turbo的全面對標，還對商業化落地、生產力探索做出了更全面的闡釋，前瞻了行業的“Next-level”。

這一次，星火大模型掀起了新的巨浪。

自力更生，星火大模型成國產力量代言人

在國內外總共覆蓋中英文的12項主流測試集，訊飛星火大模型V4.0在其中8項全面超越了GPT-4 Turbo、Claude 3 Opus、Gemini 1.5 Pro。後面這三位，正是目前英文世界大模型的戰力天花板選手。

換一個指標，去年，科大訊飛參與設計了國產通用認知智能大模型測評體系，包含由481個測試項組成的7個方面。而如今，星火大模型V4.0在其中的文本生成、語言理解、知識問答、邏輯推理、數學能力五個方面超越了GPT-4 Turbo，僅在代碼能力和多模態能力上仍有一定差距。

不過從數據來看，文本生成（80.2%）、語言理解（82.3%）、知識問答（85.7%）、邏輯推理（82.2%）、數學能力（86.5%）、代碼能力（81.2%）、多模態能力（78.4%）這組數據放在一起，星火大模型V4.0總體已然算是國產大模型的能力代表。

具體來看，GPT-4 Turbo、Claude 3 Opus和星火大模型V4.0，重點都放在多維度信息組成的複雜指令、更考驗邏輯任務能力的空間推理等高階能力上。根據科大訊飛發佈會現場的介紹，星火大模型V4.0不僅在長文本等通用能力上整體打平GPT-4 Turbo，而且更加擅長利用已有資料進行聯繫推理——比如解讀幾張有聯繫的圖片的關係，為其補全內容情節，並減少“幻覺”的出現。

有趣的地方在於，星火大模型V4.0其實在多模態能力方面，實現了對GPT4-Turbo的部分超越，比如科研、金融、醫療、司法和辦公等專業領域的圖文識別能力。這代表星火大模型V4.0的側重點明顯不同於普通的通用大模型。它更側重於某些垂直領域的應用潛力。

對此，科大訊飛董事長劉慶峯在演講中做了一些闡述：“大模型不僅可以寫詩、作畫，在改變工業、改變科研範式等方面已經實實在在發揮作用，包括我們和中國科學技術大學做的合成類的科學創新，比如説化學；還有與合肥綜合性國家科學中心能源研究院合作，在推進大模型賦能核聚變整個過程中更快地預測、更好地應對各種各樣的異常情況。”

應用，已經成為星火大模型V4.0的重頭戲。只有真正用起來，能力才會有價值。

以訊飛星火APP為例，自2023年9月全面開放以來，訊飛星火APP在安卓公開市場累計下載量達1.31億次。現在，全新升級的訊飛星火APP，允許消費者用自己的知識庫打造“更懂你的AI助手”。換句話説，專屬於個體的智能體。

按照劉慶峯在演講中透露的信息，訊飛星火APP使用的高峯期是工作日的工作時間段，意味着它真的變成了不少用户的剛需。這是對“AI只能用來玩玩”的刻板印象的有力回擊，也是星火大模型價值的體現。

但更讓人激動的應用，其實還在蓄力。個人能從星火大模型中找到助手，企業乃至社會，將從中汲取更大的力量。這就是整個大模型產業的“Next-level”，它的亮點就在落地的最後一公里，以及那些暫時還是暢想的形式。

真正的Next-level，藏在最後一公里

幾個簡單的問題，可以讓我們對星火大模型V4.0的未來進化更有數。

首先，智能體為什麼值得期待？九合創投在近日召開的年會上發佈了《不朽的計算：比特連接世界，詞元生成未來》報告。其中提到，“模型是能夠沉澱智慧的計算形態”。傳統算法是數學結果，一次使用不具備普及性。但模型可以持續進化，適應多維度的使用需求。而封裝為智能體之後的超級模型，已經是特定領域的智慧結晶。它具有不可估量的複用價值。

以星火企業智能體平台為例，科大訊飛已經首批創建了32個企業智能體，可以深入業務流程，滿足企業的需求。而這個過程其實非常輕鬆，企業只需要提出需求就可以開始創建智能體，經過功能驗證後，就可以真實上馬，並可以和企業內部辦公平台打通。

從市場價值來看，訊飛星火大模型從去年發佈到現在，已經和國家能源集團、中國石油、中國移動、交通銀行、大眾汽車、海爾集團、美的集團等行業領軍企業建立合作，證明其使用價值得到一線認可。

其次，為什麼是訊飛？因為企業智能的底層除了大模型技術，還有對企業業務的理解，對分門別類的場景的認知，這不是坐在辦公室裏就能拍腦袋想出來的。訊飛建立這些認知，花費了數十年的時間和遍佈各行各業的具體嘗試。所以，智能體是新物種，但在訊飛和星火大模型的共同支持下，它會很快和現有生態相融。

換句話説，訊飛的領先，是星火大模型的技術領先和自身To B和To G業務領先的複合結果。2024年6月，訊飛剛剛榮獲國家科學技術進步獎一等獎，獲獎項目名為“多語種智能語音關鍵技術及產業化”，技術和產業化的雙劍合璧，成為一塊勳章。上半場的技術較量，訊飛能和OpenAI掰手腕。下半場的應用較量，訊飛更懂中國市場。

最後，星火大模型V4.0背後的進化，對智能體概念的探索，遠期價值恐怕會遠超普通人的想象。目前，還只是這個概念的蓄力階段。

一個很關鍵的問題是，從GPT-4 Turbo到星火大模型V4.0，我們越來越關注大模型的多模態能力、空間和邏輯推理能力、對複雜指令的理解和執行能力等等。這種需求引導下發展的大模型和智能體，註定用於和現實世界融合交互。

現代機器人之父羅德尼·布魯克斯（Rodney Brooks）在1991年發表的《沒有表徵的智能》論文中提出，傳統智能基於複雜算法和內部數據模型是錯誤和片面的，真正的智能行為要從自主機器與環境的物理交互中產生。這個想法更加適合今天大模型和智能體的發展，或者説“具身智能”的概念——能理解和推理物理世界，並且產生互動。

“AI教母”李飛飛選擇的創業方向就是與之類似的“空間智能”。她曾在TED的演講上舉過一個例子——一張貓伸出爪子將玻璃杯推向桌子邊緣的圖片。她説，人類大腦可以評估“這個玻璃杯的幾何形狀，它在三維空間中的位置，它與桌子、貓和所有其他東西的關係”，所有推理都基於這些認知。

無疑，星火大模型V4.0也好，GPT-4 Turbo也罷，都是在朝着這種意義上的智能發展。

劉慶峯曾提出星火大模型的四條商業化路徑，其中一條就是基於“超腦2030計劃”推動機器人走進千家萬户，重頭戲在於全棧機器人能力，而這又源於大模型的多模感知和多維表達。

對科大訊飛來説，好消息是它所掌握的應用經驗，很有可能讓星火大模型在向空間智能、具身智能的發展過程中步步領先。比如現在，星火個人智能體和企業智能體的落地，其實已經在調動現實要素對大模型和智能體進行完善。只不過，目前的應用停留在數字空間，還沒有深入現實進行交互。

但我們相信，這一天會比想象的更早到來。畢竟，從去年的星火大模型1.0版本到如今的4.0版本，科大訊飛從無到有，創造出世界一流的大模型能力和應用，已然是一個奇蹟。

而在當下這個世界中，地緣層面的割裂已經影響到大模型世界的完整性。當OpenAI發出斷供宣言，有星火大模型這樣的一線玩家能夠頂上，不得不説是中國大模型產業的幸運。在這一年，中國人工智能領域的實力，正在這些領先者身上，閃耀着新的光芒。

來源：松果財經