科大訊飛公佈大模型年內三次升級時間點，10月整體趕超ChatGPT_風聞

每日经济学观察-及时资讯、以财经视角关注民生视野，一起来参与吧！05-08 14:56

2023-05-08

星星之火，可以燎原。5月6日，訊飛星火認知大模型成果發佈會在安徽合肥如期舉行。科大訊飛董事長劉慶峯、研究院院長劉聰發佈訊飛星火認知大模型，現場實測大模型七大核心能力，併發佈教育、辦公、汽車、數字員工四大行業應用成果。

發佈會現場，語音輸入，實時互動，無論是文本生成、語言理解，還是知識問答、邏輯推理，亦或是數學能力等，星火大模型都表現出色。現場真機實測的互動提問，大模型的精彩回答，引發掌聲不斷。

劉慶峯表示，認知大模型成為通用人工智能的曙光，科大訊飛有信心實現“智能湧現”。當前訊飛星火認知大模型已經在文本生成、知識問答、數學能力三大能力上已超ChatGPT。他進一步公佈大模型年內三次升級時間點，10月底將整體趕超ChatGPT。後續科大訊飛還將聯合開發者推動大模型應用落地，共建人工智能“星火”生態。

一、提出通用人工智能七大維度481項評測體系

趕超GPT要有科學的方法和體系

自去年11月30日ChatGPT發佈以來，認知大模型技術階躍持續進化，人工智能在全球引起了廣泛關注，掀起了全新的熱潮。在多個領域，認知智能都表現出了非常強大的能力。對於人工智能來説，認知大模型成為通用人工智能的“曙光”，它出現的歷史意義不亞於PC或者互聯網的誕生。

劉慶峯表示，從ChatGPT關注的48個主要任務方向和訊飛開放平台上400多萬開發者團隊的需求分析，通用人工智能應當具備七大維度能力，包括文本生成、語言理解，知識問答、邏輯推理、數學能力、代碼能力、多模態能力等。

認知大模型的“智能湧現”也將帶來解決人類剛需的全新機遇。比如，改變信息分發獲取模式，革新內容生產模式，全自然交互完成任務，實現專家級的虛擬助手，顛覆傳統手工編程方式以及成為科研工作的加速器等。“讓未來每一個有創意的人，都能成為數字經濟中的創業者。”劉慶峯説。

面向全新的人工智能時代機遇，科大訊飛已為認知大模型的“智能湧現”做好了源頭核心技術的儲備。

2011年科大訊飛便承建了語音及語言信息處理國家工程實驗室，“我們提出讓機器像人一樣能聽會説，這一次認知大模型本質上是一次對話式的通用智慧的湧現，語音和語言的核心能力是一個基礎條件。”劉慶峯説。

2014年科大訊飛推出“訊飛超腦計劃”，明確提出：讓機器像人一樣能理解會思考。2022年，又升級為“訊飛超腦2030計劃”，提出讓懂知識、善學習、能進化的通用人工智能技術成為每個人未來發展的重要機會，讓機器人走進家庭。

“在國家平台和訊飛超腦計劃的支撐下，過去幾年我們在認知智能領域取得了一系列全球領先的成果。”2017年，科大訊飛承建認知智能國家重點實驗室，也就是從這一年起，科大訊飛不僅讓機器在全球首次通過了國家職業醫師資格考試、超過了96.3%參加考試的醫生，並且在SQuAD機器閲讀理解中全球首次超過人類平均水平，剛剛過去的2022年在OpenBookQA 科學知識推理中，單模型也超過人類平均水平。“可以説多年來，科大訊飛已在認知智能領域有了豐富的儲備和積累。”

劉慶峯透露，在2022年12月15日，科大訊飛正式啓動“1+N”認知大模型專項攻關，其中“1”就是指通用認知智能大模型，“N”就是大模型在教育、辦公、汽車、人機交互等各個領域的落地。

作為人工智能“國家隊”之一，劉慶峯表示：“我們要向OpenAI致敬和學習，同時也要快速追趕並努力超越，而這需要一套科學系統的評測體系。“科大訊飛通過認知智能全國重點實驗室牽頭設計了通用認知大模型評測體系，並與中科院人工智能產學研創新聯盟和長三角人工智能產業鏈聯盟共同探討形成了覆蓋7大類481個細分任務類型。在科學的評測體系中，推動大模型的發展。

劉慶峯強調，“今天要看一個大模型系統到底好不好，首先要看它是不是能解決剛需、是不是真的有用，而不是一個簡單的單點測試。”

二、訊飛星火認知大模型三大能力已超ChatGPT

現場語音輸入流暢多維實測燃爆全場

發佈會現場，科大訊飛圍繞訊飛星火認知大模型的七大核心能力，即多風格多任務長文本生成、多層次跨語種語言理解、泛領域開放式知識問答、情景式思維鏈邏輯推理、多題型步驟級數學能力、多功能多語言代碼能力、多模態輸入和表達能力，展開現場實測。大模型更是在文本生成、語言理解、數學能力上表現出“智慧”的火花，效果驚豔。

寫郵件、做方案、講故事，訊飛星火大模型到底有多會寫？

“你為什麼叫星火？”科大訊飛研究院院長劉聰直接語音輸入，訊飛星火認知大模型不僅準確的進行了語音轉文字，而且迅速給出了它的回答。

“今天是科大訊飛星火認知大模型的發佈會，線下和線上觀看發佈會的朋友們一直以來對科大訊飛都非常關心和支持，非常感謝大家，請幫我寫一篇歡迎詞。”短短幾秒鐘，一篇要點俱全的歡迎詞隨機生成。

星火大模型編故事的能力也很出彩。“孫悟空和奧特曼也偷偷潛入了會場，他們都爭着想做訊飛星火認知大模型的代言人，還為此吵了一架，請根據上述信息創作一個故事。”星火大模型隨即腦洞大開，一段生動的故事就娓娓道來。“每一次重新生成，結果都是不一樣的，這也是我們星火大模型的魅力所在。”劉慶峯表示。

此外，它還能寫郵件、做方案、寫新聞通稿等，它還能生成英文宣傳，修改英語語法錯誤，展現作為AI助手的多才多藝。

劉慶峯表示，在長文本生成上，訊飛星火大模型在國內明顯領先，並且在中文方面超過了Chat GPT，並且在持續進步中。

中文理解十級測試，現場觀眾：訊飛星火滿分！

在語言理解上，星火大模型的變現也很出彩。劉聰現場問到：

“俗話説男子漢大丈夫寧死不屈，但是俗話又説男子漢大丈夫要能屈能伸，請問這兩句話怎麼理解？”

“如果一個小夥子跟女朋友吵架了，他應該寧死不屈還是能屈能伸呢？”

大模型都很好的理解了特定的句子和場景含義，隨着問題的變化，靈活調整自己的答案。精彩的回答也讓現場觀眾報以熱烈掌聲。

這還不夠，大模型現場還展示了“情感分析”能力，展現出跟人類共情的潛力。

“今天小明參加比賽獲得了冠軍，拿到獎盃後他默默地站了一分鐘。今天我上課被老師批評了，走出教室後我默默地站了一分鐘。請問上面這兩個默默地站了一分鐘分別表達了什麼心情？”

劉慶峯表示，科大訊飛現在的語言能理解能力相比ChatGPT還略有差距，但已超越國內同類產品。

大模型聰明與否看數學，訊飛星火數學能力遠超過國內外大模型

在數學能力中，訊飛星火大模型展現出“學霸”氣質。除了常規計算、幾何、情景應用等，劉聰現場也拋出了複雜的計算題：“花壇裏有三種花，一共88朵，其中月季花的數量是菊花的4倍，牡丹花的數量是菊花的5倍少2朵，那麼請問花壇裏一共有多少朵牡丹花？”

星火大模型很快準確給出了答案，並給出瞭解題步驟。劉慶峯表示，數理能力一定程度代表了一個大模型的聰明程度。訊飛星火大模型不僅在國內系統中遙遙領先，也超過了ChatGPT。

此外，劉聰還展示了大模型面向泛領域開放式知識問答，它具備很好的通識知識，能夠對生活常識、科學知識、工作技巧，以及醫學知識等應對自如，該能力也已超過ChatGPT。此外，星火大模型也具備邏輯推理能力與代碼能力，為了還將進一步升級多模態輸入和表達能力，不斷實現自身迭代進化。