國產AI大模型之戰：得技術者勝，得市場者強_風聞

智谷趋势-智谷趋势官方账号-新中产的首席财富顾问。微信500强。05-12 20:09

2023-05-12

智谷趨勢（ID：zgtrend） | 王延鶴

今年一季度，AI無疑是最大的熱潮。

從去年11月30日，ChatGPT正式上線開始，不論國內國外的公司，都像找到了奔向“新世界”的船票，要麼在研發AI，要麼在業務+AI結合的路上。

彭博做了個圖，展示標普500上市公司的財報裏，提到AI的次數上升了77%。

微軟的AI雲一路大勝，英偉達的芯片供不應求，谷歌、亞馬遜、Meta都將投資AI當成第一大事。

別問，問就是這次一定，這把all in。

中國A股市場更誇張，ChatGPT概念、AI板塊，上百家公司變身大牛股。

AI成了最確定的確定性。

企業是否堅定擁抱AI，也成為市場一個重要參考指標。

過去50天，中國的科技公司、高校、研究機構已發佈了30多款AI大模型產品。

謀局落子，各有千秋，平均每天至少有一個AI大新聞。不管是騾子是馬，都先出來遛遛，把融資和市值都拉一把。

超60家廠商宣佈研發大模型，像字節跳動、小米的大模型就還在路上。

5月6日，“AI國家隊”科大訊飛，發佈了訊飛星火認知大模型。

和30多個同行比起來，訊飛算是姍姍來遲，但搞的事情反而最大。

之前的AI大模型，發佈現場都是放PPT，和提前錄製好的Demo為主。大部分人還得乖乖在waitlist排隊，等一個內測資格，才能實際上手操作。

訊飛星火膽子很大，現場直接上真機實測，目前全國僅此一例，務實且有建設性。

不僅如此，星火一步到位，直接大規模開放測試。所有人都能上手體驗，實際操作加深認知。

雖説發佈會現場的演示也出現了一些小瑕疵，但瑕不掩瑜，承認差距，直視不足，一邊跑步一邊迭代。古書有云：觀敵之變動，後之發，先之至，此用兵之要術。

這樣自信又務實的企業，都是有真本事做底氣的。否則ChatGPT珠玉在前，一不小心畫餅不成，反而不妥。

再者，用少數案例來證實大模型的好壞都是不實事求是的，科大訊飛做語音AI起家，24年來一直是國內AI行業“學霸”一般的存在，在認知智能上浸潤極深。

2011年，首個“語音及語言信息處理國家工程實驗室”經國家發改委批覆成立，由中國科大與科大訊飛股份有限公司聯合共建。2017年，訊飛又獲批承建了“認知智能國家重點實驗室”，被業內戲稱為“AI國家隊”。

“1999年，中文語音市場全部被國際巨頭控制，中國人被掐住了咽喉；我們創辦科大訊飛，提出要讓中國語音技術做到全世界最好，要在多語種技術上做到全世界第一。”

如今，24年過去，初心不改，信念終成現實。科大訊飛董事長劉慶峯在發佈會上表示，在10月底的升級後，星火將整體趕超ChatGPT。

實力是拼出來的，不是喊出來的。

大模型能力成色有幾分，往往大家上手一試，就有直觀體驗。

但現在幾十個大模型，都號稱要和ChatGPT掰手腕。有人説自己只差2個月，有的人説想追上至少等明年。

要知道，OpenAI可不會原地踏步。雖然馬斯克搞了萬人聯名，建議暫停大模型研發6個月，但各大科技公司的投入不減反增。

AI大模型是智能時代最底座的技術。

這不僅是幾家巨頭爭市場，更是爭未來的生存權、發展權。中國做大模型務必要以科學的體系來統籌，企業需用正面積極的態度做競爭，市場上部分抹黑、造謠的聲音格局太小。擰成一股繩，不愁生產搞不上去。

那麼問題來了：國產大模型和ChatGPT的差距，到底還有多遠？如何科學地去評估？

科大訊飛和認知智能全國重點實驗室牽頭，設計了統一、系統性的評判體系，覆蓋7種能力，481個細分指標。

這7個維度的能力，包括：語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模態能力。

劉慶峯更是表示，“在文本生成和數學能力（一定程度代表通用認知大模型的智慧水平）上，星火認知大模型已經國內顯著領先，且相比ChatGPT也具有一定優勢；在語言理解和知識問答方面也達到接近ChatGPT水平，處於國內領先水平。”

智谷之前就註冊了訊飛星火，我們也從多個維度，體驗了一把星火的能力。

我們首先考驗了星火對當下時事的分析能力：

雖然星火沒實時接入最新數據，但對淄博燒烤、特斯拉降價的分析角度很全面，可以為大家提供一個研究的大方向。

隨後我們嘗試用笑話和梗，看能否迷惑星火：

故事創作，我們讓它續寫《流浪地球3》的大綱。

星火針對不同平台特點加入emoji、話題標籤，使文案更加風格化。

一般數學題根本難不住星火，不但給出正確答案，也給了完整的解題步驟。

也可以在幾秒鐘裏，用Python寫出計算雞兔同籠問題的程序。

總體而言，星火在中文文本、數學能力上與ChatGPT 3.5媲美，不過距離GPT-4還有所差距，這個無需否認，出生就對標成熟的ChatGPT也為時過早。就目前國內大模型市場來看，星火實力名列前茅，響應速度也很快，誕生之初即是國內尖子生已經不容易。

並且，科大訊飛公佈了時間表，在6月9日、8月15日、10月24日還會進行三次升級。在不斷交替迭代中，一步步實現進化，進步空間還有很大。

1024，是2的10次方，也是計算機二進制的基本計量單位，具有特殊的意義。

1024之後趕超ChatGPT，值得我們期待一把。大家也可以自行體驗一下，官網鏈接：https://xinghuo.xfyun.cn/

現在OpenAI一騎在前，給所有追趕者，留下了大致的追趕路線。

算法、算力、數據，這是AI版三駕馬車。

GPT-3規模是1750億浮點參數，GPT-4規模沒公佈，但大家估算在5000億-1萬億參數。

同樣是未知數的，是微軟到底為OpenAI提供了多少算力，這個數字也會是以億美金為計量單位。

眾多追趕者，都在追求“大就是好”，企圖用更大參數規模，莽出一個智慧湧現。

而OpenAI的CEO，Sam Altman卻站出來説：AI大模型已經發展到頭了。

這不是凡爾賽，是OpenAI發現：更大規模，並不等於更強模型能力。

未來的模型發展方向，可能會是參數更小，或者多個子模型協同，從算法上去優化的空間更大。

科大訊飛既致敬OpenAI，又要趕超，走的就是這條更長遠的路，也是一條自己的路。

·算法為王

“至少在訊飛，最關鍵的一定是算法”，科大訊飛研究院院長劉聰表示。

24年的積累，訊飛在Transformer深度神經網絡算法擁有豐富經驗，在語音識別、圖文識別、機器翻譯等任務都達到國際領先水平；

針對大模型模糊記憶技術短板，他們提出了知識與大模型融合統一的理解框架X-Reasoner；

截至2022年，訊飛累計斬獲了常識閲讀理解挑戰賽OpenBookQA等13項世界冠軍；

目前，訊飛開源了6個大類、超過40個通用領域的系列中文預訓練語言模型，相關模型庫月均調用量超1000萬。