國產AI大模型之戰:得技術者勝,得市場者強_風聞
智谷趋势-智谷趋势官方账号-新中产的首席财富顾问。微信500强。05-12 20:09
智谷趨勢(ID:zgtrend) | 王延鶴
01
今年一季度,AI無疑是最大的熱潮。
從去年11月30日,ChatGPT正式上線開始,不論國內國外的公司,都像找到了奔向“新世界”的船票,要麼在研發AI,要麼在業務+AI結合的路上。
彭博做了個圖,展示標普500上市公司的財報裏,提到AI的次數上升了77%。
微軟的AI雲一路大勝,英偉達的芯片供不應求,谷歌、亞馬遜、Meta都將投資AI當成第一大事。
別問,問就是這次一定,這把all in。
中國A股市場更誇張,ChatGPT概念、AI板塊,上百家公司變身大牛股。
AI成了最確定的確定性。
企業是否堅定擁抱AI,也成為市場一個重要參考指標。
過去50天,中國的科技公司、高校、研究機構已發佈了30多款AI大模型產品。
謀局落子,各有千秋,平均每天至少有一個AI大新聞。不管是騾子是馬,都先出來遛遛,把融資和市值都拉一把。
超60家廠商宣佈研發大模型,像字節跳動、小米的大模型就還在路上。
5月6日,“AI國家隊”科大訊飛,發佈了訊飛星火認知大模型。
和30多個同行比起來,訊飛算是姍姍來遲,但搞的事情反而最大。
之前的AI大模型,發佈現場都是放PPT,和提前錄製好的Demo為主。大部分人還得乖乖在waitlist排隊,等一個內測資格,才能實際上手操作。
訊飛星火膽子很大,現場直接上真機實測,目前全國僅此一例,務實且有建設性。
不僅如此,星火一步到位,直接大規模開放測試。所有人都能上手體驗,實際操作加深認知。
雖説發佈會現場的演示也出現了一些小瑕疵,但瑕不掩瑜,承認差距,直視不足,一邊跑步一邊迭代。古書有云:觀敵之變動,後之發,先之至,此用兵之要術。
這樣自信又務實的企業,都是有真本事做底氣的。否則ChatGPT珠玉在前,一不小心畫餅不成,反而不妥。
再者,用少數案例來證實大模型的好壞都是不實事求是的,科大訊飛做語音AI起家,24年來一直是國內AI行業“學霸”一般的存在,在認知智能上浸潤極深。
2011年,首個“語音及語言信息處理國家工程實驗室”經國家發改委批覆成立,由中國科大與科大訊飛股份有限公司聯合共建。2017年,訊飛又獲批承建了“認知智能國家重點實驗室”,被業內戲稱為“AI國家隊”。
“1999年,中文語音市場全部被國際巨頭控制,中國人被掐住了咽喉;我們創辦科大訊飛,提出要讓中國語音技術做到全世界最好,要在多語種技術上做到全世界第一。”
如今,24年過去,初心不改,信念終成現實。科大訊飛董事長劉慶峯在發佈會上表示,在10月底的升級後,星火將整體趕超ChatGPT。
02
實力是拼出來的,不是喊出來的。
大模型能力成色有幾分,往往大家上手一試,就有直觀體驗。
但現在幾十個大模型,都號稱要和ChatGPT掰手腕。有人説自己只差2個月,有的人説想追上至少等明年。
要知道,OpenAI可不會原地踏步。雖然馬斯克搞了萬人聯名,建議暫停大模型研發6個月,但各大科技公司的投入不減反增。
AI大模型是智能時代最底座的技術。
這不僅是幾家巨頭爭市場,更是爭未來的生存權、發展權。中國做大模型務必要以科學的體系來統籌,企業需用正面積極的態度做競爭,市場上部分抹黑、造謠的聲音格局太小。擰成一股繩,不愁生產搞不上去。
那麼問題來了:國產大模型和ChatGPT的差距,到底還有多遠?如何科學地去評估?
科大訊飛和認知智能全國重點實驗室牽頭,設計了統一、系統性的評判體系,覆蓋7種能力,481個細分指標。
這7個維度的能力,包括:語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模態能力。
劉慶峯更是表示,“在文本生成和數學能力(一定程度代表通用認知大模型的智慧水平)上,星火認知大模型已經國內顯著領先,且相比ChatGPT也具有一定優勢;在語言理解和知識問答方面也達到接近ChatGPT水平,處於國內領先水平。”
智谷之前就註冊了訊飛星火,我們也從多個維度,體驗了一把星火的能力。
我們首先考驗了星火對當下時事的分析能力:
雖然星火沒實時接入最新數據,但對淄博燒烤、特斯拉降價的分析角度很全面,可以為大家提供一個研究的大方向。
隨後我們嘗試用笑話和梗,看能否迷惑星火:
故事創作,我們讓它續寫《流浪地球3》的大綱。
星火針對不同平台特點加入emoji、話題標籤,使文案更加風格化。
一般數學題根本難不住星火,不但給出正確答案,也給了完整的解題步驟。
也可以在幾秒鐘裏,用Python寫出計算雞兔同籠問題的程序。
總體而言,星火在中文文本、數學能力上與ChatGPT 3.5媲美,不過距離GPT-4還有所差距,這個無需否認,出生就對標成熟的ChatGPT也為時過早。就目前國內大模型市場來看,星火實力名列前茅,響應速度也很快,誕生之初即是國內尖子生已經不容易。
並且,科大訊飛公佈了時間表,在6月9日、8月15日、10月24日還會進行三次升級。在不斷交替迭代中,一步步實現進化,進步空間還有很大。
1024,是2的10次方,也是計算機二進制的基本計量單位,具有特殊的意義。
1024之後趕超ChatGPT,值得我們期待一把。大家也可以自行體驗一下,官網鏈接:https://xinghuo.xfyun.cn/
03
現在OpenAI一騎在前,給所有追趕者,留下了大致的追趕路線。
算法、算力、數據,這是AI版三駕馬車。
GPT-3規模是1750億浮點參數,GPT-4規模沒公佈,但大家估算在5000億-1萬億參數。
同樣是未知數的,是微軟到底為OpenAI提供了多少算力,這個數字也會是以億美金為計量單位。
眾多追趕者,都在追求“大就是好”,企圖用更大參數規模,莽出一個智慧湧現。
而OpenAI的CEO,Sam Altman卻站出來説:AI大模型已經發展到頭了。
這不是凡爾賽,是OpenAI發現:更大規模,並不等於更強模型能力。
未來的模型發展方向,可能會是參數更小,或者多個子模型協同,從算法上去優化的空間更大。
科大訊飛既致敬OpenAI,又要趕超,走的就是這條更長遠的路,也是一條自己的路。
·算法為王
“至少在訊飛,最關鍵的一定是算法”,科大訊飛研究院院長劉聰表示。
24年的積累,訊飛在Transformer深度神經網絡算法擁有豐富經驗,在語音識別、圖文識別、機器翻譯等任務都達到國際領先水平;
針對大模型模糊記憶技術短板,他們提出了知識與大模型融合統一的理解框架X-Reasoner;
截至2022年,訊飛累計斬獲了常識閲讀理解挑戰賽OpenBookQA等13項世界冠軍;
目前,訊飛開源了6個大類、超過40個通用領域的系列中文預訓練語言模型,相關模型庫月均調用量超1000萬。