大模型落地卡在哪?訊飛星火解出三道題_風聞
科技新知-科技新知官方账号-洞察技术变化背后的产业变迁。1小时前

國產大模型跑出一條有特色的超車彎道。
@科技新知 原創
作者丨茯神 編輯丨賽柯
ChatGPT橫空出世500天之後,OpenAI再給國內趕潮大模型的從業者潑了一盆冷水。
從一直未能開放的中國用户註冊和服務,到如今關閉來自國內開發者的API接口,領先者的冷漠讓人們感受到殘酷,卻更加清醒。大模型這個未來潛力廣闊的賽道上,國產替代已經迫在眉睫。
然而,底層基礎設施上的先發優勢,容不得忽略。當初驚豔的GPT-3.5現已升級到了強大的GPT-4,一年後可能還會隨時冒出,參數規模預計達到52萬億級別的GPT-5。中國後輩們數次無限拉近身位,但終究落後一籌。
想要彎道超車,國產大模型們只能從自身出發,走出一條中國特色的大模型之路。那些在PC和移動互聯網時代,脱胎於10億以上觸網人羣和海量豐富的場景數據,積累下來的產品和應用經驗,將成為效率最高的加速燃料。
2024年的國產大模型競賽,考較的就是“落地與應用”這道開放式必答題。創新工場董事長李開復日前在公開場合中就稱,中國AI大模型已經進入到落地為王的階段,今年會迎來大模型應用爆發元年。
作為種子考生之一,科大訊飛旗下的訊飛星火大模型,從去年誕生之初,就把對標以及超越GPT系列當作目標。它以每月都有小升級,半年就有大版本的迭代速度,穩穩走在同行前列,緊緊咬住OpenAI,不負大模型“國家隊”之名。
6月27日在北京的國家會議中心,訊飛星火大模型的4.0版本又如期亮相,自主可控的底層技術、軟硬多端的產品序列、豐富多元的場景應用,成為讓人眼前一亮的關鍵詞,也組合成一份堪稱模板的大模型落地賽參考答案,值得同屆考生們汲取靈感。
**Part.**1
答題先拆題
見題先拆題,是學霸們常用的應考策略。
國產大模型們想要在今年的落地賽中脱穎而出,就必須認識到目前橫亙在眼前的三座大山:高能耗的算力成本、多環節的技術適配,以及產品化的需求定製。
大模型的盡頭是能源,這不是一句笑談。支撐通用大模型實時運算生成反饋內容的正是背後最先進的無限算力。根據第三方數據機構SemiAnalysis的評估,OpenAI已經使用了約3617台HGX A100服務器,其中包含了採購自英偉達的近3萬個GPU。
有媒體曾作出測算,英偉達新一代DGX系列服務器可整合8張A100共同工作,最大功率是6.5kW,這意味着其運行一小時會消耗6.5度電,同時還需要搭配大約同等電量的散熱設備。假如按照平均工業用電每度0.63元的標準,1台服務器工作1天的電費約200元,當規模上升到1000台時,一天的電費就高達約20萬元。
當然,更多的大模型創業公司選擇了,把自家產品部署在雲服務器廠商的平台之上。這也導致微軟一邊不計成本地投入OpenAI,另一邊在雲業務上收穫頗豐。但小公司寄人籬下,產品和服務又不得不面臨着自主性和安全性的考驗。
翻過成本大山之後,還有技術適配和需求定製兩道關卡。
從OpenAI實驗室中走出來的大型語言模型技術,早在2017年關注和立項,直到2022年底才在ChatGPT上大放異彩舉世矚目。科技成果的轉化落地不僅離不開時間上的沉澱,更需要開發產品聯接市場的企業們發揮能動性。
GPT給國產大模型們指明瞭一個方向,卻不能提供數億規模的中文語料,更不懂國內已經摸不着石頭,走入“無人區”的工業和信息化行業。而打破這些市場、行業、企業之間的流通隔閡,引導技術一步步適配轉化落地的工作,才是後者需要努力攻堅,一分高下的主戰場之一。
基於中文語系的大模型,只是能夠在國內市場上落地,完整的商業閉環還少不了可變現的產品化定製。如果停在這最後一道門前,國產大模型只會淪為千篇一律的類ChatGPT模式,用户們看到的只有一個在搜索引擎上見慣了的輸入框。
微軟、谷歌這些國外的大模型領先者,都在嘗試把技術融入到自己傳統的辦公、搜索產品當中,國產大模型們更應該發揮自身優勢,提前做好下游產品的需求挖掘和定製規劃。而這個過程中,那些本身已具備深厚的AI類產品經驗和市場積累的玩家,與考前押中一道大題簡直無異。
以上大模型落地賽的三個難點,既是門檻又何嘗不是機遇。剛剛發佈的訊飛星火V4.0,就展示出其各種轉危為機的倒推式解題手法。
Part.2
倒推法解題
倒推式解題法是數學競賽中常用的解題思路,考驗的是答題者的逆向思維運用。面對市場給出的商業化大題,企業們採用倒推,從客户或用户的需求出發,也不失為走出困境的良策。
訊飛星火V4.0的發佈,給予自己的定位就是倒推得來。正在逐步走進的AI時代,人們最需要的終極AI產品會是什麼形態?不少科幻電影中其實已經給出答案,就像《鋼鐵俠》系列中的超級智能管家“賈維斯”一樣。
賈維斯能夠在鋼鐵俠的工作、生活甚至拯救世界的過程中無縫切換、無微不至,訊飛星火V4.0就提出要做一個在你身邊,時刻懂你的AI助手。
面向C端,訊飛星火V4.0做到了懂用户。它沒有隻給用户一個冰冷的輸入框,而是在APP中細分為寫作、編程、工作、學習、生活、親子、翻譯等各種各樣的助手,讓用户需求與場景自然融合,大大降低操作門檻。
正因如此,自去年9月訊飛星火正式全民開放後,僅可統計到的安卓渠道下載量已經累計1.31億次,部分高頻場景的用户使用次數也達到了數百萬甚至數千萬次。
最新的版本中,為了實現千人千面的用户體驗,訊飛星火加入了人設模板,可以一鍵設置個人助手的表達風格;用户如果想要打造只屬於自己的個性化助手,只需要在“個人空間”中上傳自己的工作、生活、學習等資料,再選擇性地結合外部信息一併參考,就能生成萬千人海中獨一無二的存在。看來僅是懂用户還不夠,要有針對性地懂每一個用户,才是訊飛星火的追求。
不僅是手機端的APP,由星火大模型在後台賦能的訊飛智能助聽器,讓湖北的一位老年用户從聽力受損的狀態中擺脱,既能智能檢測聽力狀態,又能精準過濾背景噪音提升有效信息音量。一個懂你的AI助手,甚至能改變一個人的生活軌跡。
面向B端,訊飛星火V4.0做到了懂企業。星火大模型為了解決企業大模型應用的“最後一公里”問題,選擇用智能體平台打造專屬於每個崗位的工作助手。
複雜的企業需求不能用簡單的一句話去概括,但可以在清晰地認識到大模型能力的邊界後,把不同難度的任務分解成原子化的獨立需求,分別完成後再進行串聯整合。
如此搭建出來的企業智能體平台,是建立在科大訊飛的AI原子能力、外部信源集成,以及企業內部的IT系統打通等基礎之上的。目前的星火企業智能平台已經覆蓋到首批32個企業從生產、科研、辦公到管理中特別需要的相關智能體,如商機、銷售、客服、科技情報以及編程等。其中表現突出的代碼智能體iFlyCode,已經趕上了現在GPT-4 Turbo的最新水平。
從不同終端場景中的需求出發,訊飛星火V4.0沒有粗暴地統一標準對待,而是仔細分類、認真匹配,但想要高效地滿足需求仍離不開底層大模型技術的紮實過硬。
軟硬一體、自主可控是科大訊飛在大模型之路上追求的目標。去年10月,在科大訊飛提供大量算子庫和算法資源的基礎上,華為開發出國內首個國產萬卡算力集羣“飛星一號”。星火大模型就是藉此訓練而成,每一行代碼、每一個數據都牢牢握在中國人手裏,還獲得國家網信辦等八個部委聯合認證。
如今升級到4.0版本的訊飛星火,已經成功對標了目前最好的通用認知大模型GPT-4 Turbo,甚至在文本生成、語言理解、知識問答、邏輯推理、數學等能力上實現超越,不過在代碼和多模態能力上還有差距,但在複雜指令的表現中又明顯領先。
先弄清楚市場真正想要什麼,再設計出符合需求的產品形態,最後為了達到產品目標,花大力氣自主科研,這條自下而上倒推的國產大模型之路,算是給今年的落地賽寫下了一份可參考的答案。
Part.3
解法成共識
訊飛星火V4.0的發佈,或許會成為國產大模型500余天征程路上的一道分水嶺。其所展露出的重視用户、強調價值等理念,已經見到市場上愈來愈多的同行跟上。
驀然回首,2023年的“百模大戰”恍如隔世。僅僅在2022年底ChatGPT發佈幾個月後,國內宣佈跟進大模型賽道的互聯網大廠和初創企業,就已經超過了100個之多。
為了儘快問世自己的產品,或者拿出能夠比肩ChatGPT的有效證明,參數級別和算力規模成為眾多企業爭相比拼的關鍵。有英偉達在國內的供應商曾對外表示,一年之內,A100芯片市場上的售價就翻了一倍,主要的大客户涵蓋了騰訊、百度、字節跳動、阿里巴巴等互聯網巨頭,而創業公司較少。
畢竟資本市場更加青睞快速驗證的輕資產模式,大筆現金燒向底層基礎設施,遠遠沒有快速落地產品試水市場,來得划算。紅杉資本去年就曾撰文《生成式 AI 的第二幕》稱,目前生成式 AI 應用的最大問題,是需要證明自身的價值,因為目前基於基礎大模型開發的應用用户留存率明顯不夠。
大廠們的動作不可謂不快。阿里巴巴內部孵化出的爆款應用妙鴨相機,一度在社交媒體上刷屏;字節跳動旗下的豆包APP,也從上線初就非常注重擬人化的體驗;科大訊飛更是憑藉多年在AI產品和服務領域積累的經驗,不僅推出訊飛星火APP,還把星火大模型內嵌到汽車、家電、教育、醫療等場景當中,讓用户看不見卻用得着。
C端卷的是應用,B端卷的就是客户。
今年5月初,央企龍頭中國石油集團就傳出要加快數字化建設的步伐,隨後集團領導先後邀請百度李彥宏、科大訊飛劉慶峯交流會談,大有廣納業內賢才良言之意。最終在月底的崑崙大模型建設研討會上,中國石油選定的合作對象由中國移動、華為、科大訊飛強強聯手,組成了一支能源化工領域的人工智能“國家隊”。而百度雖也早先贏得與中國石油管道局設計院的合作,卻在這次工業大模型之爭中遺憾略遜。
競爭不會停歇,還要放眼未來。隨着技術與行業之爭的白熱化,國家層面引導扶持的介入,也是一股不可小覷的力量。比如從2017年開始多次改革的國家科學技術獎,更為強調國家戰略導向和與重大戰略需求的緊密結合。
就在這逐年趨嚴的背景下,2023年的國家科學技術獎評選中,華為、阿里雲、科大訊飛、小米等科技巨頭紛紛上榜,其中科大訊飛又憑藉“多語種智能語音關鍵技術及產業化”項目,斬獲國家科學技術進步獎一等獎,成為近十年來AI領域首個獲此殊榮的企業。
國產大模型們之爭還遠遠沒到終局的時候,僅是目前的落地賽,也不是一次交卷定輸贏。訊飛星火V4.0的發佈,走在了行業前面,更要耐得住同行的奮力追趕。未來的大模型不管再會卷向何方,但都不會背離商業化市場的本質規律,那就是拼技術積累、拼用户規模、拼客户實力、拼社會認可。這可能就是訊飛星火一直都能領先一點的秘籍所在。