昇騰AI和智子引擎的產業應用指南:讓大模型下沉到生產一線_風聞
Alter-1小时前
傑弗裏·摩爾在《跨越鴻溝》中提出過一個著名的觀點:“高科技產品面世過程中,最危險、最關鍵的一點,就是由少數有遠見者所主宰的早期市場,向實用主義者佔支配地位的主流市場過渡。”
過去一年多時間裏,這個説法精準預測了大模型市場的走向:上半年的注意力還集中在大模型的參數數量、效果優化等指標上,下半年普遍開始思考怎麼將大模型和產業結合,用大模型解決實際問題。
在大模型吹響產業化號角半年後,整個行業開啓了一場披沙瀝金的角逐賽,部分先行者逐漸摸索出了一條清晰的路。
比如日前舉辦的南京智能工業軟件與新型工業化發展論壇上,發佈了包含元乘象在內的六款大模型。不同於“通用”大模型的是,每一個大模型都深入核心業務應用場景,旨在創造新的產業價值。
01 算力基座+多模態大模型,產業落地的新業態
儘管大模型的產業化路徑還沒有統一定論,卻不乏潛在的共識:無法落地的大模型註定只是紙上談兵,唯有深入產業需求、和產業知識結合、解決實際問題的大模型,才能帶來實實在在的價值。
國內上百家大模型企業中,智子引擎就是一家積極推進大模型產業化應用落地的創業團隊。
時間回到2023年3月初,智子引擎團隊發佈了世界首個多模態對話大模型元乘象Chatimg。有別於ChatGPT擅長的文本生成和對話,元乘象Chatimg主打“看懂世界”,核心技能是“圖生文”,不僅可以識別出圖片中的內容,還能夠判斷圖中的場景在現實中是否合理。
不到兩個月的時間,智子引擎團隊就將元乘象Chatimg迭代到了2.0版本,新增語音交互、視頻輸入等能力。聚焦到圖文對話方面,元乘象Chatimg2.0可以看懂非常豐富的圖像內容,可以逐幀識別視頻內容,譬如圖片或視頻裏有哪些元素,是什麼樣的場景,並能對內容作出推理分析。
10月28日舉辦的CNCC 2023“超智融合AI大模型應用落地發展論壇”上,元乘象Chatimg3.0正式發佈,相比2.0版本進行了兩方面的升級,包括第一階段的預訓練(描述、檢測、OCR 等多任務訓練)和第二階段的指令微調(高質量的人工精篩指令集),並在問答和業務兩個方面的能力上趕超GPT-4V。

可以看到,元乘象Chatimg的迭代速度之快,半年多就完成了三次升級,但從未偏離“看懂世界”的路線,一直在深耕畫面解讀、畫面推理、判斷預測、檢測預警等能力。以檢測預警為例,物品是否在正確位置、是否存在缺陷,人是否有異常行為、是否存在風險…… 都可以通過對相關視頻圖像的解讀進行響應處理。元乘象Chatimg在城市治理、智慧巡檢、園區管理等領域有着豐富落地場景。
不過,要想讓大模型技術落地,不僅需要大模型本身的出色能力,還涉及中間的實施過程和“最後一公里”的問題。
智子引擎COO李增強先生在南京智能工業軟件與新型工業化發展論壇上,重點介紹了元乘象Chatimg訓推一體機:基於昇騰AI的算力底座,內置元乘象Chatimg多模態大模型、超過1000多種應用場景以及自學習、微調訓練模塊,具有強大的泛化能力,最低0數據標註即可訓練新的場景應用。
相較於數據處理、模型開發、模型訓練、模型管理、部署上線等傳統落地流程,元乘象Chatimg訓推一體機讓大模型實現了“開箱即用”。
在某種程度上,元乘象Chatimg訓推一體機讓大模型的落地應用不再是高度消耗智力資源的開發和調試,而成為一種即買即用的產品,快速構建新場景的極簡操作,使得大模型落地的“最後一公里”瓶頸迎刃而解。
02 大模型+智能化終端,在實踐中創造產業價值
或許可以打這樣一個比方:元乘象Chatimg訓推一體機就像是擁有自主感知、思考決策、指揮行動等能力的大腦,只要為大腦匹配眼睛、手腳等等,即可化身成為解決實際問題的智能體。
智子引擎COO李增強先生生動的為大家分享了兩個落地案例,向外界詮釋了大腦與肢體協同所迸發出的創新力。
第一個例子是元乘象Chatimg+無人機組合而成的智慧巡檢系統。無人機扮演了“眼睛”的角色,不斷將採集的音視頻內容輸送到“大腦”,並進行感知、思考、推理、表達,進而賦予了無人機強大的感知決策能力。
如果説以往的巡檢方案是“專職專能”,一個模型對應一個場景,智慧大腦賦能的無人機屬於典型的“一體多能”,藉助元乘象Chatimg的泛化能力,可以自主適配行業應用,最快5分鐘生成巡檢方案,一次飛行實現煙火識別、安全帽識別、河道污染檢測、氣體泄露檢測、違章建築等多個巡檢任務,並可以在完成巡檢工作後自動生成巡檢報告、異常工單,降低90%的人力投入。

大模型的落地正在讓場景適配從作坊式進化到流水線式,過去針對單一場景的定製化開發即將成為歷史,人工智能即將進入到一個大模型多行業複用的時代,AI落地的高門檻、高成本、低效率等問題也將得到有效的解決。
第二個例子是元乘象Chatimg+智能機器人的應用。相比無人機在視覺層面的牛刀小試,智能機器人集視覺、語音、運動等多個能力於一體,意味着有更多模態的信息交互,所能實現的能力也將更加多元化。
正如智子引擎在錄製視頻中展示的場景:只需要給機器人一個“去房間裏幫我找一下筆記本電腦”的語音指令,機器人會自動識別房間裏的物品,在房間裏“轉”了一圈後精準找到了白色書桌上的筆記本電腦;再比如“我要去參加會議,幫我推薦一些衣服”的對話,機器人會自動根據用户的性別和需求提出穿搭建議……
也許現階段的智能機器人距離科幻電影中的形象還有一定的距離,目前僅是圖文對話的延伸,而在進化方向上卻不乏啓示性:在大模型的賦能下,機器人已經具備了語音交互、識人斷物、分析建議等能力,即使現階段還無法幫助人們解決複雜需求,但在日常生活陪伴等場景上的想象空間不可小覷。
無可否認,這些應用探索尚未完全成熟。可就像中國工程院院士鄔賀銓的觀點:“Chat類的大模型引發新一輪熱潮,但對話、寫詩、作畫絕不是大模型的全部,我們需要去深入思考大模型的應用方向。”只要從根本上降低大模型的落地門檻,就能不斷在實踐中創造價值。
03 基礎設施+生態創新,數智化轉型的萬能公式
在以往的媒體報道中,智子引擎常常被視為一家“人大系”創業公司。其實在2023年10月初,智子引擎已經和南京江北新區產業技術研究院簽署投資協議,正式進駐南京,成立智子引擎全國總部,成為一家江蘇企業。截至發稿,智子引擎已在北京、上海、杭州成立多家分子公司。
為何選擇江蘇南京作為全國總部?智子引擎官方並未公開回復,但不難找到一些可能的“蛛絲馬跡”。
2022年4月29日,南京人工智能計算中心正式上線,一期規劃40P算力(二期擴容100P),同時也是長三角首個自主人工智能計算中心。彼時大模型還沒有出現現象級討論,但算力和數字經濟的關係早已深入人心。人工智能算力能否像水和電一樣,成為一種新的城市公共資源,直接關係着產業數智化轉型的進程。
除了南京人工智能計算中心這個“算力底座”,配套的還有公共算力服務、數據要素共享、產業生態發展、科研創新人才培養四大生態平台。也就是説,江蘇的佈局不僅僅是向全省提供普惠AI算力,還在着眼於產業生態的培育,通過產業服務、技術賦能、人才培養、創新應用孵化等方式打造“智慧黑土地”,不斷為千行百業的轉型充足“養分”。

栽好“梧桐樹”,引得“鳳凰”來。源於《詩經》裏的引才邏輯,在數智化時代依然適用,智子引擎就是最直接的案例。
一方面,南京人工智能計算中心可以提供充沛、高可用且普惠的AI算力,對於大模型創業者的吸引力不言而喻。參考古代遊牧民族“逐水草而居”的習俗,大模型時代將出現“逐算力而居”的局面。
另一方面,江蘇鯤鵬·昇騰生態創新中心作為南京人工智能計算中心的輔助運營夥伴,將運營重點放在了使能行業客户創新和大模型產業化落地上,致力於和夥伴們圍繞場景、技術進行聯合創新。
在南京智能工業軟件與新型工業化發展論壇上,像元乘象Chatimg這樣的行業大模型還有很多。
小視科技宙初視覺大模型作為一個大型神經網絡模型,可用於處理多視覺任務;竅楚檔案竅智引大語言模型作為企業的信息知識樞紐,融合了大語言模型與昇騰AI,可以本地化安全收集和保存信息;思必馳DFM-2大模型具有通用智能和知識的能力、解決行業挑戰的能力以及大模型與全鏈路綜合對話技術的聯動能力;硅基智能炎帝大模型擁有超過百億的參數,是綜合全面性的視頻生成大模型,為企業提質增效、業務創收賦能……無不在用協同創新的方式,為江蘇省的數智化轉型提供源源不斷的動力。
IDC在《2023-2024中國人工智能計算力發展評估報告》中提出了大模型驅動下的“產業動量之變”,即生成式AI正在內容創作、自動駕駛、零售、醫療等諸多領域重構人們的生活和生產方式,算力、算法、應用、服務等諸多產業變量將成為創新的加速器,在算力生態鏈上的各個環節催生出新的玩家。
回到昇騰AI和智子引擎給出的答案,似乎可以做出這樣的結論:諸如江蘇省在基礎設施+生態創新的探索,通過技術服務帶動區域產業前行,已經被驗證是數智化轉型的“萬能公式”。
04 寫在最後
目前大模型還處於早期競爭階段,或許會有一些浮躁和泡沫,但只要有一線用户認可的產品,就有機會抓住市場的黃金窗口期。
對於區域性的產業轉型和創新同樣如此,越早集齊算力、模型、人才、生態等資源,越能激活創新的“飛輪效應”:為企業解開算力上的束縛,不斷孵化出解決實際問題的產品和解決方案,進而讓中小企業有趁手的工具加速轉型。畢竟上下游協同創新的生態,才是產業化轉型的“牛耳”所在。