2023WAIC:多個垂直大模型亮相,大算力不可或缺
林铃锦

(編輯/呂棟)
剛剛在上海閉幕的第六屆世界人工智能大會(WAIC),火爆程度可謂歷屆之最。在會場上,一個值得關注的現象是,除了互聯網大廠展出的更加通用的大模型之外,不少垂直領域的企業也推出了自己的垂直大模型,比如容聯雲發佈了大語言模型“赤兔大模型”;達觀數據推出了具有長文本、垂直化和多語言特點的“曹植”大模型;蜜度則正式發佈自研的國內首個專為智能校對領域打造的垂直大語言模型——“蜜度文修”。
“通用大模型有很強的能力,但並不能解決很多企業的具體問題。基於行業大模型,構建自己的專屬模型,也許是企業更優的選項。”騰訊雲與智慧產業事業羣CEO湯道生在會上提到,“伴隨着大語言模型的發展,產業和社會,也將從數字化、網絡化,走向智能化。
不完全統計顯示,共有30多個大模型在本屆WAIC上集體亮相,從不同維度推動人工智能從感知走向認知、從識別走向生成、從通用走向專用。模型火爆的當下,如何預判大模型發展趨勢?會上發佈的《生成式AI》報告認為,中國將出現比肩GPT-4的多語言通用大模型,當前生成式AI市場處於技術主導的早期階段,存在千億美元市值的平台性企業的機會。
在大模型的底層,算力和芯片扮演着關鍵角色。在本屆WAIC上,華為攜手夥伴聯合發佈了昇騰AI大模型訓推一體化解決方案,加速大模型在各行業應用落地。作為“曹植”大模型國產戰略合作伙伴,雲服務廠商UCloud優刻得AIGC算力底座也在會上亮相。而天數智芯作為國產GPGPU的代表性廠商,在現場展出了通用GPU“天垓100”和推理產品“智鎧100”。

天數智芯國產GPGPU產品 圖源:觀察者網
多個垂直大模型亮相,都有什麼功能?
“大模型不是‘煙花秀’,而是要成為先進生產力,這一波AGI的革命是一場全新的‘元革命’。大模型對於產業發展來講有非常重要的意義,有了大模型之後企業迎來了一個新的機會,實現了一種“端到端”的價值變現。”7月7日,在WAIC“AI生成與垂直大語言模型的無限魅力”論壇上,上海市數據科學重點實驗室主任,復旦大學教授肖仰華指出。
在這場論壇上,達觀數據董事長兼CEO陳運文發佈達觀數據“曹植”大模型,並正式對外開放公測。據介紹,“曹植”大模型具有長文本、垂直化和多語言的特點,通過並聯多種模型和知識圖譜,曹植大模型支持多種語言長文本的自動化寫作和多語種翻譯等功能,全方位賦能長文檔寫作、機器翻譯、語義分析審核、知識問答、text-to-SQL等場景,可針對不同行業、領域的文案需求,進行深度優化和個性化定製。
區別於一問一答的簡單短文本生成,“曹植”可準確完成多類型、複雜結構的長文本寫作,自動起草多種類型的文檔,同時具有自動排版、智能糾錯、文本潤色、自動生成摘要等特色功能;還將實現多模態內容生成,如長文檔中的表格、圖表、圖片等;支持中文、英文、法語、德語、日語、韓語等數十種語言的寫作,輔助人工大幅提高辦公效率;在長文檔翻譯方面,對原文的標題、段落等內容實現 1:1版式還原,提供實時的翻譯體驗。

達觀數據“曹植”大模型發佈
7月8日,容聯雲在“生成式營銷服務與大模型”論壇上,正式發佈面向企業應用的垂直行業多層次大語言模型“赤兔大模型”,併發布容聯雲“生成式智能營銷服一體化工作空間——機器貓”和“生成式一體化智能客服平台”,旨在推動企業營銷和服務數智化轉型。
論壇上,容聯雲AI研究院院長劉傑針對大模型AI能力的專業性和商業化落地發表主題演講。據他介紹,“赤兔大模型”是容聯雲面向企業應用的垂直行業多層次大語言模型,通過重構智能客服和數智化營銷價值,賦能溝通智能2.0時代。基於“赤兔大模型”,企業可以搭建自己的智能客服和數智化營銷,完成從“降本增效”到“價值創造”的進化。
具體來看,“赤兔大模型”聚焦懂交流、會分析、有知識、能執行“四大能力”,適用於智能客服和營銷等場景。依託“赤兔大模型”,企業客服可以實現多維度、細粒度的對話分析理解與內容生產,通過意見挖掘、情感分析、立場檢測等洞察用户需求,同時,“赤兔大模型”還針對多種場景的人機交互應用,自動生成業務話術及流程方案、問答知識庫,提升AI運營效率、客服效能及銷售轉化。其次,豐富的內部知識儲備,和靈活的外部知識運用,可以解決大模型在真實性、即時性、邏輯性、可控性等方面的問題。

容聯雲發佈“赤兔大模型”
“唐宋八大家之一的歐陽修曾任館閣校勘,校對亦有修文之意,‘蜜度文修’便取名於此。”在會上,蜜度首席執行官翟光景正式發佈自研的國內首個專為智能校對領域打造的垂直大語言模型——蜜度文修。蜜度文修以大語言模型(LLM)為技術底座,通過運用高質量數據學習多種特色子任務,大幅度提升中文校對和潤色能力的智能化程度。科大訊飛與蜜度在大會現場正式合作簽約,未來,雙方將深化各自技術優勢,攜手推進智能校對產業的進階,共同賦能行業生態,為更多企業及機構提供高質量的智能化校對服務。
算力是大模型發展的關鍵
算力是人工智能產業創新的基礎,大模型領域的持續創新,驅動算力需求的爆炸式增長。大模型訓練的時長或者創新的快慢,根本上取決於算力的大小。
“沒有大算力,做大模型就是天方夜譚。”本屆WAIC期間,中國工程院院士、鵬城實驗室主任高文在昇騰人工智能產業高峯論壇上演講時直言,使用算力訓練大模型,就像工業中使用電力一樣,想靠省電做出產品,真正懂行的人聽了都不信,大模型一定要有算力作為基礎。
華為輪值董事長鬍厚崑在會上提到,華為在各單點創新的基礎上,充分發揮雲、計算、存儲、網絡、能源的綜合優勢,進行架構創新,推出了昇騰AI集羣,相當於把AI數據中心當成一台超級計算機來設計。目前,昇騰AI集羣解決方案已經在全國25個城市的人工智能計算中心及重點實驗室得到應用,其中有7個,包括武漢、西安等,成為科技部首批認可的“國家新一代人工智能公共算力開放創新平台”。我們也助力中國移動、科大訊飛、南方電網等領先企業,構建企業堅實的算力基礎設施,加速企業的智能化轉型。
作為達觀數據“曹植大模型”國產戰略合作伙伴,UCloud優刻得AIGC算力底座也在本次大會亮相。在“AI生成與垂直大語言模型的無限魅力”論壇上,優刻得董事長兼CEO季昕華髮表了“中立安全雲計算助力大模型發展”主題演講,介紹優刻得在AIGC領域的技術產品、工程能力和生態建設等發展情況。

優刻得 AIGC 私有化方案架構圖
優刻得在本次WAIC上展出AIGC解決方案全景圖,並推出涵蓋數據中心、計算平台、管理平台、網絡服務、應用服務、生態接口的一系列產品和解決方案。開放、安全、定製的AIGC解決方案讓客户既能利舊已有服務器資源,又可以便捷享受公有云的彈性擴容,實現IT層面的降本增效。並可通過數據中心託管專區,為用户提供完全物理隔離的獨享機櫃、服務器、網絡、存儲資源,結合完整的安全方案和專家服務,確保了用户的大模型平穩運行。
在英偉達強勢的市場地位下,國產GPU的落地問題,一直是困擾國產AI算力提升的挑戰。不過令人欣慰的是,在一定的技術積累下,一批初創國產GPU廠商已開始嶄露頭角。

天數智芯展台
過去兩年,天數智芯先後發佈了通用GPU訓練產品“天垓100”和推理產品“智鎧100”,並經過多家合作伙伴的適配驗證,在應用落地層面已有顯著成效,尤其是在大模型領域,該公司在上半年搭建了搭建40P算力320張天垓100加速卡算力集羣,完成智源研究院70億參數大模型全量訓練,是目前唯一能支持大模型完整訓練的國產通用GPU產品。
本屆WAIC上,天數智芯展示了在大模型訓練、推理所取得的顯著進展,其中圖片識別/以圖搜圖、3D 建模、大模型推理等展點吸引了眾多目光。同期展出的智慧零售、智能 OCR、智算中心、目標檢測等多種應用場景同樣吸引了參觀者駐足觀看。
本文系觀察者網獨家稿件,未經授權,不得轉載。