60%中國企業想用生成式AI,障礙在哪?
周毅是故意的还是不小心?

文/觀察者網 周毅,編輯 張廣凱
“前不久Gartner(國際諮詢機構)發佈的調研顯示,超過60%的中國企業計劃在未來12至24個月內部署生成式AI,可以看到企業對應用大模型技術的迫切感。那麼如何將想法變為現實,幫助企業打破大模型技術落地障礙?在過去一年和廣大客户的共創中,我們發現:要讓企業用上大模型,用好大模型,還需要解決三大挑戰。”
在5月17日騰訊雲生成式AI產業應用峯會上,騰訊雲副總裁、騰訊雲智能負責人吳運聲如是説。
吳運聲表示,隨着大模型技術的快速發展,人工智能已成為企業數字化轉型的核心動力。在加速大模型產業創新,推動企業應用大模型技術的過程中,我們需面對降低使用門檻、提高平台適配性、保障安全合規三大挑戰。這就需要打造一套大模型時代的原生工具鏈,助力企業更高效、簡單地將大模型能力應用於生產、銷售和服務等場景。

觀察者網 攝
針對這些挑戰,騰訊雲正式發佈三大AI引擎,助力企業在知識服務、圖像和視頻創作上提質提效。在當天的發佈會上,騰訊還公佈了混元大模型的最新進展,並宣佈多個模型將開源。據悉,本月底,騰訊還將推出基於混元大模型打造的C端助手App“騰訊元寶”。
“5分鐘打造一款知識服務應用”,騰訊雲發佈三大AI大模型引擎
如何找準場景、快速部署,縮短從基礎模型到產業應用的距離。這是一個各界長期探討的問題。
過去一年來,各行各業對模型的需求在不斷變化:大模型不僅僅要處理單純的文字,還需要處理圖片、視頻等多種信息。大模型的能力競爭,已經從單一文生文,拓展到文生圖、文生視頻、圖生圖、圖生視頻等多模態能力的競爭;與此同時,在降本增效的大環境下,企業對“性價比”的要求也會更高。
降低使用門檻、提高平台適配性,就成為了國內大模型產業落地首當其衝的挑戰。
吳運聲認為,只有進一步降低工具使用門檻,減少對技術人才及專業技術能力依賴,讓一線生產、經營人員也能“零門檻”用上大模型,才能加速生產經驗與模型技術的融合,用技術為企業解決實際問題。未來,企業生產場景都將建基於AI能力,企業的產品設計、運營流程、管理形式都可能圍繞AI重構。企業選擇的大模型工具,既要能匹配、適應不斷迭代的大模型技術,也需要滿足不斷擴大的場景需求,滿足可持續的投入產出比。
吳運聲補充道,生成式AI具有強大的歸納、生成、推理能力,但也面臨全新的安全挑戰。只有保障生成結果的安全、準確,才能滿足企業對穩定性的需求,讓企業管理者放心加大投入建設——為了更好地解決這些需求,騰訊雲發佈了三款PaaS產品——“大模型知識引擎”、“大模型圖像創作引擎”和“大模型視頻創作引擎”。
例如,在過去的客服等知識服務場景中,大模型應用往往受制於複雜文檔解析難、複雜任務規劃難,以及專屬行業適配度不高。騰訊最新推出的大模型知識引擎,集成了騰訊混元大模型和行業大模型的優勢,用户只需要輸入模型選擇、角色設定、知識庫管理等基本信息,“三步5分鐘”就可以搭建出一款知識應用,使用門檻大大降低。
從問答效果來看,知識引擎以RAG(檢索增強生成)技術架構為基礎, 整合了OCR文檔解析、向量檢索、大語言模型、多模態大模型等多項技術。用户上載專屬知識庫與行業專業文檔後,模型會先通過向量數據庫,生成大量問答。當用户提問時,系統先匹配相關文檔片段,再由大模型基於提取內容來推理,這樣會生成準確率遠超通用大模型的回答。此外,知識引擎還支持圖文混排、説明書、數據圖標等複雜文檔識別解析,大大提高用户體驗。
此外,針對圖像、視頻素材等生成場景,騰訊推出了“圖像創作引擎”、“視頻創作引擎”兩款大模型PaaS工具。圖像創作引擎,基於騰訊混元的自研圖像創作底層模型,具備領先的文生圖、圖生圖能力,為企業客户提供AI寫真、線稿生圖等圖像創作能力;“視頻創作引擎”,則基於多模態算法技術,實現視頻轉譯、視頻風格化、畫布拓展等多種功能,助力企業客户快速、高性價比輸出各類視頻內容,用於不同羣體、不同平台的廣告投放。
“大模型的打造只是起點,把技術落地到產業場景,創造價值才是目標”。騰訊集團高級執行副總裁、雲與智慧產業事業羣CEO湯道生表示,騰訊始終以“產業實用”作為發展大模型的核心戰略,通過打造高性能的模型、高效率的工具平台、高敏捷的場景應用、高可用的算力基礎設施,以及強安全的模型環境,構建“離產業最近的AI”。
混元大模型部分中文能力已追平GPT-4,騰訊還將推出助手類APP
除了大模型的產業落地,騰訊混元大模型的最新進展,也是當天峯會的一大焦點。
自2023年9月首次亮相以來,騰訊混元大模型不斷探索最新技術,已拓展至萬億規模,並在國內率先採用混合專家模型(MoE)結構,這帶來了模型總體性能的升級。騰訊集團副總裁蔣傑在峯會上表示,騰訊混元大模型經過持續迭代,目前整體性能居國內第一梯隊,部分中文能力追平GPT-4。
此外,騰訊還研發了1B、3B、7B、13B等不同參數量下的Dense和MoE模型,圍繞中小型模型進行了積極部署。資料顯示,混元大模型提供萬億參數hunyuan-pro、千億參數hunyuan-standard以及百億參數的hunyuan-lite等多種尺寸的模型服務,其中hunyuan-standard模型具備256k的超長上下文理解能力,單次處理字符數超過38萬個。

觀察者網 攝
在多模態能力方面,混元大模型進展頗多。大會透露,在圖片生成領域,騰訊混元文生圖基礎架構已全面升級至sora同款的DiT架構,支持中英文雙語輸入及理解,具備多輪繪圖能力,測評結果國內領先;在視頻生成領域,騰訊混元支持文生視頻、圖生視頻、圖文生視頻、視頻生視頻等多種視頻生成能力,視頻生成長度可達16秒;在生3D層面,騰訊混元已佈局文/圖生3D,單圖僅需30秒即可生成3D模型。
在大會上,蔣傑宣佈騰訊混元大模型將堅定擁抱開源,為技術社區生態繁榮貢獻力量。據瞭解,目前,騰訊混元文生圖大模型已全面開源,開源3天內就在Github上獲得超千位開發者關注。未來,多種尺寸的騰訊混元MoE模型也將對外開源,可分別支持手機端、PC端、雲/數據中心等多樣化的部署場景。
值得補充的是,在當天的峯會現場,騰訊還官宣了幾則與產品“上新”有關的消息。
蔣傑宣佈,騰訊混元將上線一站式AI智能體創作與分發平台“騰訊元器”,開啓智能體生態。在平台上,用户不僅可以在創建專屬AI智能體,使用騰訊官方的插件和知識庫,還能將這些智能體一鍵分發到QQ、微信客服、騰訊雲上;此外,為更好地為用户提供服務,基於混元大模型打造的C端助手App“騰訊元寶”,也將於5月30號發佈。
本文系觀察者網獨家稿件,未經授權,不得轉載。