60%中國企業想用生成式AI，障礙在哪？

周毅是故意的还是不小心？

2024-05-20

文/觀察者網周毅，編輯張廣凱

“前不久Gartner（國際諮詢機構）發佈的調研顯示，超過60%的中國企業計劃在未來12至24個月內部署生成式AI，可以看到企業對應用大模型技術的迫切感。那麼如何將想法變為現實，幫助企業打破大模型技術落地障礙？在過去一年和廣大客户的共創中，我們發現：要讓企業用上大模型，用好大模型，還需要解決三大挑戰。”

在5月17日騰訊雲生成式AI產業應用峯會上，騰訊雲副總裁、騰訊雲智能負責人吳運聲如是説。

吳運聲表示，隨着大模型技術的快速發展，人工智能已成為企業數字化轉型的核心動力。在加速大模型產業創新，推動企業應用大模型技術的過程中，我們需面對降低使用門檻、提高平台適配性、保障安全合規三大挑戰。這就需要打造一套大模型時代的原生工具鏈，助力企業更高效、簡單地將大模型能力應用於生產、銷售和服務等場景。

觀察者網攝

針對這些挑戰，騰訊雲正式發佈三大AI引擎，助力企業在知識服務、圖像和視頻創作上提質提效。在當天的發佈會上，騰訊還公佈了混元大模型的最新進展，並宣佈多個模型將開源。據悉，本月底，騰訊還將推出基於混元大模型打造的C端助手App“騰訊元寶”。

“5分鐘打造一款知識服務應用”，騰訊雲發佈三大AI大模型引擎

如何找準場景、快速部署，縮短從基礎模型到產業應用的距離。這是一個各界長期探討的問題。

過去一年來，各行各業對模型的需求在不斷變化：大模型不僅僅要處理單純的文字，還需要處理圖片、視頻等多種信息。大模型的能力競爭，已經從單一文生文，拓展到文生圖、文生視頻、圖生圖、圖生視頻等多模態能力的競爭；與此同時，在降本增效的大環境下，企業對“性價比”的要求也會更高。

降低使用門檻、提高平台適配性，就成為了國內大模型產業落地首當其衝的挑戰。

吳運聲認為，只有進一步降低工具使用門檻，減少對技術人才及專業技術能力依賴，讓一線生產、經營人員也能“零門檻”用上大模型，才能加速生產經驗與模型技術的融合，用技術為企業解決實際問題。未來，企業生產場景都將建基於AI能力，企業的產品設計、運營流程、管理形式都可能圍繞AI重構。企業選擇的大模型工具，既要能匹配、適應不斷迭代的大模型技術，也需要滿足不斷擴大的場景需求，滿足可持續的投入產出比。

吳運聲補充道，生成式AI具有強大的歸納、生成、推理能力，但也面臨全新的安全挑戰。只有保障生成結果的安全、準確，才能滿足企業對穩定性的需求，讓企業管理者放心加大投入建設——為了更好地解決這些需求，騰訊雲發佈了三款PaaS產品——“大模型知識引擎”、“大模型圖像創作引擎”和“大模型視頻創作引擎”。

例如，在過去的客服等知識服務場景中，大模型應用往往受制於複雜文檔解析難、複雜任務規劃難，以及專屬行業適配度不高。騰訊最新推出的大模型知識引擎，集成了騰訊混元大模型和行業大模型的優勢，用户只需要輸入模型選擇、角色設定、知識庫管理等基本信息，“三步5分鐘”就可以搭建出一款知識應用，使用門檻大大降低。

從問答效果來看，知識引擎以RAG（檢索增強生成）技術架構為基礎，整合了OCR文檔解析、向量檢索、大語言模型、多模態大模型等多項技術。用户上載專屬知識庫與行業專業文檔後，模型會先通過向量數據庫，生成大量問答。當用户提問時，系統先匹配相關文檔片段，再由大模型基於提取內容來推理，這樣會生成準確率遠超通用大模型的回答。此外，知識引擎還支持圖文混排、説明書、數據圖標等複雜文檔識別解析，大大提高用户體驗。

此外，針對圖像、視頻素材等生成場景，騰訊推出了“圖像創作引擎”、“視頻創作引擎”兩款大模型PaaS工具。圖像創作引擎，基於騰訊混元的自研圖像創作底層模型，具備領先的文生圖、圖生圖能力，為企業客户提供AI寫真、線稿生圖等圖像創作能力；“視頻創作引擎”，則基於多模態算法技術，實現視頻轉譯、視頻風格化、畫布拓展等多種功能，助力企業客户快速、高性價比輸出各類視頻內容，用於不同羣體、不同平台的廣告投放。

“大模型的打造只是起點，把技術落地到產業場景，創造價值才是目標”。騰訊集團高級執行副總裁、雲與智慧產業事業羣CEO湯道生表示，騰訊始終以“產業實用”作為發展大模型的核心戰略，通過打造高性能的模型、高效率的工具平台、高敏捷的場景應用、高可用的算力基礎設施，以及強安全的模型環境，構建“離產業最近的AI”。

混元大模型部分中文能力已追平GPT-4，騰訊還將推出助手類APP

除了大模型的產業落地，騰訊混元大模型的最新進展，也是當天峯會的一大焦點。

自2023年9月首次亮相以來，騰訊混元大模型不斷探索最新技術，已拓展至萬億規模，並在國內率先採用混合專家模型（MoE）結構，這帶來了模型總體性能的升級。騰訊集團副總裁蔣傑在峯會上表示，騰訊混元大模型經過持續迭代，目前整體性能居國內第一梯隊，部分中文能力追平GPT-4。

此外，騰訊還研發了1B、3B、7B、13B等不同參數量下的Dense和MoE模型，圍繞中小型模型進行了積極部署。資料顯示，混元大模型提供萬億參數hunyuan-pro、千億參數hunyuan-standard以及百億參數的hunyuan-lite等多種尺寸的模型服務，其中hunyuan-standard模型具備256k的超長上下文理解能力，單次處理字符數超過38萬個。

觀察者網攝

在多模態能力方面，混元大模型進展頗多。大會透露，在圖片生成領域，騰訊混元文生圖基礎架構已全面升級至sora同款的DiT架構，支持中英文雙語輸入及理解，具備多輪繪圖能力，測評結果國內領先；在視頻生成領域，騰訊混元支持文生視頻、圖生視頻、圖文生視頻、視頻生視頻等多種視頻生成能力，視頻生成長度可達16秒；在生3D層面，騰訊混元已佈局文/圖生3D，單圖僅需30秒即可生成3D模型。

在大會上，蔣傑宣佈騰訊混元大模型將堅定擁抱開源，為技術社區生態繁榮貢獻力量。據瞭解，目前，騰訊混元文生圖大模型已全面開源，開源3天內就在Github上獲得超千位開發者關注。未來，多種尺寸的騰訊混元MoE模型也將對外開源，可分別支持手機端、PC端、雲/數據中心等多樣化的部署場景。

值得補充的是，在當天的峯會現場，騰訊還官宣了幾則與產品“上新”有關的消息。

蔣傑宣佈，騰訊混元將上線一站式AI智能體創作與分發平台“騰訊元器”，開啓智能體生態。在平台上，用户不僅可以在創建專屬AI智能體，使用騰訊官方的插件和知識庫，還能將這些智能體一鍵分發到QQ、微信客服、騰訊雲上；此外，為更好地為用户提供服務，基於混元大模型打造的C端助手App“騰訊元寶”，也將於5月30號發佈。

本文系觀察者網獨家稿件，未經授權，不得轉載。