騰訊可能找到了大模型在中國最快落地的路_風聞
子弹财经-子弹财经官方账号-子弹财经(zidancaijing)07-07 21:14

出品 | 子彈財經
作者 | 語叔
編輯 | 閃電
美編 | 倩倩
審核 | 頌文
過去一年,張然被自己的工作弄得都快抑鬱了。作為一家國有商業銀行的信息技術開發人員,在2021年年底的時候,領導交給他一個非常艱鉅的任務。
這家銀行數字化全盤使用不到10年時間,之前很多的業務積攢下來的手寫單據,沒有進行數字化處理,在當前系統中無法查詢;哪怕是全面數據化之後產生的單據,尤其是發生在貸款複核過程中,需要客户提供的發票等必須輸入系統進行比對的單據,後期的複核檢查不得不依靠人工處理,大大降低了相關部門的工作效率。
説實話,一開始張然還很興奮,因為自己學習的很多新技術終於有了用武之地。然而真正接觸到相關業務需求,就讓他覺得這個任務變得不簡單起來。
因為印花各個階段和各種業務產生的單據都不同,最早他寄希望在OCR技術上,結果發現掃描識別的成功率不到85%,而且大量的圖片細節必須需要人工處理,不但沒有降低,反而增加了人工投入。後來,根據貼吧大神的説明,他又試用了雲服務平台提供的識別AI相關工具,依然存在數據缺失或者識別錯誤問題。
這並沒有達到領導對這件事的期待。對此,張然開始苦惱,甚至在工作壓力下出現了失眠的情況。
直到一個偶然的機會,他接觸到騰訊雲的行業大模型。
1、從文本到客服説實話,一開始聽騰訊雲相關技術和服務人員為他推薦的大模型解決方案,他還覺得可能跟以往雲服務沒什麼區別。
讓他沒有想到的是,以往無論是OCR還是雲服務產品,掃描完成的數據或多或少都需要人工審核和糾錯。但經過五天五萬張圖片的輸入與標註學習,TI-OCR大模型對於銀行單據識別的效果已經超過了95%,達到銀行完全可以接受的業務水平。
根據他的測算,如果系統全盤採用這個大模型作為底層,那麼預計中的後期審核人工將比採用雲服務工具減少70%以上,相關維護投入也將比現有純人工的系統降低90%。
關鍵,騰訊雲的這個大模型,還能幫助銀行將所有的單據數據從非結構化轉成結構化,通過對於銀行內部統計報表等信息的學習,大模型能自動且準確地將掃描得到的數據,填報到內部需要的各種數據表中。
就相當於一個環節,做完了以往兩三個環節才能完成的信息化工作。於是困擾了張然快一年的技術難題,就這麼愉快且輕鬆的被解決。

(圖 / 攝圖網,基於VRF協議)
而能讓張然這麼快就愛上大模型,是因為騰訊雲TI-OCR大模型的三大特點。
首先,基於原生大模型,不經過訓練,直接支持常規下游任務,零樣本學習泛化召回率可達93%;第二,通過prompt設計,不經過訓練,支持複雜下游任務,小樣本學習泛化召回率可達95%;第三,通過多模態技術,小樣本精調解決傳統OCR難題,自研端到端技術突破檢測識別業界痛點,比傳統模型召回率提高3%-20%。
基於此,張然才能遊刃有餘地解決問題。最終系統的效果非常好,得到業務部門和銀行領導的一致好評。而他也再次感受到騰訊雲行業大模型的能力。
於是,他將解決銀行客服數字化和虛擬數字人客服的希望,再度放到了騰訊雲行業大模型的身上。
實際上每家銀行現在的業務極其廣泛,由於中國多家股份制商業銀行集團內部已經輻射到金融投資的方方面面。在這樣的背景下,對於那些高淨值的客户銀行除了提供優惠的利率吸引客户以外,增加全方位的金融服務能力,是他們必須要做的選擇。而金融服務能力與客户的交接點就是客服。
無論是利用社交工具,還是電話方式來回答用户的提問,甚至幫助用户處理投資上遇到的難題,客服永遠都是銀行系統人工投入最大的領域。如何在這方面實現減員增效,是每家銀行領導都在考慮的重要問題。
當然之前張然所在銀行也開發過智能客服,但智能客服的缺點也比較明顯,一是情感設置比較缺乏,相關的回答讓用户一看就能認出是智能機器人;二是這些回答的背後,知識圖譜更新並不及時,很多時候用户能拿到的答案,要麼非常死板,要麼文不對題。而且智能客服轉人工客服之後,人工客服還要經歷一段獲取信息,學習、查找再給出答案的過程,並不能給客户一個很好的體驗。
因此,在騰訊雲行業大模型嚐到甜頭之後,張然果斷尋找騰訊雲的幫助來解決這個問題。
很快,基於騰訊雲金融行業大模型的能力,張然結合所在商業銀行自身的場景數據,業務數據,還有相關集團內金融兄弟單位的能力以及業務流程連接等數據,通過騰訊雲TI平台進行精調,構建了專屬的金融客服大模型,並進行私有化部署。
這套大模型快速學習企業的知識文檔庫,搜索現有的資源和流程,同時直接對接銀行的業務API,可以實現與用户無縫且包含感情的互動對話,並在銀行投資、財務管理,綠色金融等方面,提供智能諮詢輔助,分析決策,甚至直接引入後續業務環節的能力。
這讓銀行領導感到非常滿意,並且已經將這套系統上報給集團,希望能在集團其他兄弟單位推廣。
**2、為什麼是騰訊雲?**其實,在金融領域,騰訊雲行業大模型的能力並不僅僅是識別單據和智能客服。
針對金融企業普遍重視風控的現實,騰訊雲風控大模型融合了騰訊過去20多年黑灰產對抗經驗,和上千個真實業務場景,整體反欺詐效果比傳統模式有20%左右的提升。企業可以基於prompt模式,迭代風控能力,從樣本收集、模型訓練到部署上線,實現全流程零人工參與,建模時間也從2周減少到僅需2天。
在其他方面,騰訊雲的行業大模型也開始發揮作用。經過多年在產業互聯網領域的深耕,騰訊雲已經與眾多行業領軍企業緊密合作,為十個重要行業提供了超過五十個解決方案,致力於為企業提供高效、優質、低成本的人工智能應用創建和部署。

這些解決方案不僅涵蓋了多種行業,例如,為智能製造提供了更加精準的預測和推薦算法,為智能金融提供了更安全、高效的智能風控服務,為智能零售提供了更個性化的商品推薦服務,而且每一個方案都由騰訊雲提供的一整套模型服務工具鏈支持,包括高效率、高品質、低成本的應用部署工具、模型訓練工具等等,這些工具可以大大提高企業創建和部署AI應用的效率和質量。
實際上,隨着微軟與OpenAI逐漸發力互聯網廣告和流量獲取領域,人們發現通用大模型對於互聯網業務的增量並沒有太多助推作用。美國知名媒體NewsWeek最近對OpenAI旗下ChatGPT大模型應用網頁統計調查顯示,相關用户的熱度急劇下降,其每日流量可能已經跌到一二月份熱度最高時10-15%的水平。
這意味着,OpenAI大模型開發方想依賴流量廣告盈利的可能性降低,商業收入受限。也因此,OpenAI的ChatGPT從3.5-4,不到三個月時間就燒完了微軟投入美元100個億,後續不得不緊急融資105億美元應急。
從這點上看,以OpenAI為代表的通用大模型,找尋落地和商業化方面出現困難。而所有企業和開發者一致認為,行業應用應該是大模型下一階段商業推廣的重點。
7月6日,在上海舉辦的2023世界人工智能大會主論壇上,騰訊集團高級執行副總裁、雲與智慧產業事業羣CEO湯道生,發表演講時表示,通用大模型有很強的能力,但並不能解決很多企業的具體問題。“企業的大模型應用需要綜合考慮行業專業性、數據安全、持續迭代和綜合成本等因素。基於行業大模型,構建自己的專屬模型,也許是企業更優的選項”。
從這個角度看,首先在中國提出產業互聯網,並一直不遺餘力推動互聯網技術跟產業融合的騰訊,無疑在大模型行業應用領域佔據優勢。
一方面,多年服務一線企業的經驗,讓他們在建立大模型基礎後能快速根據企業的需求,調整出具備針對性的“行業模型”,能快速提供企業業務的部署,提升企業的效率。
另一方面,他們還針對企業面臨的行業部署大模型可能遇到問題,提供一攬子的解決方案和趁手工具,可以加快企業部署模型以及最終產生效能的能力。
更重要的是,騰訊為行業大模型專門準備了兩個強大的技術底座。
**首先是星脈網絡。**這是騰訊雲正式發佈的新一代HCC高性能計算集羣。該集羣採用騰訊雲星星海自研服務器,服務器之間採用業界最高的3.2T超高互聯帶寬,能提供高性能、高帶寬和低延遲的集羣算力。實測顯示,騰訊雲新一代集羣的算力性能較前代提升高達3倍,是國內性能最強的大模型計算集羣。
**其次,就是AI原生的向量數據庫。**7月4日騰訊雲發佈的這個數據庫,能夠被廣泛應用於大模型的訓練、推理和知識庫補充等場景,是國內首個從接入層、計算層、到存儲層提供全生命週期AI化的向量數據庫。
也因此,在國內騰訊是首先高舉行業大模型旗幟的平台,也讓越來越多的企業快速達成基於騰訊雲行業大模型的技術變革。
騰訊雲副總裁、騰訊雲智能負責人、優圖實驗室負責人吳運聲在接受媒體採訪時就此表示,騰訊專注於落地實際的問題,“我們希望在每個特定場景裏面100%解決客户的問題,而不是找100個產品解決70%到80%的問題,我們會聚焦找一些特定的行業跟客户深入打磨解決行業的問題,在業務流程裏面用大模型的技術,結合自己自身的業務場景,還有數據相關的東西對大模型進行精調,解決他的問題。”

**3、這對中國大模型意味着什麼?**實際上,騰訊走的這條行業大模型先行的路,可能才是中國大模型最可行的落地之路。
因為相較於美國,開發通用大模型需要投入的算力和培訓資源,國內平台的差距還是有的,需要不短時間才能追上別人水平。
就像此次世界人工智能大會的展覽中,騰訊重點推出的騰訊雲行業大模型解決方案。騰訊雲從產業客户需求場景出發,基於大模型高性能計算集羣,依託騰訊雲TI平台打造模型精選商店,為客户提供MaaS一站式服務和“量體裁衣、普惠適用”的行業模型解決方案,全面降低落地門檻,助力客户構建專屬大模型及智能應用。

近5年以來,中美的互聯網技術發展出現了明顯的分歧,從2018年騰訊930變革到如今,與產業相融合成為各家互聯網企業開發產品和技術的出發點。
這意味着中國互聯網企業相較於美國企業來説,更貼近於製造業和實際生產需求。所以從這樣的角度來看,中國互聯網企業掌握推動社會經濟發展的程度會更明確。
有意思的是,大模型的成長和訓練是需要大量數據的支持。目前不論是ChatGPT還是谷歌的Bard,他們都是在通用大模型領域領先。他們背後都是通過搜索引擎帶來的龐大數據進行訓練的,細分到具體行業,相應的數據量和數據活躍度,並沒有達到用户真正的需求。
這其實才是中國企業彎道超車的真正機會。
而要想在企業端落實就必須推動行業大模型的建立和發展。中國由於人口基數龐大,在各個行業都擁有着廣超美國乃至世界其他國家的數據積累,無論是醫療、法律、物流,亦或是細分行業的生產。而且這些數據在國家數據安全法的指定下,天然就具備跟海外大模型隔離的環境。
因此毫不誇張地説,這些To B端的數據是中國企業推出行業大模型最大的優勢。而針對這樣的優勢中國大模型開發的方方面面聯合起來,共同推動產業的進步,才是市場發展的基石。
吳運聲一直推崇大模型時代開放的合作戰略,他認為,開放是大模型發展非常重要的一個特點。因為底層的技術變化太快,而且技術外延的能力會非常廣,“大模型要結合到一個行業裏面,可能要花費大量的時間,這種情況下發揮最大的價值只有開放,通過開放提升讓更多人加入進來,更多行業的專家,各類的角色人員加入進來,我們才能讓這個生態,整個體系更加的健康,產生更多的可能性。”

畢竟,數實融合才是經濟發展的真正基石,這句話,放到當下大模型異常火爆的現實中,依然具備指導意義。
從出發點來看,以高舉行業大模型的騰訊為代表,中國的大模型已經具備了殺出混戰的資格。
*文中題圖來自:攝圖網,基於VRF協議。