京東產業大模型:一場“價值務實”與“技術長期主義”的化學反應_風聞
砺石商业评论-砺石商业评论官方账号-砺石商业旗下专注大公司深度报道的专业商业媒体。07-14 09:42
**導語:**一方面是圍繞“價值創造”的務實主義,一方面是基於更長遠未來的“技術追求”,這共同奠定了京東在產業大模型領域的理念領先與成果領先。
路言 | 作者 礪石商業評論 | 出品
1
大模型時代“新共識”
隨着ChatGPT的橫空出世,大模型便一直是2023年上半年中國科技產業的最熱門詞彙。不過,在進入下半年後,大模型領域卻發生了一個新的變化,即“產業大模型”正代替通用大模型成為新的方向共識。
在此背後是,隨着公眾對大模型的研究越來越多,人們便越來越意識到通用大模型所採用的通用信息存在一些錯誤、謠言與偏見,且專業知識與行業數據積累不足,導致該類模型的數據“噪音”過大,行業針對性與精準度不足,無法創造出深層次的價值。
在產業場景中,專業服務要求高、容錯性低,需要能夠在實際場景中真正解決具體的問題。因此,企業使用的大模型必須可信、可用、可控,而且最好是經過反覆與充分測試。
**這一行業變化讓筆者不得不佩服京東在大模型領域的前瞻判斷。**近半年,筆者一直對大模型領域各個企業的進展保持着密切的關注,在大模型剛開始在中國興起時,類似百度文心一言、阿里通義千問等大多數企業都是對標OpenAI推出的ChatGPT,意在打造一個類似的無所不能的通用大模型。
而**當時只有京東認為產業才是大模型的最終歸宿,**並在國內旗幟鮮明地提出了要做“產業大模型”的戰略路徑,這讓筆者印象頗為深刻。京東CEO許冉後來將京東此次從產業端切入大模型,比喻為“從北坡攀爬技術珠峯”,道路雖然更加艱難,卻有更波瀾壯闊的風景。
時至今日,京東對產業大模型的探索逐漸成為大多數深度思考者的共識。不過,在其他企業陸續選擇跟進這一戰略時,京東又率先拿出了實際成果。7月13日,京東在北京召開了“2023京東全球科技探索者大會暨京東雲峯會”(下稱:JDD),會上京東推出了被業界廣泛關注的京東言犀大模型和言犀大模型開放計算平台。
那麼,京東的大模型有什麼與眾不同呢?
從官方表述來看,京東言犀大模型是從京東優質的產業場景與數據中錘鍊而來,具備更強的產業屬性。在訓練時便使用了70%通用域數據與30%京東數智供應鏈原生數據。
2
“價值務實”下的京東大模型
除了官方表述,筆者認為要想更深入瞭解京東大模型的差異化,首先需要了解京東在大模型底層理念上的思考,這才是產品差異化的根源。
今年早期,一些在大模型領域有所積累的企業,在產品尚不成熟時便急於推出自己的大模型產品;另外一些缺乏技術積累的企業,則因為缺乏專業判斷力,只能簡單粗暴地直接模仿ChatGPT。歸納這兩類企業的本質,都只是將做出大模型作為目的本身,並藉此來搶佔輿論關注與製造資本故事,而沒有從“價值創造”的角度去思考大模型的真實應用場景。
而京東得益於其長期深耕實體經濟的務實思維,其一直堅持“創造明確的價值應當是技術的目標”,所以**天然便不會將單純的做出“大模型”作為目的,而只是將其視為不斷優化“成本、效率、體驗”的一種工具。**京東集團技術委員會主席,京東雲事業羣總裁曹鵬在接受採訪時表示,“技術本身是沒有辦法直接產生價值的,技術只有放到場景裏才能夠產生實際的價值”。
“寫寫詩,聊聊天”並不能滿足產業需求。JDD上,京東正式公佈了對大模型價值的理解,並凝練成一個公式:“大模型的價值=算法×算力×數據×產業厚度的平方”。算法、算力與數據作為人工智能的三要素,大家都頗為熟悉,產業厚度則是指能在多少產業場景中切實應用,為社會真正創造價值。
理念的落地,還需要藉助資源與能力的優勢。而京東在數字供應鏈領域的長期深耕,為京東產業大模型的落地提供了差異化的數據優勢與能力優勢。
在數據方面,京東採用30%的數智供應鏈原生數據,涵蓋了旗下零售、物流、科技、金融、產發、工業、保險與國際等核心業務。數據本身是驅動人工智能的重要力量,例如ChatGPT自發布以來,通過大量人類反饋的交互數據,效果越來越好。這種數據只有在交互中才會產生,需要動態而非靜態的數據,很難在互聯網上獲取,這是京東的獨特優勢。在能力方面,京東大模型則充分融合京東在數字基礎設施、產業協同與城市智能化管理領域的優勢積累。
這些源於產業和內部業務場景的“人無我有”的數據與能力,最終帶來了京東大模型的差異化。目前,這種差異化成果已經在京東的內部業務場景得到充分檢驗。
例如,在零售領域,京東商城的消費者可以從過去通過關鍵詞搜索的交互方式,轉向類似現場導購的問答式交互。當用户提問“我想去露營需要什麼裝備”時,系統就會自動推薦帳篷、燒烤架與登山鞋等商品。
在健康領域,京東健康利用大模型可以對用户病史信息瞭解地更透徹和全面,保證輔助診療結果能夠切合用户自身特點,從而提高診療效果。目前,健康助手及輔助診療已涵蓋超千種疾病專業性服務,20種評價標準保障醫療安全。
在物流領域,京東物流超腦目前基於多模態大模型很好地實現了實時交互、根因分析和智能決策,未來有望具備實時自動生成全局最優的供應鏈解決方案的能力。一個典型的應用場景,在對倉庫佈局進行分析時,只要輸入“請分析在今年雙11大促的佈局堵點”,融入大模型技術的系統便會給出回答,“效率堵點為地狼貨架數目不夠,建議增加一排貨架”,這大大減少了傳統方法花在調研、分析上的成本。
在當前較為流行的數字人方面,融合大模型技術的京東雲言犀多模態數字人,可以通過提供極少量樣本素材,以對話交互模式實現從形象、音色、背景視覺、知識庫到短視頻等全鏈路內容的自動生成,支持5分鐘簡易拍攝,支持生成大姿態(如側臉/走動/手勢),支持動態局部高清與語義驅動的肢體動作編排,進一步降低操作門檻與操作難度,讓更多中小商家與個人能夠用得起、用得上數字人服務。今年618期間,言犀虛擬主播開播商家較去年11.11增幅超5倍,帶動商家GMV較去年11.11增幅超246%,大幅為品牌直播間降本提效。
雖然京東大模型已經是行業內具有成熟應用實踐的大模型產品,但京東依然秉持着一貫的務實主義,沒有急於大規模對外開放,而是制定了京東言犀大模型的“三步走”戰略。
第一步,推出京東言犀大模型的基座模型與“言犀AI開發計算平台”;第二步,讓大模型在京東內部高複雜場景進行大規模錘鍊;最後,大模型在內部應用中能夠明確創造價值後,才針對嚴肅商業場景將融合行業解決方案對外輸出。
而在對外輸出上,京東也有着清晰的思考,即優先在數字化領先的場景落地。例如,製造產業的數智化供應鏈、城市智慧管理、電商數字人、金融機構數智營銷與大型央企的集團化管理,數字化基礎都較為紮實,會更利於大模型能力的釋放。這種務實的戰略,也將讓京東的大模型團隊卸掉短期的業績包袱,真正做出好的、有價值的產品與服務。
目前,針對大模型融合解決方案的對外輸出,京東也發佈了支持企業客户專用模型研發的三大基礎設施、兩大平台與五大行業應用。
三大基礎設施分別是言犀大模型開放計算平台、向量數據庫與高性能的算力基礎設施。兩大平台分別是針對數據與智能交互兩個核心能力的優加DaaS3.0與言犀智能服務3.0。五大行業應用分別是面向零售、金融、城市、健康與物流領域的專屬方案。
其中,最值得一提的是言犀大模型開放計算平台,其沉澱了京東在零售、物流、健康、金融等行業多年積累的知識,集成了京東技術團隊研發的超100種場景的AI算法和工具,打造了低代碼AI平台,可以為用户提供從數據模型到應用服務的全週期管理,實現真正的MaaS(模型即服務)。
過去,企業需要10餘人的科學家團隊工作,現在只需要1-2個算法人員,即可通過京東言犀AI開發計算平台完成從數據準備、模型訓練到模型部署的全流程,訓練效率提升2倍,推理提效6.2倍,成本節約近90%。
而對於大多數企業來説,自建大模型不僅週期長,效率低,成本高。經過內部複雜場景充分檢驗的京東大模型融合解決方案,則無疑是構建企業專用大模型的一種“最優解”,其勢必會受到那些對大模型“望眼欲穿”的企業客户的信任與期待,我們也對京東大模型在未來的大規模開放拭目以待。
3
技術追求下的複利效應
除了注重“價值創造”的務實思維,京東對“成本、效率、體驗、可信、普惠、突破”的技術追求是其在產業大模型領域拔得頭籌的另外一個重要原因。
不同於很多企業的跟風,京東在ChatGPT走紅之前,其實就已經在大模型領域完成了最核心的技術積累。例如在算力方面,京東於2021年在重慶落地了全國首個基於SuperPOD架構的超大規模計算集羣——天琴α,算力總規模達到135TFLOPS(每秒浮點運算次數),推理提速6.2倍,推理成本節省90%,是當時國內最大的超算集羣。
在算力基礎設施構建完成的同時,京東雲言犀團隊在算法上也取得了重大突破,尤其是具有自主產權的“知識注入的預訓練語言模型”K-PLUG的提出,增強了京東大模型輸出內容的可信。
目前,K-PLUG生成的商品文案已覆蓋京東超3000個品類,累計生成30億字,人工審過率超過95%,帶來超過3億元GMV,助力品牌降本增效。
在解決泛化問題上,2022年推出百億級模型Vega,並於2023年在通用語言理解基礎模型方面對織女大模型進行再升級,提出規模更大、性能更強、遷移性更好的Vega v2模型。該模型支持3D並行訓練,能實現高效推理與雲邊協同,能夠廣泛應用於情感分析、語義匹配、語法糾錯、智能問答、常識推理等多種下游自然語言處理任務。在國際權威的複雜語言理解任務評測SuperGLUE榜單上,Vega v2模型以平均分91.3的成績登頂全球榜首。
Vega系列模型的奪冠證明了京東的多語言自然語言處理技術能力在超級深度學習領域的領先性。
在上述模型訓練的過程中,京東在任務型對話、語義理解、語言生成等領域的能力都不斷成熟,這些能力最終帶來2023年更加成熟的言犀千億大模型。所以,京東在產業大模型領域的脱穎而出,絕非是因為對GPT熱潮的跟風與效仿,而是源於京東的技術追求所帶來的複利效應。
4
結語
《礪石商業評論》在長期的商業研究過程中發現,商業界不是比拼誰走得更早,更快,而是比拼誰能走得更久,更遠。
京東集團CEO許冉在發佈會演講中也表示,京東堅持做“難而正確的事”,堅持做實事、有價值的事和長期的事,“我們眼中的人工智能,是一場非常嚴肅的技術革命,需要具備長期主義的心態。京東不會把沒有實現‘色香味俱全’的菜餚端上餐桌,在內部的關鍵場景完成了歷練和實踐的大模型,京東才會開放給合作伙伴,帶動整個行業降本增效”。
很明顯,這一輪角逐大模型落地的難點並不在於技術追趕,而在於產業突破。
京東集團技術委員主席、京東雲總裁曹鵬在採訪中也表示,“大模型的角逐是一場長跑,一個技術在產業裏產生價值需要長週期的積累”。
一方面是圍繞“價值創造”的務實主義,一方面是基於更長遠未來的“技術追求”。在這樣的底層思維模式下,筆者相信京東大模型也將複製京東生態內其他成功業務的進化與蝶變過程。
在自身進化與蝶變的過程中,其也將幫助千行百業的企業家們,儘快破除對大模型的陌生感與距離感,加速在研發、生產、銷售與服務等具體業務場景的落地應用,切實享受到大模型為企業降本增效帶來的價值。
就像之前互聯網時代已經證實的那樣,誰能率先利用好互聯網技術完成企業業務模式的升級與重塑,誰就在過去20年間獲得了最大的紅利,而在人工智能技術時代亦是如此,誰能率先在企業業務場景中應用好大模型為核心的人工智能技術,誰也將有望獲得未來的最大紅利。