科技雲報道:卷完參數卷應用,大模型落地有眉目了?_風聞
科技云报到-深度原创企业级IT内容行家1小时前
科技雲報道原創。
國內大模型戰場的比拼正在進入新的階段。
隨着產業界對模型落地的態度逐漸迴歸理性,企業客户的認知從原來的“覺得大模型什麼都能做”的階段,已經收斂到“大模型能夠給自身業務帶來什麼價值上了”。
2023 年下半年,不少企業將目光鎖定在行業模型上。如何降低大模型使用門檻,讓大模型真正在行業裏用起來,是業內普遍關注的焦點。
由此,國內廠商在大模型上的認知也在逐步統一——百度創始人李彥宏認為“卷大模型沒有意義,卷應用機會更大”;騰訊高管湯道生表示“大模型只是開端,行業應用才是未來”;華為雲CEO張平安明確大模型“為行業而生,聚焦B端行業客户”,更直言盤古大模型“沒時間作詩、沒時間聊天”。
這也意味着,更多大模型廠商將開始卷應用,這會是今年競爭最為激烈的板塊之一。
大模型行業落地渴望 “開箱即用”
過去半年,大模型To B的落地應用摸索已經度過嚐鮮期。
對於企業而言,他們希望更快使用上大模型,在市場競爭中獲得優勢。但大模型的技術門檻很高,因此企業並不會從頭開始訓練自己的基礎大模型,更多是基於某個成熟的大模型做二次開發。
然而,想借用好現有的通用大模型,企業仍面臨着三大難題:
首先,各類企業的場景需求、複雜程度、智能化程度千差萬別,大模型能力邊界與企業的場景需求如何快速、準確匹配;
其次,從模型到應用中間還需要諸多技術橋樑,諸如SFT、RAG、LangChain、Agent等技術,如何與大模型有機組合達成最優解;
第三,企業過去積累了大量IT設施、軟件、企業數據、業務流程,如何讓大模型與現有設施結合的情況下,保障企業數據信息安全。
換句話説,企業無論是基於開源或閉源的通用大模型來做行業化落地,都遠沒有到達開箱即用的程度。
不過這也成為大模型廠商在競爭中突圍的方向,除了要在底層技術上繼續夯實外,補足行業Know-how和成功經驗也是重中之重。
在百度和阿里的發展經驗中,似乎可以給大模型行業一些啓示。
其中,百度用搭建行業模型、垂直場景模型和應用的方式賦能具體行業。
2023年3月,百度智能雲推出千帆大模型平台,從算力、模型、到應用層層結合,為企業提供一整套大模型開發工具。
一年後,基於一線經驗積累和實戰反饋,百度智能雲抽取出“研、產、供、銷、服”環節中的典型場景,於近日推出了5款全新模型和7款應用產品,來解決企業用好大模型的“三大難題”。
以此次發佈的國內首款大模型全面重構的智能客服——百度智能雲客悦為例,相比傳統客服,客悦可結合大模型的理解、推理、記憶能力,實現更友好的對話、更高效的運營。
比如,當用户提問“我的車總有吱吱吱的聲音”,傳統客服無法理解“吱吱吱”這種口語化的表達。
而客悦在大模型的加持下,會繼續追問用户該問題持續的時間和頻次,並通過推理反饋用户,可能是皮帶老化或者張緊輪鬆動導致,建議到店檢查。
若用户反饋沒時間檢查,客悦還會基於自身知識庫,提醒不檢修可能導致車輛失去動力、長期會引起發動機故障等問題,引起用户重視,守護行車安全。目前,用户問題自助解決率已超過90%。
在運營效率方面,上一代的傳統智能客服進行業務辦理、知識諮詢、閒聊等能力,需要花費的人效約100人/天,而客悦僅需約15.5人/天,大模型客服運營效率提升6倍。
目前為止,百度智能雲已經佈局了電力、汽車、金融、政務等十餘個行業大模型,並取得了不錯的效果,客户中也出現了國家電網、浦發銀行、泰康、吉利等知名企業。
相比之下,阿里採用了另一套邏輯:賦能於內部已有應用和服務,再技術外溢至行業客户。
除已經發布“通義千問”大模型外,夸克也發佈了自研大模型,應用於通用搜索、醫療健康等場景;後加之內部推行“雲釘一體”,作為辦公一體化平台,釘釘上線AI魔法棒,推出17項與AI相關服務,也為通義千問大模型助力頗多。
同時,阿里也提供了不少類似於Anyone fit類型的圖像模型解決方案,其工具十分貼合電商需求場景。
因在電商、物流層面的深厚積累,讓阿里擁有了對不同領域的行業特點、業務流程和客户需求有了充分的認識。
基於此,阿里的產品便可以在深度瞭解用户需求的基礎上,為客户提供定製化的解決方案,滿足其業務需求,提高其業務效率和競爭力。這讓大模型有了其應有之意,不至於淪落為“無源之水”。
頭部大廠領跑大模型行業落地
在大模型的 toB 競爭中,本質而言,是取決於客户企業對商業價值的認知。和其他行業一樣,在大模型領域,“多快好省” 和 “物美價廉” 難以兩全,匆忙上陣的結果可能是一地雞毛。
因此,企業客户在大模型的選擇上更為審慎。儘管大模型的應用還在初期,但企業在模型選擇、模型可靠性、應用成本、使用門檻等層面,已有各種考量和顧慮。
百度集團副總裁侯震宇曾在採訪中表示:“最終能夠讓大模型服務推廣開的只有兩個原因:第一個是模型效果,第二個是成本。”
以百度智能云為例,其大模型的調用和訓練成本一直在下降。文心一言開啓內測後,一個月就迭代了四次。
根據百度披露的數據,文心一言的推理成本如今只有發佈之初的十分之一,在發佈的3個月內推理效率提升10倍,模型推理性能提升50%,模型算力利用率提升1倍。
侯震宇透露,隨着技術迭代帶來的成本下降,不管是在模型使用,還是在模型微調甚至在模型再訓練方面,“價格應該不會成為大家使用或者擁抱大模型的瓶頸”。
與此同時,在SuperCLUE中文大模型7月最新榜單中,百度的大語言模型產品文心一言以62分的總成績一舉超越越GPT-3.5-turbo(59.79)和ChatGLM-130B(59.35)等,穩居行業頭部。
除了成本和效果,大模型從開發、應用到調優的每一個環節如何落地,如何基於數據安全合規進行私有化部署等,都是企業客户重點關注的問題。
例如,很多企業需要的聊天機器人,並不是選擇具備強大通用能力的大模型就可以,還要求大模型廠商能夠提供易用性、完備度、安全性、穩定性都有保證的工具鏈。
在關注大模型技術棧完備性的同時,企業還需要選擇適合自身業務的大模型廠商——既有充分的產業應用經驗積累,也能夠將技術應用到實際業務場景中。
目前,百度智能雲推出的千帆大模型平台就擁有較為全面的數據服務能力,從生成、標註、迴流再到模型訓練(Post-pretraining、Fine-tuning、Prompt-tuning)、模型評估(主觀評估、客觀評估)和壓縮、自動化 Prompt 工程、到插件應用編排,客户都可以在千帆上一站式完成。
這意味着企業客户可以將基於千帆平台從0開始訓練自己的專屬模型,同時訓練好的模型也可以部署和託管在千帆平台上,獲得極致的性能、企業級的高可用性和安全環境。
由於千帆平台已經制備了開箱即用的使用流程,用可視化產品界面的方式引導用户使用,極大降低了使用門檻。對於企業級市場比較擔心的安全可靠問題,也內置了安全機制,確保模型的輸入和輸出的安全。
不久前,IDC發佈的《AI大模型技術能力評估報告,2023》對國內主流大模型,包括百度、阿里、騰訊、華為、科大訊飛、360、商湯等14家廠商參進行了評估。
IDC分別對大模型的平台、創新、通用、算法、服務、生態合作、行業覆蓋和安全可解釋性等諸多方面進行了評價,其中百度 7 個滿分,阿里 6 個滿分。百度在算法模型、行業覆蓋領域拿下行業唯一滿分。
可以看到,頭部大廠的大模型產品已經有所成效。相較之下,部分初創和腰部公司開始呈現疲態。
從光年之外退出競爭、訊飛大幅虧損難以支撐大模型投入便可以得知,一些 “笨鳥先飛” 的企業已逐漸落後於發展大勢。
對於企業業務而言,現階段更加穩妥的方式還是在大廠之間做出抉擇。大廠大模型更能保證服務交付、運維和維保,這也是企業對自身向智能化方向轉型更加負責任地選擇。
結語
隨着企業研發、生產、銷售、人力等各項業務場景數字化深入,如何藉助大模型的力量,發揮出應用的最大價值,正成為企業商業制勝的關鍵所在。
接下來的競爭,對於企業而言,不再是侷限於大模型的追逐,而是如何基於大模型對應用產品進行自我優化和革新。
對於大模型廠商而言,比拼的不僅是算力、算法和數據,未來長期的發展比的更是落地應用、生態渠道、客户服務、運維等系統性、全面性的支持。
這需要廠商具備強大的技術水平,以及不斷迭代升級的能力。要滿足可控和合規的要求,也需要廠商有較強的綜合能力,能夠長期穩定的投入人力物力。
【關於科技雲報道】
專注於原創的企業級內容行家——科技雲報道。成立於2015年,是前沿企業級IT領域Top10媒體。獲工信部權威認可,可信雲、全球雲計算大會官方指定傳播媒體之一。深入原創報道雲計算、大數據、人工智能、區塊鏈等領域。