重新理解百度智能雲:寫在大模型開放後的24小時_風聞
产业家-产业互联网第一媒体09-01 18:38

在這些回答背後共同折射出的一個現實是——大模型不再是一個單選題,而更是一個綜合題。在這個新的時代帆船上,產品、服務、安全、開放等全部都需要成為必需品,甚至是從企業的落地層面來看,這些更是剛需品。
作者| 皮爺
出品|產業家
過去的5個月,李亮很忙。
“從今年3月份文心一言發佈之後,很多工業側的企業,甚至是國央企,都主動來和我們探討大模型的落地。”他表示,“也包括很多行業夥伴都找過來,説看如何一起打造具備服務共性的平台。”
作為百度智能雲的一位工程師,過去的近半年時間裏,他真切感受到了企業對AI大模型的熱切程度。這種熱切是企業對具備落地能力的新技術的期待,也更是擔心落後的焦慮。
這不是個例。
伴隨着OpenAI和國內一眾大模型企業的頻頻發聲,越來越多的“產業+AI大模型”框架正在清晰地呈現在企業面前,相較於之前的元宇宙、區塊鏈等技術,AI大模型應用距離企業的真實場景更近,應用路徑也更短,效果更“立竿見影”。
但在熱火朝天的AI實踐裏,越來越多企業開始逐漸發現一個更為現實的問題:最佳的大模型切入點在哪?或者説,企業應該如何高效地構建適配自身的大模型?
問題背後,對應着一眾企業在大模型轉型路上的“挫折”。“現在很多企業的問題是有意願,但沒渠道;或者是嘗試後,整體進度很慢。”一位投資人告訴我們,“中間包括數據清洗、標註,以及prompt的生成、模型微調、訓練這些,市面上都沒有特別易用的方式。”
實際上,這些現象也構成了儘管企業對大模型熱情依舊高漲,但越來越多開始在邁出第一步同時保持“謹慎”態度,這種觀望在清晰與否的轉型路徑,也更在參與其中的成本性價比。
不過,AI加速的好消息依舊在傳來。在剛剛過去的8月31日,百度文心一言、商湯商量SenseChat等大模型首批通過了《生成式人工智能服務管理暫行辦法》備案,正式面向全社會開放服務。此外,據悉,針對企業用户,百度智能雲還將在9月5日舉行的2023百度雲智大會上宣佈四大配套舉措,旨在助力企業以更低成本更快捷方式使用上大模型。
在滾滾而來的AI洪流中,企業應該如何選擇適合自己的大模型?或者説,在如今大模型開放的AI時代,怎樣的AI大模型才能成為企業在AI數智化時代的最佳航船?
在8家大模型獲批上線的當下,這個問題正在被加速推到台前。
一、AI需求,和背後的新產業命題
在得出答案之前,不妨先來看天平的另一側:即客户AI落地的難點到底在哪?
“現在大家對於大模型在行業會怎麼落地,有哪些完全顛覆性的應用,或者説這種能帶來很大風潮的應用,會出現在哪兒,也都不是很確定。其實我們客户也很清楚的認識到這一點。”百度智能雲一位解決方案工程師表示。
這是如今國內很多企業面臨AI大模型的共性。即儘管企業對自身的業務場景有充分的認知,但大模型能做到哪一步,以及如何使用大模型進行原有業務的降本增效,這都是未知命題。
而對部分已經嘗試的企業,問題則是更為尖鋭。
“我們最開始使用的是國外開源模型,但最近也在考慮嘗試重新接入國內的大模型,因為國外開源的中文語義理解太差了,基本的交互都出現問題。”一位低代碼企業創始人這樣告訴我們。
有同樣感受的是另外一家農業方向的企業,在和其創始人的交流過程中,他直言,“從最開始做prompt,到後面一輪一輪的訓練,包括數據清洗、高質量標註等等,整個過程的開銷非常大的,訓練效果還不是特別好,甚至不如原有界面。”截止到目前,這家企業的大模型產品仍然處在內測階段,尚未對外使用。
在這些之外,更多的企業則是停滯在大模型的“第一步”——選型。
不過,在選型階段,企業的顧慮有所不同。對目前大部分中小企業而言,其選型難的原因在於不清楚哪家底層大模型企業的產業能力強,這些能力包括產品能力,也更有對模型微調、知識增強等服務落地的要求。
而對大型企業而言,除了數據安全之外,產業理解和複用性是企業的最核心考量。“大企業更看重的是,你不僅要在我看重的這一點的業務上能做出效果,還有就是要在整個集團的複用性上,能和既有業務結合的效率要更高。”上述工程師表示。
在他的感知裏,以央國企為代表的大型企業更多地希望大模型服務商是一個教練的角色,不僅要給到好的工具,還要教會企業怎麼用,從長期提升價值。
從更大的視角來看,當下大模型落地的難點大概分為三個層面,一是企業不知道選擇怎樣的大模型,或者説企業不知道自身的需求怎樣的大模型可以滿足,視野範圍內的大模型選項太少;二是對部分選擇自建大模型的企業而言,其在prompt提示詞和數據清洗、標註以及中文增強等工具鏈層面屢屢碰壁,投入太大或者經驗不足;三是企業自身的數據安全和合規性較高,同時需要較深的產業know-how,對大模型服務商的功能能力要求較高。
不難感知到的是,如果從原子化服務的角度拆解來看,當下國內企業對大模型的需求已然不僅在產品層面,如參數、邏輯推理等硬核指標,更大的需求點湧現在服務側,即對不同企業需求的一站式滿足,這些滿足或是在prompt層面、或在中文增強、數據標註、訓練層面,再或是在產業場景適配乃至數據安全,以及最核心的成本層面。
大模型,已然從一道單純的技術命題,悄然進化為一道糅合技術、產品、服務等全部環節的產業綜合命題。
二、千帆背後,看見大模型的“真實表達”
在忙碌的幾個月裏,李亮對一家企業印象很深刻。
“有一個礦山行業的合作伙伴,在大模型的領域非常期望跟我們合作,想要通過大模型去進行整個的礦山的智慧化服務,包括安全生產的管理,安全生產的預警等等。”他説道,“我們現在在跟他進行多輪測試,有很多也有非常不錯的測試效果。”
**他的意外之處在於,像礦山這樣的偏傳統的企業,也開始主動找到百度尋求大模型方面的進展和落地。**據瞭解,如今雙方經過多輪共創,一個基於礦山場景的大模型已經接近成型。
實際上,這不是第一個主動找到百度智能雲的企業。而百度智能雲對這些產業夥伴的一個統一服務界面,正是在今年3月份正式推出的一站式企業級大模型平台“百度智能雲千帆”。
作為唯一TO B大模型界面,百度智能雲千帆也恰構成着百度大模型在如能源、金融、政務、交通等不同產業場景的真實表達,以及包括數據管理、模型訓練、評估&優化、預測服務和Prompt工程和插件服務等全部大模型開發週期的能力展示。
而在剛剛過去的8月,它更是交出了一張亮眼的成績單。
一個亮眼之處是,在本次對外公佈的模型種類中,百度智能雲千帆除了文心大模型的核心外,其也更全面接入Llama 2全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B等33個開源大模型,成為國內擁有大模型最多的平台。
換言之,基於百度智能雲千帆的“模型倉庫”,除了文心大模型之外,企業可以自行適合自身的其它基礎大模型產品。
此外,和其它模型倉庫不同的是,百度智能雲千帆對“模型倉庫”內的模型進行了“二次加工”。
比如,在安全性層面,千帆對所有接入的第三方模型均做了模型安全增強,不僅保障文心大模型的內容安全,還保障了第三方大模型的安全輸出;再比如在成本層面,對每一個接入的大模型,千帆都做了二次性能增強。
根據測算,在性能調優後,第三方模型體積可壓縮至25%-50%,推理成本可降低50%。這意味着,相較於直接調用,企業在千帆平台上使用這些模型可極大地節約成本,提升效果。
與此同時,千帆對接入的大模型做了深度適配,其為企業提供模型再訓練的全套工具鏈以及多種形式模型調優,其中包括SFT(全量參數微調、Prompt Tuning、Lora)及強化學習(獎勵模型學習、強化學習訓練)等等。
換言之,基於百度智能雲千帆,不論是選擇文心大模型,還是平台上的第三方開源大模型,企業都可以端到端地搭建自身的專屬模型。
不僅於此,在對外的服務能力上,百度智能雲千帆可以為企業提供公有云和私有部署兩種方式,包括上文所説的大模型落地難的推理、微調、託管,企業都可以基於公有云模式接入使用。而在本地部署方面,百度智能雲千帆也更是可以純軟件和軟硬一體的交付方式,充分滿足企業本地部署的要求。
實際上,這些能力在也構成了百度智能雲千帆在一眾產業側的真實落地。根據不完全統計,在過去的5個月時間裏,千帆大模型平台在超過400個真實產業場景中實現了落地。截止目前,百度文心大模型已擁有中國最大的產業落地規模。
**這些落地構成了中國大模型賽道的一個個特殊節點。**比如在能源層面,百度智能雲和國家電網聯合打造的“設備運檢知識助手”入選北京市首批十大行業大模型應用案例。與深圳燃氣聯合發佈的“深燃-百度·文心大模型”,基於大模型能力,只需要進行微調,就可以形成針對性的行業模型能力,完成多個應用場景的任務。
再比如在金融層面,百度智能雲與中信金控聯合打造了基於大模型的數字人,讓每一位銀行客户都有自己專屬的理財顧問,可以承擔包括投研助手、投顧助手、營銷助手、合規助手等在內的多個角色。
這些真實的產業落地側寫也更在一眾中小企業側。根據不完全統計,已經有超過10萬家企業申請測試,這個數目伴隨着如今面向全社會層面的開放動作,也更在加速倍增。據瞭解,在在開放的24小時內,文心一言共計回覆網友問題數超過3342萬個。
可以説,不論是在產品層面,還是服務層面,千帆大模型為企業提供的是一個開放兼容的大模型選擇界面,在這裏,企業既可以實現從0到1的端到端大模型搭建,也更可以尋求到包括數據標註、prompt在內的一眾工具鏈能力,以最低的成本和門檻,構建出自身的專屬大模型。
三、AI時代,我們需要怎樣的大模型?
如今,越來越多人開始討論的一個命題是:在如今的產業數字化時代,我們需要怎樣的大模型?有的人的回答是產品,有的人的回答是服務,也更有人的回答是數據安全。
在這些回答背後共同折射出的一個現實是——大模型不再是一個單選題,而更是一個綜合題。在這個新的時代帆船上,產品、服務、安全、開放等全部都需要成為必需品,甚至是從企業的落地層面來看,這些更是剛需品。
不過,這些問題也正在被作答。
以百度智能云為例,除了在產業領域側聯合企業進行落地之外,其也更是和生態夥伴聯合打造了更多基於特定場景的產品。比如和軟通動力打造的大模型基礎設施軟通天璇2.0,與微盟聯合構建的AI應用型產品WAI,以及和金蝶、金山辦公一起研發的專屬領域大模型產品。
在這個新的團戰背後,大模型正在以更加真實的姿態出現在各個產業場景和各個企業應用中,不僅是金融、能源,也不僅是大型的央國企,在如今百度智能雲千帆的底座之上,越來越多的產業場景和越來越多體量的企業都正在齊力邁出AI大模型時代的第一步。
此外,從更大的視角也同樣能清晰看到的是,這些產業的真實表達也恰在構成着大模型企業的產品和營收新增長飛輪。
根據不完全統計,截至目前,**百度智能雲千帆平台上有103款Prompt模板,包含對話、編程、電商、醫療、遊戲、翻譯、演講等十餘個場景。**其中既有基於百度智能雲在產業實踐中積累的Prompt模板,也有來源於文心一言高頻用户的Prompt模板。可以預見的是,作為大模型訓練中最核心的環節之一,這些Prompt模板將使得千帆更容易被企業和市場歡迎。
而在財報層面,根據百度發佈的2023年Q2財報顯示,第二季度百度營收341億元實現加速增長,淨利潤高速增長44%。此外,由《IDC中國AI公有云服務市場份額,2022》報告數據顯示,2022年中國AI公有云服務總體市場79.7億元,其中百度智能雲佔28.9%排名第一。
或者可以説,在AI大模型在成為各個產業基建企業驗金石的同時,它也更在成為一個新的發動機。
進度仍在持續推進。在接下來的9月5日,百度智能雲還將在2023百度雲智大會上宣佈四大配套舉措。
據內部人士透露,在此次大會上,百度智能雲將全面升級“千帆大模型平台”,升級將覆蓋算力基礎設施、大模型工具鏈、高質量數據集等等。此外,其將推出基於文心大模型重構的行業解決方案,同時還將發佈覆蓋服務營銷、辦公提效、生產優化三大領域的10款企業級的AI原生應用產品。大模型相關的生態政策也將在大會上同步披露。
或許再來回答前面那個問題,即“我們需要怎樣的一個大模型?”——這不僅是一個對企業而言,尋找最佳選項的命題,也更是對大模型企業而言,錨定未來和自證的長期思考。
恰如百度相關負責人在採訪中所説,“未來肯定還會有更多AI產品,或許這些產品不是百度開發出來,但企業都可以基於百度智能雲千帆開發出來,這是我們想要的,也是會一直持續去做的。”
答案,已經在成形的路上。
*文中李亮為化名