暢想大模型之前,數據飛輪才是企業的“基本功”_風聞
极客公园-极客公园官方账号-04-20 07:16

數據飛輪,一張通向生產力升級的「船票」。
文 | 張鵬
天天新聞裏都在説「大模型時代即將到來」,中國企業界也正在用非常快的速度,意識到生產力又要發生變化了。但這個時候,最重要的可能不是趕新潮,而是趕緊看看自己的基本功——數據。
作為繼土地、勞動力、資本和技術之後的第五大生產要素,數據的重要地位不言而喻,但根據 Gartner 的研究報告,目前仍有 68% 的企業數據沒有被用來分析、使用;高達 82% 的企業仍處於數據孤島之中。
這其實是一個很嚴重的問題。數據是一切智能化的基礎,如果不能將自己的公司業務和經營建立在數據之上,就意味着無法參與到未來令人期待的 AI 生產力升級之中。
眾所周知,字節跳動是一家把「數據驅動」刻進了骨子裏的企業,當年今日頭條、抖音剛推出時,名字就是經歷了 A/B 測試後才最終確定的。最近我觀察到字節旗下的火山引擎剛剛發佈的一系列新的數據智能產品,提供了一塊「能力跳板」。這基本上將字節內部的數據驅動理念,轉化為可落地的產品服務,我覺得這是一個幫助國內更多的企業完成「數據躍遷」的重要能力,甚至是一張通向生產力升級的「船票」。
更重要的是,我看到在 4 月 18 日的火山引擎原動力大會上,火山引擎除了發佈全新的管理駕駛艙 Plus、升級後的湖倉一體分析服務 LAS 等工具外,還給出了企業生產力升級的正確姿勢——數據飛輪模式。
到底什麼是所謂的「數據飛輪」?「數據飛輪」要解決哪些問題?
最近我和火山引擎內部的同學聊了聊,發現這背後其實還是字節「數據驅動」理念的世界觀和方法論的又一次外溢,很值得聊一聊。
01
數據飛輪需要
「看的清,做的對,跑的順」
火山引擎在去年曾經提出過雲上增長的三要素是「體驗創新」「數據驅動」和「敏捷迭代」,其中「數據驅動」是最核心的一個環節,也是今年「數據飛輪」提出的起源。
聽火山引擎的同學介紹,「數據飛輪」的核心是「數據消費」,也就是通過數據消費來促進決策加速、推動快速行動,進而提升業務價值;與此同時,業務的蓬勃發展也將帶來更大規模、更多種類數據,這也將反過來推動企業做好數據管理和質量優化。簡而言之,「數據飛輪」就是將數據生產、數據應用、數據消費三大環節有機結合起來,並且通過一系列的數據工具實現三者之間的往復轉動。
火山引擎這次提出「數據飛輪」主要想實現的是:「用數據驅動業務提升,用業務推動數據提效。」
這很容易讓人想到以往的「數據中台」概念,但是與僅僅將企業的各類數據加工成統一的數據資產不同,「數據飛輪」更想幫助企業形成看得見、摸得着的業務實效,通過是業務與數據達成互動關係,形成數據飛輪持續轉動所帶來的業務價值。
拆開來看,「數據」和「業務」是「數據飛輪」的兩端,這兩者是互為目的、彼此服務的。頻繁的數據使用,可以使得業務在做決策和運營的時候,更快更有效;而業務價值的提升也會帶來更多優質的迴流數據,倒逼數據建設與管理上的優化升級。
但理念再怎麼解釋也是抽象的,要想使「數據」與「業務」之間形成循環往復的飛輪閉環,我們討論後一致認為這需要達成兩個前提:一個是要有可用的數據;一個是要有能讓數據運作起來、產生實際價值的系統與工具。
有可用的數據當然是最基礎的,但大家經常忽視的一點是,怎樣能讓大家都看懂數據。
要使數據真正融入業務之中,就要擺脱「數據只是給程序員看的」這一誤區,轉而讓公司各個角色、各個層級的人都能看懂並使用數據,如果沒有這個第一步,那企業就很難搭建起屬於自己的「數據飛輪」。
火山引擎的同學對於這一點明顯有着成熟的認知,火山引擎數據產品負責人郭東東告訴我,不同職位的人對於數據的需求是不一樣的,決策層的需求是實時掌握業務動態,中層執行層更多是以 OKR、戰略目標來關注自己所負責部分的業務情況,最基礎的執行層更注重的則是使用數據的效率問題。
針對不同的角色,火山引擎陸續推出了很多對應的工具。今年火山引擎將重點放在瞭解決管理層的數據需求上面,推出了管理駕駛艙 Plus,目標是幫助管理者實時觀測戰略目標的達成進度,更方便、直觀地瞭解公司業務數據。
過去我們很多企業的「數據驅動」其實還是以 PPT 分析彙報為主,但是這樣做的問題在於彙報邏輯的不同很可能會導致大家對業務的不同理解,一些業務數據看着很健康,換個角度,可能就是大問題。而管理者還是希望能更全面地掌握信息,避免信息斷層,同時更直觀地看到業務哪裏有問題,哪裏可以繼續推進。
所以好的 CEO 平時管理公司業務時需要處理的數據很多,數據的維度也很多,如果有一個「駕駛艙」可以幫我梳理公司業務數據,通過把各項指標串聯起來分析業務運行的健康程度,那我就只需要時不時關注一下就可以了,就不用耗費開會聽彙報的時間了。
而我的 N-1 團隊,估計會更加歡迎這個功能,因為我不用老煩他們去做數據彙報,他們之前折騰半天去準備,預約時間去彙報討論,和我在駕駛艙看到問題或者疑問,直接針對問題和他們展開即時討論,然後最終再能追蹤結果相比,後者會節約大量彼此的時間。
據我所知,字節內部早就在使用這套工具了,像抖音等業務的負責人會通過管理駕駛艙 Plus 來把控業務的整體情況,再確定今年是要做增長還是做留存。但在一些較為傳統的行業裏,很多管理者並不是真正的在用數據的思路來定義自己的業務,所以火山引擎這次推出新產品,很大程度上也是希望培養管理者使用數據、用數據驅動實際業務的 sense。
有了數據意識,接下來的事情就是搭建起能讓數據運作起來的工具和系統。
過去大家比較熟悉的可能是字節出名的 AB test,自從給 B 端客户開放了火山引擎 DataTester 後,很多金融、互聯網行業的客户都在使用,比如平安銀行就是該工具一個重度用户,經常通過 AB test 來測試 App 的 Tab 欄該如何設計才能吸引用户。
但在應用的過程中,火山引擎數智平台的產品研發們也發現了些問題,其中很重要的一點是以往的 AB test 這個理念很容易被接受,但具體到應用場景中怎麼設計出科學、合理的 AB 實驗也是「攔路虎」。因此這次火山引擎對於 DataTester 的升級有點類似於「輔助駕駛」,工具能自動決定怎麼去做投放、怎麼去調整,比如你告訴工具你關注的是點擊率,系統就會自動將流量調整到點擊率更高的方案上。
除了以往應用工具的升級外,這次火山引擎在基礎設施上也更進一步,升級了湖倉一體分析服務 LAS,一個更為底層的全託管大數據分析服務,目標是使數據服務門檻更低、更智能、更自動。
這個目標同樣也是目前客户最大的需求。據火山引擎的同學觀察,近年來客户的需求明顯經歷了一個變遷:幾年前大家都還吵着要有自己的引擎,要自己搭建數據系統,但是隨着近年來公有云的增多,越來越多客户開始希望能有一個免運維、全託管的系統把底層系統搭建起來,自己只需要在上層「搭積木」就好了。
基於這個背景,火山引擎的同學們做了大量優化升級,湖倉一體分析服務 LAS 能夠更好地幫助客户一站式完成數據的計算、存儲、分析,甚至你每天的工作量什麼時候重、什麼時候輕,系統可以自動做一些資源的適配,保證你的工作效率。如果用一句話來解釋這個服務的厲害之處,那就是「用得越久性能越快」,因為系統可以慢慢地通過歷史數據掌握核心運行規律。
從數據到業務,從業務再到數據,正是有了工具和系統作為中間渠道,確保了數據閉環,「數據飛輪」才能轉動起來。
02
利用好字節
「數據驅動」能力的外溢
對於火山引擎把「數據飛輪」放在如此重要的地位上來推動,我是不意外的。
**張一鳴過去經常説要把公司當做產品去做,產品背後一定是有自己的一套世界觀和方法論的。**字節原本就是一家天生的數字化公司,以「數據驅動」理念孵化出了今日頭條、抖音,數據實踐的過程中也逐漸開發出了一套「數據驅動」工具,這次和火山引擎的同學聊過之後,我對於字節內部的數據實踐是如何展開的也有了更深的理解。
2014 年字節剛開始做數據平台建設時先是聚焦了當時業務目標、業務痛點,研發出的是能直接解決問題的工具,到 2018 年,隨着內部數據量的飆升和業務複雜度的提升,字節才重點投入建設數據基礎層。字節的數據驅動理念給火山引擎提供了很重要的實踐經驗,慢慢地,數據治理平台、數據處理與分析服務等開始通過火山引擎對外服務。

而之所以在這個時間點,火山引擎將「數據飛輪」抽象成理念並在原動力大會上提出來説,原因也很簡單,就是「時候到了」。
在過去與客户的接觸中,火山引擎團隊發現雖然很多公司也有「數據中台」的理念,但是很多情況是數據中台僅僅只是將數據彙集在一起,並沒有實現接下來的數據打通、數據資產化,因此很難對業務產生實質的影響。於是,從 2021 年開始,火山引擎逐步將字節內部的數據能力以工具和雲服務的形式給到 B 端的客户,希望能幫助更多企業擺脱「有數據但不會用數據」的困境。
經過兩年的「對外輸出」、彼此交流後,最近火山引擎的新發現是「大家對於 Serverless(無服務器運算)的訴求越來越強」,「只有將數據應用層、數據建設層聯合起來才能更好地發揮數據飛輪的價值」。
火山引擎試着將上述洞察融入產品服務。在與一個頭部銀行的合作中,通過將銀行的數據建設和數據營銷這兩個分屬不同產品矩陣,但在應用時會彼此影響的數據工具一次性建設、聯動起來,從工具層面幫客户避免了之後可能會出現的數據應用難題。
一個更具體的火山引擎幫助企業搭建數據飛輪的例子發生在汽車行業。
汽車研發過程中產生的大量數據很多企業是通過 Excel 表格進行記錄、總結和分享的,這樣做難免會出現數據丟失、無法對齊等情況。為了解決這個問題,火山引擎先是給車企客户推薦了 DataWind 這類可以幫助車企快速的製作報表以及直觀看數的智能數據洞察工具,大概幾個月過去,這家車企裏使用該工具的人數就突破了 1000 人。

之後隨着數據工具使用的場景越來越多,平時被忽視的一些數據管理和治理的痛點慢慢暴露,於是接下來火山引擎又給他們推薦了大數據研發治理套件產品 DataLeap,幫助對方更好地實現數據與業務之間的循環運作。最近火山也有計劃再和對方談談徹底將數據打通,通過新推出的管理駕駛艙 Plus 去更好地把控整體業務的運行情況。
不難發現,火山引擎通過一系列數據產品、服務幫助其他企業搭建「數據飛輪」的過程,是將字節的數據實踐經驗對外整體輸出。
我個人看到火山引擎能將字節在「數據驅動」思想下進行的數據實踐向外擴散,並變成一個一個科學、高效的體系還是很興奮的。畢竟,未來的大模型時代肯定還會湧現出更多的技術創新和生產力升級,但是如果一個企業本身還不是跑在數據上的公司,那麼新時代「可能的紅利」就會全部變成「確定的衝擊」。
這是個不進則退的時代,練好基本功,才會有船票。
*頭圖來源:視覺中國
本文為極客公園原創文章,轉載請聯繫極客君微信 geekparkGO