萬億數字化市場,數據科學為何能扛起“價值擔當”?_風聞
大数据在线-2022-12-15 22:52
數據科學家,被譽是“21世紀最性感的職業”。
如今,一股數據科學的熱潮正席捲國內各大高校。今年十月底,一系列數據科學的網絡直播課在多所大學火爆異常,吸引來自北大、清華、北師大、哈工大、浙大等多所高校學生廣泛參與。
該系列網絡課堂是數據科學產教融合計劃下的一項公益活動。在教育部產教融合號召的大背景下,數據科學產教融合計劃脱穎而出,該計劃由國內數據科學領域明星企業、多所高校共同發起,旨在促進數據科學從業人員能力的整體提升,為數據科學產業發展提供人才保障。
數據科學火爆的背後,恰恰源自近年來數據科學市場的迅速崛起。隨着數字經濟快速發展、數據成為最重要生產要素,數據科學的價值在產業數字化中加速得到彰顯,使得數據科學成為萬億數字化市場中當之無愧的“價值擔當”。
數據科學:黃金時代下的“人才尷尬”
世界經濟論壇(WEF)《新經濟下的數據科學—第四次工業革命中的數據科學人才競爭》報告指出,數據科學在未來將是多個行業關鍵的基礎技能。
數據科學是什麼?為何它能展現出如此強的魅力?
Master’s in Data Science網站介紹,數據科學是一個使用科學方法從數據中提取意義和洞察的研究領域,包括了制定數據分析策略、為分析準備數據、開發數據可視化和構建數據模型等方面。
“數據科學的核心是完成三個轉換:把數據轉換為信息,信息轉化為知識,以及用知識去支持決策。它具有綜合性的一系列方法,目標是做數據在業務側的價值實現。”百分點科技集團數據科學研究院院長杜曉夢博士如是説,“數據科學天然與大數據緊密相關,機器學習、運籌優化等都屬於數據科學的分支,但它不包含人工智能仿真、機器人等研究。”
無疑,數據科學屬於一門綜合型學科,綜合了數學、統計學、計算機技術以及領域知識等。數據科學家們往往還需要在這些技術與知識的基礎上,具備溝通和解決問題的能力,能把具體的業務問題轉化為數學問題。
事實上,數據科學一詞最早誕生於上個世紀60年代,2000年之後開始出現數據科學家的職位。隨着2010年大數據概念興起,數據科學逐漸獲得了各行各業的重視。例如,大部分互聯網企業最近幾年均設立了獨立的數據科學團隊;而金融、電信、醫療等傳統行業,對於數據科學人才的渴求度同樣在迅速提升。
數據科學之所以受到前所未有的關注,是因為隨着數字化進程的加深以及數據要素化,數據驅動型組織不再是虛幻的概念,而是一步步轉變為企業的現實目標,數據科學在此過程的價值與作用逐漸彰顯,乃數字化進程中的必然趨勢。
但數據科學的綜合型學科性質,也註定成才難度指數屬於天花板級。當下,數據科學雖然火爆,亦遇到略顯尷尬的局面:一方面,各個行業數字化轉型的深入,產生出旺盛的數據科學人才需求;另一方面,高校雖然重視數據科學人才,但面臨着培養難度大、所學難所用等難題,很難符合企業實際需求。
教育部一位工作人員透露,當下數據科學相關人才缺口是百萬級的,雖然開設數據科學與大數據技術相關專業的高校已達到近700所,不同層次的高校都在加大數據科學的人才的培養力度,但無論人才數量還是質量都與實際需求尚有差距。
南方某985重點大學一位教師直言道:“老師們擅長基本功的培養,但數據科學與實際業務問題的實踐息息相關,學校很難提供這方面的培養,需要高校與產業界共同突破。”
因此,攜手業界領先的數據科學企業,改變傳統培養方式,加入實踐、實操等環節就成為人才培養的突破口。就如數據科學產教融合計劃,由產業界企業將多年的實踐經驗、軟件、工具與案例整體給高校,為高校學生提供脱敏數據、完整工具、前沿經驗等進行實操培訓。
“這幾年,數據科學產業界變化很快,像數據編織、AI工程化等發展迅速。現在產業界做項目的思路、邏輯和方法與三年前是完全不同的。”杜曉夢博士如是説,“數據科學產教融合計劃可以確保將產業界最新、最前沿的實踐和方法傳遞給高校學生。”
據悉,百分點科技集團是國內數據科學領域的代表企業,也是數據科學產教融合計劃的發起者之一,其提供集成全棧技術的數據科學基礎平台,為廣大高校學生提供了實操的真實環境。“與教培軟件產品不同,數據科學基礎平台脱胎於企業級軟件產品,成熟、穩定且不會讓學生有脱節感,一切圍繞真實業務場景展開,並且會定期更新版本。”杜曉夢博士補充道。
如果説,數據科學產教融合是產業發展的必然結果;那麼,數據科學在產品、服務等領域的突破,則標誌着數據科學經歷過泡沫期之後,真正步入產業黃金期。那麼,數據科學市場到底正在發生什麼?呈現出哪些重要的新趨勢?中國數據科學市場又會朝着哪些方向發展?
扛起“價值擔當”,數據科學有這些新趨勢
早在2014年,Gartner就在新技術成長曲線中將數據科學列入膨脹期的末端,並表示未來五年數據科學將逐步應用於生產高地期(plateau of Productivity)。
事實情況的確如預測那樣。隨着數字化進程的加速,數據科學在各行各業數字化轉型中扮演着重要的角色,其市場也獲得了前所未有的成功。聯合市場研究報告顯示,2020年全球數據科學平台市場規模為47億美元,預計到2030年將達到797億美元,複合年增長率高達33.6%。
事實上,市場的快速發展讓數據科學呈現出諸多明顯的新趨勢。首先,市場向上期和巨大的潛力,吸引了不同類型的市場參與者都湧向數據科學市場,這其中既有IBM、微軟等老派廠商,也有AWS、阿里雲等雲服務商,還有像Palantir、SAS、百分點這些堅守數據科學領域多年的專業廠商,甚至不斷湧現出一大批初創企業。
中關村大數據產業聯盟一位專家認為,與機器視覺遇到泡沫化境遇不同,數據科學市場的潛力遠未爆發出來,國內外相關企業可成長與發揮的空間明顯更大。例如,Aporia、Black Crow AI、Comet、dotData、杉樹科技等國內外創業公司近年來普遍獲得了資本市場的青睞。
數據科學第二個重要的趨勢無疑就是端到端的數據科學應用平台,平台與工具加速走向集成化、工程化、自動化。Gartner在《2021 數據科學與機器學習(DSML)平台魔力象限》報告中認為,數據科學與機器學習平台必須實現全生命週期的數據科學活動,並且具備集成第三方組件、框架的能力。
Gartner認為,數據科學與機器學習平台未來重要的發展趨勢包括:自動化或增強數據處理、模型構建、在線服務的各項工作;多人協作是用户使用數據科學的剛需;開放性,如與開源工具的廣泛集成能力等。
事實上,數據科學在產品層面的新趨勢並不是無跡可循。一方面,企業數字化轉型所面臨的數據環境、業務聯繫、數據處理鏈路加速走向複雜化,加速了數據科學平台化的需求;另一方面,隨着各大企業的數據科學團隊配備走向規模化和正規化,數據科學團隊往往需要工程化程度高的平台來屏蔽基礎工作的複雜度,提升數據應用創新的效率。
當下,有預見性的領先廠商均在瞄準端到端的數據科學應用平台。例如,AWS在今年re:Invent大會上詳細介紹了其端到端數據戰略,推動數據處理、分析與應用走向高效化和自動化;其他像Palantir Foundry和Apollo、SAS Viya等均為平台化思路的產品。在國內,百分點科技等國內廠商亦在端到端數據科學平台的代表。
“過去,大家都是在各個行業中探索數據價值大多數屬於項目型,往往會研發出各種半工具化的產品。如今,數據科學公司自身多年行業實踐與打磨之後,工具產品走向成熟,具備了走向平台化的基礎;另外,從用户數字化轉型的需求來看,端到端的數據應用需求是大勢所趨,更加需要集成化、工程化、服務化的平台來滿足用户需求。例如,像高度集成、開箱即用的一體機形式,在各大雲平台的雲版本等,都是數據科學平台不斷發展的體現。”百分點科技集團首席技術官劉譯璟解釋道。
第三個重要趨勢,數據科學正加速在各大傳統行業的應用與落地。除了互聯網企業在幾年前就陸續將數據科學團隊部署到業務之中外,像金融、航空、製造、醫療等行業龍頭的數據文化、組織架構以及數據思維都在不斷成長,積極推動數據科學在業務場景中的應用。
而數據科學平台化的產品趨勢,有利於行業複雜業務能力的沉澱與賦能,進一步降低了數據科學在行業用户中的門檻。例如,國內像華為雲、百分點科技等數據科學代表公司,都在強調其對於行業業務模型的沉澱與積累,行業用户無需從頭投入,加速了端到端數據應用的落地。
一位製造業的數字化負責人直言:“同行經過業務驗證過的業務模型很有價值。通過借鑑,再結合自身情況,對於我們業務場景的數據應用能夠少走彎路。”
中國數據科學市場或迎爆發
與國外市場相比,中國數據科學市場的增長速度和市場潛力更值得期待,未來幾年或迎來爆發期。
當下,中國數字經濟的快速發展給中國數據科學市場夯實了前景廣闊的外部市場環境。尤其是近年來數據要素化的步伐在提速,對於數據流動、共享、分析與應用帶來更多便利。今年六月,中央深改委審議通過《關於構建數據基礎制度更好發揮數據要素作用的意見》,再次強調促進數據高效流通使用、賦能實體經濟以及加快構建數據基礎制度體系。
另外,經過多年的信息化與數字化建設,中國各個行業的數字化轉型正在開啓新的階段,很多行業用户在數據採集、治理等方面完成階段性工作,數據驅動型業務成為接下來的主旋律,數據科學在其中的作用與價值將會愈發突出。
以數據量最豐富領域之一政務領域為例,國務院十月發佈的《全國一體化政務大數據體系建設指南》指出,隨着數據治理階段性工作結束,在2023年底前,全國一體化政務大數據體系有望初步形成,接下來重點是基於數據的應用與創新。
更加重要的是,中國數據科學的產業生態正在穩步形成和高速發展。生態中既有像阿里雲、華為雲、AWS雲服務平台商,也有聚焦數據科學領域多年的專業廠商,更有像運籌優化求解器、機器學習平台、BI等數據科學細分領域眾多初創企業。例如,百分點科技就是國內聚焦數據科學領域多年的代表,其在政務、融媒、公安、應急管理等多個行業紮根多年,一直推動數據科學在各個行業的應用與實踐。
在數字化人才方面,教育部未來計劃投入4000億進行數字化人才培養,很重要的方向之一就是聚焦大數據、人工智能、數據科學相關的人才培養,未來有望解決數據科學領域人才匱乏的局面。
總體來看,數據科學在過去五十多年裏一直都在坐“冷板凳”,外部條件和市場環境的限制,使得數據科學並未受到重視和充分發揮價值。隨着大數據的興起以及數據要素化的提速,數據驅動的需求走向井噴,數據科學也真正迎來了“春天”。面向未來,數據科學有望在更多行業與場景中發揮更大作用,在數字化轉型中扛起“價值擔當”。