如何更好的推動機器學習應用?數據才是硬道理
作者:勃潺
【環球網科技報道 記者 勃潺】哪個才是實踐人工智能最好的企業?傳統企業。如何更好推動機器學習的應用?準備好數據。這是上海音智達信息技術有限CEO孫曉臻給出的兩個答案。
作為一家成立於2011年,專注於分析預測與行業應用的大數據公司,音智達一直為用户提供基於大數據技術的預測性分析及商務智能解決方案,旗下主要有頂尖大數據軟件產品、基於大數據技術的預測性分析和BI商務智能解決方案、數字化轉型相關的諮詢服務等三大業務,業務涵蓋生命科學、快消品、汽車、零售、電子消費產品等領域。
然而,隨着客户多元化需求的不斷增長,以及行業環境的不斷變化,音智達不得不開始尋求與合作伙伴一起協作來共同推動業務的發展。
孫曉臻在接受記者採訪時介紹:“對於我們公司來説,挑戰是非常明確的,主要包括四個方面的問題:一是人才的招聘和培養非常不容易,並且因為市場越熱,人才流失率也越高;二是開發技術難度越來越大,因為現在的技術架構已經和五年前十年前完全不同;三是部署和運維的成本很高,但客户通常又不願意為之付出很多價格;四是缺乏好的、有性價比的平台。”
近年來,越來越多的企業客户選擇亞馬遜雲科技託管雲基礎設施,並實現性能、安全性、可靠性和可擴展性的提高。這其中就有很多的客户,原本都是音智達多年來的服務對象。這在選擇合作伙伴方面,給了音智達很強的一個參考。
孫曉臻表示,一方面,音智達意識到未來數據平台最重要的趨勢就是上雲,並且非常迫切地需要一個強有力的合作伙伴體系來支撐;另一方面,亞馬遜雲科技也需要合作伙伴,特別是像音智達這樣,在各行各業都有着豐富數據服務經驗的企業。因此雙方一拍即合,音智達很快成為了亞馬遜雲科技的高級合作伙伴,並且還是首批獲得AI/ML合作伙伴能力認證的公司。
2020年音智達獲得亞馬遜雲科技AI/ML能力認證,並基於Amazon SageMaker完成了端到端的ML任務。
據瞭解,Amazon SageMaker是亞馬遜雲科技推出的機器學習平台服務,可以幫助開發者和數據科學家快速地規模化構建、訓練和部署機器學習 (ML) 模型。作為一個開放的平台,Amazon SageMaker的推出讓數據科學家、算法工程師、業務開發者都能輕鬆駕馭機器學習。此外,Amazon SageMaker擁有的工具橫跨整個機器學習開發生命週期,能夠幫助數據科學家的效率提升10倍,降低機器學習總體應用成本高達54%。
作為合作伙伴,針對大數據分析相關的問題,音智達可以為使用亞馬遜雲科技服務的企業實現定製化的雲上智能存儲、建模和部署,將更多的客户業務遷移到雲端,助力客户實現數字化轉型和創新。
在聊到Amazon SageMaker的使用體驗時,孫曉臻説道:“無論客户的答案是什麼,只要將Amazon SageMaker結合其他PaaS服務,不管架構怎樣千變萬化,都可以在亞馬遜雲上非常快速地構建起來。過去十年裏,我們大部分的解決方案都是本地化的,圍繞Hadoop生態需要千變萬化地搭積木,每個不同的業務場景都不可能套用一個生態,每次都需要不一樣的組件。而Amazon SageMaker結合亞馬遜雲科技的Amazon EMR、Amazon S3,就可以針對各式各樣的業務場景,組織出不一樣的技術架構,來滿足不同用户的需求。”
“Amazon SageMaker是一個非常優秀、面向數據科學家的機器學習服務平台。從項目需求的理解,到模型的搭建和生成,以前我們的項目實施是以月為時間單位,但現在是以周為時間單位,極大地壓縮了時間成本。客户對人工智能的期望值也變得越來越高。現在客户中誰意識到了數據的痛點,誰認識到運維很難再升級擴容和發展,誰就越迫切地告訴我想要用Amazon SageMaker。”孫曉臻透露,“一方面從客户案例來説,我們在客户的商機挖掘上效率比過去提升了50%以上,獲得了更多的機會;另一方面從業務本身來講,我們也有高達30-40%的顯著增長,因為AmazonSageMaker這個一站式平台把許多工程師、架構師的工作都簡化了,所以顯著提升了數據科學家的工作效率。”
目前,亞馬遜雲科技的服務擁有超過200多種,包括,計算、存儲、網絡數據庫、分析、IoT、AI/ML和安全。全球有數以十萬計的客户在使用亞馬遜雲科技進行機器學習,92%的TensorFlow雲上工作負載和91%的PyTorch雲上工作負載都在亞馬遜雲科技上。
“時至今日,應該再沒有客户會認為,自己沒有數據也能夠把業務做好。但也並不是所有的客户在有了數據之後,都能夠把自己的業務做成功。”孫曉臻表示,“以前説起人工智能,大家第一時間可能都會想到互聯網企業,但是現在人工智能應用最多的,恰恰是許多傳統產業。因為很多傳統產業都有數據驅動,譬如音智達服務的客户,很多都是五百強的頭部企業。五年前他們的數據量平均是10TB,五年後平均數據量基本上都已經在200TB以上,好的公司數據量甚至有1PB。既然有如此豐富的數據,那麼人工智能就可以為企業帶來非常大的價值。”
這些傳統企業真正在實踐人工智能技術的應用,而人工智能技術也需要更廣泛的普及和推廣。同時,Amazon SageMaker代表了一個很重要的選擇,孫曉臻認為它的發展會很快。“有一個很重要的點是,它確實帶來了效率的提升,做項目的週期顯著縮短了。從一個項目需求的理解、到模型、到生產,我們現在基本上是按照多少周出一個系統來談,以前像這樣的事情都是按月來談的。”
從行業發展來看,企業如果想推動機器學習的應用,最關鍵的還是要在數據上做好準備。“傳統行業有很多歷史的數據沒有留存,這對於數字化轉型來説當然是障礙。所以互聯網會走在前面,是因為它數字基因,但傳統行業不是。所以位列第一的挑戰當然是數據。”孫曉臻表示:“作為我們來講,我們的挑戰是人才,是算法的開發難度,是部署的運維的問題。”
孫曉臻對未來的發展充滿信心:“總體上來講,我們數據科學家團隊的業績今年一定是增長的。但是沒有到很爆發的階段,這是我們期望接下去的一個發展的過程。”