智能,服務,生態:華為調製的AIOps,味道有何不同?_風聞
脑极体-脑极体官方账号-从技术协同到产业革命,从智能密钥到已知尽头2021-09-29 16:13
追蹤AI技術這麼長時間,我們親眼見到了許許多多的職業,工作環境因AI而變得更好。
昔日在高空連續工作的吊車司機,變成了可以遠程操作的“空調哥”“空調姐”;曾經風裏來水裏去的巡檢工,工作強度因為智能監控系統而輕鬆了不少……
然而,還有一種隱形的重複類工作很容易被忽視,那就是IT運維。
可能在很多人眼裏,運維人員只需要在系統宕機、電腦壞了的時候擔任“救火隊員”即可。但隨着IT系統規模越來越大、網絡複雜度越來越高,傳統的運維工作正在變成了高強度且枯燥的工種。運維人員在日常巡檢中需要重複上千次抄表,每天要面對並處理成百上千次告警通知……
據説每個運維人入職時的期待,就是喝着咖啡做運維,蹺着二郎腿就把工作做好了。然而年復一年,儘管運維輔助工具也在迭代,但始終趕不上數字化進程快、企業業務變化大,別説“咖啡運維”了,晚上能少收到幾個告警工單就謝天謝地了。那麼,AI能為他們帶來改變嗎?
剛剛過去的華為全聯接大會上,華為就為企業運維人斟上了一杯“咖啡”,發佈了AIOps服務。
AIOps(智能運維)一直被看作是下一代運維模式,這杯由華為調製的運維“咖啡”,又是什麼味道的呢?
品味一番會發現,前調是智能,與AI相結合的AIOps帶來了顛覆傳統運維的體驗;中調是場景,智能技術與業務場景的有機結合,讓AIOps服務品起來更加和諧絲滑;後調是生態,要能兼容各種網絡協議、設備,才能讓不同口味的運維人員都收穫驚喜。
通過這杯咖啡,我們來一起品一品數字時代的運維之變。
前調:氤氲智能的香氣
我們都知道,AI尤其是機器學習算法,非常適合處理重複性、預測型、大數據的工作,恰好指向了當前運維工作的核心挑戰:
1.ICT網絡不斷迭代發展,系統日趨複雜,PB級海量數據成為常態,有的運營商甚至面臨2/3/4/5G四世同堂的網絡局面,運維對象越來越多,運維人員不得不忙於應付大量告警和重複工作,而無法將時間放在運維策略建構等更有創造力和價值的工作上;
2.新服務、新技術帶來了更多的維護場景和要求,容器化、虛擬化、分佈式服務、多雲管理等等,讓運維人員在故障定位、日常巡檢等工作中身心俱疲,面對問題時往往需要花費很長時間來決策,要保證系統的高可用、高可靠、高效率十分困難;
3.萬物互聯、千行百業的數字化升級,帶來了錯綜複雜的IT設施種類,從硬件到軟件如果沒有整合監控,運維工具各自孤立,缺少統一集中的監控管理機制,運維專家在統籌決策時也容易出現混淆,不得不處於時刻待命的“救火狀態”。
因此, Gartner在2016年提出的AIOps概念,即 Artificial Intelligence for IT Operations,倡導將人工智能應用於運維領域。有以下好處:
第一,AI智能體能夠從日常的運維大數據(日誌、監控信息、應用信息等)中總結規律,根據當前的環境自動分析;
第二,AI算法會在特定場景下,第一時間發現指標異常,進行故障精準分析與定位,自動觸發修復機制,將故障進行恢復,減輕運維人員的工作負擔;
第三,故障修復之後可以自動覆盤並沉澱為知識資產,進一步優化迭代算法,形成千人千面的智能運維工具。
由此,也就真正能將運維人員從重複性工作中解脱出來,讓“咖啡運維”的夢想照進現實。
中調:深入場景的甘甜
聽起來,AIOps簡直是運維人員的明日之光。Gartner也曾預測,到2022年AIOps 的採用率將會達到 50%。然而現實中,落地速度卻並不像預期中那樣迅猛。是什麼讓運維人員“只聞其香,難嘗其味”?一個詞:開發。
AIOps離不開人工智能兩大要素:數據與算法。一般來説,支撐業務的AIOps工具,需要結合企業自身的運維框架、策略,投入運維大數據,進行針對性的模型開發和訓練,才能保證算法的精準度。
但現實很骨感,企業中具備AI專業知識的綜合性運維人才十分稀缺,即便引進了相關人才,也需要花費大量時間來梳理多源異構的大數據,針對業務場景進行編碼開發,耗時不説,最終的模型效果還不一定理想,這些客觀問題都阻礙了AIOps在產業側的落地應用。
因此在華為全聯接大會上,華為正式發佈AIOps服務,聚焦網絡智能運維,降低AI開發門檻。此次發佈的AIOps服務有三個特點:
第一,紮根場景,適配需求。此次發佈的AIOps服務結合了華為30多年的網絡運維和場景理解經驗,覆蓋MBB/FBB、園區網絡、數據中心網絡、IT應用四大領域,和故障預測、檢測、診斷、識別等環節,異常識別與故障診斷準確率達90%,能夠滿足絕大多數企業的日常運維需求;
第二,簡單易用,降低門檻。華為AIOps服務沉澱了10多個開箱即用的智能APP模板,用户只需配置數據源,即可啓動APP運行,將AI應用的開發部署過程縮短到分鐘級;預集成了20多個高質量的AI原子能力,覆蓋預測、檢測、診斷、識別等網絡運維場景,只需要簡單拖拽,系統就能自動完成節點間的數據銜接,自動推薦下個節點,不需要用户從組件庫中反覆篩選驗證,大大降低了應用開發門檻。
第三,可視化定製,提升效率。華為AIOps服務還提供了80多個2D/3D可視化組件,開發人員很輕鬆就能DIY出一個包含趨勢、報表、網絡關係等元素的可視化大屏,讓業務結果直觀、快速地呈現出來,有效減少運維人員決策、處理的時間,並確保資產的整體管理和精細化運維,可以提升業務系統的SLA,為企業降本增效,讓運維數據這一重要資產發揮出更大的價值。
説了這麼多,大家一定很好奇:AIOps到底怎麼用?我們可以看一個真實的運維案例,瞭解AIOps服務如何給企業和用户帶來價值。
試想一下,如果一個用户剛剛辦理了尊貴的5G套餐,卻突然間上不了網,運營商會不會就此損失一個高端客户?隨着核心網承載量越來越大,監控指標多,傳統靜態閾值檢測存在漏報誤報的問題,一旦出現故障沒有及時排除,對用户體驗影響極大。
去年7月10日,某供應商將DNS腳本的指向配置錯誤,影響了某運營商8個城市2000多5G用户數據業務。幸好藉助華為核心網KPI異常檢測APP,提前5小時發現了問題,併發送了告警短信,降低了業務損失,保證了5G高端用户的網上衝浪體驗。
異常檢測精度高,故障定位回覆效率高,智能運維應用適配業務場景,變被動響應為主動運維……這正是華為AIOps服務的價值所在。
後調:擴散生態的温度
而更進一步,華為賦予了AIOps悠長的後調,即建構了值得長期品味的AI生態。
在本屆華為全聯接大會中,華為網絡人工智能產品部AI模型與訓練服務部部長王晶提到,“華為AIOps旨在降低ICT領域AI應用開發門檻,將AI技術帶入運維預測、檢測、診斷、識別、優化等每個環節,賦能合作伙伴創新,共同建設智能運維生態,實現商業成功”。
這杯甄給運維人的“咖啡”,為什麼需要聚生態之力來打造?歸根結底源於華為對運維行業的深度把脈:唯有眾智共創,才能快速推動智能運維AIOps時代的到來。
運維市場前景廣闊,根據艾瑞諮詢的預測,2021年中國IT服務有望突破萬億元大關,其中IT運維市場規模將達2941.2億元。這也就導致很多廠商看中了這塊“蛋糕”,紛紛進入,行業創新和實踐不斷湧現。但跨廠家主流設備無法互通,多層次協同難以形成,最終影響的還是客户體驗,從而延緩了智能運維的落地部署。要解決這一問題,就需要以開放心態實現共享,以生態模式促進共同獲益,進而推動智能運維進入良性發展階段。
所以我們注意到,華為AIOps服務另一個餘韻悠長的操作就是:開放。
首先,向跨廠家設備自開放。華為AIOps服務實現了主流設備的自動對接,支持SFTP、Kafka、Rest等通用採集協議,支持華為30類網元、跨廠家100多種主流設備的自動對接,可以滿足端管雲的數據採集需求;
其次,向企業人才、合作伙伴開放。華為自身技術資源向全球企業、運維開發工程師、合作伙伴開放,利用華為的技術、AI原子能力等,可以低門檻、零代碼地開發更多運維應用,構建自身的運維服務能力,開發獨特的運維服務,生機勃勃的應用開發生態快速崛起,將為智能運維的工具創新、能力擴展,打下堅實基礎。
今天,數字化轉型是中國經濟發展、產業升級的最強音,少了高質量、高效率的運維能力,數字化就猶如沙上聚塔,顯得尤為脆弱。從這個角度看,運維人員也早已不再是邊緣化的“救火隊員”,而是網絡安全穩健運行、系統性能最優化、組織生產力最大化的“神助攻”。
而華為打造的智能底座,正有力地託舉着運維人的智能憧憬,讓他們終於能夠放心地飲下這杯香氣四溢的“咖啡”。