AIOps應用到整個運維領域會有一定的價值

運營維護階段需要采集客戶端以及后端性能數(shù)據(jù),采用拓撲實時大屏幕,對用戶體驗進行實時監(jiān)控,大屏幕、瀏覽器用戶體驗和大屏幕,深入分析應用程序的端到端性能,并建立企業(yè)業(yè)務管理座艙,以進行業(yè)務應用與IT系統(tǒng)的關聯(lián)分析。

大數(shù)據(jù)運營階段必須部署大數(shù)據(jù)核心平臺,支持IT、網(wǎng)絡、私有云等數(shù)據(jù)的訪問,建立IT基礎設施監(jiān)控和大屏、和私有云平臺可視化大屏,部署統(tǒng)一告警平臺,進行大屏幕、私有云等大屏幕進行大數(shù)據(jù)管理。

運營維護階段需要采集客戶端以及后端性能數(shù)據(jù),采用拓撲實時大屏幕,對用戶體驗進行實時監(jiān)控,大屏幕、瀏覽器用戶體驗和大屏幕,深入分析應用程序的端到端性能,并建立企業(yè)業(yè)務管理座艙,以進行業(yè)務應用與IT系統(tǒng)的關聯(lián)分析。

智能化操作階段要求部署機器學習平臺和深度學習平臺,以更好地預測IT資源,預測用戶體驗和預測用戶保留能力,以及應用健康對商業(yè)影響的預測等等。

一個完整的云智能體系結(jié)構(gòu)主要分為三部分:

大數(shù)據(jù)采集部分:建立一套針對硬件設施、網(wǎng)絡、主機系統(tǒng)、關鍵業(yè)務監(jiān)測、分析、日志采集等大數(shù)據(jù)采集平臺,使得它能快速地采集和顯示監(jiān)測對象的基本信息及其運行狀態(tài),對各種硬件、網(wǎng)絡、主機系統(tǒng)和關鍵業(yè)務的健康度能全面、準確地評估。

數(shù)據(jù)挖掘部分:構(gòu)建大型數(shù)據(jù)提取標準、管理和建模平臺,通過與之配套的各種大數(shù)據(jù)處理工具,選擇相應角色所需的信息;操作策略及操作行為,可自由組合各種界面、大數(shù)據(jù)、功能模塊及處理流程,形成針對此種應用場景的定制化工作平臺;處理并處理大數(shù)據(jù)的數(shù)據(jù)。與此同時,大數(shù)據(jù)不斷沉淀,形成大數(shù)據(jù)運營管理倉庫,提供豐富的大數(shù)據(jù)管理工具、插件,為大數(shù)據(jù)的進一步應用提供支持。

大數(shù)據(jù)應用部分:從海量的數(shù)據(jù)沉淀中,通過成熟的大數(shù)據(jù)分析模型和智能算法,為相關人員提供重要決策大數(shù)據(jù)依據(jù),在《決策》《管理》《實施》三個角度對“網(wǎng)絡”、“數(shù)據(jù)中心”、“應用”、“安全”、“運營”五個維度進行大數(shù)據(jù)建模,最終實現(xiàn)多維大數(shù)據(jù)的組合分析,輔助大數(shù)據(jù)決策,為大數(shù)據(jù)的運營管理提供支持。

隨著IT行業(yè)的發(fā)展,服務器規(guī)模不斷擴大,業(yè)務場景日趨多樣化,這是一個值得關注的問題。此外,在從不連續(xù)的大量數(shù)據(jù)中找出產(chǎn)生故障的根源時,使用了更多的工具,例如,基礎結(jié)構(gòu)和服務采用了開放源碼的監(jiān)控,網(wǎng)絡監(jiān)視用到了軟件,應用性能管理,部分業(yè)務和性能使用日志手段進行監(jiān)控等等。這兩種工具在某種程度上都可以幫助運行人員進行分析,但由于這些軟件之間是分離分離的,如何將業(yè)務變更與IT系統(tǒng)相關聯(lián)是未來研究的方向。

報警是運維人員與系統(tǒng)進行溝通的一種方式,運營人員每天有50%的工作內(nèi)容,只有50%在計劃中。隨著更多的企業(yè)上云,運營工作的范圍正在迅速擴展。失效原因日益復雜,單靠現(xiàn)有經(jīng)驗已經(jīng)無法處理早已不可行,部分故障是已知問題,但由于牽涉面廣暫時不便解決,需要周期性重復處理。

動力告警基線

常規(guī)固定報警基線存在諸多缺陷,如重復觸發(fā),則會產(chǎn)生大量報警,且重復觸發(fā)的報警能掩蓋實際情況?;跉v史數(shù)據(jù)統(tǒng)計值生成動態(tài)報警基線,除了自動生成外,還可以人工創(chuàng)建、修改。

對AI應用到整個運維會有一定的價值,一是更主動地對系統(tǒng)數(shù)據(jù)進行采集,實時感知用戶的實際性能體驗,借助機器學習技術進行故障預測,采用更豐富多樣的告警通知方式。在關聯(lián)的觀點下,能有效地找出問題的根源,根據(jù)時間順序或邏輯,找出多個現(xiàn)象相互影響的關系,將報警聯(lián)系起來,降低了人為篩選無用或重復信息的代價。切入商業(yè)視角,更直接地支持業(yè)務提升,通過大數(shù)據(jù)技術,打破多個業(yè)務間的數(shù)據(jù)孤島,更好地體現(xiàn)IT在企業(yè)中的價值。各種API呈現(xiàn)方式靈活多變,不僅有大屏幕、報表、報表等大數(shù)據(jù)技術,以及大數(shù)據(jù)技術,使實時數(shù)據(jù)呈現(xiàn)成為可能,而且在同一區(qū)域視野下,可以顯示更多維度的信息。

云吶統(tǒng)一運維管理平臺,通過對網(wǎng)絡設備管理、服務器管理、存儲設備管理、業(yè)務應用管理、無線管理、日志分析、辦公設備/聯(lián)網(wǎng)設備、動環(huán)系統(tǒng)等本地和異地網(wǎng)絡的實時監(jiān)控、自動巡檢,精準采集、分析故障信息,判斷重要數(shù)據(jù)性能指標,實現(xiàn)大規(guī)模數(shù)據(jù)中心的集中統(tǒng)一管理。如果對云吶統(tǒng)一運維管理平臺有什么疑問,你可以聯(lián)系在線客服,或直接注冊免費試用云吶系統(tǒng)。

AIOps更有價值

當IT基礎設施運行時,優(yōu)化用戶體驗和業(yè)務操作,實現(xiàn)三個方面能力的提高,那么有沒有必要做更多的事?對于這一問題,我們可以從以下幾個方面做進一步的思考:

交叉系統(tǒng):能統(tǒng)一地對多個系統(tǒng)數(shù)據(jù)進行匯總,并整理出相應的模型,把原來孤立的數(shù)據(jù)孤島聯(lián)系起來。

高效:看不見故障現(xiàn)象,不會割裂,能迅速地在多個現(xiàn)象中,理清因果關系,并迅速地挖掘出根因。

高度精確:最大限度地避免了人為判斷中引入的干擾,使分析結(jié)果的可行性得到極大提高。而且隨著故障處理次數(shù)的增加,能給出相應的處理意見。

針對企業(yè):從最后和最重要的業(yè)務角度出發(fā),自影響業(yè)務的結(jié)果,不斷擴展需要考慮的影響因素?;谠撃P?,可以真正發(fā)現(xiàn)運營和運營數(shù)據(jù)之間的相關性。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論