運(yùn)維自動(dòng)化的關(guān)注點(diǎn)

運(yùn)維自動(dòng)化的目的是盡可能用自動(dòng)化的系統(tǒng)來(lái)替代人的工作,運(yùn)營(yíng)和維護(hù)的價(jià)值最終體現(xiàn)在業(yè)務(wù)中,而實(shí)現(xiàn)此目標(biāo)的方法是運(yùn)營(yíng)服務(wù)化,如果用一個(gè)目前比較時(shí)髦的說(shuō)法就是“運(yùn)營(yíng)即服務(wù)”。

現(xiàn)在是一個(gè)不斷創(chuàng)造新名詞的時(shí)代,周日一個(gè)朋友和我討論一個(gè)數(shù)字孿生的問(wèn)題。他們要上一個(gè)數(shù)字孿生的項(xiàng)目,我聽到數(shù)字孿生這幾個(gè)字就對(duì)他肅然起敬,居然要干這么前沿的一個(gè)事情。我說(shuō)你們真有錢,居然干得起數(shù)字孿生。他很奇怪,說(shuō)沒多少錢啊,也就一百來(lái)萬(wàn)的預(yù)算。當(dāng)時(shí)我就十分奇怪了,居然有人可以用這么少的錢干一個(gè)數(shù)字孿生的項(xiàng)目。仔細(xì)一問(wèn),原來(lái)是建一套3D可視化的系統(tǒng),把生產(chǎn)環(huán)境的一些數(shù)據(jù)傳輸過(guò)來(lái),用3D進(jìn)行展示。把3D可視化項(xiàng)目包裝成數(shù)字孿生這種玩法,實(shí)際上是這些年我們浮躁的IT界常有的事情。運(yùn)維自動(dòng)化領(lǐng)域也是如此,各種新鮮的詞匯不斷出現(xiàn),不過(guò)老白還是更愿意把這些還是稱為運(yùn)維自動(dòng)化。

運(yùn)維自動(dòng)化工作包含部署自動(dòng)化、監(jiān)控自動(dòng)化、告警自動(dòng)化、系統(tǒng)優(yōu)化、SLA保障、IT資產(chǎn)管理等工作領(lǐng)域,要想構(gòu)建一套完整的運(yùn)維自動(dòng)化系統(tǒng)是要做十分大的投入的,很多中小型企業(yè)甚至沒有經(jīng)費(fèi)去構(gòu)建一個(gè)完整的CMDB。另外,運(yùn)維自動(dòng)化系統(tǒng)還需要和ITIL等管理流程平臺(tái)貫通。二十年前,很多大型企業(yè)使用PATROL來(lái)構(gòu)建一個(gè)運(yùn)維監(jiān)控系統(tǒng),使用REMEDY來(lái)進(jìn)行ITIL流程的管理。

這些年運(yùn)維自動(dòng)化也經(jīng)歷了數(shù)個(gè)階段,經(jīng)歷了操作自動(dòng)化、場(chǎng)景自動(dòng)化、智能化運(yùn)營(yíng)等多個(gè)階段。

最早期的運(yùn)維自動(dòng)化是操作自動(dòng)化,把一些需要手工操作的工作固化下來(lái),通過(guò)專用系統(tǒng)或者工具腳本實(shí)現(xiàn)自動(dòng)化的執(zhí)行。這個(gè)階段主要解決一些手工操作效率較低,故障率較高,易誤操作的問(wèn)題。

第二個(gè)階段的運(yùn)維自動(dòng)化是場(chǎng)景自動(dòng)化,就是通過(guò)自動(dòng)化手段實(shí)現(xiàn)一些簡(jiǎn)單或者復(fù)雜的運(yùn)維場(chǎng)景的自動(dòng)化工作,比如狀態(tài)巡檢、自動(dòng)化日檢、運(yùn)行日?qǐng)?bào)、故障溯源、主備系統(tǒng)切換、系統(tǒng)擴(kuò)容等。與第一階段不同的是,場(chǎng)景自動(dòng)化不僅僅是提供一些自動(dòng)化的工作腳本和工具,而是能夠根據(jù)不同的環(huán)境與不同的場(chǎng)景,自動(dòng)選擇相關(guān)的分析策略,調(diào)用相關(guān)的知識(shí)點(diǎn)工具進(jìn)行自動(dòng)化的工作,完成自動(dòng)化的處置。

運(yùn)維自動(dòng)化的第三個(gè)階段是智能化運(yùn)營(yíng),此階段的運(yùn)維自動(dòng)化系統(tǒng)是以數(shù)據(jù)與算法為核心的,通過(guò)積累歷史的運(yùn)維數(shù)據(jù),利用分析算法,能夠根據(jù)數(shù)據(jù)進(jìn)行分析和判斷,并做出決策和執(zhí)行。此階段的運(yùn)維自動(dòng)化系統(tǒng)需要具有比較強(qiáng)大的分析策略,能夠?qū)崿F(xiàn)準(zhǔn)確的自動(dòng)化操作,不過(guò)并不是所有的工作都能夠以智能分析獲得自動(dòng)化操作的結(jié)果,部分關(guān)鍵節(jié)點(diǎn)仍然需要進(jìn)行人工判斷。

其實(shí)第三階段就是我們常說(shuō)的AIOPS,不過(guò)因?yàn)閿?shù)據(jù)與算法的積累問(wèn)題,目前AIOPS能夠覆蓋的場(chǎng)景仍然有限,絕大多數(shù)運(yùn)維自動(dòng)化仍然停留在第二階段上。自動(dòng)運(yùn)維或者智能運(yùn)維實(shí)際上并不是運(yùn)維自動(dòng)化的終極目標(biāo),實(shí)際上運(yùn)維自動(dòng)化是服務(wù)于我們的運(yùn)維業(yè)務(wù)的,就像運(yùn)維工作是服務(wù)于企業(yè)的業(yè)務(wù)的一樣。某個(gè)信息系統(tǒng)該如何進(jìn)行自動(dòng)化的運(yùn)維,數(shù)據(jù)庫(kù)故障時(shí)可以自動(dòng)切換還是需要人工干預(yù)切換,這取決于我們的業(yè)務(wù)需求和SLA,并不取決于運(yùn)維自動(dòng)化系統(tǒng)的能力本身。

運(yùn)維自動(dòng)化的目的是盡可能用自動(dòng)化的系統(tǒng)來(lái)替代人的工作,運(yùn)營(yíng)和維護(hù)的價(jià)值最終體現(xiàn)在業(yè)務(wù)中,而實(shí)現(xiàn)此目標(biāo)的方法是運(yùn)營(yíng)服務(wù)化,如果用一個(gè)目前比較時(shí)髦的說(shuō)法就是“運(yùn)營(yíng)即服務(wù)”。

IT部門在企業(yè)內(nèi)部能夠真正的實(shí)現(xiàn)運(yùn)營(yíng)服務(wù)化,IT部門必須成為一個(gè)利潤(rùn)中心,只有如此,在我們的大型企業(yè)中,運(yùn)維自動(dòng)化才能成為真正的剛需。這些年老白一直在企業(yè)內(nèi)推廣運(yùn)維自動(dòng)化工具與基于運(yùn)維自動(dòng)化工具的服務(wù)體系,不過(guò)接受這種模式的用戶占比并不高。大家都在學(xué)習(xí)互聯(lián)網(wǎng)公司的IT運(yùn)維的技術(shù)與理念,但是我們的核心業(yè)務(wù)并不像互聯(lián)網(wǎng)企業(yè)一樣是以IT為核心,因此這種模仿最終只是一種東施效顰的模仿。因?yàn)樾畔⑾到y(tǒng)運(yùn)行的好壞,性能有沒有問(wèn)題并不是絕大多數(shù)領(lǐng)導(dǎo)比較關(guān)心的問(wèn)題。缺乏自動(dòng)化手段,大不了讓弟兄們加加班,出了問(wèn)題找不到根因,下回再出事的時(shí)候領(lǐng)導(dǎo)可能都已經(jīng)忘了這次故障。系統(tǒng)資源浪費(fèi)點(diǎn)也沒關(guān)系,反正每年的IT預(yù)算都在增長(zhǎng)。

運(yùn)維自動(dòng)化建設(shè)應(yīng)該是基于具體的工作目標(biāo)的,周五參加一個(gè)會(huì)的時(shí)候,客戶的領(lǐng)導(dǎo)說(shuō)了幾句十分經(jīng)典的話。我們建設(shè)運(yùn)維自動(dòng)化系統(tǒng),總是基于一個(gè)十分全面的設(shè)計(jì),然后再去慢慢實(shí)現(xiàn),也許等我們把設(shè)計(jì)都實(shí)現(xiàn)的時(shí)候,信息系統(tǒng)已經(jīng)變得面目全非了。我們應(yīng)該從我們目前面臨的問(wèn)題入手,解決問(wèn)題就行。這些年我們發(fā)生過(guò)哪些故障,總結(jié)了哪些經(jīng)驗(yàn)教訓(xùn),能不能先不考慮是不是用一些高大上的新技術(shù)還是用采用比較低級(jí)的比較傳統(tǒng)的方法,把這些東西先變成自動(dòng)化了,解決我們現(xiàn)在的一些關(guān)鍵問(wèn)題呢?這一點(diǎn)老白是十分贊同的,唯有如此,才能做出真正有用的運(yùn)維自動(dòng)化工具,而不是做一些玩具讓運(yùn)維人員多了一些需要運(yùn)維的系統(tǒng)。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論