什么是數(shù)據(jù)中心的運(yùn)維

IT基礎(chǔ)設(shè)施運(yùn)維
數(shù)據(jù)中心求“穩(wěn)”的特點(diǎn)直接決定了數(shù)據(jù)中心運(yùn)維人員的工作特點(diǎn)。數(shù)據(jù)中心所有的運(yùn)維工作都要以“穩(wěn)”為前提,因此沒有百分百的把握不要輕易的在運(yùn)行環(huán)境下搞各種操作,沒有梳理好可能影響的設(shè)備、系統(tǒng)、應(yīng)用,不要輕易的作出割接、變更、調(diào)整的決策。

一個(gè)數(shù)據(jù)中心的良好運(yùn)轉(zhuǎn)離不開苦逼的運(yùn)維人。一個(gè)數(shù)據(jù)中心的日常運(yùn)維工作基本涉及到了IT相關(guān)的所有專業(yè),從數(shù)據(jù)中心機(jī)房的設(shè)計(jì)、暖通、動(dòng)力、服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)、綜合布線、系統(tǒng)、應(yīng)用、開發(fā)、數(shù)據(jù)分析、數(shù)據(jù)挖掘。。。基本你能想到的相關(guān)IT技術(shù)在數(shù)據(jù)中心都能夠一一找到。數(shù)據(jù)中心儼然就是一個(gè)IT技術(shù)的聚集地。

不過數(shù)據(jù)中心是IT技術(shù)的聚集地,但是并不一定是IT技術(shù)的高地。其實(shí)你很難在那些身負(fù)重任的數(shù)據(jù)中心內(nèi)部找到非常前沿的IT技術(shù)。前面我有提到,數(shù)據(jù)中心需要高可靠性。而正是這一要求,注定了所有的數(shù)據(jù)中心在日常運(yùn)維工作中首先都要追求一個(gè)字,那就是“穩(wěn)”。

只有那些經(jīng)過時(shí)間檢驗(yàn)、穩(wěn)定性高的IT技術(shù)才會(huì)被數(shù)據(jù)中心采用,因此往往越重要的數(shù)據(jù)中心如金融行業(yè)等其IT技術(shù)相對(duì)外界顯得越落后。比如現(xiàn)在很多銀行的軟件開發(fā)中心仍在采用比較古老的cobol寫代碼。不過近年來隨著互聯(lián)網(wǎng)企業(yè)的飛速發(fā)展,大量的新技術(shù)也在互聯(lián)網(wǎng)企業(yè)大膽啟用。

而數(shù)據(jù)中心求“穩(wěn)”的特點(diǎn)直接決定了數(shù)據(jù)中心運(yùn)維人員的工作特點(diǎn)。數(shù)據(jù)中心所有的運(yùn)維工作都要以“穩(wěn)”為前提,因此沒有百分百的把握不要輕易的在運(yùn)行環(huán)境下搞各種操作,沒有梳理好可能影響的設(shè)備、系統(tǒng)、應(yīng)用,不要輕易的作出割接、變更、調(diào)整的決策。

工作這些年接觸過很多廠家的技術(shù)人員,特別是那些剛?cè)胄胁痪玫募夹g(shù)人員經(jīng)常會(huì)問一個(gè)問題:我這么簡(jiǎn)單的操作為什么要等半個(gè)月?為什么半夜兩點(diǎn)才能做?明明一分鐘就完事了為什么搞得這么復(fù)雜,有點(diǎn)小題大做吧?!

其實(shí)答案也很簡(jiǎn)單,不管是大型的數(shù)據(jù)中心還是小機(jī)房的IT運(yùn)維人員都要記住,數(shù)據(jù)中心容不得一點(diǎn)馬虎。作為海量數(shù)據(jù)的載體,你面對(duì)的實(shí)際上不是一臺(tái)機(jī)器、一個(gè)應(yīng)用,二是通過數(shù)據(jù)連接的成百上千的用戶。幾乎所有重要的數(shù)據(jù)中心割接、變更、調(diào)整都是安排在零點(diǎn)甚至2點(diǎn)以后,并且會(huì)提前通知或公告客戶,目的就是將可能造成的影響降至最低。

很多人說運(yùn)維人很苦逼,其實(shí)苦逼的并不是運(yùn)維本身,苦逼的是協(xié)調(diào)本身。很多人誤以為運(yùn)維人只跟機(jī)器打交道,實(shí)際上情況反而相反,運(yùn)維人大部分時(shí)間是在跟人打交道。如果一個(gè)運(yùn)維人天天忙得半死,圍著機(jī)器、系統(tǒng)團(tuán)團(tuán)轉(zhuǎn),那問題就嚴(yán)重了。一般來說,數(shù)據(jù)中心的設(shè)備、系統(tǒng)都比較穩(wěn)定,因此當(dāng)設(shè)備、系統(tǒng)穩(wěn)定上線后,日常能做的工作無非就是健康檢查、分析及一些常規(guī)的操作。有的人會(huì)說,你重要的操作都是安排在凌晨,那你白天肯定很輕松了。實(shí)際上這是忽略了運(yùn)維人另一個(gè)重要的工作,那就是開會(huì)!

一個(gè)一分鐘左右的設(shè)備版本升級(jí)操作,你可能要開好幾個(gè)大大小小的協(xié)調(diào)會(huì)、分析會(huì),你要把可能影響到的所有系統(tǒng)、應(yīng)用全部列出來,你要把可能涉及到的所有風(fēng)險(xiǎn)點(diǎn)都要全部列出來,哪怕這個(gè)風(fēng)險(xiǎn)概率才1%。等你梳理完這些風(fēng)險(xiǎn)點(diǎn)、拉出清單后,你就要去協(xié)調(diào)清單上涉及到的各大部門開會(huì)。通常情況下,開一次會(huì)還不能定下來這個(gè)操作能不能做,畢竟第一次會(huì)主要還是搜集下大家的意見。如果業(yè)務(wù)部門說最近正好是雙十一,容不得出現(xiàn)一絲差錯(cuò),而你跟他說可能有1%的風(fēng)險(xiǎn),那不好意思,這事情就要往下推。越大的公司往往流程越復(fù)雜、分工越細(xì),涉及到的人員及業(yè)務(wù)部門越多。這一點(diǎn)醫(yī)院的手術(shù)和運(yùn)維倒是很像,醫(yī)院哪怕做一個(gè)很小的手術(shù),都會(huì)告知家屬存在一定的風(fēng)險(xiǎn),要家屬簽字知曉。

其實(shí)我一直認(rèn)為像很多大型的數(shù)據(jù)中心運(yùn)維人員應(yīng)該將自己定位于數(shù)據(jù)中心的項(xiàng)目運(yùn)營(yíng)分析管理人員,而不是簡(jiǎn)簡(jiǎn)單單的技術(shù)人員。實(shí)際上很多數(shù)據(jù)中心的技術(shù)工作廠家支撐人員都幫你做了,很多數(shù)據(jù)中心都購買了大量的廠商服務(wù)及維保服務(wù)。打個(gè)比方,你在數(shù)據(jù)中心負(fù)責(zé)華為核心交換設(shè)備的,單單該設(shè)備來說,你在數(shù)據(jù)中心里面你是專業(yè)的。但是與華為的工程師一比,你掌握的很多技術(shù)就相對(duì)要弱得多。這也很正常,人家是廠家,這個(gè)設(shè)備就是他們?cè)斐鰜淼模麄兲焯旄鞯靥幚砉收?,見過的各種現(xiàn)象遠(yuǎn)比你見得多。實(shí)際上,對(duì)于一個(gè)運(yùn)維華為核心交換設(shè)備的這位運(yùn)維人員來說,實(shí)際上他執(zhí)行得更多的是使用和養(yǎng)護(hù)工作。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論