從幕后到臺前,IT運維人如何不再摸黑前行?

隨著信息化的不斷投入,硬件設施、軟件系統(tǒng)不斷增加,IT運維的復雜性 也在不斷增加 ,導致IT運維成本居高不下,卻難以見到實際性的收益。對業(yè)務連續(xù)性要求較高的單位,系統(tǒng)一旦宕機損失是巨大的,運維部門往往要扛著巨大的壓力。

【摘要】技術(shù)飛速的發(fā)展讓IT人從一入行開始,就注定了前路變化莫測,IT人的路該何去何從?是否真的要摸黑前行呢?當下,運維崗位從幕后走到了臺前,各個企業(yè)開始考慮運維問題,但信息化運維卻仍然面臨很多的問題,對運維的需求會越來越高,作為一個合格的運維,你準備好了嗎?作者在此結(jié)合自身經(jīng)歷與大家分享對IT行業(yè)中系統(tǒng)運維崗位的看法。

【作者】潘延晟,運維工程師,系統(tǒng)架構(gòu)師,曾任吉林通鋼自動化信息技術(shù)有限責任公司信息科副總工程師。有19年的系統(tǒng)集成與信息化運維經(jīng)驗,參與建設并維護鋼鐵行業(yè)大型信息化網(wǎng)絡,專注于鋼鐵行業(yè)信息化網(wǎng)絡建設與規(guī)劃。曾獲“ 存儲架構(gòu) 之美”軟件定義存儲解決方案擂臺賽優(yōu)秀方案 。擅長領域:系統(tǒng)運維, 網(wǎng)絡安全,數(shù)據(jù)安全,系統(tǒng)架構(gòu)設計,網(wǎng)絡架構(gòu)設計。

前言

英特爾(Intel)創(chuàng)始人之一戈登·摩爾(Gordon Moore)提出摩爾定律:當價格不變時,集成電路上可容納的元器件的數(shù)目,約每隔18-24個月便會增加一倍,性能也將提升一倍。這一定律揭示了信息技術(shù)進步的速度 。從286開始一路“奔騰”,短短的二三十年間,這個行業(yè)已經(jīng)帶領萬物飛上了“云端”。現(xiàn)在這個定律已經(jīng)越來越難維持了。這種飛速的發(fā)展讓IT人從一入行開始,就注定了前路變化莫測,IT人的路該何去何從?是否真的要摸黑前行呢?作者在此結(jié)合自身經(jīng)歷與大家分享對IT行業(yè)中系統(tǒng)運維崗位的看法。

企業(yè)信息化運維崗位經(jīng)歷的三個階段

在信息化發(fā)展的初期, 企業(yè)在信息化建設中主要以購買硬件和基礎網(wǎng)絡建設為主 。人們對信息化能干什么還不夠了解,只知道一臺臺的交換機和服務器是實實在在擺在那里的。

這個階段,服務器基本采用豎井式的架構(gòu),交換機和路由器是網(wǎng)絡的主力,信息化建設 往往缺少長遠規(guī)劃。因為架構(gòu)本身的設計缺陷和設備性能等因素影響,常常出現(xiàn)系統(tǒng)宕機和網(wǎng)絡堵塞等問題,也因此開始出現(xiàn)了運維崗位。但從運維崗位出現(xiàn)開始,就面臨了一個尷尬的處境:“系統(tǒng)不出問題時,運維好像沒什么用。系統(tǒng)總是出問題時,運維好像也沒起什么用”。

到了第二階段,信息化以應用系統(tǒng)建設為主 。經(jīng)過一個階段的信息化發(fā)展建設,大多數(shù)企業(yè)認識到了信息化為企業(yè)帶來的價值,并把主要的資源投入到應用系統(tǒng)建設以及相關的應用服務上。企業(yè)逐漸接受外部咨詢服務,引入外部力量幫助進行數(shù)字化、信息化轉(zhuǎn)型。信息化的建設推動了軟件行業(yè)的發(fā)展,軟件行業(yè)受到了應有的尊重。企業(yè)開始看到了智能化的信息系統(tǒng)帶來的實際好處,對各種業(yè)務應用系統(tǒng)的依賴也越來越多,舍得在信息化系統(tǒng)上花錢,對原本看得見摸得著的硬件設備,反而開始不舍得投入了。信息化發(fā)展的重心從原本的硬件開始又轉(zhuǎn)向了軟件,而忽略了設備的老化 、架構(gòu)的不合理 、 業(yè)務不斷擴展遇到的各種軟硬件瓶頸,忽略了底層服務器、網(wǎng)絡安全、中間件以及數(shù)據(jù)庫的基礎維護,也忽略了運維崗位的重要性,覺得系統(tǒng)一旦運行就如同機械一樣穩(wěn)定可靠。

經(jīng)過上述兩個階段,企業(yè)開始意識到信息系統(tǒng)整體的重要性,開始進入重視IT治理的全面建設階段 。在基礎設施和應用系統(tǒng)建設的基礎上,全面關注信息化整體規(guī)劃 。更多關注信息化對企業(yè)發(fā)展的戰(zhàn)略支持,把IT作為企業(yè)核心競爭力的一個重要組成部分 。關注企業(yè)信息化建設的組織、流程和人力資源等, 開始把信息化建設作為企業(yè)內(nèi)部一個重要發(fā)展方向看待,而不僅僅是一個項目或者一個階段的事情 。

走到這個階段,很多企業(yè)已經(jīng)開始建立了自己行業(yè)特有的信息化系統(tǒng),如制造行業(yè)的ERP、MES,醫(yī)療行業(yè)的HIS、LIS,辦公用的OA、HR、MAIL等。同時企業(yè)的管理者也開始擔心這些企業(yè)核心的業(yè)務系統(tǒng)一旦出現(xiàn)問題時該如何應對 。事實上,這個階段,硬件故障,網(wǎng)絡安全,系統(tǒng)安全,數(shù)據(jù)安全等各種問題已經(jīng)成為信息系統(tǒng)的最大威脅。每一次系統(tǒng)事故都可能造成巨大的經(jīng)濟損失,甚至影響到國家安全。為了保障信息化系統(tǒng)的可靠運行,越來越多的設備,越來越多的技術(shù)開始涌進了數(shù)據(jù)中心并且不斷完善和優(yōu)化。虛擬化、容器、微服務 、軟件定義 、超融合 、分布式架構(gòu)、雙活、兩地三中心等技術(shù)和架構(gòu)應運而生。信息化系統(tǒng)的功能越來越強大,結(jié)構(gòu)越來越復雜,可是這么多的設備,這么復雜的架構(gòu)誰來管控?成了很多企業(yè)面臨的問題。

信息化的發(fā)展讓原本在幕后的運維開始走到了臺前,成為操控和維護龐大的智能化系統(tǒng)的主要崗位,運維崗位開始承擔更多重要的工作,但實際的情況卻不容樂觀。

現(xiàn)階段的信息化運維幾乎貫穿了整個信息系統(tǒng)的生命周期,對于運維崗位,企業(yè)提出了更多的要求??墒乾F(xiàn)在能完全滿足企業(yè)需求的運維人員數(shù)量卻遠遠低于市場的需求。人們可能會有疑問,幾乎每所大學里都有計算機技術(shù)相關專業(yè),再加上社會上的IT培訓機構(gòu)的輸出人才加在一起,IT人才還會短缺嗎?其實IT行業(yè)技術(shù)人才短缺是一個不容置疑的事實。由于傳統(tǒng)學歷教育培養(yǎng)出來的大學生缺乏實戰(zhàn)經(jīng)驗和項目經(jīng)驗,往往在教學上很難有質(zhì)量保證,導致了每年新培養(yǎng)出的IT技術(shù)人才并不能百分百的完全被企業(yè)接受, 這樣整個IT行業(yè)的人才困境就更加嚴峻。也正是由于 IT互聯(lián)網(wǎng) ”飛”一樣的發(fā)展速度, 才讓每年新增的技術(shù)人才缺口在百萬之巨。每年培養(yǎng)出來的人才可以說是杯水車薪。

從幕后走到臺前,運維崗位面臨更多挑戰(zhàn)

雖然當下階段,運維崗位從幕后走到了臺前,各個企業(yè)開始考慮運維問題,但信息化運維卻仍然面臨很多的問題 。

(1)IT運維工作瑣碎繁雜,重視程度差.

很多單位由于人員少,分工不明確,運維人員幾乎承擔了從終端到上層業(yè)務之間的所有工作,每個IT運維人就像“救火員一樣忙碌”。即便如此,業(yè)務人員還是經(jīng)常抱怨“ 關鍵時刻找不到人”、“ 問題處理 太慢”等等。IT運維人員的工作很難得到業(yè)務部門的認可,工作也難以量化。運維或信息部門作為服務部門,在信息系統(tǒng)的戰(zhàn)略規(guī)劃項目立項等工作中話語權(quán)較弱,對于現(xiàn)有系統(tǒng)中的問題只能建議,無法決策 。往往是項目建設完成之后才介入系統(tǒng)的管理和維護,等發(fā)現(xiàn)問題為時已晚。

(2)IT系統(tǒng)復雜,維護難度高,風險壓力大。

隨著信息化的不斷投入,硬件設施、軟件系統(tǒng)不斷增加,IT運維的復雜性 也在不斷增加 ,導致IT運維成本居高不下,卻難以見到實際性的收益。對業(yè)務連續(xù)性要求較高的單位,系統(tǒng)一旦宕機損失是巨大的,運維部門往往要扛著巨大的壓力。有的單位由于缺乏 科學 的資產(chǎn)管理,運維部門很難準確了解公司到底有多少IT資產(chǎn),公司是否需要購置新機也缺少數(shù)據(jù)支撐。在年底審計時全團隊奮戰(zhàn)多日才能完成單位的IT資產(chǎn)清查工作。更多的時候,運維部門成了其他部門眼中的只會花錢的部門。

(3) 技術(shù)人員難培養(yǎng),流動性大。

對于企業(yè)來說, 如此龐大 、復雜 、重要的系統(tǒng)容不得半點不確定的因素。每一個已經(jīng)開始運行的生產(chǎn)系統(tǒng)都不會允許新人隨意的去操作和測試。運維人員很難在實際的生產(chǎn)環(huán)境來獲得技術(shù)經(jīng)驗。好不容易成為熟練工了,卻因為看不到職業(yè)前景或感覺不受重視而提出辭職。這些中堅力量的離職,會造成客戶滿意度和運維質(zhì)量相當長一段時間內(nèi)出現(xiàn)波動。

(4)服務商難管理,技術(shù)水平參差不齊,服務不及時,問題不能及時解決。

IT運維服務外包也同樣存在一定風險,關鍵在于對于IT運維服務外包供應商的技術(shù)水平和服務管理不到位。由于IT運維具有相當強的專業(yè)性,很多時候甲方無法獨立判斷IT運維服務外包供應商的技術(shù)水平 和 服務能力,造成了雖然購買了服務,卻沒有收到預想的效果。

(5)企業(yè)對于自身信息化了解不足,盲目的跟風上云逃避運維問題。

隨著云計算的發(fā)展與普及,越來越多的企業(yè)選擇了業(yè)務上云,看似解決了運維問題。但是實際情況卻并非那么完美,無論選擇 IaaS,Paa S還是 SaaS ,企業(yè)都要對自己使用的系統(tǒng)有足夠的了解。云服務提供商只能保證你所租用的 服務 正常運行,卻不能代替你來管理自己的業(yè)務,不能百分百保證在非正常狀態(tài)下面臨的勒索病毒,木馬入侵,SQL注入等安全問題,因為誤操作造成的數(shù)據(jù)丟失和數(shù)據(jù)泄漏 ,因為資源不足造成的業(yè)務宕機等等問題。簡單的說,當企業(yè)對自身的業(yè)務 系統(tǒng)一無所知時,放在云上和放在本地數(shù)據(jù)中心都存在著同樣的風險。

勝任運維崗位,應該具備哪些技能

運維崗位今天所面臨的尷尬局面,不是短時間內(nèi)產(chǎn)生的,但恰恰是這些問題帶來的挑戰(zhàn),才讓IT 運維崗位充滿了機遇。

面對機遇和挑戰(zhàn),作為一個運維人,如何才勝任現(xiàn)代化的運維崗位呢,我覺得應該具備以下的技能。

1、弱電基礎 。IT運維首先就要從機房環(huán)境開始,空調(diào) 、消防 、UPS 、門禁監(jiān)控以及其他的輔助系統(tǒng),都是運維人員需要留意的部分,溫度 、濕 度 、電力供應 、防火隱患 等往往會給機房的設備造成重大的災難。

2、網(wǎng)絡基礎知識。無論是你軟件運維 、系統(tǒng)運維 、還是網(wǎng)絡運維,互聯(lián)網(wǎng)基礎知識都是必不可少的 ?,F(xiàn)在幾乎所有的應用系統(tǒng)軟件都依賴于網(wǎng)絡,而所有應用業(yè)務正常運行的基本條件就是網(wǎng)絡 暢通 。所以無論ISO 7層模型 、IP地址計算 、Vlan原理、路由協(xié)議這些基礎知識有多么的枯燥,都是一個合格的運維人不可缺少的基本技能。

3、服務器硬件基礎知識。網(wǎng)絡提供了應用系統(tǒng)運行的線路,服務器提供了應用系統(tǒng)運行的環(huán)境,應用系統(tǒng)運行時,CPU 、 內(nèi)存 、 存儲 、 甚至系統(tǒng)供電都會 對龐大的系統(tǒng) 產(chǎn)生影響。

4、操作系統(tǒng)知識。掌握主流的操作系統(tǒng),熟悉操作系統(tǒng)的基本工作原理、基本操作以及操作各個系統(tǒng)之間的區(qū)別。

5、存儲及存儲架構(gòu)知識。了解目前主流的存儲類型、架構(gòu)、以及基本的特點,除了CPU和內(nèi)存這些性能參數(shù),存儲IO性能也是影響系統(tǒng)運行的重要因素。

6、中間件及數(shù)據(jù)庫知識。了解主流的中間件和數(shù)據(jù)庫產(chǎn)品,工作過程以及技術(shù)特點,當應用業(yè)務發(fā)生問題時候,這些知識可以幫助我們判斷應該是找程序開發(fā)還是數(shù)據(jù)庫管理員。

7、簡單的腳本開發(fā) 。信息化系統(tǒng)變得越來越復雜和龐大,為了簡化運維,編寫基本的運維腳本也是運維崗位必備的技能之一。

8、了解所處行業(yè)特點 。很多行業(yè)諸如醫(yī)療、制造、金融、教育等,都有著鮮明的行業(yè)特點,由于這些行業(yè)特點, 所產(chǎn)生的信息化系統(tǒng)也有著各自的獨特性,對各種資源的需求也不盡相同,忽略了行業(yè)特點,往往會讓信息化的建設和運維產(chǎn)生很大的偏差。

9、安全知識 。如今信息化系統(tǒng)面臨的最大風險,除了設備故障以外,便是來自各方面的安全風險了。病毒、木馬 、DDOS攻擊、垃圾郵件、數(shù)據(jù)泄露等等安全問題對企業(yè)核心的信息化系統(tǒng)帶來的危害越來越大。

10、數(shù)據(jù)備份和容災。當企業(yè)開始適應信息化,并且實現(xiàn)所有業(yè)務的信息化之后, 生產(chǎn)數(shù)據(jù)就成了企業(yè)的生命線 。人為惡意操作 、勒索病毒 、設備損壞 、黑客入侵等等問題造成的數(shù)據(jù)丟失和損壞往往會給一個現(xiàn)代化的公司造成致命的打擊。

11、學習新知識的能力 。雖然技術(shù)在不斷發(fā)展和創(chuàng)新創(chuàng)新,但技術(shù)的發(fā)展總是遵循著基本的需求規(guī)律,變得速度更快 、運行更穩(wěn)定 、操作更簡便。只有不斷的去學習新的知識,對比傳統(tǒng)技術(shù)發(fā)生了哪些變化,了解技術(shù)變遷的路線,才能讓自己的知識體系更加全面和宏觀。

結(jié)語

現(xiàn)代的信息化運維已經(jīng)不是簡單的安裝操作系統(tǒng),插拔網(wǎng)線,而是對整個信息化系統(tǒng)的全面維護,是銜接業(yè)務公司與IT系統(tǒng)交流的橋梁,是企業(yè)信息化管理的一部分,是集多IT工種與一身的綜合性崗位。運維崗位看似枯燥,辛苦,又經(jīng)常背鍋,但卻是一個難得的鍛煉機會。作為一個可以接觸到信息化的全流程,全周期的崗位,運維人員應該能夠從一個全面的角度看到業(yè)務系統(tǒng)工作的流程,結(jié)合企業(yè)特點可以發(fā)現(xiàn)整個網(wǎng)絡 、系統(tǒng) 、 應用以及安全防護中的痛點在哪里,能夠站在管理角度俯瞰整個信息化系統(tǒng),知道現(xiàn)問題在哪里,知道未來企業(yè)的信息化要怎樣規(guī)劃。

隨著信息化整合度越來越高,對運維的需求不會僅僅停留在技術(shù)層面,要求也會越來越高,那么作為一個合格的運維,你準備好了嗎?

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論