優(yōu)秀的運維,一定要做到 3 點“可控”!

達內(nèi)云計算運維培訓
達內(nèi)云計算運維培訓
運維是一門既好入門但也是非常復雜的行業(yè),不像學會兩三門語言,設計幾個網(wǎng)站應用就可以成為架構(gòu)師那樣的工作。他除了技術(shù)之外,經(jīng)驗積累、視野、大局觀、甚至是心胸都有可能決定成敗。

優(yōu)秀的開發(fā)者比比皆是,但是優(yōu)秀的運維人員是少之又少。

運維是一門既好入門但也是非常復雜的行業(yè),不像學會兩三門語言,設計幾個網(wǎng)站應用就可以成為架構(gòu)師那樣的工作。他除了技術(shù)之外,經(jīng)驗積累、視野、大局觀、甚至是心胸都有可能決定成敗。

運維的內(nèi)容太復雜了!而運維最本質(zhì)的東西是“可控,為什么說運維的本質(zhì)是“可控”,大概有以下幾個原因:

第一點:穩(wěn)定性“可控”

運維不是維護一兩臺機器,發(fā)布代碼就好,而是要做成千上萬,甚至十幾萬臺的服務器和各種網(wǎng)絡設備、存儲設備等專有設備維護,這些服務器包含webserver,DB,cache,cdn,computing多種類型,如何讓這些大量的服務器穩(wěn)定的跑在生產(chǎn)環(huán)境中,不因為硬件損壞、發(fā)布變更、系統(tǒng)升級而引發(fā)的業(yè)務系統(tǒng)故障。沒有東西是不會壞的,沒有系統(tǒng)是沒有bug的。硬件要壞,系統(tǒng)升級,發(fā)布變更,這些都沒有關(guān)系,但是最重要的,一旦發(fā)生這些之后,運維人員知道,這會業(yè)務影響多大!?需要多少時間和工作量恢復?

第二點:性能“可控”

我和DBA一起維護DB多年,DBA最痛苦的地方,不在于“慢”,而在于時快時慢。一個不穩(wěn)定的性能,就無法預估承受業(yè)務壓力需要的系統(tǒng)規(guī)模,這樣對于DBA在維護是無異于自殺。很多云計算廠商做設計的時候,往往也會忽略這一點,其實性能的問題,比最高性能,來的重要的多!非常漂亮的數(shù)字不能解決問題,但是一次性能的不足,可能就引發(fā)故障。

第三點:安全“可控”

有沒有絕對的安全呢?理論上沒有,所以,運維的同學,總要花很多精力在系統(tǒng)安全上,比如控制哪些用戶可以登錄系統(tǒng)環(huán)境?哪些用戶是可以進行變更?哪些用戶甚至可以拿到最高權(quán)限?測試和開發(fā)隔離,公司內(nèi)外隔離,都是因此而生。只要能夠控制權(quán)限的面積,范圍,就能知道風險,這邊是所謂的安全“可控”。

重要如上所示,但是正如一開頭所說,運維的內(nèi)容相當復雜,交付“可控”,變更內(nèi)容“可控”,效率“可控”都是可以值得深究的東西,因此,無論是“可視化”,“大數(shù)據(jù)”,“運維自動化”等等,都是在為“運維可控”服務的。數(shù)據(jù)可視化,帶來的是規(guī)??煽?運維自動化,帶來的是效率可控,風險可控,如是而已。

每一個點的提升,都是運維的提升,希望所有從事運維的同學,都能感受到,做什么可以讓“可控力”提升,不要再半夜的時候處理故障,不要和女朋友看電影的時候回公司處理故障,也許我們再次遇到這些問題的時候,可以拿起一杯茶,做一個優(yōu)雅的運維。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論