運維到底是干什么的?看完這篇你就懂了

數(shù)據(jù)分析不是個事兒
一般來說,常見的故障有應用故障、數(shù)據(jù)庫故障、網(wǎng)線故障等等,有的是軟件故障,有時候是硬件故障,而一個有經(jīng)驗的運維工程師能在第一時間定位故障原因。

運維到底是干什么的?估計連運維工程師本身都不清楚,在百度上搜索也基本得不到答案,找了很多的運維老員工,終于總結出了運維工程師的工作內容:

1.jpeg

一般來說,運維工程師都是說的互聯(lián)網(wǎng)企業(yè)的運維師,通常屬于技術部門,是支持互聯(lián)網(wǎng)產(chǎn)品技術以及研發(fā),測試和系統(tǒng)管理的四個主要部門。國內外公司以及大型和小型公司之間的劃分將有所不同,主要的工作內容有下面幾種:

1、保障業(yè)務系統(tǒng)長期穩(wěn)定運行

畢竟業(yè)務系統(tǒng)要是出現(xiàn)一點差錯,用戶就要投訴,所以運維工程師最核心的工作就是保證業(yè)務系統(tǒng)能夠穩(wěn)定運行。

首先要知道業(yè)務跑在什么上,一般來說網(wǎng)站服務器都是nginx、apache等,依賴mysql數(shù)據(jù)庫進行數(shù)據(jù)儲存,依靠PHP進行解析,所以運維工程師必須掌握LNMP、LAMP等環(huán)境部署的知識。

2.jpeg

2、保障數(shù)據(jù)安全可靠

數(shù)據(jù)安全是公司領導最看重的部分,運維工程師也要保證數(shù)據(jù)的安全性和可靠性,要是出了一點點錯誤,領導就要找運維喝茶了。

有時候需要手動改數(shù)據(jù)庫的內容,就要學會掌握mysql數(shù)據(jù)庫的增刪查改知識;

有時候需要應對數(shù)據(jù)庫的服務器硬件壞了,就需要Mysql主從復制以備不時之需;

有時候需要還原數(shù)據(jù)庫,就需要學會mysql增量備份和恢復,以還原到指定的時間點;

有時候定時備份還不夠,就需要使用rsync+inotify來實時備份;

有時候為了增加服務器安全性,就要通過iptables來控制公司的IP或者跳板機IP訪問權限;

3.jpeg

3、構建監(jiān)控報警體系

運維工程師常用的是zabbix、nagios來進行報警監(jiān)控,如果沒有監(jiān)控運維就是瞎子,所以要先構建報警監(jiān)控體系,此后就要解決系統(tǒng)故障。

4.jpeg

一般來說,常見的故障有應用故障、數(shù)據(jù)庫故障、網(wǎng)線故障等等,有的是軟件故障,有時候是硬件故障,而一個有經(jīng)驗的運維工程師能在第一時間定位故障原因。

4、技術與業(yè)務問題處理

這里有兩個核心的問題,分別是技術問題和業(yè)務問題,技術問題主要需要網(wǎng)絡抓包分析、tcpdump抓包分析和代理機制等等內容;

5.jpeg

而業(yè)務問題就比技術要復雜一些了,比如業(yè)務層面的數(shù)據(jù)分析,不光要統(tǒng)計出業(yè)務的各種指標數(shù)據(jù),還要對數(shù)據(jù)進行分析解剖,找出業(yè)務問題的所在。

5、版本測試與上線

這也是運維工程師的常見工作內容,負責版本的測試與上線,開發(fā)人員發(fā)布版本之前,運維工程師需要進行性能和功能測試;此外在版本上線的時候,最好也在晚間業(yè)務量較小的時候上線,可以避免上線壓力過大。

6.jpeg

總結

運維和開發(fā)是兩個截然不同的方向。如果做運維的話,有開發(fā)的底子那么轉崗位也不是不可以。

運維負責具體的產(chǎn)品線運維工作,同時也需要掌握開發(fā)的能力,深入業(yè)務,最了解業(yè)務的痛點和問題,同時研發(fā)/優(yōu)化針對產(chǎn)品業(yè)務需求的平臺、工具和手段,能夠接觸到各類優(yōu)秀的系統(tǒng)架構并有能力做出優(yōu)劣對比,同時對業(yè)務的掌控決定了相應運維工程師在業(yè)務發(fā)展中的作用。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論