那個沒被云計算殺死的運維,轉(zhuǎn)型了技術(shù)運營

Heather Wang
IDC 預(yù)測, IT 運維分析,即 AIOps 市場將從 2018 年的 29 億美元增長到 2023 年的 45 億美元,其中大部分增長來自“AIOps 即服務(wù)”。

如何形容傳統(tǒng)運維的職業(yè)處境?

如果說的冠冕堂皇些:運維人員保障了企業(yè)業(yè)務(wù)的穩(wěn)定性與安全性;

如果說的直白些:傳統(tǒng)運維更像消防員,哪里起火救哪里。

若是僅僅如此,倒也還好??扇缃瘢S著云計算產(chǎn)業(yè)的日益成熟, AIOps 、DevOps 理念的盛行,大量運維工作通過自動化運維和智能化運維實現(xiàn),傳統(tǒng)運維的生存空間愈發(fā)狹窄。

IDC 預(yù)測, IT 運維分析,即 AIOps 市場將從 2018 年的 29 億美元增長到 2023 年的 45 億美元,其中大部分增長來自“AIOps 即服務(wù)”。

按工作內(nèi)容分,運維工作包括 IDC 運維、網(wǎng)絡(luò)運維、桌面運維、系統(tǒng)運維、應(yīng)用運維、運維開發(fā)、數(shù)據(jù)庫運維,大數(shù)據(jù)運維等。其中工作內(nèi)容相對簡單的,比如 IDC 運維和網(wǎng)絡(luò)運維、系統(tǒng)運維、數(shù)據(jù)庫運維,最容易被 IAAS 和 AI 取代。

思變持恒。職業(yè)前景面臨挑戰(zhàn)的運維們唯一的出路是尋求轉(zhuǎn)型,搏一搏也許還能掙得轉(zhuǎn)機。考慮到技術(shù)趨勢、運維的技術(shù)積累,基于云平臺的技術(shù)運營也許是運維們的一個不錯的轉(zhuǎn)型方向。TGO 鯤鵬會北京會員熊昌偉有 12 年 SaaS 行業(yè)工作經(jīng)驗,這位 36 歲的運維專家、阿里云 MVP 就職于用友旗下成員企業(yè)暢捷通,任運維總監(jiān)。他基于豐富的云平臺研發(fā)、架構(gòu)、運營經(jīng)驗,堅定從運維管理轉(zhuǎn)型技術(shù)運營,從保障產(chǎn)品,轉(zhuǎn)向通過運營技術(shù)提升產(chǎn)品價值。

云計算的十年

給互聯(lián)網(wǎng)帶來巨變的云計算可以追溯到 2006 年,當(dāng)時亞馬遜推出 Elastic Compute Cloud (EC2),為用戶提供虛擬計算機租賃服務(wù),用戶可以在上面運行他們的應(yīng)用程序,EC2 正是 AWS 的核心。當(dāng)時沒有人想到,這樣的虛擬計算機租賃服務(wù)會在日后成為亞馬遜的重要業(yè)務(wù)。根據(jù)財報,AWS 2019 年營收 350 億美元,占亞馬遜整體營收一成以上。

AWS 快速發(fā)展,巨頭紛紛布局。2008 年,谷歌發(fā)布 Google App Engine,日后發(fā)展成為 Google Cloud。2010 年,微軟宣布進軍云計算,推出 Microsoft Azure。至此,巨頭齊聚云計算戰(zhàn)場。

云計算讓用戶實現(xiàn)了按需購買 IT 資源,時間靈活,而且享有隨意擴展的資源彈性。此外,云計算成為基礎(chǔ)設(shè)施,讓用戶能夠站在巨人的肩膀上,拉平了技術(shù)代溝。基于這些特點,云計算行業(yè)迅速崛起,被廣泛采用。

2010 年,暢捷通開始采購混合云,到 2015 年全面轉(zhuǎn)向公有云,同時進行了云原生模式的新一代產(chǎn)品研發(fā)。

與歷史上所有前沿技術(shù)趨勢一樣,誕生之初的云計算,總會對一些舊有職業(yè)產(chǎn)生威脅,傳統(tǒng)運維就是其中之一。艾瑞咨詢在今年發(fā)布的《中國 IT 基礎(chǔ)架構(gòu)運維市場研究報告》中指出,由于與云計算基礎(chǔ)設(shè)施相關(guān)的事件、日志、指標(biāo)、告警等監(jiān)控信 息需要云服務(wù)商來提供基礎(chǔ)數(shù)據(jù),云服務(wù)商開始介入到 IT 基礎(chǔ)架構(gòu)運維服務(wù)中,IT 運維行業(yè)市場規(guī)??s小,根據(jù)艾瑞咨詢,從 2016 年開始,中國 IT 基礎(chǔ)架構(gòu)運維服務(wù)市場增速呈逐年降低趨勢。

“在這個過程中,我深刻的理解到,原有的運維模式將發(fā)生巨大的改變,很多我們大量消耗精力的地方,比如機器、網(wǎng)絡(luò)穩(wěn)定性,數(shù)據(jù)庫高可用等,都不再需要過多的關(guān)注了 ,這樣將釋放出大量的‘剩余勞動力’,去思考如何‘駕馭’好云,‘運營’好業(yè)務(wù),” 熊昌偉告訴 TGO 鯤鵬會。

他下定決心,從運維模式,轉(zhuǎn)換為技術(shù)運營,實現(xiàn)反向技術(shù)賦能。

相比面向基礎(chǔ)設(shè)施、維持穩(wěn)定,技術(shù)運營主要面向業(yè)務(wù),注重提升用戶體驗及業(yè)務(wù)經(jīng)營效率,從人員能力建設(shè)以及考核指標(biāo)都全面對標(biāo)用戶的體驗與業(yè)務(wù)經(jīng)營,比如從原來應(yīng)用 SLA 的追求,到現(xiàn)在 MTTR、MTBF 與 Apdex 多維考核。

“運維人員主要關(guān)注產(chǎn)品穩(wěn)定性,技術(shù)運營主要關(guān)注可用性、安全性、成本,只講能用的產(chǎn)品是沒有市場的。”

各大招聘網(wǎng)站對技術(shù)運營的崗位描述一般是,負責(zé)企業(yè)整體業(yè)務(wù)的技術(shù)支撐和服務(wù)。技術(shù)運營負責(zé)運維平臺的設(shè)計及優(yōu)化;根據(jù)產(chǎn)品整體定位幫助運維產(chǎn)品進行演進迭代,實現(xiàn)產(chǎn)品化和標(biāo)準(zhǔn)化;調(diào)研業(yè)務(wù)的運維、安全、效率、成本、質(zhì)量,分析問題并診斷,提供解決方案;深入業(yè)務(wù),通過技術(shù)優(yōu)化產(chǎn)品提升客戶體驗。

“技術(shù)運營主要是通過整合資源、運營技術(shù),賦能研發(fā),使他們能夠自助實現(xiàn)應(yīng)用全生命周期的管理。我們更多的的發(fā)現(xiàn)整個生命周期中系統(tǒng)平臺支撐的問題進行改進,實現(xiàn)業(yè)務(wù)狀態(tài)的數(shù)字化,輔助管理業(yè)務(wù)運營過程中出現(xiàn)的突發(fā)狀況。日常,我們對業(yè)務(wù)進行健康狀態(tài)監(jiān)控分析,出現(xiàn)致命問題時及時止損。“

業(yè)務(wù)數(shù)據(jù)數(shù)字化

熊昌偉所就職的暢捷通為小微企業(yè)提供財務(wù)及管理服務(wù),包括財務(wù)管理方面的好會計、T+Cloud、易代賬,進銷存管理方面的好生意、T1 plus,人財貨客一體化管理方面的 T+ & 工作圈、T6 等,增值數(shù)據(jù)分析方面的暢捷貸。

據(jù)介紹,暢捷通已經(jīng)有累計 466 萬家注冊企業(yè)用戶,暢捷貸已經(jīng)幫助超過 2 萬家小微企業(yè)通過軟件中的財稅數(shù)據(jù)申請純信用貸款,2019 年為 1.45 萬億交易額提供管理服務(wù)。

熊昌偉面臨的課題是,如何保證如此多用戶的訪問質(zhì)量、以及先于用戶發(fā)現(xiàn)問題。

他的解決途徑是,用模型把業(yè)務(wù)數(shù)據(jù)或者感性數(shù)據(jù)數(shù)字化,用數(shù)字來規(guī)劃業(yè)務(wù)的容量,保障業(yè)務(wù)的可靠運行。具體來說,對業(yè)務(wù)數(shù)據(jù)進行獲取、表達、存儲、傳輸、處理、交付,通過數(shù)字化提升解決問題、滿足需求的效率。這樣可以精細衡量業(yè)務(wù)表現(xiàn)和人效,比如每增加一個人,投入產(chǎn)出的變化能清楚看到。

同時,他在團隊組織架構(gòu)及職能方面,也做了相應(yīng)調(diào)整:將 20 多人的團隊分成 MSP 開發(fā)、OT 開發(fā)、DB、安全、品控幾個小組。其中, MSP 指的是 Managed Service Provider,MSP 開發(fā)負責(zé)為對內(nèi)和對外的客戶提供一站式的云服務(wù)管理、運營平臺,保障平臺的高效、可靠運行,并完成面向客戶的管理平臺建設(shè)。OT 指 Operational, Technology,OT 開發(fā)負責(zé)用科學(xué)的流程與技術(shù)提升業(yè)務(wù)運營的層次,完成面向新一代云原生應(yīng)用的可靠性管理系統(tǒng)建設(shè),為公司數(shù)字化運營提供完整全面的業(yè)務(wù)數(shù)據(jù)分析呈現(xiàn)。

目前,熊昌偉一天的工作主要圍繞公司所有產(chǎn)品的整體運行情況、發(fā)現(xiàn)和解決風(fēng)險點、提升空間,尋找業(yè)務(wù)亮點。

他提到一個小故事,曾經(jīng)有客服反饋一位客戶單據(jù)丟失,希望找回,同時希望為客服部門做一個功能,以快速處理類似問題。這樣的功能,如果按照傳統(tǒng)的產(chǎn)品設(shè)計、開發(fā)、測試上線流程,需要兩周才能完成開發(fā)。熊昌偉的團隊了解后,一方面通過日志系統(tǒng)中的業(yè)務(wù)數(shù)據(jù),快速定位到是客戶的另一個操作導(dǎo)致的單據(jù)刪除,回復(fù)客戶;另一方面,通過服務(wù)化的方式,當(dāng)天就為客服人員提供了自助查詢功能。相比傳統(tǒng)的救火式運維,技術(shù)運營的價值更豐富。

對個人而言,技術(shù)運營也正成為一個更受市場歡迎的崗位。根據(jù)科銳國際今年的報告,未來云計算市場規(guī)模仍將保持 20% 以上的增速,IT 企業(yè)對 “未來懂得最新云計算技術(shù)的運營人才需求激增”。

如何做好轉(zhuǎn)型?

轉(zhuǎn)型首先要解決的是,定位與心態(tài)。熊昌偉認為定位方面,要從保障轉(zhuǎn)向服務(wù),為公司、為業(yè)務(wù)的發(fā)展護航。技術(shù)運營要關(guān)注以下幾點:

如何促進產(chǎn)品成熟?通過量化數(shù)字,真實、實時地反應(yīng)出產(chǎn)品運行的狀態(tài)——錯誤、響應(yīng)時間、用戶路徑等——幫助研發(fā)和產(chǎn)品及時發(fā)現(xiàn)問題,調(diào)整產(chǎn)品功能和方向。

如何發(fā)揮技術(shù)的價值?運用好云的能力,避免低質(zhì)量的重復(fù)造輪子,降低產(chǎn)品開發(fā)難度,避免基礎(chǔ)組件給產(chǎn)品設(shè)計、研發(fā)帶來困擾。達到技術(shù)所見即所得。

如何給用戶帶來感動?深入業(yè)務(wù),通過技術(shù)手段,給客戶帶來超預(yù)期的使用與服務(wù)體驗。比如:當(dāng)出現(xiàn)使用問題時,系統(tǒng)能夠識別客戶端的使用問題,對于非通用性問題自動通知后臺服務(wù)人員,對于通用性問題,自動彈出建議方案。

成為企業(yè)的另一個核心競爭力。通過自身能力的打磨,實現(xiàn)對內(nèi),對外的技術(shù)能力與系統(tǒng)平臺輸出,就像電商出身但現(xiàn)在成為 IaaS 供應(yīng)商的亞馬遜和阿里巴巴。

其次是能力。與所有工作崗位一樣,技術(shù)運營在各個公司的定位大相徑庭。熊昌偉介紹,在暢捷通,對技術(shù)運營的要求主要是兩個方面。

第一,要懂技術(shù),技術(shù)運營不創(chuàng)造技術(shù),是技術(shù)的搬運工,要知道如何運用好云技術(shù),避免踩坑,避免重復(fù)造輪子。另外,要學(xué)一些架構(gòu)方面的知識和技能,運維要求對所負責(zé)領(lǐng)域精通,而技術(shù)運營要了解方方面面的知識,當(dāng)然可能不用都特別深入。

第二,要會布道,很多的好技術(shù)要推廣,要說服,讓這些技術(shù)發(fā)揮出能量,創(chuàng)造出價值,這樣才能正循環(huán)。

在具體工作中,運維轉(zhuǎn)型技術(shù)運營要關(guān)注:

運營的數(shù)字化。運營數(shù)字化聚焦在故障的生命周期,從故障的發(fā)現(xiàn)、定位到處置操作,要做到感知的泛在化、認知的智能化和操作的無人化,即 AIOps 的落地。

能力的中臺化。能力中臺化是指在構(gòu)建運維的平臺,讓可感知的網(wǎng)元,可編程的網(wǎng)元能力沉淀,運維能力顯性化。

運維的研發(fā)化。讓運維人員進行研發(fā),人創(chuàng)造機器,再由機器取代人來做維護,這個落地就是 OpsDev,基于顯性化的運維能力,各個專業(yè)領(lǐng)域都要自治。

組織的敏捷化。暢捷通打造了幾大敏捷的組織,包括 GMC(全局監(jiān)控)、SRE(應(yīng)急保障)、BOE(業(yè)務(wù)準(zhǔn)確性保障)以及 OPE(運維平臺的開發(fā))。這其中,SRE 是最重要的破局點,暢捷通組建了一個較大規(guī)模的 SRE 團隊去開發(fā)和運維。

在實際工作中,技術(shù)運營要面臨的另一個難題在于工作產(chǎn)出的衡量。運維更像滅火隊,在問題出現(xiàn)的時候去解決,那么可以通過解決掉的問題來衡量工作價值,比如故障的發(fā)生率、應(yīng)用的可用率。相比之下,技術(shù)運營需要發(fā)現(xiàn)隱患,在問題出現(xiàn)和爆發(fā)前就解決掉。熊昌偉建議,針對技術(shù)運營,可以通過發(fā)現(xiàn)的風(fēng)險點數(shù)量、或者對于故障的定位解決速度的提升來考核其表現(xiàn)。

完成轉(zhuǎn)型技術(shù)運營的標(biāo)準(zhǔn)是什么?

是否真正完成技術(shù)運營轉(zhuǎn)型,主要看工作模式是否改變。不要簡單重復(fù)三次同樣的操作,必須時刻思考如何提煉出標(biāo)準(zhǔn)流程,固化到系統(tǒng)中。技術(shù)運營必須堅持“賦能”研發(fā)與業(yè)務(wù),學(xué)習(xí)他們的工作模式,發(fā)現(xiàn)其中的不便與斷層,做好膠水層,讓各方業(yè)務(wù)流程通暢。最終,技術(shù)運營的精神思想與能力都能通過系統(tǒng)和平臺交付出去。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論