觀點|移動端運維標(biāo)準(zhǔn)的研究

網(wǎng)易新聞
隨著無線移動通信技術(shù)的快速發(fā)展,移動互聯(lián)網(wǎng)業(yè)務(wù)成為繼寬帶技術(shù)后互聯(lián)網(wǎng)發(fā)展的一個巨大推力,為移動應(yīng)用的發(fā)展提供了一個新的平臺。

2345截圖20211028093243.png

引言

隨著無線移動通信技術(shù)的快速發(fā)展,移動互聯(lián)網(wǎng)業(yè)務(wù)成為繼寬帶技術(shù)后互聯(lián)網(wǎng)發(fā)展的一個巨大推力,為移動應(yīng)用的發(fā)展提供了一個新的平臺。移動應(yīng)用以其固有的隨身性、可身份識別性,可鑒權(quán)性等獨特優(yōu)勢,為傳統(tǒng)互聯(lián)網(wǎng)業(yè)務(wù)提供了廣闊的發(fā)展空間和可持續(xù)發(fā)展的商業(yè)模式,因此對一個企業(yè)的重要性愈發(fā)凸顯。移動應(yīng)用的普及使得用戶可以“隨時、隨地、隨心”地享受互聯(lián)網(wǎng)業(yè)務(wù)帶來的各種便捷,比如更豐富的企業(yè)業(yè)務(wù)種類、更多的企業(yè)個性化服務(wù)和更高的企業(yè)服務(wù)質(zhì)量保證。

在新的商業(yè)模式下,對移動應(yīng)用開發(fā)工作的要求也越來越多,標(biāo)準(zhǔn)也越來越高,一款優(yōu)秀的移動端APP不僅僅在于實現(xiàn)了相應(yīng)的業(yè)務(wù)功能,能夠滿足用戶的正常使用;還在于它能夠安全、穩(wěn)定、高效地響應(yīng)用戶的請求,使用戶體驗達到一個高水平。這樣才能留住客戶,吸引更多的客戶,贏得客戶信任,進而提升企業(yè)的競爭力,為社會創(chuàng)造更大的價值。

運維領(lǐng)域發(fā)展現(xiàn)狀

軟件產(chǎn)品和傳統(tǒng)制造業(yè)產(chǎn)品表現(xiàn)形式雖有比較大的差異,但在生產(chǎn)流程中二者還是有諸多相似之處。如果把軟件生命周期看作汽車的生命周期,那么開發(fā)工程師就是汽車設(shè)計及生產(chǎn)人員,負責(zé)將軟件(汽車)從需求,轉(zhuǎn)為技術(shù)設(shè)計圖紙,最后變?yōu)閷崒嵲谠诘漠a(chǎn)品,主要關(guān)注汽車生命周期的前期。運維工程師要采用相應(yīng)的技術(shù)及管理手段,保證軟件(汽車)的正常、安全、穩(wěn)定、高效運行,提升用戶(乘客)使用體驗。

傳統(tǒng)的運維工作側(cè)重于服務(wù)端,負責(zé)對公司互聯(lián)網(wǎng)業(yè)務(wù)所依賴的基礎(chǔ)設(shè)施、基礎(chǔ)服務(wù)、線上業(yè)務(wù)進行穩(wěn)定性加強,基于日常巡檢發(fā)現(xiàn)服務(wù)可能存在的隱患,對整體架構(gòu)進行優(yōu)化以屏蔽常見的運行故障。服務(wù)端運維,其運維工作更主動,目標(biāo)更明確,處置手段更豐富。一線運維工程師可以在產(chǎn)品維度直觀的看到各節(jié)點的硬件性能情況、中間件運行情況和應(yīng)用軟件的可用情況。就算生產(chǎn)環(huán)境出現(xiàn)故障,也可以迅速定位問題,采用縱向擴容、橫向擴容、故障隔離、應(yīng)用回滾等一系列應(yīng)急手段來使產(chǎn)品恢復(fù)正常可用狀態(tài)。同時,服務(wù)端運維工程師可以在風(fēng)險可控的前提下,從容的規(guī)劃和實施未來的災(zāi)備擴容、流量切換、軟硬件升級等較復(fù)雜的運維動作。

相對于傳統(tǒng)的服務(wù)端運維,移動端運維還不夠成熟。原有的服務(wù)端運維手段和方法,在移動端運維過程中可能并不適用。比如,DevOps(Development and Operations,開發(fā)運維一體化)在服務(wù)端運維領(lǐng)域已經(jīng)深入人心并且有優(yōu)秀的實踐,但是,在移動端運維領(lǐng)域該如何解讀與實踐?當(dāng)用戶手機里的APP應(yīng)用出現(xiàn)了錯誤,由于這個錯誤信息在用戶側(cè),不在服務(wù)端,運維工程師又該如何得知呢?如果依賴用戶投訴,等接到相關(guān)信息時,相信這個故障已經(jīng)影響了相當(dāng)大基數(shù)的用戶量。工程師們又如何評估某個APP故障的影響范圍是什么?故障到底是和操作系統(tǒng)有關(guān)?還是與手機硬件型號有關(guān)?當(dāng)工程師們最后定位了錯誤的原因,又該如何去修復(fù)?畢竟,恢復(fù)生產(chǎn)是運維工作的第一要素,服務(wù)端問題可以通過升級后臺解決,但出問題的APP并不能自動升級,因為它運行在用戶的手機里。

所以,在移動應(yīng)用領(lǐng)域,運維工作有自己獨有的特征。如何正確理解,有針對性的去改進現(xiàn)存機制,達到與服務(wù)端運維同樣的高可用目標(biāo),是運維領(lǐng)域一個新的挑戰(zhàn)。

移動端運維特征

移動端應(yīng)用的運維工作存在以下特征:

1.問題發(fā)現(xiàn)、暴露慢。移動端應(yīng)用的問題比較隱蔽、不易察覺。出現(xiàn)問題無法實時監(jiān)控和告警,只能通過客戶投訴后才發(fā)現(xiàn)。由于延遲性高,待相關(guān)人員介入處理時,問題經(jīng)常已經(jīng)呈現(xiàn)蔓延的趨勢,處置成本極高。

2.問題分析、定位慢。移動端應(yīng)用同一時間在運行的前端版本眾多,運行平臺的操作系統(tǒng)版本不同,硬件機型繁多。使得相關(guān)人員在評估影響范圍時,周期較長。且移動端應(yīng)用一般對接的后臺系統(tǒng)較多,多系統(tǒng)協(xié)同排查困難,問題分析定位費時、費力。

3.問題應(yīng)對、處置慢。移動端應(yīng)用發(fā)生異常后,處置人員由于個人情感、技術(shù)能力、外界壓力等因素,有時候不能果斷、快速處置問題,無法做到快速阻斷問題,恢復(fù)生產(chǎn)。

移動端運維標(biāo)準(zhǔn)建設(shè)

根據(jù)移動端運維工作獨有的特征,我們可以明確,移動端應(yīng)用的運維工作首先要滿足“快速響應(yīng)”的訴求。只有做到快速響應(yīng),才能最大程度的減少對客影響。對此,我們結(jié)合移動端應(yīng)用生產(chǎn)問題的歷史處置經(jīng)驗,總結(jié)提煉了移動端應(yīng)用運維快速響應(yīng)能力模型,作為移動端應(yīng)用運維領(lǐng)域的評估依據(jù)和實施標(biāo)準(zhǔn)。

1.什么是快速響應(yīng)能力。一個產(chǎn)品對生產(chǎn)問題的快速響應(yīng)能力,可以細分為感知、定位、分析、應(yīng)急四個階段。

感知:將問題信息、影響范圍通知到相關(guān)人員。

定位:定位到出現(xiàn)問題的產(chǎn)品、功能、接口、模塊、服務(wù)器節(jié)點等,明確該問題的邊界。為后續(xù)聚焦資源、啟動應(yīng)急預(yù)案做好準(zhǔn)備。

分析:對于復(fù)雜生產(chǎn)問題,當(dāng)已有信息不足以支撐應(yīng)急決策,需具備快速收集和整合信息的能力,縮短分析人員的信息獲取時間。

應(yīng)急:優(yōu)先采用不更新應(yīng)用版本的方式,第一時間阻斷影響、恢復(fù)生產(chǎn)

2.移動端應(yīng)用運維快速響應(yīng)能力模型。為了建立一套行之有效的機制及實踐,達到移動端應(yīng)用運維快速響應(yīng)的目標(biāo)。我們以各階段工作目標(biāo)為維度,針對感知、定位、分析、應(yīng)急歸納了D1至D4四大類共計14項指標(biāo),組成移動類應(yīng)用生產(chǎn)故障快速響應(yīng)能力模型。該模型詳細描述了每類目標(biāo)的細化要求,明確了一個移動端應(yīng)用產(chǎn)品需要建設(shè)哪些能力,才能在生產(chǎn)故障時,具備快速響應(yīng)的能力。各能力模型詳細描述如下。

能力建設(shè),標(biāo)準(zhǔn)先行。移動端運維能力的建設(shè),首先應(yīng)是移動端運維標(biāo)準(zhǔn)的建設(shè)。運維標(biāo)準(zhǔn)化,可以為類似的產(chǎn)品指明方向,在產(chǎn)品建設(shè)初期就可以投入資源積累自身快速響應(yīng)能力。對于一個企業(yè)來講,參考標(biāo)準(zhǔn)去規(guī)劃和實施,能夠大大降低整體運維工作的成本,提高運維效率,將用戶的影響降低到最小,提升客戶整體使用體驗。

結(jié)語

隨著移動互聯(lián)網(wǎng)的飛速發(fā)展與質(zhì)量提升,移動端應(yīng)用運維能力建設(shè)的重要性愈發(fā)凸顯,提升移動端應(yīng)用運行維護的效率和質(zhì)量是一個必然趨勢,也是發(fā)展的必然結(jié)果。如何提高移動端應(yīng)用的快速響應(yīng)能力,是每個移動端運維工程師要考慮的問題。參考移動端應(yīng)用快速響應(yīng)能力模型,可以幫助移動端產(chǎn)品明確其非功能建設(shè)目標(biāo)。基于該模型,評估相關(guān)產(chǎn)品在該領(lǐng)域的成熟度,建立產(chǎn)品能力建設(shè)成熟度臺賬,也可以使相關(guān)產(chǎn)品的運行維護能力提升目標(biāo)更加清晰可見,幫助企業(yè)信息化運維工作順利開展。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論