配置信息、腳本管理、自動(dòng)化發(fā)布……企業(yè)級(jí)應(yīng)用運(yùn)維自動(dòng)化常見10個(gè)問題

應(yīng)用運(yùn)維涉及到各式各樣的應(yīng)用系統(tǒng),不同技術(shù)體系的產(chǎn)品,在做一些標(biāo)準(zhǔn)化時(shí)可采取封裝嵌套方式,比如服務(wù)啟停,針對(duì)Windows、linux、unix不同平臺(tái)都封裝了標(biāo)準(zhǔn)的統(tǒng)一啟停腳本,腳本內(nèi)部嵌套各個(gè)子服務(wù)的啟停腳本,將差異性內(nèi)容包裝在內(nèi)。這樣在自動(dòng)化應(yīng)用中,關(guān)注的是外層的標(biāo)準(zhǔn)腳本,內(nèi)部腳本可以按需修改調(diào)整。

本文內(nèi)容由多位社區(qū)會(huì)員貢獻(xiàn)。整理者:zjwy82,某銀行系統(tǒng)架構(gòu)師,參與多個(gè)大型企業(yè)級(jí)應(yīng)用的規(guī)劃、開發(fā)與實(shí)施,對(duì)于傳統(tǒng)企業(yè)級(jí)應(yīng)用的自動(dòng)化集成與部署有良好的實(shí)踐經(jīng)驗(yàn)。

1、自動(dòng)化運(yùn)維平臺(tái)建設(shè)中的配置管理起到什么作用?

配置管理范圍很大,在自動(dòng)化中,不同領(lǐng)域關(guān)注信息不一樣,如應(yīng)用關(guān)注服務(wù),系統(tǒng)關(guān)注服務(wù)器,網(wǎng)絡(luò)關(guān)注交換機(jī)火墻及IP。自動(dòng)化的操作要保證正確性,就依賴配置準(zhǔn)確,合理建模,一個(gè)操作與預(yù)期是否一致,所操作的對(duì)象要準(zhǔn)就依賴配置信息,配置要管理自動(dòng)化自動(dòng)化的操作要保證正確性,就依賴配置準(zhǔn)確,合理建模,一個(gè)操作與預(yù)期是否一致,所操作的對(duì)象要準(zhǔn)就依賴配置信息,配置要管理自動(dòng)化自動(dòng)化的操作要保證正確性,就依賴配置準(zhǔn)確,合理建模,一個(gè)操作與預(yù)期是否一致,所操作的對(duì)象要準(zhǔn)就依賴配置信息,配置要管理自動(dòng)化。

2、配置信息庫應(yīng)該如何設(shè)計(jì),既可以涵蓋自動(dòng)化所需的數(shù)據(jù),又不龐大而繁雜不好管理?

配置管理是很古老的話題,在做自動(dòng)化時(shí)可采取小而全大集權(quán)的模式。小而全是指各專業(yè)領(lǐng)域建立自己的配置管理子庫,管理自己所需的數(shù)據(jù)。大集權(quán)是指配置項(xiàng)標(biāo)準(zhǔn)集中管理,專業(yè)領(lǐng)域橫向依賴的信息集中管理,各子庫作為數(shù)據(jù)源,集中庫作為信息交換源。

子庫建設(shè)為各專業(yè)領(lǐng)域的自動(dòng)化提供依據(jù),在自動(dòng)化場景中應(yīng)用配置信息,使得配置信息的準(zhǔn)確。

3、配置信息如何利用自動(dòng)化來實(shí)現(xiàn)動(dòng)態(tài)采集?

配置信息的自動(dòng)化采集需要預(yù)先建立一些標(biāo)準(zhǔn),如配置項(xiàng)標(biāo)準(zhǔn)、采集模板、采集時(shí)序等,配置項(xiàng)要根據(jù)不同的產(chǎn)品類型設(shè)定,例如操作系統(tǒng)要區(qū)分Linux、unix等;采集模板在配置項(xiàng)標(biāo)準(zhǔn)上根據(jù)不同要求擴(kuò)展。有了標(biāo)準(zhǔn)采集,設(shè)定相應(yīng)采集時(shí)序,對(duì)采集內(nèi)容進(jìn)行定期采集入庫管理,建立配置信息的基線。例如我們每天采集相應(yīng)信息,與上一個(gè)基線比對(duì),差異情況推送給相應(yīng)負(fù)責(zé)人進(jìn)行確認(rèn),根據(jù)確認(rèn)結(jié)果更新基線。配置的準(zhǔn)確性還依賴于使用,在使用過程中發(fā)現(xiàn)配置采集的準(zhǔn)確性問題,修訂配置項(xiàng)標(biāo)準(zhǔn)和采集模板。

4、應(yīng)用運(yùn)維自動(dòng)化中的腳本標(biāo)準(zhǔn)化怎么做?

應(yīng)用運(yùn)維涉及到各式各樣的應(yīng)用系統(tǒng),不同技術(shù)體系的產(chǎn)品,在做一些標(biāo)準(zhǔn)化時(shí)可采取封裝嵌套方式,比如服務(wù)啟停,針對(duì)Windows、linux、unix不同平臺(tái)都封裝了標(biāo)準(zhǔn)的統(tǒng)一啟停腳本,腳本內(nèi)部嵌套各個(gè)子服務(wù)的啟停腳本,將差異性內(nèi)容包裝在內(nèi)。這樣在自動(dòng)化應(yīng)用中,關(guān)注的是外層的標(biāo)準(zhǔn)腳本,內(nèi)部腳本可以按需修改調(diào)整。

5、自動(dòng)化運(yùn)維的核心是做腳本開發(fā)嗎?

自動(dòng)化運(yùn)維不僅僅是實(shí)現(xiàn)日常運(yùn)維工作腳本化的開發(fā)與管理,而應(yīng)從組織、文化、管理和技術(shù)幾個(gè)方面建立一個(gè)系統(tǒng)性的能力框架體系,形成一種運(yùn)維長效機(jī)制,為數(shù)據(jù)中心向運(yùn)營轉(zhuǎn)型提供支撐能力。

6、自動(dòng)化運(yùn)維中的腳本怎么管理?

自動(dòng)化離不開腳本,腳本管理上可以集中式管理和分布式管理(放在目標(biāo)對(duì)象上),集中管理的好處是能夠統(tǒng)一控制版本,避免同一操作在不同目標(biāo)對(duì)象上執(zhí)行不一樣版本的腳本。分布式管理能夠確保自動(dòng)化平臺(tái)對(duì)目標(biāo)對(duì)象失去管控情況下的替代手段。在自動(dòng)化運(yùn)維時(shí)建議集中管理,能夠控制版本一致性,同時(shí)可以對(duì)歷史版本統(tǒng)一管理留存,執(zhí)行時(shí)將腳本下發(fā)到目標(biāo)機(jī),可以確保一次操作的完整時(shí)序。

7、自動(dòng)化發(fā)布的設(shè)計(jì)時(shí),如何保證安全性和正確性?

安全性和正確性是自動(dòng)化的基本要求。實(shí)際上這個(gè)問題在手工操作時(shí)也一樣存在,只是殺傷面不一樣。

對(duì)于自動(dòng)化發(fā)布而言,要原子化,即操作任務(wù)拆解,應(yīng)遵循單元操作功能簡單,可回滾,可重新調(diào)度,可驗(yàn)證,有驗(yàn)證的原則。

安全控制依賴于多個(gè)層面,一是用戶權(quán)限,要和現(xiàn)有用戶授權(quán)平臺(tái)對(duì)接(至少權(quán)限數(shù)據(jù)對(duì)接,哪些用戶可用,哪些服務(wù)可操作),二是對(duì)象一致即配置準(zhǔn)確,所操作服務(wù)器嚴(yán)格控制,三是開發(fā)測試生產(chǎn)對(duì)接,做測試。

8、自動(dòng)化發(fā)布時(shí)各應(yīng)用開發(fā)和運(yùn)維人員如何實(shí)時(shí)監(jiān)控發(fā)布的詳細(xì)情況?

自動(dòng)化發(fā)布的目標(biāo)是將應(yīng)用服務(wù)按需求正確部署,傳統(tǒng)情況下我們都是通過登錄主機(jī)操作,能實(shí)時(shí)查看到輸出結(jié)果,這樣的操作有既視感,讓操作人員心安。而自動(dòng)化后怎么監(jiān)控的問題會(huì)在初期困擾運(yùn)維人員,我們通過將日志準(zhǔn)實(shí)時(shí)采集展示在自動(dòng)化平臺(tái)上實(shí)現(xiàn)對(duì)后臺(tái)運(yùn)行情況的監(jiān)控。同時(shí)也在自動(dòng)化的步驟中增加驗(yàn)證步驟,將原有通過人觀察結(jié)果判斷的方式轉(zhuǎn)換成自動(dòng)化判斷方式。

對(duì)于開發(fā)和運(yùn)維人員,通過前端顯示流程執(zhí)行進(jìn)度、狀態(tài)及后臺(tái)輸出等信息來實(shí)現(xiàn)等效的手工操作觀察。

自動(dòng)化運(yùn)維尤其是復(fù)雜多變的發(fā)布,雖說可通過狀態(tài)等自動(dòng)判斷和驗(yàn)證等多種措施保證正確性,但模擬常規(guī)的查看后臺(tái)運(yùn)行狀態(tài)等準(zhǔn)實(shí)時(shí)監(jiān)視是非常有必要的。其他應(yīng)用系統(tǒng)有多種業(yè)務(wù)驗(yàn)證規(guī)則并有相應(yīng)的業(yè)務(wù)人員檢查,還需技術(shù)人員監(jiān)控查閱后臺(tái)服務(wù)情況,自動(dòng)化運(yùn)維系統(tǒng)是業(yè)務(wù)與技術(shù)合一的系統(tǒng),開發(fā)技術(shù)人員往往對(duì)自己的編程過于樂觀,測試也很難百分之百到位,運(yùn)維實(shí)施過程中監(jiān)控后臺(tái)運(yùn)行情況就很有必要。

9、對(duì)于使用自動(dòng)化運(yùn)維平臺(tái)進(jìn)行大規(guī)模變更,應(yīng)建立什么樣的審核制度進(jìn)行風(fēng)險(xiǎn)控制?

變更是運(yùn)維中最常實(shí)施的場景,大規(guī)模實(shí)施的風(fēng)險(xiǎn)控制也是我們所關(guān)注的點(diǎn)。在日常工作中,變更從發(fā)起需求到實(shí)施需要經(jīng)過需求評(píng)估、方案制定與評(píng)估、變更方案驗(yàn)證測試、變更方案評(píng)審、生產(chǎn)實(shí)施幾個(gè)階段。自動(dòng)化的實(shí)施在流程上各個(gè)環(huán)節(jié)依然需要具備,同時(shí)在技術(shù)上,采取分批試點(diǎn)驗(yàn)證后集中實(shí)施的方式。總結(jié)來說,一是前期準(zhǔn)備充分,二變更流程審核,三是試點(diǎn)實(shí)施驗(yàn)證,四是規(guī)模實(shí)施。

10、為了滿足需求,以及需求的不斷變化,運(yùn)維操作的拆解,需要拆解到什么樣粒度?

對(duì)于自動(dòng)化操作拆解粒度,實(shí)際上也是自動(dòng)化建設(shè)過程中的標(biāo)準(zhǔn)化過程。對(duì)于應(yīng)用的自動(dòng)化而言,由于應(yīng)用系統(tǒng)的差異性,完全統(tǒng)一的標(biāo)準(zhǔn)化存在難度。但也應(yīng)遵循單元操作功能簡單,可回滾,可重新調(diào)度,可驗(yàn)證的原則。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論