“+智能”,讓災(zāi)備“可見”

任何人都不希望看到災(zāi)難或故障發(fā)生,更不想因?yàn)樘幹貌患皶r(shí)或不妥當(dāng),而造成經(jīng)濟(jì)、企業(yè)聲譽(yù)等方面的損失。但是現(xiàn)實(shí)中,來自自然界的災(zāi)難,以及企業(yè)內(nèi)外部遭受的攻擊,真可謂無處不在,無孔不入。因此,對(duì)于那些看重?cái)?shù)據(jù)安全、業(yè)務(wù)連續(xù)性的企業(yè)來說,災(zāi)備系統(tǒng)建設(shè)不可或缺,有備才能無患。

本文來自微信公眾號(hào)“云數(shù)智觀察”,作者/濤哥。

幾年前,筆者有幸親身參與了某商業(yè)銀行的遠(yuǎn)程災(zāi)備切換現(xiàn)場(chǎng)演練。記得那是一個(gè)下午,參與演練的幾十人集中在一個(gè)偌大的禮堂,按照業(yè)務(wù)流程分成若干個(gè)小組就座,銀行的領(lǐng)導(dǎo)、災(zāi)備方案提供商的技術(shù)專家都參與其中。兩點(diǎn)整,演練正式開始,從發(fā)現(xiàn)故障發(fā)出告警,到各個(gè)業(yè)務(wù)部門如何響應(yīng)、流轉(zhuǎn),再到系統(tǒng)切換命令的下達(dá)、執(zhí)行,直至最后災(zāi)備系統(tǒng)的啟動(dòng)、業(yè)務(wù)恢復(fù)正常,一套完整的流程得到了全面演練。現(xiàn)場(chǎng)氛圍十分嚴(yán)肅、緊張,作為旁觀者的筆者本人甚至連大氣也不敢喘。

任何人都不希望看到災(zāi)難或故障發(fā)生,更不想因?yàn)樘幹貌患皶r(shí)或不妥當(dāng),而造成經(jīng)濟(jì)、企業(yè)聲譽(yù)等方面的損失。但是現(xiàn)實(shí)中,來自自然界的災(zāi)難,以及企業(yè)內(nèi)外部遭受的攻擊,真可謂無處不在,無孔不入。因此,對(duì)于那些看重?cái)?shù)據(jù)安全、業(yè)務(wù)連續(xù)性的企業(yè)來說,災(zāi)備系統(tǒng)建設(shè)不可或缺,有備才能無患。

雖然大家都知道災(zāi)備的重要性,但是真的遇到自己上災(zāi)備系統(tǒng),很多企業(yè)還是會(huì)猶豫甚至?xí)蛲颂霉?。為什么?因?yàn)闉?zāi)備不僅僅是“錢堆出來的”,也不僅僅是一項(xiàng)有難度的技術(shù)活兒,更因?yàn)樗c業(yè)務(wù)流程相關(guān)、與人相關(guān),牽一發(fā)而動(dòng)全局,一旦出現(xiàn)失誤,很可能造成不可逆的損失。所以,建設(shè)了災(zāi)備系統(tǒng)卻形同虛設(shè),當(dāng)災(zāi)難或故障發(fā)生時(shí),不敢切換、不能切換或不會(huì)切換的情況并不鮮見。

1.png

究其原因,災(zāi)備系統(tǒng)的建設(shè)、管理與切換,不可見、不可控、不智能、不自動(dòng)化,在很大程度上需要仰仗人力,這就增加了不確定性和人為失誤的幾率。過去,很多企業(yè)可能重在災(zāi)備系統(tǒng)的投資建設(shè),認(rèn)為只要有了災(zāi)備系統(tǒng)就能在需要時(shí)派上用場(chǎng)。但實(shí)際上,有了災(zāi)備系統(tǒng)和在關(guān)鍵時(shí)刻能夠發(fā)揮應(yīng)有的作用,這中間還是有Gap的。

怎么辦?必須在災(zāi)備管理上下功夫!隨著技術(shù)的進(jìn)步、客戶需求的變化,災(zāi)備也要與時(shí)俱進(jìn),由以前的重建設(shè)到現(xiàn)在的重管理,由人力監(jiān)控管理到實(shí)現(xiàn)自動(dòng)化、智能化和可視化。

別讓災(zāi)備淪為擺設(shè)

工信部發(fā)布的《“十四五”軟件和信息技術(shù)服務(wù)業(yè)發(fā)展規(guī)劃》中就提出,豐富數(shù)據(jù)備份、災(zāi)難恢復(fù)等安全軟件產(chǎn)品和服務(wù)。隨著國家、行業(yè)和企業(yè)對(duì)數(shù)據(jù)安全與業(yè)務(wù)連續(xù)的重視程度不斷提升,災(zāi)備行業(yè)也實(shí)現(xiàn)了高速發(fā)展。Gartner預(yù)測(cè),2023年,全球?yàn)?zāi)備市場(chǎng)支出將達(dá)到330億美元,其中云災(zāi)備即服務(wù)(DRaaS)市場(chǎng)將呈現(xiàn)快速增長(zhǎng)態(tài)勢(shì),在中國市場(chǎng)上趨勢(shì)亦是如此。

從大的背景來看,由于數(shù)字化轉(zhuǎn)型的驅(qū)動(dòng),災(zāi)備作為一項(xiàng)保障業(yè)務(wù)連續(xù)性的關(guān)鍵措施,將為企業(yè)的數(shù)字化轉(zhuǎn)型守護(hù)好安全底線;從技術(shù)和應(yīng)用的發(fā)展來看,混合多云環(huán)境下,在不同的云上部署應(yīng)用和數(shù)據(jù),并保證其安全可用,就需要很好地解決多云環(huán)境下數(shù)據(jù)的備份和恢復(fù)問題,而大數(shù)據(jù)與AI的引入,也為災(zāi)備的發(fā)展和應(yīng)用開辟了新路,災(zāi)備智能化成了大勢(shì)所趨;從企業(yè)的實(shí)踐來看,為了保證業(yè)務(wù)7×24小時(shí)連續(xù)運(yùn)行,高可用性、實(shí)時(shí)性等成了基本要求,這就要求災(zāi)備不斷提升技術(shù)能力,為用戶提供更快捷、更可靠的災(zāi)備服務(wù)。

在數(shù)字化、多云、大數(shù)據(jù)、AI等綜合因素的共同影響和作用下,災(zāi)備正朝著自動(dòng)化、智能化、可視化、高可用、全面保護(hù)的方向發(fā)展。自動(dòng)化的災(zāi)備流程、智能化的監(jiān)控與管理,將進(jìn)一步提高災(zāi)備的效率與可靠性,有效消除用戶在數(shù)據(jù)和業(yè)務(wù)安全方面的后顧之憂。

“+智能”災(zāi)備更可控

地震、洪水等自然災(zāi)害是最常見的可能引發(fā)業(yè)務(wù)中斷事故的原因。還記得今年夏天的那場(chǎng)臺(tái)風(fēng)“杜蘇芮”嗎,受它影響,我國北方多地持續(xù)暴雨,北京西部地區(qū)就遭受了嚴(yán)重的洪水災(zāi)害,不僅出現(xiàn)了斷水?dāng)嚯姅嗑W(wǎng)的情況,而且一些數(shù)據(jù)中心也遭遇到不同程度的損毀。

如果因?yàn)榈卣稹⒑樗茸匀粸?zāi)害,致使電視臺(tái)的節(jié)目播出中斷,有可能給媒體傳播平臺(tái)的傳播力、引導(dǎo)力、影響力、公信力造成負(fù)面影響?!稄V播電視安全播出管理規(guī)定》中有這樣的明確要求:省級(jí)以上廣播電臺(tái)、電視臺(tái)、衛(wèi)星地球站應(yīng)當(dāng)配置完整、有效的容災(zāi)系統(tǒng),保證特殊情況下主要節(jié)目安全播出。

廣西廣電新媒體的核心系統(tǒng)眾多,每天都產(chǎn)生海量的數(shù)據(jù),由于媒體行業(yè)的特殊性,這些系統(tǒng)和數(shù)據(jù)對(duì)性能和安全性的要求都非常高。一旦發(fā)生自然災(zāi)害或者邏輯錯(cuò)誤、硬件故障、勒索病毒攻擊等,導(dǎo)致播出事故,將給其公眾形象造成不可挽回的損失。廣西雖然沒有處于大地震帶上,但距云南大地震帶較近,如果云南發(fā)生大地震,有可能引發(fā)南寧附近的余震,這些都是必須考慮的“意外”因素。

作為省級(jí)電視臺(tái),廣西廣電新媒體按照《廣播電視安全播出管理規(guī)定》,應(yīng)達(dá)到一級(jí)保障要求。因此,廣西廣電新媒體亟需一套適用于其新一代系統(tǒng)架構(gòu)的災(zāi)備解決方案。

1.png

在英方的助力下,廣西廣電新媒體在災(zāi)備建設(shè)上實(shí)現(xiàn)了“三步走”:第一,針對(duì)媒體中心每日產(chǎn)生的數(shù)據(jù),采用i2COOPY數(shù)據(jù)實(shí)時(shí)復(fù)制軟件,將數(shù)據(jù)實(shí)時(shí)遷移至廣西廣電云,確保生產(chǎn)端和災(zāi)備端的數(shù)據(jù)一致性;第二,通過英方i2Active+i2Availability+i2CDP的“組合拳”,對(duì)廣西廣電新媒體的關(guān)鍵業(yè)務(wù)進(jìn)行容災(zāi)接管和實(shí)時(shí)備份,達(dá)到了秒級(jí)的RPO與分鐘級(jí)的RTO指標(biāo)要求;第三,采用英方i2DRM容災(zāi)管理平臺(tái)進(jìn)行容災(zāi)的統(tǒng)一管理,建立完善的業(yè)務(wù)連續(xù)性管理系統(tǒng),并通過完善的資源管理,結(jié)合可視化的流程編排,實(shí)現(xiàn)不同場(chǎng)景下的容災(zāi)預(yù)案的電子化管理。

眾所周知,電視臺(tái)的系統(tǒng)龐雜,包括廣播電視節(jié)目制作、播出、媒體運(yùn)營(yíng)、廣告投放等。復(fù)雜的業(yè)務(wù)系統(tǒng)涉及眾多資源,如各種應(yīng)用軟件、數(shù)據(jù)庫,以及網(wǎng)絡(luò)資源、存儲(chǔ)資源、切換腳本資源等。在建設(shè)災(zāi)備系統(tǒng)時(shí),對(duì)這些紛繁復(fù)雜的資源進(jìn)行統(tǒng)一、有效的管理是一個(gè)棘手的問題。但是對(duì)于i2DRM來說則是“小菜一碟”。在實(shí)踐中,i2DRM可以輕松地將業(yè)務(wù)系統(tǒng)涉及的各種資源納入通過一管理,在容災(zāi)演練和切換時(shí),對(duì)所有資源進(jìn)行統(tǒng)一調(diào)度,確保了容災(zāi)演練和切換的順利進(jìn)行。

對(duì)于媒體來說,其關(guān)注點(diǎn)還是在于保證節(jié)目和內(nèi)容的正常、安全播出。而傳統(tǒng)的災(zāi)備系統(tǒng)在運(yùn)維和管理上不透明,對(duì)于電視臺(tái)的運(yùn)維人員來說是一項(xiàng)極大的負(fù)擔(dān)。廣西廣電新媒體之所以青睞i2DRM,很重要的一個(gè)原因是,平臺(tái)提供了指揮界面、大屏顯示等可視化的方式,而大屏展示正是容災(zāi)管理平臺(tái)的核心功能之一。在災(zāi)備演練切換執(zhí)行的全過程中,管理和運(yùn)維人員可以通過大屏顯示信息,實(shí)時(shí)掌握?qǐng)?zhí)行進(jìn)度和所有相關(guān)資源的狀態(tài)信息,并能在任意時(shí)刻通過大屏快速進(jìn)行決策。不僅如此,在每次的演練執(zhí)行完成后,容災(zāi)管理平臺(tái)還能自動(dòng)生成執(zhí)行報(bào)告,使得管理者可以根據(jù)報(bào)告對(duì)此前的預(yù)案進(jìn)行持續(xù)化的改進(jìn),從而大幅提升容災(zāi)管理的智能化水平。

災(zāi)備智能化是云和大數(shù)據(jù)環(huán)境下災(zāi)備的新發(fā)展需求。災(zāi)備的智能化是在傳統(tǒng)存儲(chǔ)災(zāi)備、定時(shí)備份的基礎(chǔ)上,通過一系列技術(shù)創(chuàng)新,實(shí)現(xiàn)災(zāi)備的自動(dòng)化接管和演練。作為國內(nèi)災(zāi)備行業(yè)的領(lǐng)軍企業(yè),英方正是將智能化作為災(zāi)備演進(jìn)的新突破口,通過全流程化的指揮管理、資源管理、預(yù)案管理及平臺(tái)管理,并結(jié)合平臺(tái)可視化的容災(zāi)流程編排和災(zāi)難恢復(fù)國家標(biāo)準(zhǔn),對(duì)整個(gè)應(yīng)急切換、容災(zāi)演練進(jìn)行全程實(shí)時(shí)監(jiān)控,利用決策級(jí)的大屏界面展示容災(zāi)的關(guān)聯(lián)資源,科學(xué)把握和推進(jìn)容災(zāi)切換進(jìn)度,讓管理員可以準(zhǔn)確、快速地指揮決策。

總結(jié)來說,i2DRM容災(zāi)管理平臺(tái)通過決策級(jí)的大屏指揮視圖功能,可以從容應(yīng)對(duì)容災(zāi)切換或演練的突發(fā)狀況,整體過程相比傳統(tǒng)容災(zāi)流程更加透明可控,因此特別適合那些對(duì)業(yè)務(wù)連續(xù)性有較高要求的客戶,特別是在大型災(zāi)備系統(tǒng)的演練及災(zāi)備切換中表現(xiàn)尤為突出。

全流程的可視化、智能化

2021年11月23日上午,東南亞地區(qū)最大的銀行新加坡星展銀行的網(wǎng)上銀行服務(wù)出現(xiàn)大規(guī)模中斷,遭數(shù)千名客戶投訴后,11月24日在恢復(fù)服務(wù)幾小時(shí)后再次中斷。2023年5月,尼日利亞市值最大的銀行Zenith Bank主數(shù)據(jù)中心的一套備用電源系統(tǒng)起火,導(dǎo)致數(shù)據(jù)中心基礎(chǔ)設(shè)施全面宕機(jī)。2023年6月,加拿大皇家銀行(RBC)的在線和移動(dòng)系統(tǒng)遇到問題,致使大量客戶不能轉(zhuǎn)賬。

為了保證業(yè)務(wù)的連續(xù)性,更好地支撐業(yè)務(wù)創(chuàng)新,金融行業(yè)亟待提升數(shù)據(jù)中心的容災(zāi)能力,尤其是要將災(zāi)備切換演練落到實(shí)處。目前,國內(nèi)很多商業(yè)銀行正在積極推進(jìn)“三大銀行”(責(zé)任銀行、合規(guī)銀行、智慧銀行)的建設(shè),加速數(shù)字化轉(zhuǎn)型,致力于打造智慧銀行。業(yè)務(wù)的智慧化,當(dāng)然需要智慧化的災(zāi)備作為支撐。

面對(duì)行業(yè)的強(qiáng)監(jiān)管要求和不斷增長(zhǎng)的數(shù)據(jù),銀行亟需建立高效、合規(guī)、智能的災(zāi)備方案,以確保數(shù)據(jù)零丟失和業(yè)務(wù)連續(xù)性。在實(shí)踐中,由于銀行的系統(tǒng)架構(gòu)十分復(fù)雜,而災(zāi)備設(shè)備和資源又比較分散,因此對(duì)所有資源進(jìn)行統(tǒng)一管理,以確保恢復(fù)的可行性就顯得十分重要。隨著新一代信息技術(shù)的持續(xù)更迭,特別是大數(shù)據(jù)、人工智能等技術(shù)的快速發(fā)展,銀行也開始努力尋求智能化的災(zāi)備管理,利用云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)手段,實(shí)現(xiàn)更快、更智能的響應(yīng)。正是在這一背景下,i2DRM容災(zāi)管理平臺(tái)越來越快地走進(jìn)了銀行。

一個(gè)完整的災(zāi)備流程通常包括容災(zāi)準(zhǔn)備、預(yù)案和流程管理、演練/切換執(zhí)行、評(píng)估報(bào)告等環(huán)節(jié),如果僅僅依靠人力進(jìn)行監(jiān)控與管理,顯然很難做到面面俱到。i2DRM正是一個(gè)覆蓋容災(zāi)全流程的智能化管理體系,旨在讓容災(zāi)建設(shè)、運(yùn)維管理和切換/演練變得更加輕松。

i2DRM能夠?qū)崿F(xiàn)全流程自動(dòng)化,主要因?yàn)槠漕A(yù)案的電子化與流程化能力。具體來看,通過預(yù)案管理功能,它能夠?qū)崿F(xiàn)流程化、可視化的任務(wù)編排,將預(yù)案進(jìn)行統(tǒng)一電子化管理,并以任務(wù)為單元,進(jìn)行串行或并行編排,根據(jù)不同場(chǎng)景組成預(yù)案,最終可對(duì)預(yù)案發(fā)起應(yīng)急切換或演練。強(qiáng)大的執(zhí)行管理能力也是i2DRM能夠?qū)崿F(xiàn)災(zāi)備管理智能化的一個(gè)重要原因。通過資源鎖定、人員簽到、執(zhí)行任務(wù)、執(zhí)行完成/資源釋放等一系列步驟,i2DRM能夠?qū)σ淹瓿删幣旁O(shè)計(jì)的預(yù)案發(fā)起切換或演練,在執(zhí)行任務(wù)的過程中還可通過流程化的調(diào)度引擎,實(shí)現(xiàn)整個(gè)切換過程的自動(dòng)執(zhí)行。

貴陽銀行就是通過i2DRM完成了核心業(yè)務(wù)系統(tǒng)的容災(zāi)業(yè)務(wù)流程指引工作,當(dāng)前置應(yīng)用系統(tǒng)、核心應(yīng)用系統(tǒng)、數(shù)據(jù)庫應(yīng)用系統(tǒng)、數(shù)倉轉(zhuǎn)換系統(tǒng)發(fā)生異常時(shí),能夠助力客戶根據(jù)對(duì)應(yīng)的容災(zāi)業(yè)務(wù)流程指引完成相關(guān)容災(zāi)切換工作并形成容災(zāi)報(bào)告,從而降低風(fēng)險(xiǎn)發(fā)生的概率以及災(zāi)難可能造成的損失。

i2DRM在容災(zāi)管理上的諸多創(chuàng)新,進(jìn)一步提升了行業(yè)客戶應(yīng)對(duì)各類風(fēng)險(xiǎn)的能力,改善了容災(zāi)備份的管理和使用體驗(yàn),讓容災(zāi)更加智能,在確保安全的同時(shí),實(shí)現(xiàn)了業(yè)務(wù)價(jià)值的最大化。這正是英方打造新一代容災(zāi)管理平臺(tái)的初衷。

從災(zāi)備走向數(shù)據(jù)管理

由于在災(zāi)備體系統(tǒng)一管理、常態(tài)化演練、自動(dòng)應(yīng)急切換、災(zāi)難切換大屏指揮等場(chǎng)景中游刃有余,i2DRM已經(jīng)在金融、企業(yè)中有了很多成功的落地應(yīng)用,而政務(wù)、公檢法和交通等行業(yè)的客戶同樣對(duì)于災(zāi)備的可視化和智能化管理有著迫切的需求。

災(zāi)備智能化是一個(gè)不斷演進(jìn)、完善的過程。i2DRM在實(shí)現(xiàn)傳統(tǒng)災(zāi)備的產(chǎn)品界面展示向集中式、智能化的大屏展示過渡方面實(shí)現(xiàn)了重要突破,讓災(zāi)備可見、智能接管,并且實(shí)現(xiàn)了災(zāi)備管理預(yù)編排和智能管理,引領(lǐng)了災(zāi)備未來的發(fā)展趨勢(shì)。

據(jù)了解,當(dāng)前i2DRM還是主要支持英方自己的軟件產(chǎn)品,不過其資源中心近期也新增了Oracle ADG集成功能,可自動(dòng)獲取ADG規(guī)則,并對(duì)ADG進(jìn)行納管和狀態(tài)監(jiān)控,支持單獨(dú)對(duì)ADG或切換流程中對(duì)ADG進(jìn)行切換操作,同時(shí)內(nèi)置ADG啟動(dòng)、停止、切換操作,無需編寫腳本。未來,隨著研發(fā)的持續(xù)投入,i2DRM將更加開放,支持更多的產(chǎn)品接入。

有業(yè)內(nèi)專家指出,災(zāi)備未來將向數(shù)據(jù)管理進(jìn)一步延伸。數(shù)據(jù)是企業(yè)的重要資產(chǎn),在不影響數(shù)據(jù)安全性的前提下,將數(shù)據(jù)用于開發(fā)測(cè)試、容災(zāi)演練、數(shù)據(jù)分析甚至進(jìn)行更深入的價(jià)值挖掘,這些都是災(zāi)備系統(tǒng)需要去持續(xù)探索的。英方也在突破災(zāi)備的“舒適圈”,在更廣闊的數(shù)據(jù)復(fù)制行業(yè)開拓創(chuàng)新。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論