哪些數據備份場景依然是信創(chuàng)趨勢下的關注重點?

數據是企業(yè)的核心資產,數據備份可以有效應對系統(tǒng)運行過程中的存在的數據損失風險,是保障業(yè)務連續(xù)性的基石。對于關系型數據庫備份、文件備份、虛機備份等傳統(tǒng)備份場景,現有的備份技術和解決方案已經相當成熟和普及。

本文來自微信公眾號“twt企業(yè)IT社區(qū)”,作者/康建國,某省農信資深系統(tǒng)工程師,主要負責Power小型機、存儲、數據庫等方面的運維及管理工作,對存儲雙活、數據庫高可用等方面有著深入的見解。

數據是企業(yè)的核心資產,數據備份可以有效應對系統(tǒng)運行過程中的存在的數據損失風險,是保障業(yè)務連續(xù)性的基石。對于關系型數據庫備份、文件備份、虛機備份等傳統(tǒng)備份場景,現有的備份技術和解決方案已經相當成熟和普及。隨著IT基礎設施國產化進程的大力推進,同時伴隨著近些年來,云原生、分布式數據庫等分布式技術的蓬勃發(fā)展,我們需要重新審視已有的備份技術和體系,辨別新形勢下新的備份場景,同時需要為這些新的備份場景尋找合適的備份解決方案。

在談數據備份之前,首先需要明確一下備份和容災的區(qū)別,因為我們討論備份場景的時候一些同行會發(fā)出這樣的困惑:我們這個數據平臺底層是多副本設計,為啥還要做備份?我們這個數據庫通過數據復制實現了同城容災,為啥本地還要做備份?

數據多副本這樣的高可用設計以及容災架構的設計是為了應對軟硬件故障、或者火災地震等意外發(fā)生時,整個應用系統(tǒng)可以正常運行或者切換到另一處后系統(tǒng)功能可以繼續(xù)正常工作。數據備份則是為了抵御各類計劃外故障、數據誤刪、惡意攻擊等異常場景下的數據丟失。僅有高可用容災設計,無法避免數據誤刪和惡意攻擊等意外,而僅有數據備份又無法在災難發(fā)生時快速恢復業(yè)務系統(tǒng)。因此,備份和容災和備份有著明顯的區(qū)別,同時又緊密結合、缺一不可,IT運維人員千萬不可有重容災輕備份的偏見思維。

數據備份理論范疇很廣,通常包括備份場景、備份策略、備份介質、備份架構等多個維度。

一、傳統(tǒng)備份場景

首先我們梳理匯總一下我們金融行業(yè)長久以來需要備份的幾個主要場景,包括關系型數據庫備份、文件備份、大數據平臺備份、虛擬化環(huán)境備份等。

1.關系型數據庫備份

以DB2、ORACLE為代表的關系型數據庫的備份是所有數據備份場景里面占比最高的場景,經過幾十年的發(fā)展,這個場景的備份各行業(yè)各企業(yè)都已經做得很成熟了。

2.文件備份

重要數據文件的備份也是傳統(tǒng)備份里面一個常見的場景,包括以文件形式存儲的重要業(yè)務數據、系統(tǒng)配置文件、系統(tǒng)日志等等。文件備份的手段很多,當數量不大時用拷貝、打包等方式備份到第二存儲介質了即可。當海量文件需要備份時,在備份和恢復速度方面就會有很大挑戰(zhàn)。這種場景下需要使用基于rsync命令的高并發(fā)備份工具去備份海量文件,當然也可以考慮用CDP技術對儲存文件的硬盤進行快照,需要恢復的時候直接掛載起來使用即可。

3.大數據平臺備份

大數據平臺里面的數據有幾個特點,第一,數據量巨大;第二,數據結構類型復雜多樣,有結構化、非結構化、半結構化;第三,數據功能分多個層次,包括基礎數據、初步架構數據、深度加工數據、分析結果數據等等;第四,數據來源很廣,有內部各應用下沉的基礎數據,有外部引入的基礎數據。因此,很難有一個萬能的備份平臺來完成對大數據平臺內所有數據的備份恢復工作。

筆者認為對于大數據平臺的數據備份,需要對數據進行分級分類設計。例如:如果基礎數據是可以隨時從源頭調用,而源頭又有完善的備份機制,那么基礎數據是否就可以沒必要備份了。而經過復雜加工之后的數據單獨切分出來進行備份。保障接近應用上層的若干連續(xù)分級數據的備份即可。在分級分類的時候,需要考慮到數據量級、數據再生條件、數據重要性、數據加工的復雜度和耗時等等因素,保留中間層可以為分析模型提供直接分析支持的數據即可。

4.虛擬化環(huán)境備份

虛擬化環(huán)境備份主要是VMware和云平臺中虛機的備份,這一塊可以依賴虛擬化平臺自身的備份功能,也可以借助CDM/CDP等技術手段進行備份。隨著云計算技術的不斷成熟,依賴云平臺自身運維功能進行云主機、云硬盤的備份手段已經很成熟了。

二、信創(chuàng)趨勢下的備份考量

(一)重要備份場景

隨著國產化進程的推進,在新形勢新趨勢下有哪些備份場景需要我們用戶重點關注呢?筆者認為有以下兩個場景最值得研究和關注。

1.分布式數據庫備份

近幾年伴隨著基礎軟件國產化的快速推進,以DB2、ORACLE為首的外國商用集中式數據庫向國產分布式數據庫的改造正如火如荼地進行。在這樣的形式下,國產分布式數據庫的備份場景已經是目前信創(chuàng)趨勢下的一大重點。

我們用戶需要重點關注和研究國產分布式數據庫的備份技術和實現手段,這里面需要注意的是國產備份軟件和國產分布式數據庫的兼容性和穩(wěn)定性問題。目前,愛數、鼎甲、云信達、壹進制等國產備份廠商已經紛紛和幾大國產分布式數據庫進行了適配。但是由于國產分布式數據庫自身的功能還在發(fā)展階段,缺陷較多,這對國產備份軟件在適配方面提出了非常高的要求。

另外,分布式數據庫自身架構和部署方式的不同也會給備份帶來不同的特點,比如單中心、多中心的不同部署方式對應的備份方式可能不一樣。單分片、多分片架構備份的特點也不一樣。對于多分片數據庫的備份,在多個數據分片合并恢復的時候需要考慮數據庫的全局一致性。

2.容器備份

隨著云原生理念的不斷普及,越來越多的企業(yè)開始和研究和應用容器技術,部分大型銀行的核心系統(tǒng)已經使用容器。因此,容器的備份應當是目前以及未來備份場景中需要重點關注的一個方面。

大部分容器使用場景下,為了更便捷地進行容器任意調度、遷移,在設計上把容器盡可能做成無狀態(tài)服務,狀態(tài)保存在外部存儲池中。在這種設計下,容器應用無需備份,只需要對外部存儲中的應用數據進行備份。

但是在如今k8s容器時代,容器是一個動態(tài)變化的資源,例如正在運行在哪個node上、配置的參數、版本等等信息都可能是變化的。容器的數據備份已經不能把容器本身以及應用的數據分開來了。備份的時候,應該把應用的資源以及數據打包,一起備份到第二存儲上去。

(二)備份策略制定

數據備份的策略,從大的維度要確定哪些數據需要備份、哪些數據需要全量備份、哪些數據可以增量備份,從細的維度要確定備份的頻率、窗口等各種必要因素。制定備份策略的過程需要考慮到數據本身的量級、數據的具體類型、極端條件下對數據恢復時間及數據丟失量的容忍程度、數據備份系統(tǒng)以及備份介質本身的性能特性、業(yè)務發(fā)展的規(guī)模及趨勢判斷等等。

(三)備份系統(tǒng)設計

信創(chuàng)趨勢下,對于備份系統(tǒng)的設計主要包括備份介質和備份軟件的選擇、備份系統(tǒng)整體架構的設計。

1.備份介質的選擇

備份介質從是否需要加電的角度分為在線介質和離線介質兩類。在線介質主要是各類磁盤設備,包括服務器本地硬盤、集中式塊存儲、集中式NAS、分布式NAS、對象存儲等。離線介質主要是磁帶和藍光存儲。

按照《GB/T 20988—2007信息安全技術信息系統(tǒng)災難恢復規(guī)范》中對于數據備份系統(tǒng)的要求--“備份介質場外存放”,個人認為離線備份是有必要的。現在部分用戶完全使用在線設備(比如大數據平臺、對象存儲)用作備份數據的永久保留個人認為和監(jiān)管要求有偏離。

傳統(tǒng)離線介質主要是磁帶,單盤容量大,保存周期長,金融行業(yè)已經具有多年的成熟使用經驗,但目前仍然是依靠外國產品。隨著國產化進程的推進,備份介質的國產化是不可避免的主題。使用大容量光盤作為存儲介質的藍光存儲目前成為備選方案之一,但其生態(tài),即和各個備份場景的兼容性還有待完善和檢驗。

2.備份軟件的選擇

過去我們主要使用TSM、NBU、CV等國外廠商的備份軟件,這些備份軟件也和DB2、ORACLE等外國商用數據庫有著很好的兼容性。近幾年伴隨著基礎軟件國產化的推進,DB2、ORACLE等外國商用數據庫向國產數據庫的改造推進速度極快,同時也涌現出一批有競爭力的國產備份軟件。當然由于國產數據庫尤其是國產分布式數據庫以及國產操作系統(tǒng)版本更新速度很快,對國產備份軟件和它們兩者之間的兼容性的挑戰(zhàn)很大。很多用戶也是在采用有代理還是無代理的備份方式之間徘徊。個人認為可以優(yōu)先考慮無代理備份方式,以減少由于數據庫服務器本地操作系統(tǒng)或者數據庫版本升級帶來的麻煩。

3.備份系統(tǒng)整體架構的設計

對于備份系統(tǒng)整體架構的設計就是將備份介質、備份軟件、備份數據傳輸方式三者整體結合起來的過程。備份介質和備份軟件根據在線/離線、外國/國產、有無代理等維度考慮。備份數據傳輸方式主要是萬兆以太網和SAN網絡兩種。在國產分布式數據庫、大數據平臺等備份場景下,同時結合國產備份軟件,萬兆以太網已成為從數據源端到備份介質之間傳輸的主要網絡載體。

對于備份系統(tǒng)整體架構的設計,這里舉兩種典型的架構設計。第一種是系統(tǒng)集成方案,比如采用分布式NAS對于近期備份數據在線保存,采用藍光存儲作為長期歸檔保存,同時采用一個國產備份軟件用來定時將分布式數據庫數據先備份到分布式NAS,再從分布式NAS上將超過一定時間的備份結果轉儲到離線存儲進行永久保存。第二種則是很多國產備份廠商推崇的軟硬一體架構,比如華為的OceanProtect一體化備份方案、各個國產備份廠商的備份一體機等等。對于技術基礎扎實喜歡DIY的用戶可以選擇第一種,對于希望快速部署拿來即用的用戶則可以選擇第二種。

三、總結

數據備份是永恒的話題,做好數據備份是保障業(yè)務連續(xù)性的基石,是企業(yè)的生命線。隨著IT基礎設施和基礎軟件國產化進程的快速推進,我們需要及時探索新的更符合長期發(fā)展的備份方案,更新企業(yè)的整體備份架構,方能跟上時代步伐,與時俱進。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論