技術(shù)干貨|Oracle RAC上云怎么玩?

存儲在線
崔歡歡
眾所周知,Oracle數(shù)據(jù)庫作為數(shù)據(jù)中心的核心業(yè)務(wù)系統(tǒng),在企業(yè)、政府、金融、教育、醫(yī)療等行業(yè)被廣泛應(yīng)用。Oracle RAC(實時應(yīng)用集群)是Oracle數(shù)據(jù)庫完全高可用體系解決方案中的一個關(guān)鍵產(chǎn)品,也是Oracle數(shù)據(jù)庫支...

眾所周知,Oracle數(shù)據(jù)庫作為數(shù)據(jù)中心的核心業(yè)務(wù)系統(tǒng),在企業(yè)、政府、金融、教育、醫(yī)療等行業(yè)被廣泛應(yīng)用。Oracle RAC(實時應(yīng)用集群)是Oracle數(shù)據(jù)庫完全高可用體系解決方案中的一個關(guān)鍵產(chǎn)品,也是Oracle數(shù)據(jù)庫支持網(wǎng)格計算環(huán)境的核心技術(shù)。目前,大量大型企業(yè)的核心ERP、政府的重要業(yè)務(wù)、醫(yī)院的HIS等系統(tǒng)都采用了Oracle RAC以保障其穩(wěn)定運行。

科普:Oracle RAC是什么樣的架構(gòu)?

b

我們來了解下,Oracle RAC實時應(yīng)用集群是一個什么樣的架構(gòu)呢,當(dāng)前Oracle 主流使用是的Oracle9i、10g、11g版本,可以支持24 x 7 有效的數(shù)據(jù)庫應(yīng)用系統(tǒng),能在低成本服務(wù)器上構(gòu)建高可用性數(shù)據(jù)庫系統(tǒng),并且應(yīng)用無需修改代碼可以自由部署,Oracle RAC架構(gòu)如下:

b1

圖示:RAC的數(shù)據(jù)放在共享存儲上,計算由數(shù)臺服務(wù)器提供

b2

圖示:RAC在傳統(tǒng)物理環(huán)境下的部署結(jié)構(gòu)

由上可看出Oracle RAC既有它的優(yōu)勢也有不足之處:

RAC方案優(yōu)點:1、多節(jié)點并發(fā)處理,高性能;2、高可用,跨四切換;3、高擴展性

RAC方案不足:1、相對單機管理更復(fù)雜;2、如果系統(tǒng)規(guī)劃設(shè)計能力不足,性能可能不如單節(jié)點;

傳統(tǒng)的Oracle RAC在管理、監(jiān)控、硬件性能擴展、存儲擴容方面有明顯局限性,超融合架構(gòu)具有隨需應(yīng)變、靈活擴展、高可用、高可靠等天然優(yōu)勢,如果Oracle RAC與超融合架構(gòu)相結(jié)合,則可以很好地解決這些問題。而深信服超融合實現(xiàn)了計算、存儲、網(wǎng)絡(luò)、安全的完全軟件定義和融合,不僅極大簡化IT的運維工作,還能夠為業(yè)務(wù)的快速變化提供快速的響應(yīng)能力。

深信服企業(yè)級云正是基于超融合架構(gòu)構(gòu)建,能夠承載Oracle RAC、MySQL、HIS等關(guān)鍵應(yīng)用的企業(yè)級云解決方案。這里我們重點分享Oracle RAC在深信服超融合環(huán)境中的最佳實踐,通過不斷的技術(shù)創(chuàng)新,一方面,結(jié)合 Oracle數(shù)據(jù)庫系統(tǒng)原本就具備的可移植性好、使用方便、功能強、適應(yīng)高吞吐量的特點,實現(xiàn)了深信服超融合對Oracle 及 Oracle RAC的完美支持;另一方面,通過在I/O、網(wǎng)絡(luò)、共享盤等領(lǐng)域的重大技術(shù)突破,解決了超融合架構(gòu)的虛擬化環(huán)境中運行Oracle RAC數(shù)據(jù)庫集群原本存在的性能問題。

實踐:超融合如何支持Oracle RAC上云?

實現(xiàn)Oracle RAC在云化環(huán)境下的部署,有幾個關(guān)鍵因素需要考慮:1、數(shù)據(jù)庫可用性;2、數(shù)據(jù)庫磁盤配置和數(shù)據(jù)安全;3、數(shù)據(jù)庫性能保障。

這些要素在沒有進(jìn)行定向優(yōu)化的虛擬化環(huán)境中難以被滿足的,因此深信服超融合針對Oracle RAC場景進(jìn)行了大量創(chuàng)新,形成了一套最佳實踐:

1、 數(shù)據(jù)庫可用性設(shè)計

a.平臺創(chuàng)建2臺虛擬機部署Oracle服務(wù)并分配在不同物理服務(wù)器上,超融合為RAC集群虛擬機提供互斥策略,充分避免單臺物理節(jié)點承載業(yè)務(wù)的可用性風(fēng)險。

b.當(dāng)某個承載Oracle業(yè)務(wù)的物理節(jié)點發(fā)生故障時,RAC機制實現(xiàn)應(yīng)用層訪問切換。同時,超融合會在第三臺主機中拉起發(fā)生故障的Oracle虛擬機,恢復(fù)RAC集群健壯性。

c.對于突發(fā)訪問的可用性考慮,超融合提供DRS、DRX策略,一旦數(shù)據(jù)庫出現(xiàn)高峰訪問導(dǎo)致性能瓶頸,Oracle虛擬化機可以自動熱擴容。

b3

Oracle RAC業(yè)務(wù)環(huán)境需求

2、 數(shù)據(jù)庫磁盤配置和數(shù)據(jù)安全設(shè)計

a.RAC集群為了保證數(shù)據(jù)的一致性,所有Oracle虛擬機都是訪問統(tǒng)一的共享存儲空間,深信服超融合在創(chuàng)建Oracle虛擬磁盤的過程中,提供了專用的Oracle共享磁盤選項。

b.超融合采用分布式存儲架構(gòu),數(shù)據(jù)在磁盤中是多副本存儲。Oracle的共享磁盤數(shù)據(jù)會被同時寫入并分配到不同物理節(jié)點的不同磁盤內(nèi),確保數(shù)據(jù)的安全性。

c.為了避免誤操作或者邏輯錯誤導(dǎo)致的數(shù)據(jù)安全問題,超融合平臺還提供了自動備份策略。

b4

Oracle RAC業(yè)務(wù)超融合部署

3、 數(shù)據(jù)庫性能設(shè)計

a.超融合平臺提供SSD+HDD的混合磁盤,大幅提升磁盤IO性能,Oracle的集群業(yè)務(wù)可以實現(xiàn)高性能業(yè)務(wù)發(fā)布。

l 超融合通過平臺的Hugepages并結(jié)合linux操作系統(tǒng)的內(nèi)核特性,提升了在大量業(yè)務(wù)并發(fā)的壓力下Oracle RAC的事務(wù)性能。

b5

基于深信服超融合架構(gòu)部署oracle RAC的平臺效果圖

對于Oracle RAC,深信服超融合主要創(chuàng)新:

對于Oracle RAC場景,深信服超融合架構(gòu)不僅僅是滿足基礎(chǔ)需求,而是提供了一整套便于部署、高性能、高穩(wěn)定的解決方案,這些特性源自于對云平臺的創(chuàng)新:

a.簡單高效的部署Oracle RAC

深信服超融合平臺提供簡單易用的Oracle RAC配置向?qū)?,只需六步,即可完成配置,幫助用戶快速搭?遷移RAC環(huán)境,快速上線業(yè)務(wù),極大減輕了DBA的運維工作量,讓IT管理人員能夠把精力更多地投入到業(yè)務(wù)本身,產(chǎn)出更多的效益。

b6

b7

超融合上Oracle RAC配置向?qū)?/span>

b.超融合的高性能I/O

傳統(tǒng)的存儲架構(gòu)通常是采用SAS盤組RAID的來提升性能,但是這種方式對于隨機讀寫的性能效果一般。

深信服超融合架構(gòu)的會在數(shù)據(jù)寫操作時將數(shù)據(jù)分割為64k大小的數(shù)據(jù)塊,并將這些數(shù)據(jù)塊進(jìn)行計算后緩存到SSD緩存盤中,并且數(shù)據(jù)寫入后不需要等待底層的機械磁盤的讀寫確認(rèn),大幅的提升了虛擬機的讀寫性能。

通過使用iometer實際測試一臺中低配置的超融合,單機的iops性能的8K隨機寫能到13000,隨機讀能到60000,隨機讀寫(7:3)能到30000,最大吞吐可以達(dá)到2G/s。相對于傳統(tǒng)的FC存儲設(shè)備的性能有非常大的提升。

經(jīng)過優(yōu)化后的緩存命中率達(dá)99%,性能得到極大提升:

b8

c,虛擬共享盤

過去的RAC部署,管理員都需要在已有的存儲中規(guī)劃好存儲的磁盤、劃分不同的Lun來給做數(shù)據(jù)盤、日志盤、仲裁盤。

而深信服超融合可以通過虛擬存儲資源池直接提供虛擬的共享盤,充分利用已有的磁盤資源。這種方案使得RAC節(jié)點數(shù)量和容量的擴容也變得非常方便,節(jié)點方面只需要添加一個虛擬機節(jié)點加入到現(xiàn)有的集群就實現(xiàn)擴容;而容量方面用戶直接新建一塊共享盤掛載到虛擬機上即可,擴容過程非常的簡潔高效。

d.心跳網(wǎng)絡(luò)優(yōu)化

Oracle RAC的心跳線,不但會用來檢測集群節(jié)點間的網(wǎng)絡(luò)健康狀態(tài),還會做緩存同步刷新及全局資源維護(hù),在grid control出現(xiàn)后還傳輸數(shù)據(jù)塊,所以心跳網(wǎng)絡(luò)要做到吞吐高性能和巨幀支持。

超融合平臺在部署Oracle RAC的情況下會單獨創(chuàng)建一個分布式交換機來連接不同節(jié)點的心跳線,防止因為心跳線網(wǎng)絡(luò)不穩(wěn)定導(dǎo)致集群的故障。同時超融合可以把多個網(wǎng)絡(luò)接口進(jìn)行聚合來提升現(xiàn)有的物理帶寬,讓心跳網(wǎng)絡(luò)擁有更高的帶寬來滿足數(shù)據(jù)塊的同步。并且平臺支持開啟高性能模式,解決因為MTU的原因?qū)е碌木W(wǎng)絡(luò)分片包過多影響虛擬機節(jié)點性能的問題。

e.高可靠性

超融合上我們針對RAC的特性專門做了高可用性的優(yōu)化,任務(wù)的RAC節(jié)點都不會運行在同一個物理節(jié)點上,防止了單一物理節(jié)點的故障導(dǎo)致整個RAC集群的故障。超融合平臺的HA功能在任一節(jié)點出現(xiàn)故障的情況下會在5分鐘內(nèi)重新拉起一個虛擬節(jié)點,這樣可以保證在出現(xiàn)故障的情況下,減小用戶訪問的并發(fā)影響。

f. DRS

大型數(shù)據(jù)庫對于內(nèi)存和CPU資源的消耗非常大,如果突發(fā)情況業(yè)務(wù)訪問增加,超融合平臺可以針對Oracle的RAC節(jié)點自動添加計算資源和內(nèi)存資源,防止因為業(yè)務(wù)訪問壓力增大,系統(tǒng)資源消耗過度導(dǎo)致的RAC節(jié)點宕機問題。這些資源的調(diào)度是自動進(jìn)行的,不需要管理員的介入操作,大大簡化了IT管理的復(fù)雜度。

Oracle選型參考:

b9

技術(shù)架構(gòu)在核心業(yè)務(wù)系統(tǒng)的采納及應(yīng)用狀況,可以很好地評判出其技術(shù)成熟度和市場認(rèn)可度。據(jù)了解,目前市場上能夠承載Oracle RAC這樣關(guān)鍵應(yīng)用的企業(yè)級云方案非常少,深信服超融合正在為南寧鐵路局等越來越多的高端用戶提供核心業(yè)務(wù)系統(tǒng)支撐的企業(yè)級云解決方案,保障用戶的業(yè)務(wù)系統(tǒng)能夠穩(wěn)定運行且滿足業(yè)務(wù)需求的各項性能。

THEEND