OceanBase數(shù)據(jù)庫(kù)陽(yáng)振坤:數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)發(fā)展 共建數(shù)據(jù)技術(shù)未來(lái)

能從根源上解決數(shù)據(jù)庫(kù)發(fā)展的問(wèn)題,最完善的解決方案是真正的分布式數(shù)據(jù)庫(kù)。分庫(kù)分表只能稱為分布式系統(tǒng),是分布式數(shù)據(jù)庫(kù)嗎?陽(yáng)振坤笑了笑,“打個(gè)問(wèn)號(hào)吧!”很多人都清楚事務(wù)的ACID特性,知道事務(wù)要滿足原子性、一致性、隔離性和持久性,這是從數(shù)據(jù)庫(kù)本身的角度來(lái)看。

隨著互聯(lián)網(wǎng)的爆發(fā)式增長(zhǎng),數(shù)據(jù)庫(kù)作為IT信息產(chǎn)業(yè)最重要最核心的部分,迎來(lái)了成長(zhǎng)和發(fā)展的絕佳時(shí)機(jī)。如何把握機(jī)遇,迎接海量數(shù)據(jù)、通用高性能的挑戰(zhàn)?國(guó)產(chǎn)自研分布式數(shù)據(jù)庫(kù)OceanBase,在國(guó)家內(nèi)循環(huán)、新基建政策的引導(dǎo)下,發(fā)揮著強(qiáng)大的中國(guó)制造的技術(shù)魅力。

在互聯(lián)網(wǎng)爆炸式增長(zhǎng)對(duì)海量業(yè)務(wù)中數(shù)據(jù)庫(kù)高并發(fā)、高性能的嚴(yán)苛要求下,數(shù)據(jù)庫(kù)領(lǐng)域的標(biāo)桿OceanBase,以其高性能、可擴(kuò)展、高可用以及低成本等特點(diǎn),特別是阿里集團(tuán)內(nèi)部包含網(wǎng)商銀行、支付寶等航母量級(jí)的數(shù)據(jù)庫(kù)場(chǎng)景應(yīng)用的成熟經(jīng)驗(yàn),保障了業(yè)務(wù)連續(xù)、穩(wěn)定、高效運(yùn)轉(zhuǎn),為用戶創(chuàng)造更大價(jià)值。

2345截圖20200908083720.png

2020數(shù)據(jù)技術(shù)嘉年華上,北京奧星貝斯科技有限公司CTO、OceanBase數(shù)據(jù)庫(kù)創(chuàng)始人陽(yáng)振坤,接受了企業(yè)網(wǎng)的專訪。他對(duì)OceanBase的發(fā)展歷史進(jìn)行了總結(jié)和回顧,全面詮釋了數(shù)據(jù)庫(kù)技術(shù)的發(fā)展歷程,同時(shí)作為前沿的技術(shù)專家,也對(duì)未來(lái)數(shù)據(jù)庫(kù)系統(tǒng)的發(fā)展趨勢(shì)做了預(yù)測(cè)和展望。

2345截圖20200908083720.png

北京奧星貝斯科技有限公司CTO、OceanBase數(shù)據(jù)庫(kù)創(chuàng)始人陽(yáng)振坤

數(shù)據(jù)庫(kù)從誕生至今已有幾十年的時(shí)間,但是市場(chǎng)格局變化不大,最早發(fā)展起來(lái)的數(shù)據(jù)庫(kù)廠商長(zhǎng)期占據(jù)著統(tǒng)治地位。由于數(shù)據(jù)庫(kù)處在整個(gè)IT產(chǎn)業(yè)鏈最基礎(chǔ)的位置,替換風(fēng)險(xiǎn)很大,但收益相比起來(lái)卻小得多,因此非常難被替換。這也是為什么像IBM、微軟這樣的后來(lái)者也難以取代Oracle。這就導(dǎo)致了數(shù)據(jù)庫(kù)變成一個(gè)門(mén)檻極高、強(qiáng)者恒強(qiáng)的領(lǐng)域。

然而,時(shí)代的發(fā)展往往會(huì)打破慣例?;ヂ?lián)網(wǎng)的爆發(fā)式增長(zhǎng)對(duì)數(shù)據(jù)庫(kù)的高并發(fā)、大數(shù)據(jù)量提出了很高的要求,而傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)難以滿足,這就給OceanBase的問(wèn)世創(chuàng)造了“天時(shí)”基礎(chǔ)。加之阿里巴巴內(nèi)部從淘寶到支付寶擁有大量使用數(shù)據(jù)庫(kù)的場(chǎng)景,OceanBase可以從不是特別關(guān)鍵的應(yīng)用場(chǎng)景開(kāi)始嘗試,一步步地將數(shù)據(jù)庫(kù)做到關(guān)鍵系統(tǒng),這也是絕大多數(shù)互聯(lián)網(wǎng)企業(yè)可以做數(shù)據(jù)庫(kù)的優(yōu)勢(shì)——自帶場(chǎng)景的“地利”條件。最后便是以陽(yáng)振坤為代表的具備分布式技術(shù)背景的團(tuán)隊(duì),在當(dāng)時(shí)單機(jī)數(shù)據(jù)庫(kù)已經(jīng)走到盡頭的情況下,以“人和”之勢(shì)定下了走向分布式的路線。

就這樣,打破傳統(tǒng)數(shù)據(jù)庫(kù)一統(tǒng)天下格局的OceanBase在一個(gè)千載難逢的機(jī)遇下應(yīng)運(yùn)而生,讓國(guó)產(chǎn)自研關(guān)系型數(shù)據(jù)庫(kù)嶄露頭角并推廣使用,不斷推動(dòng)國(guó)產(chǎn)數(shù)據(jù)庫(kù)技術(shù)快速發(fā)展和走向成熟。目前,OceanBase已經(jīng)在數(shù)十家商業(yè)銀行上線運(yùn)行。在簡(jiǎn)要回顧OceanBase十年的成長(zhǎng)路時(shí),陽(yáng)振坤的自豪之情溢于言表。

其實(shí)在OceanBase立項(xiàng)之初時(shí),關(guān)于“分布式”曾有一番熱烈的討論。隨著業(yè)務(wù)的高速發(fā)展,海量數(shù)據(jù)激增,數(shù)據(jù)庫(kù)面臨著巨大的挑戰(zhàn)和困境。大家常見(jiàn)的解決方法是拆庫(kù)做分庫(kù)分表,就是將原來(lái)一個(gè)數(shù)據(jù)庫(kù),根據(jù)業(yè)務(wù)的不同拆分成多個(gè)數(shù)據(jù)庫(kù),一個(gè)數(shù)據(jù)庫(kù)放一個(gè)表,后期如果業(yè)務(wù)處理不了,再將一張表拆分成多個(gè)分表。要是業(yè)務(wù)量小,尚可滿足業(yè)務(wù)需求,但是隨著拆分到上千甚至上萬(wàn)個(gè)分表,這個(gè)事情就變得極其復(fù)雜且解決起來(lái)異常困難。因?yàn)槊刻烀恳粋€(gè)表都會(huì)進(jìn)行無(wú)數(shù)次變更,這些變更需要做在所有的分片上,只要一個(gè)分片異常就需要回滾,就有概率出現(xiàn)回滾不成功,從而導(dǎo)致數(shù)據(jù)丟失或影響業(yè)務(wù)的連續(xù)性,給企業(yè)帶來(lái)的損失將是不可彌補(bǔ)甚至不堪設(shè)想的。

能從根源上解決數(shù)據(jù)庫(kù)發(fā)展的問(wèn)題,最完善的解決方案是真正的分布式數(shù)據(jù)庫(kù)。分庫(kù)分表只能稱為分布式系統(tǒng),是分布式數(shù)據(jù)庫(kù)嗎?陽(yáng)振坤笑了笑,“打個(gè)問(wèn)號(hào)吧!”很多人都清楚事務(wù)的ACID特性,知道事務(wù)要滿足原子性、一致性、隔離性和持久性,這是從數(shù)據(jù)庫(kù)本身的角度來(lái)看。有人混淆分布式數(shù)據(jù)庫(kù)的概念,把分庫(kù)分表也叫分布式,但其實(shí)它不是分布式數(shù)據(jù)庫(kù),因?yàn)樗嵌鄠€(gè)數(shù)據(jù)庫(kù)而不是一個(gè)數(shù)據(jù)庫(kù)。分庫(kù)分表方案雖然可以解決一些問(wèn)題,但也帶來(lái)更多的挑戰(zhàn),更大的復(fù)雜性和更高的成本。

正因?yàn)槿绱?,?yáng)振坤的團(tuán)隊(duì)毅然決然地選擇了最難走的一條路——做一款原生分布式關(guān)系數(shù)據(jù)庫(kù)。這需要所有代碼一行一行自己寫(xiě),沒(méi)有任何一行別人的代碼,沒(méi)有任何其他人的東西。另外,除了要滿足事務(wù)和數(shù)據(jù)庫(kù)里面的各種約束、各種一致性,還包含分布式事務(wù)處理、性能和響應(yīng)時(shí)間,而最困難的是故障恢復(fù),因?yàn)榉植际江h(huán)境下出故障是必然的,且故障率會(huì)隨著節(jié)點(diǎn)的增加呈指數(shù)級(jí)增加。再有就是整個(gè)性能的穩(wěn)定和分布式上的優(yōu)化,單機(jī)上的優(yōu)化器已經(jīng)很難了,分布式優(yōu)化器,尤其是做整個(gè)事務(wù)處理的優(yōu)化器,挑戰(zhàn)要大得多得多?;貞浧餙ceanBase從初生到成長(zhǎng)的過(guò)程,以及團(tuán)隊(duì)所攻克的一個(gè)又一個(gè)難關(guān),陽(yáng)振坤不禁感慨良多。

解決了從數(shù)據(jù)庫(kù)本身的角度來(lái)做一款真正意義上的分布式數(shù)據(jù)庫(kù)后,從業(yè)務(wù)的角度,客戶對(duì)數(shù)據(jù)庫(kù)其實(shí)有更高的要求。第一個(gè)要求是數(shù)據(jù)不能錯(cuò),第二個(gè)要求是服務(wù)不能停,第三個(gè)要求是事務(wù)高并發(fā)處理能力。陽(yáng)振坤補(bǔ)充道,全世界有非常多的數(shù)據(jù)庫(kù)廠商,近年來(lái)也進(jìn)入了國(guó)產(chǎn)數(shù)據(jù)庫(kù)的繁榮時(shí)期,但是能真正把業(yè)務(wù)角度客戶關(guān)注的這三點(diǎn)做到,并在實(shí)際生產(chǎn)中全面應(yīng)用的其實(shí)少之又少。如今,OceanBase已經(jīng)可以做到水平擴(kuò)展,不需要重新拆分業(yè)務(wù),就可以在主庫(kù)做交易處理,在備庫(kù)做數(shù)據(jù)分析處理,甚至在未來(lái)可以在主庫(kù)上同時(shí)完成交易和分析的處理。這一技術(shù)上的革新很好地克服了分庫(kù)分表方案的弊端。陽(yáng)振坤介紹道,OceanBase跟分庫(kù)分表最根本的區(qū)別在于分庫(kù)分表是多個(gè)庫(kù),而原生分布式是不管有多少臺(tái)機(jī)器仍是一個(gè)數(shù)據(jù)庫(kù)。用戶可以像使用一個(gè)傳統(tǒng)商業(yè)數(shù)據(jù)庫(kù)一樣來(lái)使用它,這就很自然地應(yīng)對(duì)了站在業(yè)務(wù)角度客戶所關(guān)注的三方面要求。

數(shù)據(jù)庫(kù)的成長(zhǎng)發(fā)展離不開(kāi)業(yè)務(wù)的打磨。OceanBase今天有數(shù)以萬(wàn)計(jì)的服務(wù)器,晝夜運(yùn)行在支付寶整個(gè)系統(tǒng)里,它從邊緣系統(tǒng)到次重要系統(tǒng)最后引用到核心系統(tǒng),一步步經(jīng)過(guò)應(yīng)用實(shí)踐檢驗(yàn)發(fā)展過(guò)來(lái)。OceanBase在多年前就成功實(shí)現(xiàn)異地多活跨城應(yīng)用,陽(yáng)振坤分享道:OceanBase異地的多活,跨幾個(gè)城市的多活,具有很成熟的實(shí)踐基礎(chǔ),因?yàn)橹Ц秾毜臉I(yè)務(wù)早就是國(guó)際型了。到目前為止,這個(gè)實(shí)際場(chǎng)景所帶來(lái)的技術(shù)實(shí)現(xiàn)依然具有實(shí)踐意義和參考價(jià)值,技術(shù)也是非常領(lǐng)先的。

如今的海量數(shù)據(jù)處理系統(tǒng),不論是大數(shù)據(jù)系統(tǒng)還是數(shù)據(jù)倉(cāng)庫(kù),都是分布式——原生分布式。再回過(guò)頭來(lái)看關(guān)系型數(shù)據(jù)庫(kù),尤其是OLTP數(shù)據(jù)庫(kù),目前仍然是以單機(jī)/集中式為主。不是OLTP數(shù)據(jù)庫(kù)不需要做分布式,而是分布式的OLTP數(shù)據(jù)庫(kù)的研發(fā)異常艱難。但如同汽車終將代替馬車:回想起150多年前,汽車剛剛被發(fā)明時(shí),馬車還是最主流的交通工具,當(dāng)時(shí)在馬路上優(yōu)先通行的是馬車,汽車也沒(méi)有生態(tài)。而到了2020年的今天,作為主流交通工具的馬車早已成為遠(yuǎn)古的過(guò)去,汽車早就成為了不可逆轉(zhuǎn)的主流。所以,OceanBase正在撰寫(xiě)數(shù)據(jù)庫(kù)的現(xiàn)在,創(chuàng)造數(shù)據(jù)庫(kù)的未來(lái),值得期待。

關(guān)于OceanBase數(shù)據(jù)庫(kù):

●2010年,OceanBase項(xiàng)目立項(xiàng)。

●2011年,淘寶收藏夾上線。

●2014年,支付寶交易庫(kù)上線。

●2015年,網(wǎng)商銀行成立,OceanBase成為全球首個(gè)應(yīng)用在金融核心業(yè)務(wù)系統(tǒng)的分布式關(guān)系數(shù)據(jù)庫(kù);

●2016年,OceanBase 1.0版本在支付寶賬務(wù)系統(tǒng)上線,支撐12萬(wàn)筆/秒支付峰值;

●2017年,支付寶首次把賬務(wù)庫(kù)在內(nèi)的所有核心數(shù)據(jù)鏈路全部遷移到OceanBase上,創(chuàng)造4200萬(wàn)筆/秒數(shù)據(jù)庫(kù)處理峰值紀(jì)錄;

●2017年,OceanBase走出阿里對(duì)外商用,先后在南京銀行等多家商業(yè)銀行落地。

●2019年,OceanBase參加國(guó)際標(biāo)準(zhǔn)的數(shù)據(jù)庫(kù)TPC-C基準(zhǔn)性能測(cè)試,以6088萬(wàn)tpmC登頂TPC-C性能榜;

●2020年,OceanBase再次登頂TPC-C測(cè)試性能榜首,并創(chuàng)造了7.07億tpmC的新紀(jì)錄;

●2020年,OceanBase公司成立,以專注發(fā)展OceanBase數(shù)據(jù)庫(kù),向客戶提供更專業(yè)服務(wù)。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論