將技術(shù)普惠進(jìn)行到底,百度智能云云原生數(shù)據(jù)庫(kù)GaiaDB來(lái)啦!

如今,不管是AP還是TP領(lǐng)域,云原生數(shù)據(jù)庫(kù)作為數(shù)據(jù)庫(kù)的全新范式,以高彈性、高穩(wěn)定性、低成本、普惠化的特性,為全球數(shù)據(jù)庫(kù)行業(yè)提供了有價(jià)值的探索。

本文來(lái)自微信公眾號(hào)“科技云報(bào)到”。

OpenAI再度扔出重磅炸彈。

近期,OpenAI公司在社交平臺(tái)上宣布,其收購(gòu)了領(lǐng)先實(shí)時(shí)分析數(shù)據(jù)庫(kù)公司Rockset。

OpenAI強(qiáng)調(diào),OpenAI將在其產(chǎn)品中整合Rockset技術(shù),基于Rockset提供的數(shù)據(jù)索引和查詢功能,使公司能夠?qū)⑵鋽?shù)據(jù)轉(zhuǎn)化為可操作的智能(Actionable Intelligence)。Rockset主打?qū)崟r(shí)搜索和數(shù)據(jù)分析,是基于RocksDB,Rockset將RocksDB搬到云上進(jìn)行云原生化,為用戶提供了更加靈活、可擴(kuò)展、低成本的數(shù)據(jù)庫(kù)解決方案,并且減輕了數(shù)據(jù)庫(kù)存儲(chǔ)引擎的開(kāi)發(fā)時(shí)間。

如今,不管是AP還是TP領(lǐng)域,云原生數(shù)據(jù)庫(kù)作為數(shù)據(jù)庫(kù)的全新范式,以高彈性、高穩(wěn)定性、低成本、普惠化的特性,為全球數(shù)據(jù)庫(kù)行業(yè)提供了有價(jià)值的探索。

640 (1).png

數(shù)據(jù)庫(kù)的全新范式

在云計(jì)算出現(xiàn)前,關(guān)系型數(shù)據(jù)庫(kù)通常采用本地部署方式,其中,商業(yè)數(shù)據(jù)庫(kù)代表有Oracle、Microsoft SQL Server、IBM Db2,開(kāi)源數(shù)據(jù)庫(kù)代表則是MySQL、PostgreSQL。那時(shí),大多數(shù)企業(yè)都是自行采購(gòu)硬件和租用IDC。除服務(wù)器外,機(jī)柜、交換機(jī)、網(wǎng)絡(luò)配置和軟件安裝等底層很多事情都需要專業(yè)人士負(fù)責(zé)。

搭建底層系統(tǒng)方面,傳統(tǒng)數(shù)據(jù)庫(kù)架構(gòu)依賴于高端硬件,每套數(shù)據(jù)庫(kù)系統(tǒng)可擴(kuò)展的服務(wù)器少、架構(gòu)相對(duì)簡(jiǎn)單,且無(wú)法支持新業(yè)務(wù)的擴(kuò)展需求。如果企業(yè)想要提升性能,主要靠采用配置更高、更先進(jìn)的硬件。當(dāng)然,這樣成本也會(huì)更昂貴。并且,它無(wú)法應(yīng)對(duì)高并發(fā)讀寫(xiě)。比如以Web 2.0為代表的網(wǎng)站,其數(shù)據(jù)庫(kù)負(fù)載非常高,本地部署的傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)往往無(wú)法應(yīng)對(duì)每秒上萬(wàn)次的讀寫(xiě)請(qǐng)求,硬盤(pán)I/O成為性能瓶頸。

除了擴(kuò)展性差,傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)還面臨一些挑戰(zhàn),比如部署成本高,維護(hù)難度大;由于私有化部署,數(shù)據(jù)庫(kù)內(nèi)核迭代升級(jí)比較緩慢。

2010年初,隨著企業(yè)上云進(jìn)程的加速,大量企業(yè)開(kāi)始嘗試將傳統(tǒng)數(shù)據(jù)庫(kù)搬遷至云端,傳統(tǒng)數(shù)據(jù)庫(kù)逐漸從私有部署轉(zhuǎn)化為云上部署,但變化主要集中在部署模式自動(dòng)化,運(yùn)維能力的提升,并未充分利用云計(jì)算的能力為數(shù)據(jù)庫(kù)技術(shù)本身賦能。近年來(lái),云基礎(chǔ)設(shè)施的迅猛發(fā)展也進(jìn)一步帶動(dòng)云數(shù)據(jù)庫(kù)的應(yīng)用,并且因其按需擴(kuò)展和按需付費(fèi)等卓越特性,受到了中小企業(yè)和互聯(lián)網(wǎng)客戶的廣泛歡迎。

然而,云數(shù)據(jù)庫(kù)并非專為云場(chǎng)景或云環(huán)境設(shè)計(jì)和構(gòu)建的,沒(méi)有結(jié)合云的彈性,規(guī)模擴(kuò)展等能力做出特殊優(yōu)化,它僅僅利用了云的資源。云數(shù)據(jù)庫(kù)的部署和管理方式與傳統(tǒng)的本地?cái)?shù)據(jù)庫(kù)相似,其存在一些固有的問(wèn)題,比如存儲(chǔ)空間浪費(fèi)、計(jì)算資源浪費(fèi)、數(shù)據(jù)恢復(fù)時(shí)間長(zhǎng)以及數(shù)據(jù)延遲、系統(tǒng)性能受限、網(wǎng)絡(luò)帶寬消耗大、缺乏彈性擴(kuò)展和自動(dòng)化管理能力等,這些問(wèn)題阻礙了業(yè)務(wù)的進(jìn)一步發(fā)展。

例如游戲行業(yè)中,業(yè)務(wù)存在明顯的流量峰谷,這種特性使得傳統(tǒng)的數(shù)據(jù)庫(kù)很難應(yīng)對(duì)極致的彈性需求,從而帶來(lái)資源利用率不足、運(yùn)維人力成本高等問(wèn)題。又比如面對(duì)秒殺和雙十一等場(chǎng)景,傳統(tǒng)數(shù)據(jù)庫(kù)擴(kuò)容后無(wú)法縮容,導(dǎo)致資源浪費(fèi)。

這時(shí),云原生數(shù)據(jù)庫(kù)作為一種全新數(shù)據(jù)庫(kù)范式被提出來(lái),其核心是設(shè)計(jì)一種更符合“資源彈性管理”理念的數(shù)據(jù)庫(kù)架構(gòu),充分利用云平臺(tái)的池化資源,適應(yīng)云平臺(tái)的基礎(chǔ)設(shè)施。并且,經(jīng)過(guò)多次迭代更新,云原生數(shù)據(jù)庫(kù)的技術(shù)也普惠到了更多的場(chǎng)景和部署環(huán)境,包括私有云場(chǎng)景,為企業(yè)提供數(shù)據(jù)安全可控的解決方案。

目前,市場(chǎng)中的代表產(chǎn)品包括阿里云PolarDB、百度智能云的云原生數(shù)據(jù)庫(kù)GaiaDB、騰訊云TDSQL-C等,可以完美兼容傳統(tǒng)的使用習(xí)慣,對(duì)交易類場(chǎng)景可以提供低延時(shí)的事務(wù)處理能力。同時(shí)由于借助了分布式存儲(chǔ)池化能力,擴(kuò)展性也得到了極大增強(qiáng)。

據(jù)Gartner預(yù)測(cè),到2025年,基于云原生平臺(tái)的數(shù)字化業(yè)務(wù)比例將達(dá)到95%,這將帶來(lái)云原生數(shù)據(jù)庫(kù)市場(chǎng)的快速增長(zhǎng)。

市場(chǎng)上解決擴(kuò)展性的問(wèn)題除了先進(jìn)的云原生存算分離架構(gòu)外,還有一個(gè)方向就是采用計(jì)算節(jié)點(diǎn)分布式的方式實(shí)現(xiàn),市場(chǎng)上的典型就是OceanBase,TiDB等。

云原生數(shù)據(jù)庫(kù)——看上去很美

應(yīng)用有門(mén)檻

據(jù)中國(guó)信通院調(diào)研,當(dāng)前57.9%的企業(yè)會(huì)考慮使用云原生數(shù)據(jù)庫(kù)并將其應(yīng)用到主要業(yè)務(wù)系統(tǒng)中,另外42%的企業(yè)還處于觀望狀態(tài)。從應(yīng)用行業(yè)角度,互聯(lián)網(wǎng)行業(yè)占比55.4%,而金融、制造、消費(fèi)行業(yè)平均占比不超過(guò)10%。

一邊是被互聯(lián)網(wǎng)行業(yè)廣泛接受和采用,另一邊傳統(tǒng)企業(yè)依然顧慮重重裹足不前,什么原因?qū)е略圃鷶?shù)據(jù)庫(kù)遭遇“冰火兩重天”?事實(shí)上,企業(yè)在數(shù)據(jù)庫(kù)技術(shù)選型過(guò)程中仍然面臨挑戰(zhàn),比如數(shù)據(jù)庫(kù)能否靈活部署?技術(shù)是否足夠成熟?是否具備良好的兼容性和服務(wù)可持續(xù)性?這些問(wèn)題不僅決定著云原生數(shù)據(jù)庫(kù)的普及水平,很大程度上也影響著企業(yè)的業(yè)務(wù)穩(wěn)定性與創(chuàng)新效率。

從市場(chǎng)上看,OceanBase、TiDB、TDSQL、PolarDB是企業(yè)選擇最多的數(shù)據(jù)庫(kù)產(chǎn)品。其中,以O(shè)ceanBase、TiDB為代表的開(kāi)源分布式數(shù)據(jù)庫(kù),雖然具備高度的部署靈活性,可在公有云、私有云進(jìn)行隨意部署,但在某些高級(jí)特性和語(yǔ)法上與MySQL、SQL存在差異,這可能需要更多的適配工作,從而阻礙了企業(yè)線上業(yè)務(wù)的全面開(kāi)展。

TDSQL、PolarDB具有良好的語(yǔ)法兼容性,能夠兼容絕大多數(shù)常用的MySQL語(yǔ)法,但其高度依賴底層專有高性能硬件,尤其是對(duì)內(nèi)存和網(wǎng)絡(luò)帶寬有嚴(yán)格要求。如果硬件資源不足,數(shù)據(jù)庫(kù)性能會(huì)受到嚴(yán)重影響,甚至可能導(dǎo)致無(wú)法正常運(yùn)行。同時(shí),兩個(gè)產(chǎn)品不支持第三方IDC,這意味著如果用戶想要使用TDSQL或PolarDB,就必須綁定使用騰訊云和阿里云提供的服務(wù),這讓用戶對(duì)于云服務(wù)商的選擇性大打折扣。這使得企業(yè)沒(méi)有辦法自由地使用云原生數(shù)據(jù)庫(kù)。

當(dāng)企業(yè)在選擇一款擴(kuò)展能力強(qiáng)的數(shù)據(jù)庫(kù)時(shí),顧慮主要集中在部署和使用兩個(gè)環(huán)節(jié)。

首先,在數(shù)據(jù)庫(kù)部署方面,云原生數(shù)據(jù)庫(kù)的存算分離架構(gòu)將數(shù)據(jù)存儲(chǔ)和計(jì)算分離開(kāi)來(lái),使得存儲(chǔ)和計(jì)算資源可以獨(dú)立擴(kuò)展和管理,雖然具備了良好的擴(kuò)展性,但對(duì)軟硬件環(huán)境存在依賴,導(dǎo)致類似PolarDB,TDSQL必須綁定使用其云服務(wù)。

其次,分布式數(shù)據(jù)庫(kù)規(guī)避了部署的問(wèn)題,但是在數(shù)據(jù)庫(kù)使用方面,架構(gòu)上的限制,導(dǎo)致其語(yǔ)法和標(biāo)準(zhǔn)的MySQL始終有一些差異,這讓企業(yè)擔(dān)心陷入被綁定或者需要付出修改應(yīng)用的代價(jià),也讓企業(yè)陷入兩難境地。

因此,技術(shù)成熟度最高、部署最靈活、系統(tǒng)穩(wěn)定性最好是企業(yè)選擇一款數(shù)據(jù)庫(kù)的關(guān)鍵考量標(biāo)準(zhǔn)。

可以看到,無(wú)論是OceanBase、TiDB,還是TDSQL、PolarDB,雖然這些數(shù)據(jù)庫(kù)產(chǎn)品都是市場(chǎng)主流產(chǎn)品,但并沒(méi)有降低客戶使用云原生數(shù)據(jù)庫(kù)的門(mén)檻。那么企業(yè)如果想保持兼容性的同時(shí),又能靈活部署,還要穩(wěn)定性好的云原生數(shù)據(jù)庫(kù)還有其他選擇嗎?

GaiaDB的云原生數(shù)據(jù)庫(kù)

普惠之路

圍繞選擇云原生數(shù)據(jù)庫(kù)的三大關(guān)鍵標(biāo)準(zhǔn),百度智能云自研的云原生數(shù)據(jù)庫(kù)GaiaDB應(yīng)運(yùn)而生。GaiaDB在設(shè)計(jì)之初就堅(jiān)持的高可用、易部署、易使用的技術(shù)路線,其背后所展現(xiàn)出的技術(shù)普惠思想,讓企業(yè)得以在通用服務(wù)器上部署并使用高性能的數(shù)據(jù)庫(kù)服務(wù),將技術(shù)創(chuàng)新的“果實(shí)”惠及千行百業(yè),使企業(yè)能夠真正享受到云原生數(shù)據(jù)庫(kù)的價(jià)值。

從整體技術(shù)看,百度智能云GaiaDB采用存算分離的云原生架構(gòu),實(shí)現(xiàn)按需、極致彈性擴(kuò)展能力,線上最大實(shí)例超過(guò)500TB,整體規(guī)模達(dá)到數(shù)十PB。目前已實(shí)現(xiàn)泛互聯(lián)網(wǎng)、金融、人工智能、游戲、交通等全行業(yè)覆蓋,不僅兼容開(kāi)源生態(tài),還在保持與單機(jī)一樣的兼容性的情況下,實(shí)現(xiàn)了更加靈活的彈性、企業(yè)級(jí)高可用和高性價(jià)比,為用戶帶來(lái)新的云原生數(shù)據(jù)庫(kù)體驗(yàn)。

此外,百度智能云GaiaDB相比其他同類型云原生數(shù)據(jù)庫(kù),有兩個(gè)最鮮明的優(yōu)勢(shì)。

第一,數(shù)據(jù)庫(kù)的易于部署是實(shí)現(xiàn)普惠目標(biāo)的關(guān)鍵環(huán)節(jié)。不同于很多云原生數(shù)據(jù)庫(kù)需要依賴底層高性能的硬件,GaiaDB基于通用硬件設(shè)計(jì)實(shí)現(xiàn),不依賴于任何特殊硬件和基礎(chǔ)設(shè)施,讓用戶可以實(shí)現(xiàn)云上云下一套架構(gòu),這樣的方式使GaiaDB具有較強(qiáng)的通用性和良好的經(jīng)濟(jì)性。

對(duì)于大多數(shù)企業(yè)和開(kāi)發(fā)者而言,簡(jiǎn)單、快捷的部署流程能夠極大地降低技術(shù)采納的門(mén)檻。很多企業(yè)出于安全合規(guī)要求或多云容災(zāi)要求,需要將數(shù)據(jù)庫(kù)部署在自建IDC或跨云部署,這需要數(shù)據(jù)庫(kù)產(chǎn)品提供更加靈活的跨平臺(tái)部署能力。

對(duì)此,GaiaDB云上云下采用一套技術(shù)架構(gòu),不僅大幅降低了數(shù)據(jù)庫(kù)的部署門(mén)檻,同時(shí)也降低了搭建成本。值得一提的是,GaiaDB是全球唯一能支持多云的云原生數(shù)據(jù)庫(kù),基于通用硬件實(shí)現(xiàn)了高性能硬件同樣的效果和更好的可用性。

第二,易用性方面,GaiaDB為了方便開(kāi)發(fā)人員進(jìn)行調(diào)試,還開(kāi)發(fā)了可以運(yùn)行在筆記本上的GaiaDB Lite,這樣開(kāi)發(fā)人員就可以把數(shù)據(jù)庫(kù)下載到自己的Mac筆記本上調(diào)試,非常方便開(kāi)發(fā)人員使用。

作為一款100%兼容MySQL的云原生數(shù)據(jù)庫(kù)產(chǎn)品,百度智能云GaiaDB良好的兼容性讓用戶可以保留已有的使用習(xí)慣和相關(guān)技術(shù)棧,就能夠輕松地管理和使用數(shù)據(jù)庫(kù)。同時(shí),技術(shù)棧兼容可以讓開(kāi)發(fā)者和業(yè)務(wù)可以快速遷移到云原生數(shù)據(jù)庫(kù),既能保障100%的兼容性,又能兼容擴(kuò)展能力,這使得業(yè)務(wù)的遷移更加絲滑,用戶原有的技術(shù)體系和人才儲(chǔ)備得以延續(xù)使用,全面降低了云原生數(shù)據(jù)庫(kù)的遷移成本和學(xué)習(xí)成本。

在運(yùn)維方面,GaiaDB引入了智能化的運(yùn)維和管理功能,進(jìn)一步降低了數(shù)據(jù)庫(kù)的運(yùn)維難度和成本。通過(guò)內(nèi)置的監(jiān)控、診斷和優(yōu)化工具,用戶可以實(shí)時(shí)了解數(shù)據(jù)庫(kù)的運(yùn)行狀態(tài)、性能瓶頸和潛在問(wèn)題,并及時(shí)進(jìn)行優(yōu)化和調(diào)整,極大提升了數(shù)據(jù)庫(kù)的運(yùn)維效率。此外,GaiaDB還支持自動(dòng)備份、恢復(fù)和容災(zāi)等功能,確保數(shù)據(jù)的安全性和可用性。

為進(jìn)一步降低數(shù)據(jù)庫(kù)運(yùn)維門(mén)檻,GaiaDB正在與大模型的能力結(jié)合,為用戶提供智能的運(yùn)維輔助能力,幫助數(shù)據(jù)庫(kù)運(yùn)維工程師高效獲取數(shù)據(jù)庫(kù)知識(shí),并做出快速準(zhǔn)確的運(yùn)維決策。

在做足充分技術(shù)準(zhǔn)備的同時(shí),百度智能云GaiaDB還在云上提供免費(fèi)版本,為高校學(xué)生、個(gè)人開(kāi)發(fā)者、初創(chuàng)企業(yè)等初階群體提供云原生數(shù)據(jù)庫(kù)完整功能,實(shí)現(xiàn)云原生數(shù)據(jù)庫(kù)技術(shù)的廣泛應(yīng)用與普及,進(jìn)一步推動(dòng)云原生數(shù)據(jù)庫(kù)在更大范圍的普惠。

今年,百度智能云GaiaDB還將發(fā)布5.0版本,重點(diǎn)方面會(huì)瞄著更普惠、更智能、更強(qiáng)大三個(gè)方向進(jìn)行演進(jìn)。GaiaDB 5.0將支持單主集群、Serverless,這幾個(gè)關(guān)鍵能力都是分別滿足不同場(chǎng)景低門(mén)檻的訴求,讓用戶使用GaiaDB更輕松和容易。同時(shí),GaiaDB將在支持Copilot的基礎(chǔ)上從開(kāi)發(fā)、運(yùn)維、使用多個(gè)角度利用大模型的能力進(jìn)行增強(qiáng),包括NL2SQL、智能運(yùn)維、智能問(wèn)數(shù)的能力。

百度智能云GaiaDB通過(guò)基于云計(jì)算的特性,為用戶提供了有別于分布式數(shù)據(jù)庫(kù)的全新使用體驗(yàn),在降低數(shù)據(jù)庫(kù)TCO的同時(shí),提供極高的擴(kuò)展性,同時(shí)又規(guī)避了分布式數(shù)據(jù)庫(kù)帶來(lái)的兼容性問(wèn)題,這使得云原生數(shù)據(jù)庫(kù)成為繼云托管數(shù)據(jù)庫(kù)之后備受市場(chǎng)關(guān)注的數(shù)據(jù)庫(kù)方案。

技術(shù)創(chuàng)新永無(wú)止境。從傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)、云數(shù)據(jù)庫(kù),再到云原生數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)技術(shù)不斷變革。我們相信,以百度智能云GaiaDB為代表的云原生數(shù)據(jù)庫(kù)作為支撐企業(yè)業(yè)務(wù)的關(guān)鍵IT基礎(chǔ)設(shè)施,在技術(shù)普惠的驅(qū)動(dòng)下,更多企業(yè)將受益于這項(xiàng)技術(shù)所帶來(lái)的便利,更好地滿足業(yè)務(wù)發(fā)展需要,通過(guò)激發(fā)數(shù)字生產(chǎn)力,為描繪數(shù)字未來(lái)藍(lán)圖貢獻(xiàn)力量。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論