數(shù)據(jù)中心運營,云巨頭是如何修煉“內功”的?

云智時代
云智時代
對于負責數(shù)據(jù)中心運維的工程師而言,充分的睡眠是相當“奢侈”的東西,因為他們會時刻收到來自數(shù)據(jù)中心基礎設施中的各項報警郵件、短信等信息,Peter也不例外。

亞馬遜云服務(AWS)是全球最大的云服務提供商,目前它在全球擁有24個地理區(qū)域,77個可用區(qū)(AZ)。如此龐大的云基礎設施是如何運維的,一直以來都備受業(yè)界關注,而多年來AWS很少談及這個話題。

在今年的亞馬遜re:Invent在線峰會上,AWS首次揭開了自己云基礎設施的神秘面紗,從數(shù)據(jù)中心的供電管理系統(tǒng),云數(shù)據(jù)中心的延遲,到芯片的研發(fā)等等,雖然只是冰山一角,但可以從不同的視角更加直觀、清晰的了解AWS是如何修煉“內功”的。

讓深度睡眠不再“奢侈”

在AWS全球基礎架構和客戶支持資深副總裁Peter DeSantis看來,“AWS保持如此龐大、復雜的云基礎設施的穩(wěn)定性和可靠性沒有捷徑,是靠一步一步的積累走出來的,必須對每個細節(jié)進行研究”。

對于負責數(shù)據(jù)中心運維的工程師而言,充分的睡眠是相當“奢侈”的東西,因為他們會時刻收到來自數(shù)據(jù)中心基礎設施中的各項報警郵件、短信等信息,Peter也不例外。

Peter通過數(shù)據(jù)中心的配電系統(tǒng)和UPS管理來展示其如何通過良好的數(shù)據(jù)中心運維手段來保證自己的睡眠質量,十分形象。圖上的橫軸為云數(shù)據(jù)中心的復雜度,縱軸是破壞半徑,當AWS云數(shù)據(jù)中心的發(fā)電機、配電系統(tǒng)和UPS復雜度越高,破壞半徑系數(shù)越高的時候,Peter的睡眠質量就處于Insomnia的失眠狀態(tài);而當Peter通過優(yōu)化AWS云數(shù)據(jù)中心基礎設施之后,其睡眠質量得到了明顯改善,處于了Deep Sleep深度睡眠的狀態(tài)。

2345截圖20200908083720.png

2345截圖20200908083720.png

Peter是如何做到的?總體來看,關于AWS云數(shù)據(jù)中心運維可總結為可靠可控,降低管理復雜度。

AWS云數(shù)據(jù)中心的供電系統(tǒng)由發(fā)電機組、配電系統(tǒng)和UPS等組件構成。AWS為其發(fā)電機組配備了冗余的發(fā)電機來提升可靠性。

2345截圖20200908083720.png

相比于發(fā)電機可以通過冗余來作為基礎的思考,配電系統(tǒng)和UPS就要復雜的多。“不論是GE、ABB還是施耐德,它們的配電開關系統(tǒng)功能都很完善,但挑戰(zhàn)是對于AWS這樣的超大規(guī)模云數(shù)據(jù)中心而言,并不是每個功能都適用”,Peter坦言。

說白了就是配電開關的嵌入式軟件束縛了AWS數(shù)據(jù)中心運維的手腳,而AWS憑借多年的運維經驗很清楚哪些功能適合,哪些根本不需要。比如有的功能,AWS不需要;而有的,AWS有更加優(yōu)化的方案。

Peter總結了三個方面:第一,當發(fā)現(xiàn)軟件系統(tǒng)的Bug,AWS工程師的響應很快,而等配電供應商去修改周期更長;第二,有些功能與實際用途不匹配;第三,AWS需要經常優(yōu)化自己的管理系統(tǒng)、流程等,嵌入式軟件無法保證可控性。

基于此,AWS重寫了配電控制系統(tǒng),從而為其配電系統(tǒng)帶來了可控性,運維也更加簡單。

同樣對UPS的控制系統(tǒng),AWS也通過重寫UPS控制系統(tǒng)來滿足自身對功能的需求。Peter特別介紹了如何為UPS電池減重,從而大大降低了UPS電池管理的復雜度。

2345截圖20200908083720.png

標準的一兆瓦UPS電池重達12000磅,AWS重新定制了UPS電池,做成了5000瓦一個,可插拔的放入到機架中,并通過專有控制系統(tǒng)來對UPS進行管理。這樣做的好處的顯然的,“UPS電池單元體積和重量降低后,破壞半徑會降低,可插拔的方式讓工程師可秒級換掉損壞的UPS,運維復雜性大大降低”,Peter說。

“這些是AWS設計基礎架構中最重要的思維模式,思考它的破壞半徑大概有多大,同時它的復雜度有多大,從這兩個維度想辦法去提升運維穩(wěn)定性”,Peter總結說。這也讓AWS云數(shù)據(jù)中心的UPS的冗余系統(tǒng)擁有了7個9的可用性,遠超行業(yè)的平均水平。

“一毫秒”是關鍵

從電商業(yè)務起家的亞馬遜,最早的數(shù)據(jù)中心位于美國西雅圖,隨著業(yè)務的發(fā)展,亞馬遜開始在美國多地建立數(shù)據(jù)中心,以滿足不斷增長的數(shù)據(jù)規(guī)模和業(yè)務需要。

在數(shù)據(jù)中心的地理位置選擇上,亞馬遜會綜合考慮諸多自然條件因素,比如雷電、龍卷風、海嘯、地震等,這就使得數(shù)據(jù)中心的之間的距離較遠。Peter說,早期亞馬遜的數(shù)據(jù)中心之間有70毫秒的延遲,如何將數(shù)據(jù)中心之間的延遲降低?于是,亞馬遜考慮到數(shù)據(jù)中心之間數(shù)據(jù)傳輸,以及自然條件的因素,找到了平衡的區(qū)域AZ概念,即在同一區(qū)域部署多個數(shù)據(jù)中心。

于是亞馬遜在2003年開始著手考慮云業(yè)務AWS的時候,首次提出了區(qū)域(Region)和可用區(qū)(AZ)的概念。區(qū)域英文名稱Region,是指云提供商的基礎設施所覆蓋的范圍,比如你的云數(shù)據(jù)中心位于北美或者亞太,抑或歐洲。在《Gartner的云基礎設施和平臺服務魔力象限》報告中,如果要參與評估,會要求云提供商在說明格式中表述關于位置的要求:“按國家、公司開展業(yè)務所用的語言和可提供技術支持的語言所劃分的數(shù)據(jù)中心位置,供應商必須在至少三個大洲擁有經過ISO27001審核(或同等標準)的數(shù)據(jù)中心。”所以在一個區(qū)域,云提供商會建設一組數(shù)據(jù)中心。

可用區(qū)英文簡稱AZ是指一個數(shù)據(jù)中心,即在一個區(qū)域(Region)中可包含多個可用區(qū)(AZ),AWS為每個區(qū)域標配至少三個可用區(qū),比如AWS位于中國的北京區(qū)域(光環(huán)新網運營)和寧夏區(qū)域(西云數(shù)據(jù)運營),至少就有6個數(shù)據(jù)中心。

“AZ之間的距離在若干英里或幾十英里之間,這樣的距離是保持數(shù)據(jù)中心延遲在一毫秒的關鍵”,Peter說。

也就是說在保證一毫秒關鍵的前提下,讓數(shù)據(jù)中心之間的距離拉遠,來減小數(shù)據(jù)中心的相互干擾,甚至是雷電等不可預測因素同時給相近的數(shù)據(jù)中心帶來相互影響。

在AZ的設計上,AWS為數(shù)據(jù)中心配置獨立的網絡,供配電系統(tǒng),配線系統(tǒng)等。

所以,AZ之間盡量的互不干擾,獨立系統(tǒng),以及低延遲等嚴苛因素的配置,不僅帶來的更好的冗余,也將破壞半徑的影響再次降低。

2345截圖20200908083720.png

如圖中所示,一個AWS區(qū)域,配備了3個獨立的可用區(qū),以及兩個網絡接入點(Transit Center)。

“目前,AWS在24個地理區(qū)域擁有77個可用區(qū),并已公布計劃在澳大利亞、印度、印度尼西亞、日本、西班牙和瑞士新建6個AWS區(qū)域、18個可用區(qū)”,Peter說。

同時,除了可用區(qū)架構之外,AWS也會充分考慮人對數(shù)據(jù)中心的影響。AWS數(shù)據(jù)中心執(zhí)行嚴格的保密制度,“AZ所在的位置是嚴格保密的,比如所有運往AZ的硬件設備,都會首先運達一個中轉中心,再由那里運往AZ所在的位置”,AWS大中華區(qū)產品部計算與存儲總監(jiān)周舸如是說。

云端“適用”的芯片設計

自從2015年亞馬遜收購Annapurna labs后,AWS云上的芯片研發(fā)就在加速奔跑。如今,其自研的Graviton2處理器已經上市,同時Nitro系統(tǒng)也演進了到了第四代。

“AWS是目前在云端唯一能夠提供支持英特爾、AMD、英偉達和ARM處理器的云提供商,Nitro系統(tǒng)起了非常關鍵的作用”,Peter說。

正是如此廣泛的芯片支持,使得Amazon EC2計算實例,從2019年的270種跨越到了現(xiàn)在超過400種,并不斷給用戶帶來更具性價比的計算實例選擇。

在今年的re:Invent大會上,AWS發(fā)布了Amazon EC2 Mac實例,來支持2800萬Apple開發(fā)者在云端構建macOS環(huán)境,并可以動態(tài)擴容,按需付費;基于AWS Graviton 2處理器的C6gn實例,可提供100 Gbps的網絡性能,與當前基于x86的同類實例相比,性價比提高了40%。

而且,在Nitro系統(tǒng)的加持下,AWS專門為機器學習推出了滿足模型訓練和推理的高性價比芯片,比如使用AWS自研AWS Inferentia芯片的Inf1實例,為機器學習推理帶來最優(yōu)的性價比;以及剛剛發(fā)布的全新機器學習訓練芯片AWS Trainium,與標準的AWS GPU實例相比,可帶來30%的吞吐量提升,以及降低45%的單次引用成本。

為什么AWS自研了基于Arm架構的芯片后,Graviton2很快在云端獲得了諸多用戶的青睞?

“Graviton 2處理器跨越到了更多的領域,激活了整個生態(tài)系統(tǒng),很多基于Linux系統(tǒng)的應用都可以快速、簡單的轉到Graviton上”,Peter說。

2345截圖20200908083720.png

AWS在芯片設計上有自己的理解,“AWS要做的是真正滿足云端性能而且省電的處理器,這是關鍵”,Peter解釋說,“所以我們自研處理盡量做到多核,以及滿足微服務的發(fā)展。”

近年來,AWS在芯片上的每一次迭代,都會給用戶帶來更優(yōu)的計算實例性價比,性能提升的同時,整體成本也大幅降低。

在給用戶帶來高性價比芯片的同時,通過自研芯片的發(fā)展,AWS大大降低了其云數(shù)據(jù)中心的碳排放,降幅達88%。

結語

Peter還提及了數(shù)據(jù)中心采購供應鏈的多元化,以及數(shù)據(jù)中心的可再生能源對AWS云基礎設施的影響。在2015年,AWS云數(shù)據(jù)中心中4個關鍵組件的供應商來自4個國家和地區(qū)的29個供應商,而在2020年已經變成7個國家和地區(qū)的86個供應商,多元化夯實了AWS抵御風險的能力;同時AWS也積極擁抱再生能源,如今的規(guī)模已經達到每年6.5GW,并承諾在2025年實現(xiàn)100%使用再生能源。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論