數(shù)據(jù)中心降溫 靠“吹”不行了 得靠“泡”

深度圍觀頻道
大數(shù)據(jù)、云計算的快速發(fā)展,讓世界變得更加互聯(lián),人類生活感覺到更加便捷的同時,背后產(chǎn)生越來越多的數(shù)據(jù)。數(shù)據(jù)以難以想象的速度快速增長,國際數(shù)據(jù)公司最新統(tǒng)計和預(yù)測,全球數(shù)據(jù)會從2018年32ZB增長到2025年的175ZB。數(shù)據(jù)成倍的增長,將會需要越來越多的計算能力進(jìn)行運(yùn)算和處理。

低能耗的數(shù)據(jù)中心需求不僅關(guān)系到了人類環(huán)境的可持續(xù)發(fā)展,也直接決定了算力的成本和服務(wù)的競爭力。

11.png

01

數(shù)據(jù)中心面臨的挑戰(zhàn)

上世紀(jì)60年代也就是最早的互聯(lián)網(wǎng)大型機(jī)的時代,不超過100萬節(jié)點(diǎn)進(jìn)行連接。80年代差不多有一千萬,90年代差不多有一個億。2000年進(jìn)入了熟悉的桌面互聯(lián)網(wǎng),差不多10億設(shè)備進(jìn)行互聯(lián)。

2010年進(jìn)入移動互聯(lián)網(wǎng)時代,有100多個億設(shè)備進(jìn)入互聯(lián)網(wǎng)連接。最新IOT時代,不僅是手機(jī),還有我們的電腦和家電,所有設(shè)備都會連接到了互聯(lián)網(wǎng),超過500億設(shè)備連接到互聯(lián)網(wǎng)連接數(shù)量成倍的增長。

大數(shù)據(jù)、云計算的快速發(fā)展,讓世界變得更加互聯(lián),人類生活感覺到更加便捷的同時,背后產(chǎn)生越來越多的數(shù)據(jù)。數(shù)據(jù)以難以想象的速度快速增長,國際數(shù)據(jù)公司最新統(tǒng)計和預(yù)測,全球數(shù)據(jù)會從2018年32ZB增長到2025年的175ZB。數(shù)據(jù)成倍的增長,將會需要越來越多的計算能力進(jìn)行運(yùn)算和處理。

22.jpeg

回顧近幾十年處理器的發(fā)展,摩爾定律逐漸放緩,當(dāng)摩爾定律放緩以后,想追求更高的計算力,散熱和能耗遭遇到挑戰(zhàn)。云計算資源集中化,高密度提升必然會帶來單個服務(wù)器和機(jī)柜的功率的上升,對支撐服務(wù)器穩(wěn)定運(yùn)行的數(shù)據(jù)中心也會有巨大的能耗挑戰(zhàn)。另外,數(shù)據(jù)中心的耗電量占4%左右。低能耗的數(shù)據(jù)中心需求呼聲越來越高,不僅關(guān)系到了人類環(huán)境的可持續(xù)發(fā)展,也直接決定了算力的成本和服務(wù)的競爭力。

上海市最近發(fā)布了新建數(shù)據(jù)中心PUE嚴(yán)格控制在1.3以下。國家對新基建時代的能耗,以及各地政府對能效的要求也越來越嚴(yán)格。對未來大數(shù)據(jù),大規(guī)模的數(shù)據(jù)中心的建設(shè)會更加嚴(yán)格的控制,我們不得不對挑戰(zhàn)進(jìn)行不斷地探索。

既要解決高密度的計算問題,又要解決能效的問題,成本更低,可靠性高,這是未來數(shù)據(jù)中心的挑戰(zhàn),倒逼我們不斷的思考和探索未來下一代的數(shù)據(jù)中心怎樣解決挑戰(zhàn)。

02

風(fēng)冷不冷液冷才是冷

為什么用液冷?就目前可行的產(chǎn)業(yè)方向看,大多數(shù)的企業(yè)都是從兩個大的方向上努力:

第一:CPU芯片持續(xù)改進(jìn),可以增大芯片的面積,增加芯片的尺寸,但同樣帶來負(fù)面效應(yīng)。

第二:液體代替空氣冷(風(fēng)吹)卻介質(zhì),通過液體對比空氣的性質(zhì),可以提升能力,這是提高散熱效率的關(guān)鍵點(diǎn)。常規(guī)的冷卻是空氣冷卻,冷卻介質(zhì)就是空氣。

33.jpeg

阿里云基礎(chǔ)設(shè)施服務(wù)器研發(fā)架構(gòu)師鐘楊帆說:“液冷就是通過液體,比如說水或者說其它的特殊不導(dǎo)電的液體代替空氣,將芯片內(nèi)存以及CPU等發(fā)熱部件的熱量直接帶走,而不通過傳統(tǒng)的低效的空氣。”

阿里云在面臨這些問題的時候,也是在不斷的思索,不斷的探索和嘗試?,F(xiàn)在大規(guī)模使用的空氣冷卻的技術(shù)架構(gòu),使用空氣介質(zhì)作為傳導(dǎo)。整體的架構(gòu)可以看到,浸沒液冷代替了空氣介質(zhì),提高了冷卻效率。從架構(gòu)上看,這是做了很大的減法,完全排除了能效比較低的冷卻設(shè)備,比如說風(fēng)扇和空調(diào)。

從風(fēng)扇、硬盤、CPU等等角度看,傳統(tǒng)的冷卻都是空氣將熱量帶走,少量的部件通過液體帶走。如果采用了一種介質(zhì)或者說采用了一種技術(shù)可以完全的替代空氣,能夠使得熱量完全的從液體上帶走,這樣的冷卻效率會大幅度的提升,以及達(dá)到一個極致的冷卻效果。

與此同時,未來服務(wù)器的數(shù)量會越來越多,規(guī)模會越來越大,除了考慮可靠性的問題,還需降低失效率。

傳統(tǒng)空氣冷卻的影響失效率的因素看,主要是溫度、振動、粉塵、潮濕。在數(shù)據(jù)中心里,失效率最高的是硬盤失效。溫度提高對硬盤的失效率故障顯著增加。未來如何通過溫度的適當(dāng)降低,同時減少振動粉塵和潮濕的因素影響,提高數(shù)據(jù)中心的可靠性和降低失效率這是一個值得研究得課題。

03

“泡”澡效果最好但挑戰(zhàn)仍然很多

阿里云從2015年開始對比了不同的冷卻架構(gòu),包括空氣冷卻,冷板液冷,從不同的維度進(jìn)行總結(jié)和對比。從空氣冷卻到冷板液冷,從各個方面進(jìn)行對比,實(shí)踐中不同的嘗試著驗(yàn)證迭代,結(jié)果證明:浸沒液冷是數(shù)據(jù)中心的一個躍遷式的技術(shù)創(chuàng)新,具有高可靠、高可用的特點(diǎn)。

一項(xiàng)新的技術(shù)在規(guī)模不大的時候,可能不太容易發(fā)現(xiàn)問題和所面臨的挑戰(zhàn),但一旦規(guī)模大了以后,我們要看在實(shí)際的應(yīng)用過程中會出現(xiàn)什么樣的問題,怎么解決規(guī)?;奶魬?zhàn)。

浸沒液冷的技術(shù)優(yōu)勢,之前基本上沒有看到在互聯(lián)網(wǎng)數(shù)據(jù)中心大規(guī)模進(jìn)行部署,液冷領(lǐng)域很難看到大規(guī)模的部署數(shù)據(jù)中心。鐘楊帆說:“現(xiàn)在很多問題沒有說非得用液冷解決,牽一發(fā)而動全身,面臨一些全新的挑戰(zhàn),這是革命性的變化,這仍然一個很大的工程。”

先看基礎(chǔ)設(shè)施是否可以達(dá)到與風(fēng)冷同樣的可靠性,如果可靠性很差,問題就很大。介質(zhì)變了,放在液體中是不是可以長期穩(wěn)定的工作,液體是不是不導(dǎo)電?很多的全新領(lǐng)域都需要解決。

再就是運(yùn)維的挑戰(zhàn),因?yàn)槊芏雀吡艘院?,它的重量也會更重了,如何維護(hù)?

44.jpeg

在基礎(chǔ)設(shè)施里,完全的重構(gòu),把數(shù)據(jù)中心和服務(wù)器融合在一起去考慮,全部整合在一起做重構(gòu),以及極簡的設(shè)計。

04

冷卻不再靠天

阿里云2018年部署的張北數(shù)據(jù)中心,為了降低能耗,實(shí)現(xiàn)節(jié)能環(huán)保的探索。最早2017年建立了互聯(lián)網(wǎng)行業(yè)的服務(wù)器集群是在杭州。2018年開啟了液冷的商用,包括了計算、存儲、網(wǎng)絡(luò),全部都實(shí)現(xiàn)了浸沒液冷的轉(zhuǎn)化。杭州,今年剛剛建設(shè)成的一個全球規(guī)模最大的浸沒液冷數(shù)據(jù)中心,這是全中國首個綠色數(shù)據(jù)中心。

“我們對比測算過了,如果相比傳統(tǒng)的數(shù)據(jù)中心,阿里云這一個數(shù)據(jù)中心每年可以節(jié)省至少上千萬元元的電。經(jīng)過長期、規(guī)?;牟渴?-3年的時間,高密度通過高效液體冷卻可以打破空氣冷卻瓶頸,在單機(jī)柜的功率密度可以提升3倍以上。”鐘楊帆表示。

高可靠,硬盤、內(nèi)存和CPU進(jìn)行對比,通過全密閉的浸沒實(shí)驗(yàn)的技術(shù),可以降低整體的部件失效率達(dá)到50%以上。高能效,我們對能效也是不斷的追求的指標(biāo),通過數(shù)據(jù)中心IT設(shè)備冷卻一體化的架構(gòu)創(chuàng)新設(shè)計,根本上去除低能效的部件。除了服務(wù)器以外,整體的能耗可以下降40%左右。高可用,自然冷卻高度依賴氣象條件,很多的數(shù)據(jù)中心選擇了比較冷的地方,靠近北極,就是為了利用當(dāng)?shù)乇容^優(yōu)的自然環(huán)境。

浸沒冷卻完全是不再依賴任何的氣象條件,可以在高溫,高濕,以及在腐蝕性,海邊的惡劣的環(huán)境中進(jìn)行運(yùn)行。大多數(shù)數(shù)據(jù)中心,里面的噪聲很吵,這是風(fēng)冷數(shù)據(jù)中心的特點(diǎn)。因?yàn)轱L(fēng)冷需要風(fēng)扇,所以會有聲音。雖然說進(jìn)去以后非常吵,令人厭煩,但無可奈何。

鐘楊帆說:“進(jìn)入浸沒數(shù)據(jù)中心以后,你會發(fā)現(xiàn)基本上沒有聲音了,這是非常安靜的,對運(yùn)維人員是比較大的改善。”

05

結(jié)語

液冷這個新的行業(yè),因?yàn)樗锩缘刈冞w,必須得重塑發(fā)展,然后進(jìn)行推廣和擴(kuò)大。希望所有的行業(yè)伙伴一起可以參與進(jìn)來建設(shè)整個行業(yè)生態(tài),能夠助力新基建,幫助數(shù)據(jù)中心能夠達(dá)到節(jié)能綠色環(huán)保。

THEEND

最新評論(評論僅代表用戶觀點(diǎn))

更多
暫無評論