數(shù)據(jù)中心邁入液冷時代

戴爾和超微表示,通過直接在機架上的 GPU 上使用液體冷卻,他們可以將數(shù)據(jù)中心的功耗降低三分之一。機架供應(yīng)商告訴《EE Times》,通過取代當(dāng)今數(shù)據(jù)中心的主要解決方案空氣冷卻,液體冷卻將使數(shù)據(jù)中心運營商能夠?qū)⒏嗟木性谟嬎闵?,而不是空調(diào)上。

本文來自微信公眾號“半導(dǎo)體產(chǎn)業(yè)縱橫(ID:ICVIEWS)”,編譯自eetimes。

目前典型數(shù)據(jù)中心所用電力的46%用于空氣冷卻。

戴爾和超微表示,通過直接在機架上的GPU上使用液體冷卻,他們可以將數(shù)據(jù)中心的功耗降低三分之一。機架供應(yīng)商告訴《EE Times》,通過取代當(dāng)今數(shù)據(jù)中心的主要解決方案空氣冷卻,液體冷卻將使數(shù)據(jù)中心運營商能夠?qū)⒏嗟木性谟嬎闵?,而不是空調(diào)上。

人工智能正在推動需求。就在世界各地新建的超大型數(shù)據(jù)中心開始給電網(wǎng)帶來壓力之際,更高的能源效率前景也隨之而來。

戴爾和Supermicro是高端數(shù)據(jù)中心液冷機架的主要供應(yīng)商,它們一直在提高產(chǎn)量以滿足預(yù)期的激增需求。Supermicro表示,它每月可在全球范圍內(nèi)交付一千多個機架。

Supermicro技術(shù)和AI高級副總裁Vik Malyala告訴EE Times:“我們可以了解我們的技術(shù)合作伙伴將推出哪些技術(shù),無論是英特爾、AMD還是Nvidia,以及像博通和英特爾這樣的網(wǎng)絡(luò)公司。我們與他們合作,然后查看他們的路線圖。”

Nvidia等GPU制造商為冷板和散熱器創(chuàng)建了參考設(shè)計。戴爾和Supermicro密切合作以采用這些設(shè)計。

戴爾工程技術(shù)專家Tim Shedd告訴《EE Times》:“我們希望確保我們設(shè)計的任何產(chǎn)品都能得到芯片制造商的支持,并得到他們的保證和支持。我們添加了多年來在行業(yè)中積累的專有功能,例如專有泄漏感應(yīng)技術(shù),以保護(hù)客戶和服務(wù)器。”

Supermicro表示,其冷卻解決方案包含冷板設(shè)計的專有信息。Malyala補充說,數(shù)據(jù)中心運營商一直不愿意放棄對空氣冷卻的依賴,但他預(yù)計這種狀況將會改變。

“隨著數(shù)據(jù)中心部署規(guī)模越來越大,我們知道效率將成為一個非常關(guān)鍵的因素,”瑪利亞拉說。“電力消耗是一場噩夢。”

戴爾估計,目前典型數(shù)據(jù)中心所用電力的46%用于空氣冷卻。Shedd表示:“通過部署液體冷卻,我們可以將能耗降低到10%或更低,而不必在所有東西上都安裝冷卻板,而是使用智能混合技術(shù):只需空氣和液體冷卻。”他補充說,降低能耗的關(guān)鍵是減少數(shù)據(jù)中心的空氣壓縮機數(shù)量。

如今,大多數(shù)數(shù)據(jù)中心都采用從設(shè)施周邊吹向服務(wù)器的空氣進(jìn)行冷卻。服務(wù)器上的風(fēng)扇提供額外的冷卻。

“我需要相當(dāng)冷的水,通常約為45°F,才能充分冷卻空氣,”Shedd說道。“這意味著一年中的大部分時間,我都需要壓縮機和制冷來冷卻水。使用液體冷卻,對于使用冷板和液體冷卻的數(shù)據(jù)中心部分,我通常可以使用90°F的水,甚至100°F的水來進(jìn)行冷卻。現(xiàn)在,在大多數(shù)氣候條件下,我?guī)缀醪恍枰獕嚎s機,因此節(jié)省的能源非??捎^。”

市場研究公司Dell'Oro在7月份的新聞稿中表示,液體冷卻正在從一個小眾市場轉(zhuǎn)變?yōu)橹髁鳂I(yè)務(wù),由于對熱管理的需求增加,到2030年其價值將達(dá)到150億美元。

液冷系統(tǒng)出貨量將增長20%

Malyala表示,超微預(yù)計今年支持人工智能基礎(chǔ)設(shè)施(包括液體冷卻)的系統(tǒng)的出貨量增長率將至少達(dá)到20%。他說:“我們正在考察許多數(shù)據(jù)中心,我們意識到其中許多數(shù)據(jù)中心效率極低,因為建設(shè)基礎(chǔ)設(shè)施的人并不是支付制冷費用的人。”

Shedd指出,需求是由1,000瓦GPU的進(jìn)步以及你可能想不到的地方對AI的需求所推動的。“我們必須將AI帶入數(shù)據(jù),而不是將數(shù)據(jù)帶入處理能力。我不一定想將數(shù)據(jù)發(fā)送到云端,因為我擔(dān)心安全問題。政府不想將他們的數(shù)據(jù)(尤其是這種敏感、經(jīng)過處理、有用的數(shù)據(jù))發(fā)送到外面。那不是10,000個GPU的數(shù)據(jù)中心;那是一個機架。”

戴爾發(fā)現(xiàn)了液體冷卻在新領(lǐng)域的應(yīng)用案例。“我們過去主要關(guān)注高性能計算和一些非常具體的商業(yè)垂直行業(yè),比如銀行業(yè)和其他真正需要密集計算的領(lǐng)域,”Shedd說道。“現(xiàn)在我們看到用例細(xì)化到工廠中的一個機架,他們希望實時從生產(chǎn)線收集數(shù)據(jù),處理數(shù)據(jù)并做出決策。這可能需要在該機架中使用液體冷卻。”

Malyala表示,邊緣安全是液冷機架供應(yīng)商的一個不斷增長的業(yè)務(wù)。“我們談?wù)摰氖俏覀兊拿坎渴謾C,”他說。“我們?nèi)绾卧谠?jīng)的中心位置有效地保證它們的安全?實時威脅檢測和保護(hù)正在發(fā)生——這正在向邊緣靠攏。”

關(guān)掉空調(diào)

通過將數(shù)據(jù)中心甚至機架轉(zhuǎn)換為液體冷卻,應(yīng)該可以“關(guān)閉空調(diào),或者至少以更高效的方式運行它們”,Malyala說。“你說的是40%的節(jié)能。這基本上意味著你可以在相同的空間內(nèi)放置40%的額外基礎(chǔ)設(shè)施。”

戴爾還將液體冷卻的節(jié)能視為向客戶銷售更多機架和提高數(shù)據(jù)中心處理密度的一種方式。

能源節(jié)省的效果還可能進(jìn)一步擴大。新加坡供應(yīng)商Sustainable Metal Cloud 8月份向CNBC表示,其浸入式冷卻技術(shù)的安裝成本比液體解決方案低28%,且可將能耗降低高達(dá)50%。

在現(xiàn)有數(shù)據(jù)中心安裝液體冷卻需要對設(shè)施內(nèi)部進(jìn)行大量改造,而這正是客戶感到畏懼的。“對于客戶,我們需要根據(jù)他們的實際情況來滿足他們的需求,”Shedd說。“有些客戶目前無法部署液體冷卻。安裝所有管道和水管實在是太麻煩了。所以我們與他們合作。我們不斷提高服務(wù)器風(fēng)扇的效率。我們不斷努力讓客戶使用更高的溫度,這樣他們就可以減少使用壓縮機。”

戴爾期待液體冷卻領(lǐng)域進(jìn)一步創(chuàng)新。未來處理器的熱密度將超過燃?xì)鈬姛舻幕鹧?。首席運營官杰夫·克拉克(Jeff Clarke)在9月份的LinkedIn博客中表示,戴爾正在改變冷卻板,以管理最具挑戰(zhàn)性的處理器功能,而不會影響數(shù)據(jù)中心的能源效率。他說道:“我們正在為未來打造新的集成機架,以便每個機架能夠承受超過400 kW的電力和冷卻。”

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論