綠色智算中心如何破解AI能耗困局

未然
目前,中國(guó)的算力發(fā)展正駛?cè)肟燔嚨?。截?023年底,國(guó)內(nèi)算力服務(wù)的機(jī)架數(shù)量達(dá)到810萬(wàn)個(gè),總規(guī)模位居全球第二。構(gòu)建全國(guó)一體化的算力網(wǎng)絡(luò),是迎接科技革命和產(chǎn)業(yè)變革新浪潮的關(guān)鍵一步。今年的政府工作報(bào)告中提到,2024年將超前布局?jǐn)?shù)字基礎(chǔ)設(shè)施,加速打造全國(guó)一體化的算力架構(gòu)。

本文來(lái)自微信公眾號(hào)“IDC圈”,作者/未然。

在數(shù)字經(jīng)濟(jì)的巨浪中,算力如水和電一樣,成為現(xiàn)代社會(huì)的生命線。掌握算力,就像握有通往人工智能世界的黃金船票。

目前,中國(guó)的算力發(fā)展正駛?cè)肟燔嚨?。截?023年底,國(guó)內(nèi)算力服務(wù)的機(jī)架數(shù)量達(dá)到810萬(wàn)個(gè),總規(guī)模位居全球第二。構(gòu)建全國(guó)一體化的算力網(wǎng)絡(luò),是迎接科技革命和產(chǎn)業(yè)變革新浪潮的關(guān)鍵一步。今年的政府工作報(bào)告中提到,2024年將超前布局?jǐn)?shù)字基礎(chǔ)設(shè)施,加速打造全國(guó)一體化的算力架構(gòu)。

然而,算力的飛速增長(zhǎng)也帶來(lái)了電力的挑戰(zhàn)。據(jù)報(bào)道,全球數(shù)據(jù)中心的用電量將在四年內(nèi)翻倍,從2022年的460太瓦時(shí)躍升至2026年的1050太瓦時(shí),而在國(guó)內(nèi)同樣面臨數(shù)據(jù)中心的用電量增長(zhǎng)的境遇。

自“東數(shù)西算”工程實(shí)施以來(lái),據(jù)報(bào)道,2022年,全國(guó)數(shù)據(jù)中心耗電量約占全社會(huì)用電量約3%。在比特與瓦特之間的供需矛盾中,近兩年來(lái),人們開(kāi)始呼吁算力與電力協(xié)同發(fā)展。隨著降低能耗的呼聲日益高漲,業(yè)界對(duì)綠色算力的期待也在不斷增長(zhǎng)。

智算中心的能源環(huán)保困境

AI模型的訓(xùn)練和推理過(guò)程對(duì)計(jì)算資源的需求巨大,這直接導(dǎo)致了電力需求的激增和相應(yīng)的碳排放。以GPT-3為例,擁有1750億個(gè)參數(shù)。訓(xùn)練GPT-3需要大量的計(jì)算資源,使用了數(shù)千個(gè)GPU和數(shù)周的時(shí)間。據(jù)估計(jì),訓(xùn)練GPT-3的碳排放量相當(dāng)于一輛汽車在其生命周期內(nèi)(包括制造和行駛)的總碳排放。具體來(lái)說(shuō),大約需要數(shù)十萬(wàn)度電,這對(duì)環(huán)境的影響是顯著的。

訓(xùn)練大型神經(jīng)網(wǎng)絡(luò)模型的時(shí)間、配置和能耗也因模型和訓(xùn)練算法的效率而異。例如,優(yōu)化模型的FLOP利用率(MFU)以及整體網(wǎng)絡(luò)和服務(wù)器的功率效率和使用情況都對(duì)能耗產(chǎn)生顯著影響。不同地區(qū)的電網(wǎng)碳強(qiáng)度差異,也會(huì)導(dǎo)致訓(xùn)練同一模型產(chǎn)生的碳排放量有所不同。例如,法國(guó)60%的電力來(lái)自核電,電網(wǎng)碳強(qiáng)度僅為0.057 kg CO2e/kWh,遠(yuǎn)低于美國(guó)的0.387 kg CO2e/kWh。

640 (1).png

除了直接的能源消耗,智算中心還需考慮隱含排放,即制造和運(yùn)輸計(jì)算設(shè)備所涉及的總碳排放量。盡管關(guān)于AI加速器芯片的隱含排放數(shù)據(jù)不多,但估計(jì)每個(gè)A100 GPU的隱含排放為150kg CO2,而一臺(tái)托管8個(gè)GPU的服務(wù)器的隱含排放為2500kg CO2。隱含排放約占訓(xùn)練運(yùn)行總排放量的8-10%。

智算中心的運(yùn)營(yíng)成本中,電力成本占據(jù)了相當(dāng)大的比例。以一個(gè)典型的8個(gè)GPU的H100服務(wù)器為例,每月需要消耗10,200W的IT功率,電費(fèi)成本約為4,406元(假設(shè)每千瓦時(shí)電價(jià)為0.6元)。隨著推理需求的不斷增加,這一成本還將進(jìn)一步上升。

為了確保智算中心的正常運(yùn)營(yíng),穩(wěn)定且可靠的能源供應(yīng)鏈至關(guān)重要。地緣政治和天氣干擾可能導(dǎo)致能源價(jià)格波動(dòng),因此,建立穩(wěn)定的供應(yīng)鏈以降低這種風(fēng)險(xiǎn)顯得尤為重要。此外,還需要具備快速提升燃料生產(chǎn)能力,從而迅速規(guī)劃大規(guī)模發(fā)電的能力。

破局之道

提高能源效率是降低智算成本的首要途徑。通過(guò)優(yōu)化模型FLOP利用率(MFU),可以在不增加計(jì)算資源投入的情況下提高計(jì)算效率。此外,改進(jìn)訓(xùn)練算法和硬件架構(gòu)也有助于降低功耗。

使用低碳能源是減少碳排放的有效手段。例如,法國(guó)在這方面做出了很好的示范,其60%的電力來(lái)自核電,大大降低了碳排放;而微軟通過(guò)采購(gòu)清潔能源滿足人工智能和數(shù)數(shù)據(jù)中心不斷增長(zhǎng)的需求,計(jì)劃到2030年在美國(guó)和歐洲建立10.5吉瓦的綠色產(chǎn)能;其他國(guó)家可以通過(guò)增加可再生能源的比重,如風(fēng)能、太陽(yáng)能等,來(lái)降低電網(wǎng)的碳強(qiáng)度。

640 (1).png

綠色數(shù)據(jù)中心通過(guò)采用節(jié)能技術(shù)和設(shè)備,可以顯著降低能源消耗。例如,使用液冷技術(shù)代替?zhèn)鹘y(tǒng)的風(fēng)冷技術(shù),可以提高散熱效率,減少空調(diào)系統(tǒng)的能耗。此外,合理的建筑設(shè)計(jì)和布局也有助于提高能源利用效率。

碳補(bǔ)償機(jī)制是一種通過(guò)購(gòu)買碳信用來(lái)抵消碳排放的手段。智算中心可以通過(guò)投資可再生能源項(xiàng)目或植樹(shù)造林等方式,達(dá)到碳中和的目標(biāo)。雖然這并不能從根本上解決問(wèn)題,但可以在短期內(nèi)緩解碳排放的壓力。

AI技術(shù)的發(fā)展不可逆轉(zhuǎn),智算中心作為其核心支撐,將在未來(lái)扮演越來(lái)越重要的角色。降低智算成本不僅是企業(yè)的需求,更是國(guó)家科技發(fā)展的戰(zhàn)略任務(wù)。通過(guò)平衡訓(xùn)練與推理的投入、優(yōu)化能耗與碳排放、加強(qiáng)地區(qū)間的協(xié)同調(diào)度以及提升軟實(shí)力建設(shè),這些措施將有利于綠色智算中心的能源之困的破局。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論