為什么效率在現(xiàn)代數(shù)據中心很重要

Kevin Deierling
全球超級計算機的Green500排行榜及時提供了一種不同的方法。其排行除了以運營速度為中心的Top500強之外,也是全球最節(jié)能的500臺超級計算機的排行榜,其目的是提高人們對除FLOPS以外的其他性能指標的認識。

幾十年來,當談論到計算機的性能時,人們理所當然地認為指的是運行速度。而在超級計算機的世界中,其運行速度是以每秒浮點運算次數(shù)來衡量的。目前全球運行速度最高的計算機是日本的Fugaku超級計算機,其運行速度高達415 Petaflops。

但是將運行速度作為超級計算機性能比較的唯一度量標準存在一些問題。而基于FLOPS的技術競賽不斷見證速度更快的超級計算機的出現(xiàn),這些超級計算機消耗大量的電力并產生大量的熱量,因此需要部署非常復雜的冷卻系統(tǒng),以防止它們過熱。過分依賴計算機基準測試的速度也會輕視其他重要特性,例如可靠性、可用性、有效性,以及是經濟性。而將運行速度作為其成功的主要衡量標準,使得超級計算機的總擁有成本達到了前所未有的高度,同時也加劇了對環(huán)境的負面影響。

全球超級計算機的Green500排行榜及時提供了一種不同的方法。其排行除了以運營速度為中心的Top500強之外,也是全球最節(jié)能的500臺超級計算機的排行榜,其目的是提高人們對除FLOPS以外的其他性能指標的認識。它通過根據功耗對超級計算機進行排名,并考慮到能源效率和可靠性來實現(xiàn)這一目標。Green500正如其名稱所暗示的那樣,這是為了向超級計算機領域的各種利益相關者和投資者宣傳環(huán)境保護的重要性。

Green500排行榜揭示了有關超級計算的發(fā)展方向,并指出了效率可能成為行業(yè)領導者和追隨者之間主要差異的原因。

目前在Green500榜單中排名第一的是由日本初創(chuàng)廠商Preferred Networks公司建造的MN-3系統(tǒng),其能效為21.1 gigaFLOPS/W。以運行速度來衡量,MN-3在500強排名中排名第394名,并且目前還不能用于商業(yè)用途。

排在第二位的是NVIDIA公司開發(fā)的人工智能超級計算機Selene。Selene的能效為20.52 gigaFLOPS/W,在效率上可與MN-3并駕齊驅,但在運行速度的Top500排行榜上排名第七,因此其運行速度相當快。

Selene采用獨特的開放式架構DGX SuperPOD。而NVIDIA公司在短短幾周的時間內完成了DGX SuperPOD設計和制造,將其DGX處理器設計與Mellanox的人工智能網絡架構結合在一起。

正是這種配置為Selene帶來了更高的性能、效率和經濟性,以及在各種用途方面的靈活性。NVIDIA公司開發(fā)Selene的目的是創(chuàng)建一個超級計算機級系統(tǒng),該系統(tǒng)功能強大,足以訓練和運行用于自動駕駛汽車等領域的人工智能模型,并且十分靈活,可以成為以學術為主導的深度學習研究項目的一部分。

自從部署以來,Selene每周可以同時運行數(shù)千個工作。它執(zhí)行人工智能數(shù)據分析、傳統(tǒng)機器學習和高性能計算(HPC)應用程序。DGX SuperPOD的強大功能正被一些公司使用,比如汽車廠商Continental公司、航空航天廠商洛克希德馬丁公司,以及云計算提供商微軟公司。

Green500榜單為超級計算機的發(fā)展指明了一個新的方向,希望成為人工智能行業(yè)先驅的組織需理解對計算能力的需求,這種能力提供了前所未有的規(guī)模以及快速簡單的部署。

未來的超級計算機需要在更加節(jié)能環(huán)保的數(shù)據中心中運行。而采用開放式架構,不再需要花費數(shù)月時間才能調試完成的專有設計。

現(xiàn)代計算需要具有多種用途且使用壽命長的計算機,將盡可能多的處理、內存和存儲設備集成到更小的空間中,并盡可能減少能耗。名列Green500榜單中的一些超級計算機已經將這些想法付諸于現(xiàn)實。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論