AI如何推動網(wǎng)絡基礎設施的變革

Gary Bernstein
根據(jù)Statista的數(shù)據(jù),2023年全球人工智能市場價值將達到1423億美元,其中金融、醫(yī)療保健和高科技/電信市場將率先采用人工智能。

本文來自微信公眾號“CDCC”,作者/Gary Bernstein。

人工智能技術(shù)的最新發(fā)展幾乎沒有一天不成為頭條新聞。早在2022年11月,OpenAI就推出了ChatGPT大型語言模型,2023年4月,微軟Azure OpenAI服務的GPT-4發(fā)布,而就在今年5月,谷歌推出了與之競爭的全新Bard AI聊天機器人。毫無疑問,人工智能擁有改變我們?nèi)粘I畹木薮罅α?。從聊天機器人到人臉識別,再到自動駕駛和早期疾病診斷,人工智能的應用似乎永無止盡。

根據(jù)Statista的數(shù)據(jù),2023年全球人工智能市場價值將達到1423億美元,其中金融、醫(yī)療保健和高科技/電信市場將率先采用人工智能。在最新的數(shù)據(jù)中心內(nèi),人工智能已被廣泛用于監(jiān)控數(shù)據(jù)中心資產(chǎn)、主動檢測故障以及通過更好地管理PUE(能源利用效率)來提高能效。我們今天能夠看到的是,不僅是那些超大型獨角獸企業(yè),許多大型企業(yè)公司也都在利用人工智能。

1.png

“InfiniBand”和“以太網(wǎng)”

如今,許多支持人工智能的網(wǎng)絡都在使用InfiniBand技術(shù)。這是一個有趣的發(fā)展,因為以太網(wǎng)是大多數(shù)數(shù)據(jù)中心的全球標準,而InfiniBand目前只占市場的很小一部分,傳統(tǒng)上只用于HPC網(wǎng)絡。現(xiàn)在,InfiniBand市場的領導者Nvidia與思科、Arista和Broadcom等眾多領先的以太網(wǎng)交換機和芯片制造商之間的競爭已經(jīng)展開。博通公司最近推出了"Jericho3-AI"StrataDNX™芯片,將使用以太網(wǎng)而不是InfiniBand來構(gòu)建人工智能集群。無論采用哪種協(xié)議,InfiniBand和以太網(wǎng)都有高帶寬和低延遲的要求,都需要高質(zhì)量和高性能的光纖布線解決方案。

對電力和帶寬的需求激增

數(shù)據(jù)中心面臨的兩個主要挑戰(zhàn)與極端的電力需求和相關的設備冷卻要求以及GPU(圖形處理器)過高的帶寬需求有關。

帶有運行人工智能應用的GPU的超級計算機(如Nvidia的DGX平臺)耗電量巨大,并且需要多個高帶寬連接。Nvidia有DGX A100、H100,并且剛在2023年5月的Computex大會上推出了GH200。這些GPU平臺需要為每個6U機箱提供6.5kW到11kW以上的功率。如果將這些數(shù)據(jù)與以往滿載數(shù)據(jù)中心機柜的整柜7或8kW平均功耗,以及15至20kW的最大功耗相比,你就會明白人工智能到底有多耗電。

在帶寬方面,這些GPU超級計算機通常需要多達8 x 100Gb/s(EDR)或200Gb/s(HDR)的連接。每個GPU提供8個連接,總帶寬可達8x200G。

Nvidia首席執(zhí)行官Jensen Huang最近在datacenterfrontier.com上表示,“生成式人工智能正在推動計算需求的指數(shù)級增長”,“你會看到一個10年過渡期的開始,基本上是回收或再利用世界上的數(shù)據(jù)中心,并將其構(gòu)建為加速計算”。

IT基礎設施如何應對?

極端的供電和冷卻要求迫使數(shù)據(jù)中心管理者重新思考基礎設施的設計并實施變革。這通常包括改變網(wǎng)絡設計和更多地分散GPU超級計算機機柜,可能使用列末(EoR)拓撲結(jié)構(gòu),以更好地應對溫度上升。這意味著交換機到GPU的物理距離必須增加。為了延長交換機到GPU的連接,數(shù)據(jù)中心運營商可能需要使用更多的光纖布線,而不僅僅是傳統(tǒng)的交換機到交換機之間的結(jié)構(gòu)化光纖布線。由于連接距離較長,直連銅纜(DAC)可能不是一個好的選擇,因為在這種速度下,這些線纜組件的最大連接距離被限制在3至5米。除了光纖布線外,有源光纜(AOC)也是一種可行的選擇,因為與DAC相比,它們可以覆蓋更長的距離。有源光纜的優(yōu)點包括其功耗要比收發(fā)器(光模塊)低得多,并且能改善延遲。西蒙提供的有源光纜可以以0.5米為單位遞增,從而對線纜管理更為友好。

1.png

數(shù)據(jù)中心主干網(wǎng)的交換機到交換機連接需要并行光纖技術(shù)來支持不斷增長的帶寬需求。目前的許多并行光纖技術(shù)方案都采用8芯光纖與MPO/MTP光纖連接器相連接。這些Base-8 MPO/MTP解決方案可采用多模或單模光纖,并能夠輕松遷移到更高速度。企業(yè)數(shù)據(jù)中心在向100Gb/s和400Gb/s升級時應考慮使用Base-8 MPO/MTP OM4布線解決方案,而云數(shù)據(jù)中心在向400Gb/s和800Gb/s遷移時應選擇Base-8 MPO/MTP單模布線解決方案。

市場上的創(chuàng)新光纖配線系統(tǒng)可以靈活地支持不同的光纖預端接模塊,包括MTP-LC的Base-8和Base-12模塊、MTP直通模塊和熔接模塊。這些系統(tǒng)便于接入、易于升級并改進了光纜管理。

由于延遲在人工智能應用中變得非常重要,西蒙推薦使用超低損耗(ULL)性能和MTP/APC連接器的“支持人工智能”解決方案。在部署新短距離單模應用(支持100、200和400 Gb/s速率,傳輸距離可達500米)時,應考慮采用超低損耗光纖布線。超低損耗布線可支持人工智能應用所需的更為嚴格的插入損耗要求,從而提升整體網(wǎng)絡性能。西蒙還建議使用APC(斜面物理接觸)光纖連接器,如MTP/APC連接器,APC除了常用于單模連接,還可以用于某些多模布線應用。APC(與UPC連接器相比)的端面幾何形狀經(jīng)過斜面研磨處理,可提高反射率,從而改善光纖性能。

人工智能是一種顛覆性技術(shù),它也有可能徹底改變我們的生活和工作方式。數(shù)據(jù)中心運營商需要為人工智能的需求做好準備,現(xiàn)在就應該開始規(guī)劃。他們應該考慮能快速、輕松地遷移到更高數(shù)據(jù)傳輸速度的解決方案,同時考慮如何提高數(shù)據(jù)中心的能效。為人工智能需求做好準備的數(shù)據(jù)中心將處于有利地位,能夠隨著人工智能的發(fā)展和應用,充分擁抱人工智能帶來的機遇。

資料來源:西蒙布線

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論