2024年數(shù)據(jù)中心芯片的發(fā)展趨勢

數(shù)據(jù)中心運(yùn)營商對“協(xié)處理器”有很大的興趣——旨在補(bǔ)充和增強(qiáng)主處理器功能的微處理器。

640 (1).png

本文來自半導(dǎo)體產(chǎn)業(yè)縱橫,由半導(dǎo)體產(chǎn)業(yè)縱橫(ID:ICVIEWS)綜合。

2024年剩余時間有望成為數(shù)據(jù)中心芯片市場繁忙的一年,因為競爭對手芯片制造商都在準(zhǔn)備發(fā)布新處理器。

分析師表示,AMD和英特爾預(yù)計將推出新的競爭性數(shù)據(jù)中心CPU,而包括超大規(guī)模廠商和初創(chuàng)公司在內(nèi)的其他芯片制造商計劃推出新的AI芯片,以滿足AI工作負(fù)載不斷飆升的需求。比如英特爾在本周二確認(rèn)其用于人工智能訓(xùn)練和推理的新型Gaudi 3人工智能加速器預(yù)計將于2024年第三季度全面上市,而Meta在周三宣布其下一代人工智能推理處理器現(xiàn)已投入生產(chǎn)并已在其數(shù)據(jù)中心使用。

Omdia數(shù)據(jù)中心IT首席分析師Manoj Sukumaran表示,雖然服務(wù)器銷量預(yù)計將增長6%,從2023年的1080萬臺服務(wù)器出貨量增長到2024年的1150萬臺,但2024年服務(wù)器收入預(yù)計將同比增長59%,這表明處理器仍然是一個熱門且不斷增長的市場。事實上,在未來五年內(nèi),服務(wù)器收入預(yù)計將增加一倍以上,到2028年達(dá)到2700億美元。

“盡管單位出貨量沒有大幅增長,但收入增長相當(dāng)快,因為這些服務(wù)器內(nèi)部裝有大量芯片,因此服務(wù)器價格大幅上漲,”Sukumaran告訴Data Center Knowledge。“這對芯片供應(yīng)商來說是一個巨大的機(jī)會。”

協(xié)處理器是熱門商品

數(shù)據(jù)中心運(yùn)營商對“協(xié)處理器”有很大的興趣——旨在補(bǔ)充和增強(qiáng)主處理器功能的微處理器。

Sukumaran表示,傳統(tǒng)上,數(shù)據(jù)中心服務(wù)器市場以CPU為中心,CPU是通用服務(wù)器中最昂貴的組件。他表示,2020年只有超過11%的服務(wù)器擁有協(xié)處理器,但到2028年,預(yù)計超過60%的服務(wù)器將配備協(xié)處理器,這不僅可以提高計算能力,還可以提高效率。

Nvidia H100和AMD MI300 GPU、谷歌云張量處理單元(TPU)等協(xié)處理器以及其他定制專用集成電路(ASIC)很受歡迎,因為它們能夠?qū)崿F(xiàn)AI訓(xùn)練、AI推理、數(shù)據(jù)庫加速、網(wǎng)絡(luò)卸載和安全功能和視頻轉(zhuǎn)碼,Sukumaran說。

分析師指出,視頻轉(zhuǎn)碼是一個使Netflix、YouTube和其他流媒體能夠優(yōu)化從電視到智能手機(jī)等不同用戶設(shè)備的視頻質(zhì)量的過程。

AMD和Intel與ARM CPU的CPU市場仍然利潤豐厚。英特爾仍然是市場份額的領(lǐng)先者,但來自初創(chuàng)公司Ampere和其他云服務(wù)提供商的AMD和基于Arm的CPU近年來已經(jīng)削弱了英特爾的主導(dǎo)地位。

Omdia的數(shù)據(jù)顯示,雖然英特爾擁有61%的CPU市場份額,但AMD已經(jīng)獲得了顯著的吸引力,從2020年服務(wù)器出貨量的不到10%增長到2023年的27%。Arm CPU去年占據(jù)了9%的市場份額。

Sukumaran表示:“過去幾年,Arm軟件生態(tài)系統(tǒng)已經(jīng)相當(dāng)成熟,Arm CPU的低功耗和高核心密度對云服務(wù)提供商很有吸引力。”

事實上,谷歌云周二宣布其首款基于Arm的CPU(稱為Google Axion處理器)將于今年晚些時候向客戶提供。

英特爾今年的目標(biāo)是通過發(fā)布下一代服務(wù)器處理器來重新在CPU市場站穩(wěn)腳跟。帶有E核的全新英特爾至強(qiáng)6處理器(之前代號為“Sierra Forest”)預(yù)計將于2024年第二季度上市,專為需要功效和性能的超大規(guī)模企業(yè)和云服務(wù)提供商而設(shè)計。

緊隨其后的是推出帶有P核的全新Intel Xeon 6處理器,以前的代號為Granite Rapids,主打高性能。然而,AMD并沒有坐以待斃,計劃發(fā)布名為Turin的第五代EPYC CPU。

Moor Insights&Strategy副總裁兼首席分析師馬特·金博爾(Matt Kimball)表示:“AMD毫無疑問是性能領(lǐng)先者,并且在從英特爾手中奪取市場份額方面表現(xiàn)出色。”幾乎所有這些都已通過超大規(guī)模企業(yè)存儲在云端,AMD也希望進(jìn)一步擴(kuò)大其在本地企業(yè)中的收益。2024年,從性能角度來看,您將看到英特爾在服務(wù)器端CPU方面再次具有競爭力。”

芯片制造商開始關(guān)注人工智能推理

各個垂直領(lǐng)域的公司都在競相構(gòu)建人工智能模型,因此人工智能培訓(xùn)的規(guī)模仍然很大。但Tirias Research創(chuàng)始人兼首席分析師Jim McGregor表示,到2024年,人工智能推理芯片市場將開始出現(xiàn)。

“正在向推理處理轉(zhuǎn)變,”他說。“我們看到大量人工智能工作負(fù)載和生成式人工智能工作負(fù)載的出現(xiàn)。他們已經(jīng)訓(xùn)練了模型?,F(xiàn)在,他們需要一遍又一遍地運(yùn)行它們,并且希望盡可能高效地運(yùn)行這些工作負(fù)載。因此,期待看到供應(yīng)商推出新產(chǎn)品。”

McGregor表示,Nvidia憑借其GPU在人工智能領(lǐng)域占據(jù)主導(dǎo)地位,但AMD已于12月發(fā)布了用于人工智能訓(xùn)練和推理的Instinct MI300系列GPU,推出了可行的競爭產(chǎn)品。

雖然GPU甚至CPU都用于訓(xùn)練和推理,但越來越多的公司(包括高通、Amazon Web Services(AWS)和Meta等超大規(guī)模企業(yè),以及Groq、Tenstorrent和Untether AI等AI芯片初創(chuàng)公司)已經(jīng)構(gòu)建或正在開發(fā)專門用于人工智能推理的芯片。分析師還表示,這些芯片更加節(jié)能。

Kimball表示,當(dāng)組織部署Nvidia H100或AMD MI300時,這些GPU非常適合訓(xùn)練,因為它們很大,具有大量內(nèi)核,并且具有高帶寬內(nèi)存,具有高性能。

“推理是一項更輕量級的任務(wù)。他們不需要H100或MI300的強(qiáng)大功能,”他說。

2024年頂級數(shù)據(jù)中心芯片

以下是預(yù)計將于2024年推出的處理器列表。

AMD

AMD首席執(zhí)行官蘇姿豐在2023年第四季度財報電話會議上表示AMD計劃在2024年下半年推出下一代服務(wù)器處理器Turin。Turin基于該公司新的Zen 5核心。

“Turin是現(xiàn)有第四代EPYC平臺的直接替代品,通過添加下一代Zen 5核心、新的內(nèi)存擴(kuò)展功能和更高的核心數(shù)量,擴(kuò)展了我們的性能、效率和TCO領(lǐng)先地位,”她在會上表示財報電話會議。

目前還沒有該產(chǎn)品的具體細(xì)節(jié)。但Moor Insights&Strategy分析師Kimball表示,這款產(chǎn)品將具有重要意義。他表示:“AMD將尋求從性能和每瓦性能的角度進(jìn)一步將自己與英特爾區(qū)分開來。”自去年12月推出以來,AMD也看到了對其Instinct MI300加速器(包括MI300X GPU)的巨大需求。蘇姿豐在財報電話會議上表示,該公司計劃今年為云、企業(yè)和超級計算客戶積極提高M(jìn)I300的產(chǎn)量。

英特爾

英特爾高管計劃今年發(fā)布幾款主要芯片:Gaudi 3 AI加速器和下一代Xeon服務(wù)器處理器。

Gaudi 3將用于AI訓(xùn)練和推理,瞄準(zhǔn)企業(yè)市場。它的設(shè)計目的是與Nvidia和AMD的GPU競爭。英特爾表示這款A(yù)I芯片將比其前身Gaudi 2提供四倍的人工智能計算能力和1.5倍的內(nèi)存帶寬。

英特爾高管補(bǔ)充道,與Nvidia的H100 GPU相比,Gaudi 3預(yù)計訓(xùn)練和推理時間將加快50%,推理能效將提高40%。

分析師金博爾表示:“這將具有巨大的節(jié)能效果和更低的價格。”

至于下一代Intel Xeon 6處理器,Sierra Forest將包括一個具有288個核心的版本,這將是業(yè)界最大的核心數(shù)量。這也是該公司首款“E-core”服務(wù)器處理器,旨在平衡性能與能源效率。

Granite Rapids是一款“P核”服務(wù)器處理器,專為實現(xiàn)最佳性能而設(shè)計。該公司表示,與Sapphire Rapids相比,它將為AI工作負(fù)載提供兩到三倍的性能提升。

英特爾發(fā)言人表示,Gaudi 3將于2024年第二季度向OEM供應(yīng),預(yù)計在第三季度全面上市。Sierra Forest(現(xiàn)稱為具有E核的英特爾至強(qiáng)6處理器)預(yù)計將于2024年第二季度上市。英特爾發(fā)言人表示,Granite Rapids(現(xiàn)在稱為帶有P核的英特爾至強(qiáng)6處理器)預(yù)計將“很快”推出。

這一消息是在英特爾去年推出第五代至強(qiáng)CPU之后發(fā)布的。

英偉達(dá)

3月中旬,英偉達(dá)宣布將于今年晚些時候開始出貨下一代Blackwell GPU,分析師表示,這將使這家芯片巨頭能夠繼續(xù)主導(dǎo)AI芯片市場。

Blackwell GPU的新系列專為云提供商和企業(yè)而設(shè)計,在單個GPU上提供20 petaflops的AI性能,使組織能夠以四倍的速度訓(xùn)練AI模型,將AI推理性能提高30倍,并使用多達(dá)25高管們表示,能效比Nvidia上一代Hopper架構(gòu)芯片高出數(shù)倍。

Nvidia還將在2024年第二季度發(fā)貨基于Hopper的H200。該公司最近宣布了新的基準(zhǔn)測試,表明它是運(yùn)行生成式人工智能工作負(fù)載的最強(qiáng)大的平臺。該公司表示,在推理700億個參數(shù)的Llama 2模型時,H200的性能比H100快45%。

Ampere

去年5月,這家由英特爾前總裁Renee James領(lǐng)導(dǎo)的初創(chuàng)公司宣布了一個新的定制設(shè)計、與Arm兼容的服務(wù)器處理器系列。具有多達(dá)192個核心。該公司高管表示,該處理器名為AmpereOne,專為云服務(wù)提供商而設(shè)計,可同時提供高性能和高能效。

AWS

AWS是與Nvidia、AMD和Intel等大型芯片制造商合作的超大規(guī)模提供商之一,并使用他們的處理器為客戶提供云服務(wù)。但他們也發(fā)現(xiàn)構(gòu)建自己的定制芯片來為自己的數(shù)據(jù)中心供電并為客戶提供云服務(wù)是有利且具有成本效益的。

AWS今年將推出Graviton4,一種用于通用工作負(fù)載的基于Arm的CPU,以及用于人工智能訓(xùn)練的Tranium2。AWS安納普爾納實驗室產(chǎn)品和業(yè)務(wù)開發(fā)高級總監(jiān)Gadi Hutt表示,去年,該公司還推出了第二代人工智能推理芯片Inferentia2。

“我們的目標(biāo)是為客戶提供選擇的自由,并以顯著降低的成本為他們提供高性能,”赫特說。

Tranium2的計算能力是其首款Tranium處理器的四倍,內(nèi)存是其三倍。Hutt表示,AWS在60,000個芯片集群中使用第一個Tranium芯片,而Tranium2將在100,000個芯片集群中使用。

微軟Azure

微軟最近發(fā)布了用于人工智能和生成式人工智能任務(wù)的Microsoft Azure Maia 100 AI加速器,以及用于通用計算工作負(fù)載的基于Arm的處理器Cobalt 100 CPU。

該公司去年11月表示,將于2024年初開始推出這兩款處理器,最初為Microsoft Copilot和Azure OpenAI Service等微軟服務(wù)提供支持。

該公司表示,MaiaAI加速器專為AI訓(xùn)練和推理而設(shè)計,而Cobalt CPU是一款節(jié)能芯片,旨在提供良好的每瓦性能。

谷歌云

Google Cloud是超大規(guī)模領(lǐng)域的開拓者,于2013年首次推出了定制張量處理單元(TPU)。TPU專為人工智能訓(xùn)練和推理而設(shè)計,可在Google Cloud上向客戶提供。這些處理器還支持Google服務(wù),例如搜索、YouTube、Gmail和Google地圖。

該公司去年年底推出了第五代TPU。該公司表示,Cloud TPU v5p訓(xùn)練模型的速度比其前身快2.8倍。

谷歌云周二宣布開發(fā)出首款基于Arm的CPU,名為Google Axion處理器。使用Arm Neoverse V2 CPU構(gòu)建的新CPU將于今年晚些時候向Google Cloud客戶提供。

該公司表示,客戶將能夠在許多谷歌云服務(wù)中使用Axion,包括谷歌計算引擎、谷歌Kubernetes引擎、Dataproc、Dataflow和Cloud Batch。

分析師Kimball預(yù)計,隨著谷歌云開始為其客戶部署自己的CPU,AMD和英特爾的收入將受到打擊。

Meta

宣布,Meta今年已在其數(shù)據(jù)中心部署了用于人工智能推理的下一代定制芯片。

下一代人工智能推理芯片之前代號為Artemis,是該公司為Meta的人工智能工作負(fù)載設(shè)計的元訓(xùn)練和推理加速器(MTIA)系列定制芯片的一部分。

Meta去年推出了第一代人工智能推理芯片MTIA v1。該公司表示,與第一代芯片相比,新的下一代芯片的性能提高了三倍,每瓦性能提高了1.5倍。

Cerebras Systems

人工智能硬件初創(chuàng)公司Cerebras Systems于3月中旬推出了第三代人工智能處理器WSE-3。這款晶圓級芯片的性能是其前身的兩倍,并在高端人工智能訓(xùn)練市場與英偉達(dá)展開競爭。

該公司在三月中旬還與高通合作,為其客戶提供人工智能推理服務(wù)。在Cerebras硬件上訓(xùn)練的模型經(jīng)過優(yōu)化,可在Qualcomm Cloud A100 Ultra加速器上運(yùn)行推理。

Groq

Groq是一家位于加利福尼亞州山景城的人工智能芯片初創(chuàng)公司,它構(gòu)建了LPU推理引擎來運(yùn)行大型語言模型、生成式人工智能應(yīng)用程序和其他人工智能工作負(fù)載。

Groq于2020年發(fā)布了首款人工智能推理芯片,目標(biāo)客戶是超大規(guī)模企業(yè)、公共部門、人工智能初創(chuàng)公司和開發(fā)商。公司發(fā)言人表示,該公司將于2025年發(fā)布下一代芯片。

Tenstorrent

Tenstorrent是一家總部位于多倫多的人工智能推理初創(chuàng)公司,有著悠久的歷史:其首席執(zhí)行官是Jim Keller,一位芯片架構(gòu)師,曾在蘋果、AMD、特斯拉和英特爾工作,幫助設(shè)計了AMD的Zen架構(gòu)以及早期蘋果iPad和iPhone的芯片。

Tenstorrent戰(zhàn)略和企業(yè)傳播副總裁Bob Grim表示,該公司今年已開始接受Wormhole AI推理芯片的訂單,并將于今年晚些時候正式推出。

他說,Tenstorrent正在向企業(yè)、實驗室和任何需要高性能計算的組織銷售由32個Wormhole芯片驅(qū)動的服務(wù)器。Grim表示,Tenstorrent目前專注于人工智能推理,但其芯片也可以為人工智能訓(xùn)練提供支持,因此該公司計劃未來也支持人工智能訓(xùn)練。

Untether AI

Untether AI是一家總部位于多倫多的人工智能芯片初創(chuàng)公司,致力于打造節(jié)能人工智能推理芯片。

該公司發(fā)言人表示,該公司的總裁是前英特爾公司副總裁兼總經(jīng)理Chris Walker,該公司于2021年推出了首款產(chǎn)品,并計劃于今年推出第二代SpeedAI240芯片。

該發(fā)言人表示,Untether AI的芯片專為各種外形尺寸而設(shè)計,從用于嵌入式應(yīng)用的單芯片設(shè)備到4芯片PCI-Express加速卡,因此其處理器可用于從邊緣到數(shù)據(jù)中心的各個環(huán)節(jié)。

THEEND

最新評論(評論僅代表用戶觀點(diǎn))

更多
暫無評論