AMD全面發(fā)力AI芯片挑戰(zhàn)英偉達,差距還有多大?

極客芯片
AMD在軟件優(yōu)化方面做得特別好,盡管在硬件性能方面存在差異,但仍能跟上英偉達的發(fā)展步伐。Tang表示,用戶并不需要更改代碼庫或重新編寫大型語言模型,就可以切換到采用AMD的產(chǎn)品。他表示,它們本質(zhì)上是可以互換的。

本文來自極客網(wǎng),作者:極客芯片。

AMD制造的AI芯片“幾乎”與業(yè)界領(lǐng)先的英偉達AI芯片一樣快。這是根據(jù)Databricks旗下的AI軟件開發(fā)商MosaicML的一項研究得出的結(jié)論。研究發(fā)現(xiàn),在訓(xùn)練大型語言模型和執(zhí)行其他AI密集型任務(wù)時,AMD的AI芯片達到了英偉達同類產(chǎn)品的80%。

640.jpg

MosaicML將AMD MI250與Nvidia A100進行了對比,并訓(xùn)練了不同大小的大型語言模型

英偉達的芯片目前在訓(xùn)練AI模型(例如用于運行ChatGPT或Midjourney的模型)方面占據(jù)主導(dǎo)地位。這些產(chǎn)品的成功和對計算能力的需求將英偉達的估值推至1萬億美元,并引發(fā)了GPU的短缺。

MosaicML對比測試AMD的M1250 GPU與英偉達的A100 GPU

MosaicML最近將AMD的M1250 GPU與英偉達的A100 GPU進行了對比測試。這兩款設(shè)備都比各自開發(fā)的頂級芯片落后一代,它們被用來訓(xùn)練大型語言模型,研究人員發(fā)現(xiàn),AMD和英偉達的芯片在訓(xùn)練模型時都能“開箱即用”,AMD M1250 GPU的性能約為英偉達A100 GPU的80%。

MosaicML訓(xùn)練了10億到130億個參數(shù)的模型,類似于企業(yè)中用于為大型公司數(shù)據(jù)集的搜索和匯總提供AI驅(qū)動工具的模型。他們在4個GPU的單個節(jié)點上進行訓(xùn)練,發(fā)現(xiàn)MI250 GPU的吞吐量在A100 GPU的80%以內(nèi)。MI250在每秒浮點運算和內(nèi)存方面略有優(yōu)勢,允許每個GPU訓(xùn)練更大的模型。

該公司計劃在更大的GPU集群上對更大的模型進行分析,以確認AMD系統(tǒng)是否可以在大規(guī)模下運行,并正在與超大規(guī)模廠商合作。他們還計劃創(chuàng)建推理基準,并在兩個系統(tǒng)上使用擴散模型等其他模型來測試更廣泛的選項。

雖然這兩款芯片并不是這兩家公司的頂級產(chǎn)品,但它們都被廣泛用于數(shù)據(jù)中心和訓(xùn)練AI模型。MosaicML表示,新的機器學(xué)習(xí)訓(xùn)練硬件對于在英偉達GPU供應(yīng)緊張的情況下提高計算可用性是必要的。

軟件驅(qū)動的AMD

MosaicML表示,AMD的性能與該公司去年發(fā)布的新版本軟件有關(guān),該軟件與開源AI軟件PyTorch交互。MosaicML首席技術(shù)官Hanlin Tang表示,AMD對MI250 GPU的進一步軟件更新將使其在今年年底之前達到英偉達A100 GPU的性能。

他表示,AMD在軟件優(yōu)化方面做得特別好,盡管在硬件性能方面存在差異,但仍能跟上英偉達的發(fā)展步伐。Tang表示,用戶并不需要更改代碼庫或重新編寫大型語言模型,就可以切換到采用AMD的產(chǎn)品。他表示,它們本質(zhì)上是可以互換的。

Tang表示,AMD并沒有委托MosaicML進行這項研究。MosaicML開發(fā)的軟件旨在使企業(yè)更容易創(chuàng)建AI模型并在內(nèi)部進行培訓(xùn),而不是依賴OpenAI或其他大型AI實驗室的工具。他指出,這項研究是為了表明除了英偉達的芯片之外還有其他選擇。

他說,“總的來說,我們對AI訓(xùn)練硬件的未來市場非常樂觀,有更多的選擇意味著更多的計算供應(yīng),更低的市場價格,最終為想要訓(xùn)練自己的模型的用戶降低成本。”

Databricks透露,該公司近日已經(jīng)斥資13億美元收購MosaicML,這是該公司構(gòu)建企業(yè)級開源AI模型生態(tài)系統(tǒng)的更廣泛努力的一部分。這兩家公司都在開發(fā)軟件工具,使AI算法更小、更便宜地在大型數(shù)據(jù)集上運行,但MosaicML軟件將用于增強Databricks的服務(wù)。

在這份報告發(fā)布之際,英特爾日前宣布了從2025年開始在AI芯片領(lǐng)域展開競爭的長期計劃。該公司正在轉(zhuǎn)變戰(zhàn)略,專注于制造與英偉達和AMD的硬件相抗衡的產(chǎn)品。

英特爾在上周宣布其FalconShores芯片將擁有288GB內(nèi)存,并支持8位浮點計算,這對于訓(xùn)練AI模型非常重要。英特爾還聲稱,其Ponte Vecchio AI芯片的性能優(yōu)于英偉達H100。雖然Vecchio AI芯片的供應(yīng)面臨延期,但將成為美國阿貢國家實驗室最新超級計算機的核心,預(yù)計今年將完成發(fā)貨。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論