隨著AI大模型的迅速崛起,計(jì)算的核心從CPU悄然轉(zhuǎn)向了GPU。一場(chǎng)前所未有的技術(shù)革命正在醞釀,而這場(chǎng)革命的主角正是GPU。這并非簡(jiǎn)單的硬件升級(jí),而是對(duì)整個(gè)云計(jì)算生態(tài)的重新定義。
全球科技巨頭正在GPU市場(chǎng)展開(kāi)一場(chǎng)殊死搏斗。AMD、英特爾、華為,各家都在傾盡全力,試圖在這個(gè)高速增長(zhǎng)的領(lǐng)域撼動(dòng)英偉達(dá)的霸主地位。
隨著GPU和ASIC等硬件的發(fā)展,我們不僅見(jiàn)證了計(jì)算架構(gòu)的革命,也看到了這些技術(shù)如何推動(dòng)人工智能從理論走向?qū)嵺`的進(jìn)程。這種設(shè)計(jì)哲學(xué)的轉(zhuǎn)變,從注重通用計(jì)算能力轉(zhuǎn)向滿足特定計(jì)算需求的高效能,不僅加速了AI應(yīng)用的研發(fā)和部署,也大大擴(kuò)展了AI技術(shù)的應(yīng)用場(chǎng)景。
大模型潛力巨大,對(duì)智算能力的需求激增。但一個(gè)大規(guī)模的高性能智算集群,除了要GPU打底之外,網(wǎng)絡(luò)、存儲(chǔ)、甚至調(diào)度、加速引擎等軟件能力,也成為了很多企業(yè)擁抱大模型的攔路虎。
自2020年以來(lái),人工智能的爆發(fā)式增長(zhǎng)顯然推動(dòng)了半工業(yè)的發(fā)展?;贕PU的人工智能處理需要盡可能強(qiáng)大,但只有依靠頂級(jí)互連,系統(tǒng)才能達(dá)到最佳狀態(tài)。
在人工智能計(jì)算架構(gòu)的布局中,CPU與加速芯片協(xié)同工作的模式已成為一種典型的AI部署方案。CPU扮演基礎(chǔ)算力的提供者角色,而加速芯片則負(fù)責(zé)提升計(jì)算性能,助力算法高效執(zhí)行。
如今,人工智能的硬件和軟件應(yīng)用已經(jīng)發(fā)展成為專為優(yōu)化人工智能和神經(jīng)網(wǎng)絡(luò)操作而設(shè)計(jì)的。其中包括神經(jīng)處理單元(NPU),它們?cè)诩铀偃斯ぶ悄苋蝿?wù)方面的能力通常與圖形處理單元(GPU)相媲美。
隨著人工智能技術(shù)的快速發(fā)展,F(xiàn)PGA的可編程性優(yōu)勢(shì)逐漸凸顯,特別是在需要頻繁調(diào)整底層模型的人工智能推理場(chǎng)景中。
近年來(lái),國(guó)內(nèi)AI企業(yè)在面臨重重挑戰(zhàn)的情況下,依然展現(xiàn)出頑強(qiáng)的創(chuàng)新精神和技術(shù)突破。盡管在技術(shù)積累和產(chǎn)業(yè)生態(tài)方面起步較晚,但憑借政策支持、資本投入、市場(chǎng)需求的強(qiáng)勁推動(dòng),中國(guó)的AI基礎(chǔ)設(shè)施建設(shè)正在迅速崛起。
隨著人工智能技術(shù)的快速發(fā)展,GPU作為重要的算力支撐時(shí)常被提及。國(guó)內(nèi)外重要的GPU芯片公司也為人熟知,包括英偉達(dá)、AMD、英特爾,景嘉微、海光信息、天數(shù)智芯、摩爾線程等。
去年開(kāi)始,整個(gè)PC產(chǎn)業(yè)鏈,自上而下地都在為AI PC造勢(shì)。從處理器端的英特爾、AMD、高通等開(kāi)始,到下游終端廠商,宣傳上清一色的AI PC概念。
智能化應(yīng)用數(shù)量的增長(zhǎng)對(duì)GPU算力資源的需求越來(lái)越多。NVIDIA雖然提供了GPU虛擬化和多GPU實(shí)例切分方案等,依然無(wú)法滿足自由定義虛擬GPU和整個(gè)企業(yè)GPU資源的共享復(fù)用需求。