淺談GPU的國產(chǎn)替代之路

在軟件上,國產(chǎn)難題主要涉及驅(qū)動開發(fā)、算法及軟件生態(tài)。業(yè)內(nèi)人士指出,計算芯片最大的門檻其實不是硬件,而是軟件。目前業(yè)內(nèi)GPU特別是用于通用算力的GPGPU,主流的軟件架構(gòu)是英偉達的CUDA,此架構(gòu)在2006問世以來,與下游軟件、驅(qū)動廠家已經(jīng)有了深度合作。

本文來自微信公眾號“信創(chuàng)專研社”。

GPU,Graphic Processing Unit,即圖形處理單元,是計算機顯卡的核心,主要用于處理眾多與圖形顯示相關(guān)的操作。而最早出現(xiàn)在上世紀80年代的GPU何以在近幾年迎來高光時刻?這要得益于它強大的并行化的計算能力,雖然GPU最初的用途是渲染圖形和圖像,但隨著計算機技術(shù)的不斷進步,特別是NVIDIA通用并行計算架構(gòu)CUDA推出了GPGPU,其將GPU部分或全部圖形處理能力投入通用計算后,GPU越來越多地被用于各種需要大量“算力”的領(lǐng)域。

人工智能AI大模型的出現(xiàn),便是GPU需求的燃爆點。

1.png

國內(nèi)GPU市場現(xiàn)狀

最近,OpenAI公司CEO山姆奧特曼在一場非公開會議上透露,GPU的嚴重短缺阻礙了ChatGPT的進步,GPU市場有多火爆可見一斑。據(jù)統(tǒng)計資料顯示,2021年全球GPU市場規(guī)模335億元,2028年全球GPU市場規(guī)模有望達到4774億元,其中中國市場2020年規(guī)模47.39億美元,預(yù)計2027年市場規(guī)模將達345.57億美元。而全球GPU行業(yè)市場主要由英偉達NVIDIA和AMD兩家主導(dǎo),市場占比分別為84%和12%,尤其在AI大模型訓(xùn)練芯片市場中,NVIDIA憑借V100 NVLink、V100PCIe等系列產(chǎn)品占據(jù)了超過90%的市場份額。

1.png

在國內(nèi),GPU本就稀缺,加之美國為了限制和打壓中國芯片科技的發(fā)展,從2019年開始就對我國高端GPU芯片進口進行限制和斷供,2022年NVIDIA兩款顯卡A100和H100被限制出口中國,使得國內(nèi)GPU更加供不應(yīng)求。

龐大的市場需求和歐美的芯片封鎖,迫使得國產(chǎn)GPU被推到了聚光燈下,迎來了絕佳的發(fā)展期。有業(yè)內(nèi)人士稱:“國產(chǎn)GPU在信創(chuàng)方面已經(jīng)實現(xiàn)逐步替代,AI&數(shù)據(jù)中心、智能汽車、游戲等應(yīng)用領(lǐng)域的國產(chǎn)GPU需求量也有極大的提升,國產(chǎn)GPU迎來發(fā)展黃金期,我們看好國產(chǎn)GPU公司的發(fā)展與投資機遇。”

近日,國內(nèi)多個GPU廠商,從老牌的景嘉微,到初創(chuàng)的沐曦,都順應(yīng)市場需求,相繼推出了各自在GPU領(lǐng)域的最新拳頭產(chǎn)品。

中天恒星:6月15日在北京發(fā)布國產(chǎn)自主GPU架構(gòu)“天狼星”,擁有完全自主知識產(chǎn)權(quán),自研核心架構(gòu)確保產(chǎn)品迭代自主可控,同時擁有完備的交付能力,并已實現(xiàn)量產(chǎn)。

景嘉微:成功研發(fā)JM54系列、JM72系列、JM92系列三代GPU產(chǎn)品。應(yīng)用于臺式機、筆記本、一體機、服務(wù)器、工控機、自助終端等設(shè)備。

天數(shù)智芯:6月10日發(fā)布天垓100加速卡的算力集群,已經(jīng)具備支持百億級參數(shù)大模型訓(xùn)練的能力。是國內(nèi)第一款全自研、GPU架構(gòu)下的云端訓(xùn)練芯片,實現(xiàn)了我國通用GPU從0到1的重大突破。

芯動科技:芯動發(fā)布的“風(fēng)華2號”是一款集超低功耗、強渲染、4K高清三屏顯示、4K視頻解碼及智能AI計算于一體的桌面和筆記本GPU,實現(xiàn)了多個自研技術(shù)的創(chuàng)新突破。

摩爾線程:基于MUSA架構(gòu)打造了兩顆全功能GPU芯片“蘇堤”和“春曉”;面向信創(chuàng)市場推出了桌面級顯卡MTT S10、MTT S30和MTT S50。

沐曦:6月14日宣布曦云系列的最新產(chǎn)品MXC500成功點亮,產(chǎn)品直接對標英偉達A100,采用通用GPU架構(gòu),兼容CUDA。

盡管國產(chǎn)GPU的推出步伐不斷加快,其中也不乏一些對標國際高端GPU的產(chǎn)品,但不得不承認,國產(chǎn)GPU要走向真正成熟可靠,實現(xiàn)完全國產(chǎn)替代還有很長的距離。

01

GPU研發(fā)技術(shù)壁壘極高

GPU的研發(fā)是一項大型的系統(tǒng)工程,包含硬件架構(gòu)、算法、軟件生態(tài)等多個組成,缺一不可,壁壘極高。CPU巨頭Intel近二十年多次嘗試征服高端GPU領(lǐng)域,曾在前兩年專門成立加速計算系統(tǒng)與圖形事業(yè)部(AXG),試圖再度殺入高端GPU市場,卻始終反響平平。甚至現(xiàn)在的GPU絕對霸主NVIDIA,從95年首款產(chǎn)品NV1正式誕生發(fā)展至今,也是在顯卡領(lǐng)域耕耘了20多年才有當前的成績。足可見GPU產(chǎn)業(yè)的門檻之高。

在硬件上,國產(chǎn)最大的問題就是IP,任何一款高端芯片的打造都離不開IP。但是,GPU IP的自研開發(fā)需要3-5年的周期,需要數(shù)百個專業(yè)領(lǐng)域的工程師。因此短時間內(nèi)在硬件上實現(xiàn)完全國產(chǎn)化并不容易,國內(nèi)GPU廠商如芯動、摩爾線程等幾乎都是外購IP加上部分的自主研發(fā)。中天恒星剛發(fā)布的“天狼星”雖然實現(xiàn)了國產(chǎn)自主GPU架構(gòu),100%IP屬于自主研發(fā),但真正要完善軟件生態(tài),穩(wěn)定商用,我想還需要很長的一段時間。

在軟件上,國產(chǎn)難題主要涉及驅(qū)動開發(fā)、算法及軟件生態(tài)。業(yè)內(nèi)人士指出,計算芯片最大的門檻其實不是硬件,而是軟件。目前業(yè)內(nèi)GPU特別是用于通用算力的GPGPU,主流的軟件架構(gòu)是英偉達的CUDA,此架構(gòu)在2006問世以來,與下游軟件、驅(qū)動廠家已經(jīng)有了深度合作。而且CUDA本身涵蓋了多個技術(shù)領(lǐng)域,其開發(fā)與后續(xù)更新都與英偉達自家GPU高度綁定,從某種角度來看,英偉達在GPU領(lǐng)域的壟斷很大程度上是通過CUDA平臺上的軟件生態(tài)實現(xiàn)。因此國內(nèi)GPU廠商如果想真正對標英偉達,CUDA生態(tài)是繞不開的一環(huán)。

02

國產(chǎn)GPU整個商業(yè)生態(tài)尚未成熟

在芯片“斷供”之前,國內(nèi)購買海外高端GPU芯片之路暢通,很少有客戶在重大項目采購時會考慮國產(chǎn)GPU,都普遍傾向海外最先進、最穩(wěn)定的產(chǎn)品,以保證項目順利完成。究其原因有二,一是畢竟國產(chǎn)GPU的發(fā)展才剛剛起步,在性能和穩(wěn)定性方面尚未取得長時間,多項目的驗證,不少國產(chǎn)GPU在實際應(yīng)用中出現(xiàn)了工作負載低,芯片性能不穩(wěn)定,兼容性差的情況。二是軟件生態(tài)不夠完善,如果一個芯片沒有與之配套的軟件生態(tài),則很難真正形成大面積的應(yīng)用。

在當下GPU應(yīng)用最火的AI大模型訓(xùn)練中,騰訊云新一代HCC(High-Performance Computing Cluster)高性能計算集群使用的是英偉達最新代次H800 GPU;阿里曾在2018-2019年采購了上萬塊英偉達的V100和T4 GPU用于近年來的云計算和大模型訓(xùn)練,其他字節(jié)、百度、美團、B站等都清一色采購英偉達的A100、H100 GPU或是去年禁令后英偉達專門推出的減配版A800、H800 GPU。

1.png

這使得國產(chǎn)GPU在國內(nèi)鮮有大企業(yè)應(yīng)用成功的案例,大部分還僅僅圍繞在PC、圖形渲染領(lǐng)域,或是應(yīng)用在專門的軍事、政府等部門。商業(yè)市場的大門,只是開了一條縫。

另外,國產(chǎn)GPU廠商的硬件架構(gòu),軟件API接口不盡相同,客戶基本只能多選一,兼容和替換都不夠靈活,比較難實現(xiàn)技術(shù)生態(tài)的統(tǒng)一。

03

短期難盈利

對于GPU創(chuàng)企而言,巨大的研發(fā)費用和資本開支是必需,但長期、持續(xù)的利潤支撐才是GPU跨代發(fā)展的強勁驅(qū)動力。

盡管近幾年因為AI人工智能的火爆,使得GPU創(chuàng)企的融資環(huán)境變得相對寬松,但由于國內(nèi)近幾年批量的GPU創(chuàng)企涌入,使得競爭激烈,加上研發(fā)投入巨大,在規(guī)模市場打開之前,GPU廠商在短期內(nèi)難以實現(xiàn)量產(chǎn)盈利,令一眾大VC和PE機構(gòu)望而卻步。

芯片市場上,OPPO上個月關(guān)停了手機芯片自研公司哲庫,便是因為短期難盈利,倒在了黎明前。同樣,對于部分GPU創(chuàng)企來說,也面臨著資本市場洗牌的風(fēng)險。

04

新技術(shù)替代的風(fēng)險

還有一點,編者認為很少有人提及,但相信在不少國內(nèi)準備或正在GPU領(lǐng)域大展拳腳的玩家一定會考慮到:那就是量子計算的突破。

1.png

量子計算具有超強并行計算能力,相比傳統(tǒng)計算機可以以百萬倍計,作為下一代算力提升的突破點,量子計算極有可能成為下一輪科技革命的“主引擎”。這顛覆性的技術(shù)優(yōu)勢也讓越來越多的國家紛紛投入到量子計算領(lǐng)域的研發(fā)中。

在3月份的GTC開發(fā)者大會上,英偉達就表示已經(jīng)在量子計算領(lǐng)域進行研究,與以色列的Quantum Machines合作,在用AI芯片構(gòu)建的超級計算機上運行量子物理學(xué)中使用的算法;同時與德國的于利希超級計算中心和ParTec公司合作,開展一個經(jīng)典-量子混合計算實驗室項目。

這樣一來,問題就顯然易見了,一邊是GPU研發(fā)周期長,投入大,短期難盈利;一邊則是量子計算的突破,如果在五年內(nèi)量子計算技術(shù)應(yīng)用落地,那么以算力火爆的GPU會不會很快被量子計算機所取代?這在科技發(fā)展迅猛的時代,確實值得深思。

縱觀科技發(fā)展的半個世紀,沒有一個技術(shù)或產(chǎn)品是一蹴而就的。“寶劍鋒從磨礪出,梅花香自苦寒來",國產(chǎn)GPU的發(fā)展,需要企業(yè)靜下心來正視現(xiàn)存的問題,持續(xù)打磨自身技術(shù)功底,勇于創(chuàng)新,踏踏實實服務(wù)客戶,服務(wù)市場。

相信國產(chǎn)GPU的成功最終會到來!

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論