大模型時代,國產(chǎn)AI芯片最新進展!算力集群化是必然趨勢

伴隨大模型帶來的生成式AI突破,人工智能正在進入一個新的時代。算力是人工智能產(chǎn)業(yè)創(chuàng)新的基礎(chǔ),大模型的持續(xù)創(chuàng)新,驅(qū)動算力需求的爆炸式增長??梢哉f,大模型訓(xùn)練的效率或者是創(chuàng)新的速度,根本上取決于算力的大小。

本文來自微信公眾號“電子發(fā)燒友網(wǎng)”,作者/李彎彎。

在剛過去的2023世界人工智能大會上,大模型可以說是其中的大亮點之一,華為盤古、商湯日日新、網(wǎng)易伏羲等30多款國產(chǎn)AI大模型集中亮相。與此同時,各類人工智能芯片公司、算力提供商也針對大模型展示了相應(yīng)的方案。

大模型時代,國產(chǎn)AI芯片進展如何?

在這次大會上,瀚博半導(dǎo)體、燧原科技、登臨科技、天數(shù)智芯等紛紛展示了針對大模型的產(chǎn)品方案,呈現(xiàn)出國產(chǎn)AI芯片在大模型領(lǐng)域的進展情況。

瀚博半導(dǎo)體成立于2018年12月,是一家自研GPU芯片及解決方案提供商。在此次大會上,瀚博發(fā)布了第二代GPU SG100,并推出南禺系列GPU加速卡VG1600、VG1800、VG14,以及LLM大模型AI加速卡VA1L、AIGC大模型一體機、VA12高性能生成式AI加速卡等6款新品。

據(jù)介紹,瀚博SG100芯片采用7nm先進制程,具備業(yè)界領(lǐng)先的渲染性能,同時兼具低延時高吞吐的AI算力和強大的視頻處理能力。

值得關(guān)注的,針對大模型時代算力需求,瀚博本次首發(fā)了LLM大模型AI加速卡VA1L,具備200 TOPS INT8/72 TFLOPS FP16算力,并支持ChatGPT、LLaMA、Stable Diffusion等主流AIGC網(wǎng)絡(luò)模型。

與此同時,瀚博此次還推出了AIGC大模型一體機,共使用8張LLM大模型AI加速卡VA1L,支持512GB顯存,進而支持1750億參數(shù)的大模型。

另外,作為瀚博VA1和VA10的升級版,VA12是一塊通用AI加速卡,支持檢測、分類、分割、視頻增強、語義理解、BERT、Transfomer和視頻編解碼等應(yīng)用。

燧原科技在此次大會上發(fā)布了燧原曜圖文生圖MaaS平臺服務(wù)產(chǎn)品。該產(chǎn)品以燧原科技“邃思”系列芯片為算力支撐,由首都在線提供計算服務(wù),燧原曜圖MaaS平臺服務(wù)產(chǎn)品為用戶提供面向AIGC時代的高效易用、安全可靠、企業(yè)級的文生圖服務(wù)。

燧原科技表示,它具備開箱即用可用、所想即所見、創(chuàng)意無限的文本生成圖像能力,通過軟硬一體方案降低大規(guī)模AIGC應(yīng)用的工程難度與算力成本,開啟AIGC應(yīng)用規(guī)?;涞貢r代。

燧原科技創(chuàng)始人兼CEO趙立東在某論壇上提到,目前燧原已經(jīng)為大型科研機構(gòu)部署了千卡規(guī)模的AI訓(xùn)練算力集群,并成功落地;而且與騰訊合作,在OCR文字識別、智能交互、智能會議等方面,性能達(dá)到了業(yè)界同類產(chǎn)品兩倍以上,性價比上具有很高優(yōu)勢。此外,在智慧城市方面,燧原完成2022年成都高新區(qū)國產(chǎn)化AI視頻基礎(chǔ)設(shè)施平臺項目建設(shè)。

此次大會上,登臨科技展示了最新一代創(chuàng)新通用GPU產(chǎn)品Goldwasser II系列以及基于開源大語言模型可交互界面。據(jù)了解,Goldwasser II針對基于Transformer和生成式AI大模型進行專門優(yōu)化,在性能有大幅提升,已于2022年流片,目前已開始規(guī)?;慨a(chǎn)和商業(yè)客戶驗證。據(jù)現(xiàn)有客戶測試結(jié)果,二代產(chǎn)品針對基于transformer類型的模型提供3-5倍的性能提升,大幅降低類ChatGPT及生成式AI應(yīng)用的硬件成本。

天數(shù)智芯在此次會上也展示了在大模型訓(xùn)練、推理所取得的顯著進展,包括圖片識別/以圖搜圖、3D建模、大模型推理等。在大模型領(lǐng)域,天數(shù)智芯今年上半年,搭建了40P算力320張?zhí)燠?00加速卡算力集群,完成智源研究院70億參數(shù)大模型全量訓(xùn)練,

天垓100是天數(shù)智芯2018年研發(fā)的通用AI訓(xùn)練芯片,據(jù)天數(shù)智芯董事長蓋魯江介紹,目前天垓100這款產(chǎn)品還已經(jīng)成功跑通了清華智譜AI大模型ChatGLM,Meta研發(fā)的LLaMA模型。此外,天數(shù)智芯正在幫智源研究院跑650億參數(shù)的模型,預(yù)計10月份可以跑完。

針對于A800芯片在無許可證的情況下將被禁售的話題,蓋魯江談到,事實上,不管英偉達(dá)的產(chǎn)品能不能賣給中國,我們的產(chǎn)品已經(jīng)能夠用起來了。

算力集群化是發(fā)展趨勢

伴隨大模型帶來的生成式AI突破,人工智能正在進入一個新的時代。算力是人工智能產(chǎn)業(yè)創(chuàng)新的基礎(chǔ),大模型的持續(xù)創(chuàng)新,驅(qū)動算力需求的爆炸式增長??梢哉f,大模型訓(xùn)練的效率或者是創(chuàng)新的速度,根本上取決于算力的大小。

然而,中國的算力已經(jīng)成為一個越來越稀缺的資源。華為輪值董事長胡厚崑在某論壇上談到,大模型的研發(fā)高度依賴高端AI芯片、集群及生態(tài)。高計算性能、高通信帶寬和大顯存成為大模型訓(xùn)練必不可少的算力底座,單AI芯片進步速度還未跟上大模型對大算力的需求,算力集群化成為不可逆轉(zhuǎn)的發(fā)展趨勢。

在2023世界人工智能大會上,華為宣布昇騰AI集群全面升級,集群規(guī)模從最初的4000卡集群擴展至16000卡,擁有更快的訓(xùn)練速度和30天以上的穩(wěn)定訓(xùn)練周期。

胡厚崑表示,華為在各個單點創(chuàng)新的基礎(chǔ)上,充分發(fā)揮云、計算、存儲、網(wǎng)絡(luò)以及能源的綜合優(yōu)勢,進行架構(gòu)創(chuàng)新,推出了昇騰AI集群,相當(dāng)于把AI算力中心當(dāng)成一臺超級計算機來設(shè)計,使得昇騰AI集群性能更高,并且可靠性更高。

據(jù)他介紹,昇騰AI集群目前已經(jīng)可以達(dá)到10%以上的大模型訓(xùn)練效率的提升,可以提供10倍以上的系統(tǒng)穩(wěn)定的提高,支持長期穩(wěn)定訓(xùn)練。

華為昇騰計算業(yè)務(wù)總裁張迪煊表示,基于昇騰AI,原生孵化和適配了30多個大模型,到目前為止,中國有一半左右的大模型創(chuàng)新,都是由昇騰AI來支持的。

除了華為,阿里、騰訊等也打造了較大的算力集群,不過主要還是依靠英偉達(dá)的GPU芯片。阿里云表示,其擁有國內(nèi)最強的智能算力儲備,智算集群可支持最大十萬卡GPU規(guī)模,承載多個萬億參數(shù)大模型同時在線訓(xùn)練。

騰訊云此前大量采購了英偉達(dá)A100/H800芯片,發(fā)布新一代HCC高性能計算集群,用于大模型訓(xùn)練、自動駕駛、科學(xué)計算等領(lǐng)域。基于新一代集群,騰訊團隊在同等數(shù)據(jù)集下,將萬億參數(shù)的AI大模型混元NLP訓(xùn)練由50天縮短到4天。

小結(jié)

無論是大模型的訓(xùn)練,還是后期的推理部署,對算力的需求都相當(dāng)大。雖然,當(dāng)前國產(chǎn)AI芯片與國際領(lǐng)先GPU產(chǎn)品在大模型的訓(xùn)練上有差距,不過可以看到,已經(jīng)有不少產(chǎn)品,在較大模型的訓(xùn)練上已經(jīng)取得成績,后續(xù)必然還會有更大的進展。同時,為了滿足大模型對大算力的需求,算力集群化將會是未來趨勢。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論