大模型快速發(fā)展,GPU IP有何作用

隨著人工智能技術(shù)的快速發(fā)展,GPU作為重要的算力支撐時常被提及。國內(nèi)外重要的GPU芯片公司也為人熟知,包括英偉達、AMD、英特爾,景嘉微、海光信息、天數(shù)智芯、摩爾線程等。

本文來自微信公眾號“電子發(fā)燒友網(wǎng)”,作者/李彎彎。

隨著人工智能技術(shù)的快速發(fā)展,GPU作為重要的算力支撐時常被提及。國內(nèi)外重要的GPU芯片公司也為人熟知,包括英偉達、AMD、英特爾,景嘉微、海光信息、天數(shù)智芯、摩爾線程等。

事實上,除此之外還有一些GPU IP公司也為GPU產(chǎn)業(yè)發(fā)展做出很大貢獻,包括Imagination、Arm、芯原科技等。在當(dāng)前備受關(guān)注的大模型方面,這些公司的產(chǎn)品也起到一定支持作用。

Imagination

Imagination的GPU IP產(chǎn)品包括IMG A系列、IMG CXT、IMG DXT等多個系列,每個系列有不同的特點和應(yīng)用場景。IMG A系列,是Imagination有史以來性能最強大GPU IP產(chǎn)品,IMG A系列被設(shè)計為可應(yīng)用于與各種場景的GPU,是多種垂直應(yīng)用領(lǐng)域的終極解決方案。

該系列產(chǎn)品覆蓋從入門級市場的每時鐘周期處理1個像素(1 PPC)的組件,到高性能設(shè)備的速度高達每秒2萬億次浮點運算(2 TFLOP)的內(nèi)核,以及針對云應(yīng)用的、速度超越該數(shù)值的多核解決方案。

IMG CXT,搭載首個針對移動端優(yōu)化的PowerVR Photon光線追蹤架構(gòu),為移動端游戲玩家和開發(fā)者提供桌面級光線追蹤功能的體驗。實現(xiàn)了光線追蹤性能的大幅提升,支持在移動設(shè)備中以高幀率實現(xiàn)逼真的光線追蹤陰影、反射、全局照明和環(huán)境遮蔽等效果。

IMG DXT是新一代面向移動端的高性能GPU IP,為移動設(shè)備用戶帶來先進的圖形技術(shù)。提供三款配置,包括DXT-8-256、DXT-48-1536和DXT-72-2304,分別針對主流、高端和旗艦移動設(shè)備。旗艦產(chǎn)品DXT-72-2304具有72 GTexels/s和2.5 TFLOP FP32算力,與上一代產(chǎn)品相比,其最大單核性能提升了50%。

Imagination的GPU IP產(chǎn)品廣泛應(yīng)用于移動設(shè)備、汽車、數(shù)據(jù)中心、桌面和云游戲等多個領(lǐng)域。通過提供高性能的圖形渲染和數(shù)據(jù)處理能力,為各種應(yīng)用場景提供了強大的支持。

Imagination的GPU IP高性能、可擴展性和低功耗的特性,使得在支持大模型的應(yīng)用上具有優(yōu)勢。如IMG DXD,其多核配置提供了強大的計算能力,5 TFLOPS FP32和144 GTexel/s,能夠在大模型的應(yīng)用上起到支持作用。

Arm

Arm的GPU IP產(chǎn)品系列主要包括Mali系列和Immortalis系列。Mali系列GPU IP是Arm的長期主力產(chǎn)品,擁有從入門級到旗艦級的完整產(chǎn)品線。Mali系列包括Mali-G710、Mali-G610、Mali-G510、Mali-G310等多個型號,分別定位于不同性能和價格的市場段。

Mali系列GPU基于Valhall GPU架構(gòu),并持續(xù)優(yōu)化和提升性能。例如,Mali-G710號稱綜合性能提升20%、機器學(xué)習(xí)性能提升35%、紋理性能提升50%、能效提升20%。

Immortalis系列是Arm在2022年推出的全新旗艦級GPU IP產(chǎn)品,旨在提供終極的移動3D體驗。Immortalis GPU基于Mali設(shè)計,并引入了硬件光線追蹤功能,這是首款在移動端支持此功能的GPU。

Immortalis GPU采用10-16核設(shè)計,性能比上一代Mali GPU高15%。其光線追蹤單元旨在提高效率,只占用約4%的著色器核心面積,卻能帶來300%的性能提升。

目前,Immortalis系列已經(jīng)推出了Immortalis-G715和Immortalis-G720等型號。Immortalis-G720是Arm目前性能和能效表現(xiàn)最為出色的GPU,與上一代產(chǎn)品相比,其性能和能效分別提高了15%,系統(tǒng)級效率更躍升了40%。

Arm的GPU IP產(chǎn)品廣泛應(yīng)用于移動設(shè)備、汽車、數(shù)據(jù)中心、桌面和云游戲等多個領(lǐng)域。它們能夠支持各種計算任務(wù),如圖形渲染、物理模擬、圖像處理、機器學(xué)習(xí)和人工智能等。

Arm的GPU IP高性能計算、能效優(yōu)化和生態(tài)系統(tǒng)支持方面特點,使其在大模型的應(yīng)用方面具有優(yōu)勢。Arm的GPU IP,如Mali系列和Ethos系列,已被多家公司采用,并成功應(yīng)用于大模型訓(xùn)練和推理中。

在大模型訓(xùn)練方面,Arm的GPU IP被廣泛應(yīng)用于深度學(xué)習(xí)、自然語言處理等領(lǐng)域。通過與合作伙伴共同開發(fā)定制化的解決方案,Arm GPU IP為這些領(lǐng)域的研究者和開發(fā)者提供了強大的計算能力支持。

在云端推理方面,Arm的GPU IP同樣發(fā)揮了重要作用。通過提供高性能的云端計算資源,Arm GPU IP支持了多種大模型應(yīng)用的實時推理需求。

芯原股份

芯原股份的GPU IP系列產(chǎn)品,以其高性能、靈活性和廣泛的應(yīng)用范圍,成為市場上備受矚目的產(chǎn)品。芯原可擴展的Vivante圖形處理器(GPU)IP系列應(yīng)用廣泛,包括從低功耗的小型物聯(lián)網(wǎng)MCU到面向汽車和計算機應(yīng)用的功能強大的SoC。設(shè)計可滿足各種芯片尺寸和功耗預(yù)算,是具成本效益的優(yōu)質(zhì)圖形處理器解決方案。

芯原科技此前還詳細(xì)介紹了其GPGPU-AI IP為核心的AI芯片定制解決方案。其以Tensor Core和GPGPU/GPU為主,提供了一個靈活的架構(gòu)。

芯原GPGPU-AI處理器上有芯原通用的軟件棧,在上層可以支持標(biāo)準(zhǔn)的應(yīng)用接口,下層可以適配芯原各種各樣的算力IP,算力IP有圖形處理器、并行計算處理器、神經(jīng)網(wǎng)絡(luò)處理器。芯原GPGPU-AI分幾個層次擴展的算力,可以支持異構(gòu)計算,包括矢量計算、標(biāo)量計算和張量處理單元,還可以支持大模型,高帶寬計算需求,同時基于在AI領(lǐng)域有多年的積累,可對數(shù)據(jù)組織、數(shù)據(jù)搬移和計算有針對性的優(yōu)化,另外還有專門針對大模型的帶寬壓縮技術(shù)。

芯原的GPU IP已被廣泛應(yīng)用于桌面顯卡、車載信息娛樂、工業(yè)顯示、物聯(lián)網(wǎng)及可穿戴設(shè)備、大規(guī)模并行計算等領(lǐng)域。

寫在最后

可以看到,GPU IP在多個領(lǐng)域都有廣泛應(yīng)用,包括科學(xué)計算、大數(shù)據(jù)分析、深度學(xué)習(xí)和人工智能、游戲服務(wù)器、圖像處理、圖形渲染和動畫制作、視頻處理和圖像識別等。

當(dāng)然,GPU IP也在不斷發(fā)展和演進中,未來,專用加速IP與通用GPU的融合或許是GPU技術(shù)未來發(fā)展的一個亮點,這種融合將使GPU更具多功能性,更好地處理特定工作負(fù)載。高速DRAM和緩存技術(shù)的不斷演進也將推動GPU的性能提升,使其能夠更有效地處理復(fù)雜的計算任務(wù),如支持大模型的訓(xùn)練和部署。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論