分析丨新型AI芯片,邊緣物聯(lián)網(wǎng)時代即將到來?

方文三
無人機(jī)、智能可穿戴設(shè)備和工業(yè)物聯(lián)網(wǎng)傳感器等設(shè)備都配備了AI芯片,因此計算可以在數(shù)據(jù)發(fā)源地之互聯(lián)網(wǎng)的[邊緣]進(jìn)行,可以實(shí)時處理并保證數(shù)據(jù)隱私。

本文來自AI芯天下,作者/方文三。

近年來,邊緣計算技術(shù)試圖讓這些設(shè)備在不依賴互聯(lián)網(wǎng)的情況下仍然可以保持智能。

這就要求它們所搭載的芯片本身具有處理AI任務(wù)的能力。

這些小型設(shè)備所搭載的電池電量十分有限,往往不足以處理復(fù)雜的AI任務(wù)。

因此,提高AI芯片的能效變得至關(guān)重要。

2345截圖20220818151609.png

解決能源問題很關(guān)鍵

在傳統(tǒng)的芯片里,數(shù)據(jù)的計算和存儲通常在兩個獨(dú)立的單元進(jìn)行。

研究發(fā)現(xiàn)在這樣的芯片中,絕大多數(shù)的能量并非用于AI計算,而是消耗在計算和存儲單元之間頻繁的數(shù)據(jù)移動中。

無人機(jī)、智能可穿戴設(shè)備和工業(yè)物聯(lián)網(wǎng)傳感器等設(shè)備都配備了AI芯片,因此計算可以在數(shù)據(jù)發(fā)源地之互聯(lián)網(wǎng)的[邊緣]進(jìn)行,可以實(shí)時處理并保證數(shù)據(jù)隱私。

在今天的AI芯片中,數(shù)據(jù)處理和數(shù)據(jù)存儲在計算單元和內(nèi)存單元中。

這些單元之間頻繁的數(shù)據(jù)移動消耗了AI處理過程中的大部分能量,而微型邊緣設(shè)備上的AI功能會受到電池容量的限制。

目前,邊緣設(shè)備上的大多數(shù)AI應(yīng)用程序都涉及將數(shù)據(jù)從設(shè)備移動到云端,AI在云端對其進(jìn)行處理和分析,然后將結(jié)果移回設(shè)備。

雖然使用RRAM芯片進(jìn)行計算不一定是新的,但通常,它會導(dǎo)致芯片上執(zhí)行的計算精度降低,并且芯片架構(gòu)缺乏靈活性。

因此減少數(shù)據(jù)移動是解決能源問題的關(guān)鍵。

2345截圖20220818151609.png

研究小組發(fā)布新型AI芯片

斯坦福大學(xué),加州大學(xué)圣地亞哥分校,以及清華大學(xué)合作研究團(tuán)隊(duì)提出了一個新的解決方案。

研究小組已經(jīng)開發(fā)了一個新的內(nèi)存中計算(CIM:compute-in-memory)芯片的原型,消除了這種分離的需要。

他們在8月17日發(fā)表在《自然》雜志上的論文中稱,他們的原型展示了兩倍于現(xiàn)有AI平臺的效率。

這款芯片采用了基于阻變存儲器(RRAM)的[存算一體]架構(gòu)來減少數(shù)據(jù)流動。

它在支持多種AI應(yīng)用的同時,大幅提升了能效,使得在邊緣設(shè)備中實(shí)現(xiàn)復(fù)雜的AI任務(wù)成為可能。

這就好比直接在倉庫中對原材料進(jìn)行加工生產(chǎn),而不必頻繁地把原材料運(yùn)往專門的加工車間,極大地減少了數(shù)據(jù)流動,從而大幅提升了芯片的能效。

2345截圖20220818151609.png

NeuRRAM芯片的新穎之處

NeuRRAM芯片的能效不僅是目前最先進(jìn)的內(nèi)存計算芯片的兩倍,而且它提供的結(jié)果也與傳統(tǒng)數(shù)字芯片一樣準(zhǔn)確。

NeuRRAM的新穎之處在于,對于各種AI應(yīng)用,極高的效率現(xiàn)在與極大的靈活性相結(jié)合,與標(biāo)準(zhǔn)數(shù)字通用計算平臺相比,精度幾乎沒有損失。

研究人員通過一種稱為能量延遲產(chǎn)物(EDP)的測量來測量芯片的能效。

NeuRRAM芯片實(shí)現(xiàn)了比最先進(jìn)的芯片低1.6至2.3倍的EDP(越低越好)和7至13倍的計算密度。

它在手寫數(shù)字識別任務(wù)中實(shí)現(xiàn)了99%的準(zhǔn)確率;85.7%用于圖像分類任務(wù);和84.7%的谷歌語音命令識別任務(wù)。

此外,該芯片還實(shí)現(xiàn)了圖像恢復(fù)任務(wù)中圖像重建誤差降低70%。

2345截圖20220818151609.png

采用新存儲技術(shù)實(shí)現(xiàn)多核存算一體

NeuRRAM芯片使用的阻變存儲器是一種新型的非易失性存儲技術(shù)。

這種技術(shù)具有高密度,非易失,易加工等優(yōu)點(diǎn),是低功耗,低成本的邊緣計算場景的理想選擇。

除了更高的能效,NeuRRAM也是首個支持多種神經(jīng)網(wǎng)絡(luò)模型的多核存算一體芯片。

因此,NeuRRAM可以被應(yīng)用到多類邊緣計算任務(wù)中,例如圖像分類,圖像去噪,關(guān)鍵詞識別。

在這些不同應(yīng)用中,NeuRRAM均可實(shí)現(xiàn)和傳統(tǒng)數(shù)字芯片相當(dāng)?shù)腁I推理準(zhǔn)確度。

NeuRRAM還不是一顆產(chǎn)品級芯片,但是它驗(yàn)證了全棧式優(yōu)化對于該技術(shù)產(chǎn)業(yè)化的重要性。

這款NeuRRAM神經(jīng)形態(tài)芯片使AI離在與云斷開的廣泛邊緣設(shè)備上運(yùn)行又近了一步。

2345截圖20220818151609.png

架構(gòu)設(shè)計有別于傳統(tǒng)芯片

在NeurRRAM架構(gòu)中,CMOS神經(jīng)元電路與RRAM權(quán)重在物理上交錯。

它與傳統(tǒng)設(shè)計不同,傳統(tǒng)設(shè)計中的CMOS電路通常位于RRAM砝碼的外圍。

神經(jīng)元與RRAM陣列的連接可以配置為神經(jīng)元的輸入或輸出。

這允許神經(jīng)網(wǎng)絡(luò)在各種數(shù)據(jù)流方向上進(jìn)行推理,而不會產(chǎn)生面積或功耗方面的開銷。

這反過來又使體系結(jié)構(gòu)更易于重新配置。

作為神經(jīng)形態(tài)AI芯片,NeuroRRAM在48個神經(jīng)突觸內(nèi)核上執(zhí)行并行分布式處理。

為了同時實(shí)現(xiàn)高通用性和高效率,NeuRRAM通過將神經(jīng)網(wǎng)絡(luò)模型中的一層映射到多個內(nèi)核上以對多個數(shù)據(jù)進(jìn)行并行推理來支持?jǐn)?shù)據(jù)并行性。

此外,NeuRRAM通過將模型的不同層映射到不同的內(nèi)核并以流水線方式執(zhí)行推理來提供模型并行性。

2345截圖20220818151609.png

將推動未來的邊緣計算

目前,NeuRRAM只是一種物理概念層面的驗(yàn)證,但要轉(zhuǎn)化為實(shí)際的邊緣設(shè)備則需要更多開發(fā)。

這種結(jié)合效率、準(zhǔn)確性和執(zhí)行不同任務(wù)的能力充分展示了芯片的潛力。

如果成功,像NeuRRAM這樣的RRAM內(nèi)存計算芯片具有幾乎無限的潛力。它們可以嵌入農(nóng)田進(jìn)行實(shí)時AI計算,根據(jù)當(dāng)前土壤條件調(diào)整灌溉系統(tǒng)。

大規(guī)模生產(chǎn)這些芯片會更加便宜,且適應(yīng)性強(qiáng)、功耗低,可以用于改善我們的日常生活,如用于家庭健康監(jiān)測的醫(yī)療設(shè)備。

也可用于解決從氣候變化到糧食安全的各種問題。

AI計算是非常消耗能源的,但大部分的能源消耗不是由計算本身造成的。能源密集型部分是在AI芯片內(nèi)的內(nèi)存和計算單元之間移動數(shù)據(jù)。

結(jié)尾:

現(xiàn)在考慮商業(yè)化的問題還為時過早。

雖然他們認(rèn)為該芯片的高效硬件實(shí)現(xiàn)與內(nèi)存中計算是一個成功的組合,但廣泛采用仍將取決于能否降低能效基準(zhǔn)。

部分資料參考:澎湃新聞:《Nature:新型AI芯片大幅提升能效,邊緣物聯(lián)網(wǎng)時代即將到來?》,智科院:《新的AI芯片的能源效率是替代品的兩倍》

THEEND

最新評論(評論僅代表用戶觀點(diǎn))

更多
暫無評論