AI芯片的低功耗突破

半導體行業(yè)觀察
eenews
存內模擬計算(The Analog in Memory Computing,AiMC)架構使用經(jīng)過修改的存儲單元在經(jīng)過訓練的神經(jīng)網(wǎng)絡中處理網(wǎng)絡邊緣AI的數(shù)據(jù),功率效率為2900TOPS/W。

比利時Imec和美國晶圓代工廠商GlobalFoundries已開發(fā)出一種使用模擬技術的測試芯片,用于邊緣AI的低功耗機器學習引擎。

Imec使用一種新技術開發(fā)了一種測試芯片,該技術大大降低了機器學習邊緣AI系統(tǒng)的功能。

存內模擬計算(The Analog in Memory Computing,AiMC)架構使用經(jīng)過修改的存儲單元在經(jīng)過訓練的神經(jīng)網(wǎng)絡中處理網(wǎng)絡邊緣AI的數(shù)據(jù),功率效率為2900TOPS/W。

imec機器學習主管Diederik Verkest說:“我們建立了一個特殊的計算單元,可以在這里通過減少數(shù)字傳輸來節(jié)省能源。”他說:“取決于[激活單元]激活線上的脈沖寬度,可以在繼續(xù)進行數(shù)字計算之前獲得[模擬-數(shù)字轉換器]ADC的權重之和。”

在該芯片中,我們使用3級權重。權重可以是-1、0或1,并且我們使用兩個SRAM單元來存儲此權重級別。計算單元是一個模擬電路,頂部有一些其他晶體管。這會產生與存儲的三級權重和激活信號(DAC的輸出)相乘的比例的模擬信號。

嚴格來說,三級權重是以數(shù)字方式存儲的,但是所有計算都是在模擬域中完成的。”他補充說:“AnIA的成功推出標志著朝著驗證存內計算(AiMC)中的模擬邁出了重要的一步。參考實現(xiàn)不僅表明在實踐中可以進行模擬內存計算,而且能效比數(shù)字加速器高十到一百倍。從我們的角度來看,這是機器學習程序中的一個里程碑,它表明模擬計算可以與數(shù)字計算具有相同的準確性”。

Analog Inference Accelerator(AnIA)測試芯片是在Global Foundries位于德國德累斯頓的工廠基于22nm FD-SOI低功耗工藝構建的。該芯片面積為4mm2,具有1024個輸入信號和512個輸出,其性能與當今的GPU相似。它顯示出與數(shù)字實現(xiàn)相同的精度,誤差在1%以內,但功率效率為2900TOPS/W。低功耗和低成本的結合為嵌入式硬件中的邊緣AI圖像識別和傳感打開了機遇。

GF計算和有線基礎設施產品管理副總裁Hiren Majmudar說:“模擬計算是一個驚人的前沿,因為它可以減少數(shù)據(jù)移動,這將成為主流。”

Edge AI測試芯片

“該測試芯片是向業(yè)界展示22FDX如何顯著降低能耗密集型AI和機器學習應用程序功耗的關鍵一步,”Majmudar說。

Verkest說:“我們獲得與GPU相同的性能,但具有更高的能源效率和小尺寸(4mm2)的芯片。如果增加陣列的大小,還將提高性能水平。”

GF將把AiMC包括在22nm FD-SOI(22FDX)技術中實現(xiàn)的功能與新的AiMC功能在GF位于德國德累斯頓Fab 1的最先進的300mm生產線中生產。

他說:“我們正在看到GF與經(jīng)過驗證的芯片合作伙伴,我們預計模擬計算芯片將在今年下半年和明年年初投入生產,并在2022年或更晚一些進入大眾市場,”

GF的該版本使用了經(jīng)過修改的SRAM單元,但是其他存儲技術也可以使用相同的技術。imec的Verkest說:“您可以使用SRAM,MRAM,DRAM,這些都是我們研發(fā)工作的一部分,以了解最佳選擇。”

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論