光芯片進軍AI,打破模擬計算的擴展限制

隨著機器學習模型變得更大、更復雜,它們需要更快、更節(jié)能的硬件來執(zhí)行計算。傳統(tǒng)的數(shù)字計算機正在努力跟上。

本文來自半導體行業(yè)觀察,內(nèi)容由半導體行業(yè)觀察(ID:icbank)編譯自techxplore。

隨著機器學習模型變得更大、更復雜,它們需要更快、更節(jié)能的硬件來執(zhí)行計算。傳統(tǒng)的數(shù)字計算機正在努力跟上。

模擬光學神經(jīng)網(wǎng)絡(luò)可以執(zhí)行與數(shù)字神經(jīng)網(wǎng)絡(luò)相同的任務,例如圖像分類或語音識別,但由于計算是使用光而不是電信號進行的,因此光學神經(jīng)網(wǎng)絡(luò)可以運行速度快很多倍,同時消耗更少的能量。

然而,這些模擬設(shè)備容易出現(xiàn)硬件錯誤,從而降低計算的準確性。硬件組件中的微觀缺陷是造成這些錯誤的原因之一。在具有許多連接組件的光學神經(jīng)網(wǎng)絡(luò)中,錯誤會迅速累積。

即使使用糾錯技術(shù),由于構(gòu)成光學神經(jīng)網(wǎng)絡(luò)的設(shè)備的基本特性,一些錯誤也是不可避免的。一個大到足以在現(xiàn)實世界中實施的網(wǎng)絡(luò)將過于不精確而無法發(fā)揮作用。

麻省理工學院的研究人員克服了這一障礙,找到了一種有效擴展光學神經(jīng)網(wǎng)絡(luò)的方法。通過在構(gòu)成網(wǎng)絡(luò)架構(gòu)的光開關(guān)中添加一個微型硬件組件,它們甚至可以減少可能在設(shè)備中累積的不可糾正的錯誤。

他們的工作可以實現(xiàn)超快速、節(jié)能的模擬神經(jīng)網(wǎng)絡(luò),其運行精度與數(shù)字神經(jīng)網(wǎng)絡(luò)相同。使用這種技術(shù),隨著光路變大,其計算中的誤差量實際上會減少。

“這很了不起,因為它與模擬系統(tǒng)的直覺背道而馳,在模擬系統(tǒng)中,較大的電路應該有較高的錯誤,因此錯誤會限制可擴展性。本文使我們能夠解決這些系統(tǒng)的可擴展性問題明確的‘是’,”主要作者Ryan Hamerly說,他是麻省理工學院電子研究實驗室(RLE)和量子光子學實驗室的訪問科學家,也是NTT Research的資深科學家。

Hamerly的合著者是研究生Saumil Bandyopadhyay和資深作者Dirk Englund,后者是麻省理工學院電氣工程與計算機科學系(EECS)的副教授、量子光子學實驗室的負責人和RLE的成員。該研究發(fā)表在《自然通訊》上。

與光相乘

光學神經(jīng)網(wǎng)絡(luò)由許多連接的組件組成,這些組件的功能類似于可重新編程、可調(diào)的鏡子。這些可調(diào)反射鏡稱為馬赫-曾德爾干涉儀(MZI)。神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)被編碼成光,從激光射入光學神經(jīng)網(wǎng)絡(luò)。

典型的MZI包含兩個反射鏡和兩個分束器。光進入MZI的頂部,在那里它被分成兩部分,在被第二個分束器重新組合之前相互干涉,然后從底部反射到陣列中的下一個MZI。研究人員可以利用這些光信號的干擾來執(zhí)行復雜的線性代數(shù)運算,稱為矩陣乘法,這是神經(jīng)網(wǎng)絡(luò)處理數(shù)據(jù)的方式。

但是,隨著光從一臺設(shè)備移動到另一臺設(shè)備,每個MZI中可能出現(xiàn)的錯誤會迅速累積。人們可以通過提前識別錯誤并調(diào)整MZI來避免一些錯誤,這樣較早的錯誤就會被陣列中較晚的設(shè)備抵消。

“如果你知道錯誤是什么,這是一個非常簡單的算法。但眾所周知,這些錯誤很難確定,因為你只能訪問芯片的輸入和輸出,”Hamerly說。“這促使我們研究是否有可能創(chuàng)建免校準糾錯。”

Hamerly和他的合作者之前展示了一種更進一步的數(shù)學技術(shù)。他們可以成功地推斷出錯誤并相應地正確調(diào)整MZI,但即使這樣也沒有消除所有錯誤。

由于MZI的基本性質(zhì),在某些情況下無法調(diào)整設(shè)備,因此所有光都會從底部端口流出到下一個MZI。如果設(shè)備在每一步都損失了一小部分光并且陣列非常大,那么到最后只會剩下一點點能量。

“即使有糾錯,芯片的好壞也有一個基本的限制。MZI在物理上無法實現(xiàn)它們需要配置的某些設(shè)置,”他說。

因此,該團隊開發(fā)了一種新型MZI。研究人員在設(shè)備末端添加了一個額外的分束器,將其稱為3-MZI,因為它具有三個分束器而不是兩個。由于這個額外的分束器混合光線的方式,MZI更容易達到它需要的設(shè)置,通過它的底部端口從外面發(fā)送所有光線。

重要的是,附加分束器的尺寸只有幾微米,并且是無源元件,因此不需要任何額外的布線。添加額外的分束器不會顯著改變芯片的尺寸。

更大的芯片,更少的錯誤

當研究人員進行模擬以測試他們的架構(gòu)時,他們發(fā)現(xiàn)它可以消除許多妨礙準確性的不可糾正錯誤。隨著光學神經(jīng)網(wǎng)絡(luò)變得更大,設(shè)備中的誤差量實際上下降了——這與使用標準MZI的設(shè)備中發(fā)生的情況相反。

Hamerly說,使用3-MZIs,他們有可能創(chuàng)造出一個足夠大的設(shè)備用于商業(yè)用途,并且誤差已經(jīng)減少了20倍。

研究人員還開發(fā)了一種專門針對相關(guān)誤差的MZI設(shè)計變體。這些問題是由于制造缺陷造成的——如果芯片的厚度稍有錯誤,MZI可能都會偏移大約相同的量,因此誤差都差不多。他們找到了一種方法來更改MZI的配置,以使其對這些類型的錯誤具有魯棒性。該技術(shù)還增加了光學神經(jīng)網(wǎng)絡(luò)的帶寬,使其運行速度提高了三倍。

既然他們已經(jīng)使用模擬展示了這些技術(shù),Hamerly和他的合作者計劃在物理硬件上測試這些方法,并繼續(xù)推動他們可以在現(xiàn)實世界中有效部署的光學神經(jīng)網(wǎng)絡(luò)。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論