光芯片,火力全開

半導(dǎo)體行業(yè)觀察
L晨光
近幾十年以來,微電子技術(shù)與電子芯片產(chǎn)業(yè)遵循著摩爾定律不斷發(fā)展,隨著傳統(tǒng)制程工藝逼近極限,電子芯片在進(jìn)一步提升計(jì)算速度和降低功耗方面的技術(shù)突破,面臨難以解決的瓶頸。在后摩爾時(shí)代,光芯片這一顛覆性技術(shù)被視為破局的關(guān)鍵。

本文來自微信公眾號(hào)“半導(dǎo)體行業(yè)觀察”,作者/L晨光。

近幾十年以來,微電子技術(shù)與電子芯片產(chǎn)業(yè)遵循著摩爾定律不斷發(fā)展,隨著傳統(tǒng)制程工藝逼近極限,電子芯片在進(jìn)一步提升計(jì)算速度和降低功耗方面的技術(shù)突破,面臨難以解決的瓶頸。在后摩爾時(shí)代,光芯片這一顛覆性技術(shù)被視為破局的關(guān)鍵。

光芯片,難覓用武之地?

實(shí)際上,光芯片很早就有,已經(jīng)很成熟,比如2000年前后的海底光纜,光通訊兩端的收發(fā)模塊都是光子芯片,甚至在上課或開會(huì)時(shí)用的激光筆,里面也有激光器芯片,也是一種光子芯片。

但這些是不可編程的光學(xué)線性計(jì)算單元,所以無法運(yùn)用于計(jì)算領(lǐng)域。要想通過光來提升算力,具有實(shí)用價(jià)值的計(jì)算單元就必須具備可編程性。

而針對(duì)光計(jì)算的研究也很早就開始了,始于20世紀(jì)60年代,但受到當(dāng)時(shí)應(yīng)用范圍有限以及電子計(jì)算技術(shù)快速發(fā)展的影響,光計(jì)算處理器未能成功邁向商用。

直到最近10年,這種光計(jì)算芯片才逐漸取得突破性進(jìn)展。

尤其是在當(dāng)前時(shí)代,AI應(yīng)用正推動(dòng)對(duì)算力的需求,光芯片作為重要的潛在顛覆性技術(shù)路徑,光計(jì)算芯片近年來又重新受到廣泛關(guān)注。

光芯片的核心是用波導(dǎo)來代替電芯片的銅導(dǎo)線,來做芯片和板卡上的信號(hào)傳輸,其實(shí)就是換了一種介質(zhì)。當(dāng)光在波導(dǎo)里面?zhèn)鬏數(shù)臅r(shí)候,波導(dǎo)和波導(dǎo)之間出現(xiàn)光信號(hào)干涉,用這個(gè)物理過程來模擬線性計(jì)算這一類的計(jì)算過程,即通過光在傳播和相互作用之中的信息變化來進(jìn)行計(jì)算。

與最先進(jìn)的電子神經(jīng)網(wǎng)絡(luò)架構(gòu)及數(shù)字電子系統(tǒng)相比,光子計(jì)算架構(gòu)在速度、帶寬和能效上優(yōu)勢(shì)突出。因此,光子計(jì)算能夠有效突破傳統(tǒng)電子器件的性能瓶頸,滿足高速、低功耗通信和計(jì)算的需求。

640 (1).png

片上光子計(jì)算處理示意圖

(圖源:SEMI半導(dǎo)體研究院)

需要指出的是,光子計(jì)算的發(fā)展目標(biāo)不是要取代傳統(tǒng)計(jì)算機(jī),而是要輔助已有計(jì)算技術(shù)在基礎(chǔ)物理研究、非線性規(guī)劃、機(jī)器學(xué)習(xí)加速和智能信號(hào)處理等應(yīng)用場(chǎng)景更高效地實(shí)現(xiàn)低延遲、大帶寬和低能耗。

硅光計(jì)算芯片通過在單個(gè)芯片上集成多種光子器件實(shí)現(xiàn)了更高的集成度,還能兼容現(xiàn)有半導(dǎo)體制造工藝,降低成本,解決后摩爾時(shí)代AI硬件的性能需求,突破馮·諾依曼架構(gòu)的速度和功耗瓶頸。

綜合來看,光芯片的優(yōu)勢(shì)可以總結(jié)為:速度快/低延遲、低能耗、擅長(zhǎng)AI矩陣計(jì)算等。

速度快/低延遲:光計(jì)算芯片最顯著的優(yōu)勢(shì)是速度快、延遲低,在芯片尺寸的厘米尺度上,這個(gè)延遲時(shí)間是納秒級(jí),且這個(gè)延遲與矩陣的尺寸幾乎無關(guān),在尺寸較大的情況下,光子矩陣計(jì)算的延遲優(yōu)勢(shì)非常明顯。

低能耗:鏡片折射本身是不需要能量的,是一個(gè)被動(dòng)過程。在實(shí)際應(yīng)用中,由于要對(duì)計(jì)算系統(tǒng)編程,其中光信號(hào)的產(chǎn)生和接收是需要耗能的。在光學(xué)器件和其控制電路被較好地優(yōu)化前提下,基于相對(duì)傳統(tǒng)制程的光子計(jì)算的能效比,可媲美甚至超越先進(jìn)制程的數(shù)字芯片。

擅長(zhǎng)矩陣運(yùn)算:光波的頻率、波長(zhǎng)、偏振態(tài)和相位等信息可以代表不同數(shù)據(jù),且光路在交叉?zhèn)鬏敃r(shí)互不干擾,比如兩束手電筒的光束交叉時(shí),會(huì)穿過對(duì)方光束形成“X”型,并不會(huì)互相干擾。這些特性使光子更擅長(zhǎng)做矩陣計(jì)算,而AI大模型90%的計(jì)算任務(wù)都是矩陣計(jì)算。

因此,光計(jì)算芯片在AI時(shí)代迎來新的用武之地。

光芯片迎來突破性進(jìn)展

光計(jì)算芯片可對(duì)神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推理過程中的大規(guī)模矩陣運(yùn)算、神經(jīng)元非線性運(yùn)算進(jìn)行加速,還可通過對(duì)不同神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)進(jìn)行硬件結(jié)構(gòu)映射,來提高芯片的通用性和靈活性。

據(jù)了解,在人工神經(jīng)網(wǎng)絡(luò)計(jì)算加速方面,基于硅光平臺(tái)的神經(jīng)網(wǎng)絡(luò)已取得多項(xiàng)進(jìn)展。2016年,首個(gè)光學(xué)計(jì)算系統(tǒng)問世,極大地推動(dòng)了集成光學(xué)在未來取代傳統(tǒng)電子計(jì)算芯片的發(fā)展,開創(chuàng)了光子AI計(jì)算領(lǐng)域發(fā)展的先河。

2.1超高速光電計(jì)算芯片,算力超3000倍

研究人員創(chuàng)造性地提出了一種“掙脫”摩爾定律的全新計(jì)算架構(gòu):光電模擬芯片(ACCEL)。從最本質(zhì)的物理原理出發(fā),結(jié)合了基于電磁波空間傳播的光計(jì)算,與基于基爾霍夫定律的純模擬電子計(jì)算,“掙脫”傳統(tǒng)芯片架構(gòu)中數(shù)據(jù)轉(zhuǎn)換速度、精度與功耗相互制約的物理瓶頸,在一枚芯片上突破大規(guī)模計(jì)算單元集成、高效非線性、高速光電接口三個(gè)國(guó)際難題。在保證高任務(wù)性能的同時(shí),還實(shí)現(xiàn)超高的計(jì)算能效和計(jì)算速度。

640 (1).png

光電計(jì)算芯片ACCEL的計(jì)算原理和芯片架構(gòu)

(來源:Nature)

實(shí)測(cè)表現(xiàn)下,ACCEL光電融合芯片的系統(tǒng)級(jí)算力較現(xiàn)有的高性能芯片架構(gòu)提升了數(shù)千倍。然而,這還只是這枚芯片諸多優(yōu)勢(shì)的其中之一。

其系統(tǒng)級(jí)能效是現(xiàn)有高性能芯片的四百萬余倍。形象來說,原本供現(xiàn)有芯片工作一小時(shí)的電量,可供它工作五百多年。

此外,在超低功耗下運(yùn)行的ACCEL有助于大幅度改善發(fā)熱問題,對(duì)于芯片的未來設(shè)計(jì)帶來全方位突破,并為超高速物理觀測(cè)提供算力基礎(chǔ)。

更進(jìn)一步,該芯片光學(xué)部分的加工最小線寬僅采用百納米級(jí),而電路部分僅采用180nm CMOS工藝,已取得比7nm制程的高性能芯片多個(gè)數(shù)量級(jí)的性能提升。同時(shí)所使用的材料簡(jiǎn)單易得,造價(jià)僅為后者的幾十分之一。

2.2新型芯片開啟光速AI計(jì)算之門

研究人員開發(fā)了一種新型芯片,它使用光而不是電來執(zhí)行訓(xùn)練AI所必需的復(fù)雜數(shù)學(xué)運(yùn)算。該芯片有可能從根本上加快計(jì)算機(jī)的處理速度,同時(shí)還可降低能源消耗。

該芯片首次將本杰明·富蘭克林獎(jiǎng)?wù)芦@得者納德·恩赫塔在納米尺度上操縱材料的開創(chuàng)性研究與硅光子(SiPh)平臺(tái)結(jié)合起來。前者涉及利用光進(jìn)行數(shù)學(xué)計(jì)算,后者使用的是硅。

光波與物質(zhì)的相互作用代表著開發(fā)計(jì)算機(jī)的一種可能途徑,這種方法不受當(dāng)今芯片局限性的限制。新型芯片的原理本質(zhì)上與20世紀(jì)60年代計(jì)算革命初期芯片的原理相同。

研究人員解釋說,他們可將硅晶片做得更薄,比如150納米,并且使用高度不均勻的硅晶片,在無需添加任何其他材料的情況下,這些高度的變化提供了一種控制光在芯片中傳播的方法,因?yàn)楦叨鹊淖兓蓪?dǎo)致光以特定的模式散射,從而允許芯片以光速進(jìn)行數(shù)學(xué)計(jì)算。但這僅限于特定領(lǐng)域。

除了更快的速度和更少的能耗之外,新型芯片還具有隱私優(yōu)勢(shì)。由于許多計(jì)算可同時(shí)進(jìn)行,因此無需在計(jì)算機(jī)的工作內(nèi)存中存儲(chǔ)敏感信息,從而使采用此類技術(shù)的未來計(jì)算機(jī)幾乎無法被入侵。

2.3逆向設(shè)計(jì)高集成度光計(jì)算芯片

逆向設(shè)計(jì)高集成度光子集成器件是近年來的前沿?zé)狳c(diǎn)研究方向。

傳統(tǒng)的逆向設(shè)計(jì)過程中,光場(chǎng)仿真時(shí)間隨器件面積指數(shù)級(jí)增長(zhǎng),這限制了器件的設(shè)計(jì)面積與矩陣計(jì)算維度。

為了解決這個(gè)問題,研究人員提出一種壓縮光場(chǎng)仿真時(shí)間的方法——p2DEIA,基于光傳播的二維有效折射率近似,能夠大幅縮減逆向設(shè)計(jì)仿真時(shí)間,突破傳統(tǒng)方法在器件面積上的限制,從而設(shè)計(jì)大矩陣維度的光學(xué)向量-矩陣乘法芯片。

此外,由于p2DEIA方法對(duì)折射率的約束,該芯片具有無定形透鏡型結(jié)構(gòu),可以避免諧振特征引起的窄帶寬和制造誤差敏感性,這在實(shí)現(xiàn)大規(guī)模集成的光計(jì)算芯片中發(fā)揮關(guān)鍵作用。

640 (1).png

(a):p2DEIA方法示意圖;

(b):無定型透鏡結(jié)構(gòu)示意圖

相關(guān)研究人員利用該方法,突破了仿真成本造成的逆向設(shè)計(jì)面積瓶頸,并成功設(shè)計(jì)了3種向量-矩陣乘法器芯片,矩陣維度分別是2×2、3×3和10×10,并進(jìn)行了相關(guān)器件測(cè)試。實(shí)驗(yàn)結(jié)果表明,該乘法器的實(shí)測(cè)性能與仿真性能非常接近,這為實(shí)現(xiàn)大規(guī)模集成的光計(jì)算芯片提供了新的方法和思路。

640 (1).png

向量-矩陣乘法器設(shè)計(jì)示意圖

2.4中科院成功研制出光計(jì)算芯片

據(jù)報(bào)道,中科院李明研究員和祝寧華院士團(tuán)隊(duì)也成功研制出光計(jì)算芯片。

目前而言,絕大多數(shù)傳統(tǒng)芯片都是基于馮·諾依曼計(jì)算范式的電子芯片。但電子芯片存在的能耗較高、容易發(fā)熱等一些問題始終無法解決,而且在計(jì)算時(shí)還會(huì)出現(xiàn)數(shù)據(jù)潮汐的傳輸問題。當(dāng)電子數(shù)據(jù)如同海潮一般襲來,數(shù)據(jù)接收和處理端自然會(huì)有點(diǎn)“手忙腳亂”,影響其性能。

然而,光計(jì)算則不同。

光芯片利用光波作為載體進(jìn)行信息處理,具有低延時(shí)、低功耗、大帶寬等諸多優(yōu)點(diǎn),這是一種“傳輸即計(jì)算,結(jié)構(gòu)即功能”的計(jì)算架構(gòu),有望避免馮·諾依曼計(jì)算范式中出現(xiàn)的數(shù)據(jù)潮汐傳輸問題。

尤其是在人工智能領(lǐng)域,經(jīng)常需要處理大規(guī)模的數(shù)據(jù)和執(zhí)行龐雜的計(jì)算任務(wù),因此需要強(qiáng)大的計(jì)算能力和高速的數(shù)據(jù)傳輸能力。

對(duì)此,中國(guó)科學(xué)院研制出一款超高集成度光學(xué)卷積處理器,成功突破了“光計(jì)算”技術(shù)的壁壘。這款芯片的運(yùn)算速度很快,同時(shí),功耗比傳統(tǒng)的AI芯片功耗要低很多,關(guān)鍵是不需要使用高端光刻機(jī)就可以完成生產(chǎn)。

基于這種技術(shù),光芯片性能再次提升,而一旦這種技術(shù)應(yīng)用于AI領(lǐng)域,能實(shí)現(xiàn)對(duì)現(xiàn)有AI芯片的顛覆,其速度可能不只是快1.5倍-10倍,可能會(huì)更快,應(yīng)用空間廣闊。

潛力之下,光芯片挑戰(zhàn)尚在

雖然提到了很多優(yōu)勢(shì),但光芯片作為一項(xiàng)前沿技術(shù),必然有很多挑戰(zhàn)有待克服。

3.1工藝挑戰(zhàn)

由于要用于復(fù)雜計(jì)算,光器件的數(shù)量必然會(huì)很多,要達(dá)到不錯(cuò)的性能至少需要上萬個(gè),這會(huì)帶來更復(fù)雜的結(jié)構(gòu)和更大的尺寸。為了實(shí)現(xiàn)可編程,必然要對(duì)每個(gè)器件進(jìn)行控制,也會(huì)要求高集成度和一些Knowhow積累。這些要求會(huì)產(chǎn)生一些工藝上的挑戰(zhàn),同時(shí)導(dǎo)致成本很高,以及整體穩(wěn)定性、生產(chǎn)良率都有挑戰(zhàn),所以必須找到一種低成本、高良率的方法,來控制大量光器件的技術(shù)。

3.2溫度難題

因?yàn)槭悄M計(jì)算,當(dāng)整個(gè)環(huán)境溫度對(duì)電芯片產(chǎn)生影響的時(shí)候,對(duì)光信號(hào)也會(huì)產(chǎn)生擾動(dòng),影響計(jì)算精度。有一種辦法是把整個(gè)芯片放在恒溫環(huán)境下,通過溫控電路來實(shí)現(xiàn)。但這反過來會(huì)犧牲一些光計(jì)算的低能耗優(yōu)勢(shì)。此外,對(duì)于溫度控制,還包括芯片內(nèi)部發(fā)熱,導(dǎo)致對(duì)周邊器件的影響問題。

寫在最后

光子計(jì)算提供了一條超越摩爾定律的算力提升路徑。雖然光計(jì)算還沒有完全落地,但硅光芯片每個(gè)產(chǎn)業(yè)鏈環(huán)節(jié)的全面性,是光計(jì)算芯片量產(chǎn)的前提。

這是一個(gè)全新的賽道,“超越摩爾定律”也是一個(gè)激動(dòng)人心的口號(hào),但幾乎沒有前路可以借鑒,開拓者們正在披荊斬棘,技術(shù)挑戰(zhàn)與風(fēng)險(xiǎn)并存。但唯一可以確定的是,人類社會(huì)對(duì)提升算力的追求,正比以往任何一個(gè)時(shí)刻都更加迫切。

參考鏈接

[1]經(jīng)緯創(chuàng)投:英偉達(dá)暴漲、ChatGPT浪潮下,一條超越摩爾定律的算力提升路徑——光計(jì)算芯片

[2]科技日?qǐng)?bào):新型芯片開啟光速AI計(jì)算之門

[3]與非網(wǎng):突破摩爾定律限制,光子計(jì)算是實(shí)現(xiàn)超級(jí)算力的歸途

[4]DeepTech深科技:清華團(tuán)隊(duì)研發(fā)光電融合芯片,算力是商用GPU的3000余倍,推動(dòng)構(gòu)建生態(tài)友好的AI計(jì)算框架

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論