光芯片,能否一戰(zhàn)?

摩爾定律已經(jīng)相當(dāng)快了。根據(jù)其定義,每隔兩年左右,計(jì)算機(jī)芯片中晶體管的數(shù)量就會(huì)增加一倍,速度和效率就會(huì)大幅提升。但深度學(xué)習(xí)時(shí)代的計(jì)算需求增長(zhǎng)速度甚至更快——這種速度可能無(wú)法持續(xù)。

本文來(lái)自微信公眾號(hào)“半導(dǎo)體行業(yè)觀察”,作者/quantamagazine。

摩爾定律已經(jīng)相當(dāng)快了。根據(jù)其定義,每隔兩年左右,計(jì)算機(jī)芯片中晶體管的數(shù)量就會(huì)增加一倍,速度和效率就會(huì)大幅提升。但深度學(xué)習(xí)時(shí)代的計(jì)算需求增長(zhǎng)速度甚至更快——這種速度可能無(wú)法持續(xù)。

國(guó)際能源署預(yù)測(cè),到2026年,人工智能消耗的電量將是2023年的10倍,而當(dāng)年的數(shù)據(jù)中心消耗的能源將與日本相當(dāng)。計(jì)算硬件公司Lightmatter的創(chuàng)始人兼首席執(zhí)行官尼克哈里斯(Nick Harris)表示:“人工智能所需的[計(jì)算能力]每三個(gè)月就會(huì)翻一番——這比摩爾定律預(yù)測(cè)的要快得多。它將摧毀企業(yè)和經(jīng)濟(jì)體。”

最有希望的解決方法之一是不再使用可靠的電子(電子在計(jì)算領(lǐng)域已經(jīng)占據(jù)了50多年的主導(dǎo)地位)來(lái)處理信息,而是使用光子流(微小的光束)。最近的研究結(jié)果表明,對(duì)于現(xiàn)代人工智能的某些基本計(jì)算任務(wù)而言,基于光的“光學(xué)計(jì)算機(jī)”可能具有優(yōu)勢(shì)。

劍橋大學(xué)物理學(xué)家娜塔莉亞·伯洛夫(Natalia Berloff)表示,光學(xué)計(jì)算的發(fā)展“為人工智能等需要高速、高效處理的領(lǐng)域的突破鋪平了道路”。

最佳光學(xué)

理論上,光具有誘人的潛在優(yōu)勢(shì)。首先,光信號(hào)比電信號(hào)可以攜帶更多信息——它們具有更大的帶寬。光頻率也比電頻率高得多,因此光學(xué)系統(tǒng)可以在更短的時(shí)間內(nèi)以更少的延遲運(yùn)行更多的計(jì)算步驟。

然后還有效率問題。除了相對(duì)浪費(fèi)的電子芯片的環(huán)境和經(jīng)濟(jì)成本外,它們運(yùn)行時(shí)的溫度也很高,以至于只有一小部分晶體管(所有計(jì)算機(jī)核心的微型開關(guān))可以隨時(shí)處于活動(dòng)狀態(tài)。理論上,光學(xué)計(jì)算機(jī)可以同時(shí)運(yùn)行更多操作,處理更多數(shù)據(jù),同時(shí)消耗更少的能量。斯坦福大學(xué)電氣工程師戈登·韋茨斯坦(Gordon Wetzstein)說:“如果我們能夠利用這些優(yōu)勢(shì),這將開辟許多新的可能性。”

鑒于其潛在優(yōu)勢(shì),研究人員長(zhǎng)期以來(lái)一直試圖將光用于人工智能,這是一個(gè)計(jì)算需求很大的領(lǐng)域。例如,在20世紀(jì)80年代和90年代,研究人員使用光學(xué)系統(tǒng)構(gòu)建了一些最早的神經(jīng)網(wǎng)絡(luò)。加州理工學(xué)院的Demetri Psaltis和兩位同事利用這些早期的光學(xué)神經(jīng)網(wǎng)絡(luò)(ONN)之一創(chuàng)建了一個(gè)巧妙的面部識(shí)別系統(tǒng)。他們將受試者(實(shí)際上是其中一位研究人員)的圖像存儲(chǔ)為光折變晶體中的全息圖。研究人員使用全息圖來(lái)訓(xùn)練ONN,然后ONN可以識(shí)別研究人員的新圖像并將其與同事區(qū)分開來(lái)。

但光也有缺點(diǎn)。至關(guān)重要的是,光子通常不會(huì)相互作用,因此一個(gè)輸入信號(hào)很難控制另一個(gè)信號(hào),而這正是普通晶體管的本質(zhì)。晶體管的工作性能也非常好。它們現(xiàn)在被安裝在硬幣大小的芯片上,數(shù)量達(dá)數(shù)十億,是數(shù)十年來(lái)不斷改進(jìn)的產(chǎn)物。

但近年來(lái),研究人員發(fā)現(xiàn)了光學(xué)計(jì)算的殺手級(jí)應(yīng)用:矩陣乘法(matrix multiplication)。

一些簡(jiǎn)單的數(shù)學(xué)

矩陣或數(shù)字?jǐn)?shù)組的乘法過程支撐著大量重型計(jì)算。具體來(lái)說,在神經(jīng)網(wǎng)絡(luò)中,矩陣乘法是網(wǎng)絡(luò)在舊數(shù)據(jù)上訓(xùn)練和在訓(xùn)練好的網(wǎng)絡(luò)中處理新數(shù)據(jù)的基本步驟。而光可能比電更適合矩陣乘法。

2017年,麻省理工學(xué)院的Dirk Englund和Marin Solja?i?領(lǐng)導(dǎo)的研究小組描述了如何在硅芯片上構(gòu)建光學(xué)神經(jīng)網(wǎng)絡(luò),這種人工智能計(jì)算方法因此而爆發(fā)。研究人員將他們想要相乘的各種量編碼成光束,然后將光束通過一系列組件,這些組件會(huì)改變光束的相位(即光波的振蕩方式),每次相位改變都代表一個(gè)乘法步驟。通過反復(fù)分裂光束、改變相位并重新組合,他們可以讓光有效地進(jìn)行矩陣乘法。在芯片的末端,研究人員放置了光電探測(cè)器來(lái)測(cè)量光束并顯示結(jié)果。

研究人員訓(xùn)練他們的實(shí)驗(yàn)設(shè)備識(shí)別口語(yǔ)元音,這是神經(jīng)網(wǎng)絡(luò)的常見基準(zhǔn)任務(wù)。借助光的優(yōu)勢(shì),它可以比電子設(shè)備更快、更高效地完成這一任務(wù)。其他研究人員已經(jīng)知道光有潛力用于矩陣乘法;2017年的論文展示了如何將其付諸實(shí)踐。

康奈爾大學(xué)光子學(xué)專家Peter McMahon表示,這項(xiàng)研究“重新激發(fā)了人們對(duì)光神經(jīng)網(wǎng)絡(luò)的極大興趣。這項(xiàng)研究影響巨大。”

好主意

自2017年那篇論文發(fā)表以來(lái),該領(lǐng)域穩(wěn)步發(fā)展,各類研究人員紛紛研制出新型光學(xué)計(jì)算機(jī)。Englund和幾位合作者最近推出了一種名為HITOP的新型光學(xué)網(wǎng)絡(luò),它結(jié)合了多項(xiàng)進(jìn)步。最重要的是,它旨在隨著時(shí)間、空間和波長(zhǎng)的增加而擴(kuò)大計(jì)算吞吐量。前麻省理工學(xué)院博士后、現(xiàn)就職于南加州大學(xué)的Zaijun Chen表示,這有助于HITOP克服光學(xué)神經(jīng)網(wǎng)絡(luò)的一個(gè)缺點(diǎn):將數(shù)據(jù)從電子元件傳輸?shù)焦鈱W(xué)元件需要大量能量,反之亦然。但通過將信息打包到光的三維空間中,Chen表示,它可以更快地通過ONN傳輸更多數(shù)據(jù),并將能量成本分?jǐn)偟蕉啻斡?jì)算中。這降低了每次計(jì)算的成本。研究人員報(bào)告說,HITOP可以運(yùn)行比以前基于芯片的ONN大25,000倍的機(jī)器學(xué)習(xí)模型。

需要明確的是,該系統(tǒng)還遠(yuǎn)遠(yuǎn)不能與之前的電子系統(tǒng)相媲美;HITOP每秒可執(zhí)行約1萬(wàn)億次操作,而先進(jìn)的Nvidia芯片可以處理300倍的數(shù)據(jù),Chen說,他希望擴(kuò)大該技術(shù)的規(guī)模,使其更具競(jìng)爭(zhēng)力。但光學(xué)芯片的效率令人信服。“這里的關(guān)鍵是我們將能源成本降低了1,000倍,”陳說。

其他研究小組也開發(fā)出了具有不同優(yōu)勢(shì)的光學(xué)計(jì)算機(jī)。去年,賓夕法尼亞大學(xué)的一個(gè)研究小組描述了一種新型ONN,它具有不同尋常的靈活性。這種基于芯片的系統(tǒng)將激光照射到組成電子芯片的半導(dǎo)體部分,從而改變半導(dǎo)體的光學(xué)特性。激光有效地映射了光信號(hào)的傳輸路徑,從而映射了光信號(hào)的計(jì)算路徑。這讓研究人員可以輕松地重新配置系統(tǒng)的功能。這與大多數(shù)其他基于芯片的系統(tǒng)(光學(xué)和電氣)有著鮮明的區(qū)別,這些系統(tǒng)的路徑都是在制造廠精心設(shè)計(jì)的,很難改變。

“我們擁有的東西非常簡(jiǎn)單,”這項(xiàng)研究的主要作者Tianwei Wu說。“我們可以重新編程,動(dòng)態(tài)改變激光模式。”研究人員利用該系統(tǒng)設(shè)計(jì)了一個(gè)成功區(qū)分元音的神經(jīng)網(wǎng)絡(luò)。大多數(shù)光子系統(tǒng)在構(gòu)建之前都需要進(jìn)行訓(xùn)練,因?yàn)橛?xùn)練必然涉及重新配置連接。但由于這個(gè)系統(tǒng)很容易重新配置,研究人員在將模型安裝在半導(dǎo)體上后對(duì)其進(jìn)行了訓(xùn)練。他們現(xiàn)在計(jì)劃增加芯片的尺寸,并在不同顏色的光中編碼更多信息,這應(yīng)該會(huì)增加它可以處理的數(shù)據(jù)量。

即使是在90年代創(chuàng)建了面部識(shí)別系統(tǒng)的Psaltis也對(duì)這一進(jìn)步感到驚嘆。“與實(shí)際發(fā)生的事情相比,我們40年前最瘋狂的夢(mèng)想也微不足道。”

第一縷曙光

雖然光學(xué)計(jì)算在過去幾年中發(fā)展迅速,但它還遠(yuǎn)未取代實(shí)驗(yàn)室外運(yùn)行神經(jīng)網(wǎng)絡(luò)的電子芯片。論文宣布光子系統(tǒng)比電子系統(tǒng)效果更好,但它們通常使用舊的網(wǎng)絡(luò)設(shè)計(jì)和較小的工作負(fù)載來(lái)運(yùn)行小型模型。安大略省皇后大學(xué)的Bhavin Shastri表示,許多關(guān)于光子霸權(quán)的報(bào)道數(shù)據(jù)并沒有說明全部情況。“很難與電子產(chǎn)品進(jìn)行同類比較,”他說。“例如,當(dāng)他們使用激光時(shí),他們并沒有真正談?wù)摓榧す夤╇姷哪芰俊?rdquo;

實(shí)驗(yàn)室系統(tǒng)需要擴(kuò)大規(guī)模才能顯示出競(jìng)爭(zhēng)優(yōu)勢(shì)。McMahon問道:“要把它做大到什么程度才能獲勝?”答案是:非常大。這就是為什么沒有人能與英偉達(dá)制造的芯片相媲美,英偉達(dá)的芯片為當(dāng)今許多最先進(jìn)的人工智能系統(tǒng)提供動(dòng)力。在此過程中,需要解決大量的工程難題——電子方面已經(jīng)解決了幾十年的問題。McMahon說:“電子領(lǐng)域從一開始就具有巨大的優(yōu)勢(shì)。”

一些研究人員認(rèn)為,基于ONN的AI系統(tǒng)將首先在具有獨(dú)特優(yōu)勢(shì)的專業(yè)應(yīng)用中取得成功。Shastri表示,一種有希望的用途是抵消不同無(wú)線傳輸之間的干擾,例如5G蜂窩塔和幫助飛機(jī)導(dǎo)航的雷達(dá)高度計(jì)。今年早些時(shí)候,Shastri和幾位同事創(chuàng)建了一種ONN,它可以對(duì)不同的傳輸進(jìn)行分類并實(shí)時(shí)挑選出感興趣的信號(hào),處理延遲不到15皮秒(15萬(wàn)億分之一秒)——不到電子系統(tǒng)所需時(shí)間的千分之一,而功耗不到1/70。

但McMahon表示,這一宏偉愿景——一種可以超越通用電子系統(tǒng)的光學(xué)神經(jīng)網(wǎng)絡(luò)——仍然值得追求。去年,他的團(tuán)隊(duì)進(jìn)行了模擬,結(jié)果顯示,在十年內(nèi),一個(gè)足夠大的光學(xué)系統(tǒng)可以使一些人工智能模型的效率比未來(lái)的電子系統(tǒng)高出1,000倍以上。“許多公司現(xiàn)在都在努力獲得1.5倍的收益。一千倍的收益,那將是驚人的,”他說。“這可能是一個(gè)10年的項(xiàng)目——如果成功的話。”

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論