越來越“熱”的芯片,如何降溫?

隨著芯片制程的不斷微縮,大大加劇了散熱困境。按照傳統(tǒng)散熱經(jīng)驗,芯片的散熱密度存在物理極限,每平方毫米芯片的散熱能力約為1瓦。目前行業(yè)內(nèi)的發(fā)展趨勢是,進(jìn)入10納米以下,英特爾和AMD等芯片巨頭紛紛采用均熱片來解決發(fā)熱問題。

本文來自微信公眾號“半導(dǎo)體行業(yè)觀察”。

前言

2024年,AI的“狂飆突進(jìn)”勢頭不減,繼ChatGPT之后,文生視頻大模型Sora的推出更是讓人們看到AI的無限可能。然而,隨之而來的能耗問題也不容忽視。國際能源署(IEA)《Electricity 2024——Analysis and forecast to 2026E》的報告,ChatGPT每響應(yīng)一個請求需要消耗2.9瓦時,這相當(dāng)于一個5瓦的LED燈泡亮35分鐘??紤]到每天90億次搜索,這將在一年內(nèi)額外消耗近10太瓦時的電力,相當(dāng)于一座小型核電站一年的發(fā)電量。而這些能源消耗的“罪魁禍?zhǔn)?rdquo;之一,就是支撐AI運行的芯片。為了保證芯片的高效運行,龐大的數(shù)據(jù)中心往往需要消耗大量的電力進(jìn)行冷卻。根據(jù)IEA的報告,數(shù)據(jù)中心的電力需求主要來自計算和冷卻兩個方面,兩者各占總電力需求的40%左右。預(yù)計到2026年,全球數(shù)據(jù)中心、加密貨幣和人工智能的電力消耗將在620至1,050 TWh之間變動。

640 (1).png

來源:IEA《Electricity 2024-Analysis and forecast to 2026》

近年來,為了滿足5G、AI、汽車電子等新興市場不斷增長的算力需求,芯片的集成度不斷提高,相應(yīng)的功耗也隨之增加。功耗增加會產(chǎn)品熱量,當(dāng)熱度達(dá)到一定程度,芯片輕則宕機(jī),重則損毀。一個直觀的生活案例,這就好比我們的手機(jī),過熱會直接死機(jī)。因此芯片散熱已是當(dāng)今工程師的“必修課”。但為了滿足便攜性和美觀性需求,電子設(shè)備的尺寸又必須不斷減小,這就導(dǎo)致給散熱系統(tǒng)留下的空間愈發(fā)有限。如何高效散熱,已成為整個行業(yè)亟待解決的關(guān)鍵問題。

電子系統(tǒng)散熱:日益嚴(yán)峻的挑戰(zhàn)

隨著芯片制程的不斷微縮,大大加劇了散熱困境。按照傳統(tǒng)散熱經(jīng)驗,芯片的散熱密度存在物理極限,每平方毫米芯片的散熱能力約為1瓦。目前行業(yè)內(nèi)的發(fā)展趨勢是,進(jìn)入10納米以下,英特爾和AMD等芯片巨頭紛紛采用均熱片來解決發(fā)熱問題。3納米和2納米甚至是埃米時代的來臨,散熱將是頭等大事。

在人工智能浪潮的推動下,下一代AI芯片,其功耗甚至超過1千瓦。面對如此高功耗,液冷技術(shù)成為必要的降溫選擇。然而,設(shè)備越熱,其冷卻成本也隨之增加。CDCC的統(tǒng)計數(shù)據(jù)顯示,數(shù)據(jù)中心的制冷系統(tǒng)在資本支出(CAPEX)中占20-25%,在運營支出(OPEX)中的電力成本更是占了40%。

功耗曾經(jīng)被視為軟性指標(biāo),但現(xiàn)在已成為芯片設(shè)計中的重要考量因素。過高的熱量帶來的不良影響不容忽視:

●性能下降:過高的溫度會導(dǎo)致芯片性能下降,甚至出現(xiàn)死機(jī)、藍(lán)屏等故障。

●可靠性降低:高溫會加速電子元件的老化,縮短設(shè)備的使用壽命。

●安全性隱患:極端情況下,過熱可能引發(fā)火災(zāi)等安全事故。

●能源浪費:過多的電力消耗不僅增加了運營成本,還加劇了能源危機(jī)。

熱量不僅會影響單個電子元件的性能,還會對整個電子系統(tǒng)的可靠性造成威脅。以現(xiàn)代汽車為例,在汽車電動化、智能化和網(wǎng)聯(lián)化的發(fā)展趨勢下,車內(nèi)集成了成百上千個電子元件,這些元件之間相互作用產(chǎn)生的熱量和振動,會形成復(fù)雜的熱應(yīng)力和機(jī)械應(yīng)力場,影響設(shè)備的穩(wěn)定性和可靠性。

面對日益嚴(yán)峻的散熱挑戰(zhàn),以及對芯片性能提升的孜孜以求,如何在保證芯片性能的前提下,有效解決散熱問題,是擺在業(yè)界面前的一項緊迫任務(wù)。

從EDA的角度來看,要實現(xiàn)精準(zhǔn)的熱分析面臨著諸多挑戰(zhàn)。首先,熱量在芯片內(nèi)的傳播路徑復(fù)雜多樣,需要考慮不同材料的熱導(dǎo)率、界面熱阻等因素。其次,對于3D-IC等先進(jìn)封裝技術(shù),需要考慮不同層次之間的熱傳導(dǎo)和散熱路徑,這增加了分析的復(fù)雜性和計算的負(fù)擔(dān)。此外,由于熱仿真的精度要求高,需要考慮如何在保證計算效率的同時,不影響分析結(jié)果的準(zhǔn)確性。

然而,當(dāng)前市場上的熱分析工具往往是零散的且功能單一,工程師需要同時使用多個不同的軟件和方法來完成散熱設(shè)計,這增加了工程開發(fā)周期和成本,同時降低了設(shè)計的效率和一致性。傳統(tǒng)的電子散熱設(shè)計和分析工具已顯得力不從心。

因此,電子行業(yè)亟需要創(chuàng)新的方法和工具來為芯片“降溫”。這種解決方案應(yīng)具備以下特點:

早期評估:在設(shè)計初期就對熱解決方案進(jìn)行評估,積極利用數(shù)字孿生等創(chuàng)新技術(shù),避免后期返工。通過采用“左移”開發(fā)策略,即在設(shè)計早期引入熱分析,我們可以更早地發(fā)現(xiàn)并解決潛在的熱問題,從而提高產(chǎn)品的可靠性。

●全局入手:將整個電子系統(tǒng)作為一個整體進(jìn)行熱分析,考慮各組件之間的相互作用。

●統(tǒng)一平臺:提供一個集成的設(shè)計環(huán)境,涵蓋熱仿真、流體仿真等多種分析功能。

Cadence Celsius Studio:

開啟散熱設(shè)計新時代

今年初,Cadence以其一貫的創(chuàng)新精神,推出了一款真正的系統(tǒng)級熱分析工具——Cadence Celsius Studio,它結(jié)合有限元分析(FEA)與計算流體力學(xué)(CFD)技術(shù),為電子行業(yè)日益嚴(yán)峻的散熱問題提供了一套全面的解決方案。作為業(yè)界首個將AI技術(shù)與熱設(shè)計深度融合的綜合性平臺,Celsius Studio打破了傳統(tǒng)熱分析工具的局限,將電熱協(xié)同仿真、電子元件冷卻和熱應(yīng)力分析整合到一個綜合的平臺,引領(lǐng)電子系統(tǒng)熱設(shè)計邁向一個全新的智能化時代。

Cadence Celsius Studio實現(xiàn)了多項突破:

(一)真正的熱系統(tǒng)分析:在Cadence Celsius Studio中,熱和應(yīng)力的建模是通過有限元分析(FEA)來完成的,通過精細(xì)到粗略的網(wǎng)格設(shè)計,可以滿足廣泛的精度需求。在Cadence Celsius EC Solver中,工程師可以通過建模對流和/或主動冷卻(如風(fēng)扇等),來實現(xiàn)散熱分析。

(二)AI驅(qū)動,實現(xiàn)設(shè)計優(yōu)化:當(dāng)今的高性能電子系統(tǒng)要求設(shè)計人員考慮SI、PI和熱完整性以及電磁干擾和兼容性(EMI/EMC)等問題,多物理場分析變得至關(guān)重要。Celsius Studio中所搭載的Cadence Optimality Intelligent System Explorer,是一款A(yù)I驅(qū)動的多物理場優(yōu)化軟件,它突破了傳統(tǒng)人力密集型優(yōu)化流程的限制,用AI驅(qū)動的技術(shù)取代了傳統(tǒng)的設(shè)計-測試-優(yōu)化循環(huán)的交互流程,可對整個設(shè)計空間進(jìn)行快速高效的探索,鎖定理想設(shè)計。

人工智能技術(shù)的引入,為電子設(shè)計自動化帶來了革命性的變革。Celsius Studio不僅能幫助工程師在設(shè)計早期階段發(fā)現(xiàn)熱問題,還可提供分析和設(shè)計洞察,預(yù)測潛在的熱問題,并提供智能化的優(yōu)化建議,盡可能減少機(jī)械工程團(tuán)隊的后期設(shè)計迭代,縮短電子系統(tǒng)的開發(fā)迭代周期。Celsius Studio專為大規(guī)模并行執(zhí)行而設(shè)計,經(jīng)過生產(chǎn)驗證,其可在不犧牲精度的前提下,與手動、詳盡、強力的參數(shù)表研究相比,生產(chǎn)力平均提高10倍。

計算流體動力學(xué)(CFD)是多物理系統(tǒng)分析的一個方面,它使用數(shù)值模型模擬流體的行為及其熱力學(xué)特性。

(三)打通電氣工程師和機(jī)械工程師的“鴻溝”:隨著PCB機(jī)械外殼尺寸日益減小以及PCB本身復(fù)雜性的增加,電氣和機(jī)械工程師之間的協(xié)作對于芯片和系統(tǒng)的熱分析和優(yōu)化愈發(fā)重要。從電路板的輪廓到最終布局和布線,雙方必須掌握相同的信息,彼此同步進(jìn)行,并消除過程中的冗余。

為了進(jìn)行這種分析,ECAD(電子計算輔助設(shè)計)+MCAD(機(jī)械計輔助設(shè)計)的協(xié)作必不可少。MCAD和ECAD之間的無縫集成曾經(jīng)是導(dǎo)致分析速度慢的主要障礙之一。在Celsius Studio中,Cadence內(nèi)部的專家簡化了MCAD和ECAD模型的導(dǎo)入過程,將之前幾天的工作量大大縮短到幾乎無感知的時間,使得電路板和機(jī)架內(nèi)的熱、應(yīng)力和冷卻分析變得更加高效和簡便。

Celsius Studio平臺既面向電氣工程師,也可以滿足機(jī)械工程師的需求。對于電氣工程師,Celsius Thermal Solver可進(jìn)行芯片/SoC性能/熱分析、封裝和PCB的電熱協(xié)同仿真,以及在兼顧熱影響的同時進(jìn)行封裝/PCB的元件擺放。對于熱工程師,Celsius Electronics Cooling提供了電子元件冷卻散熱分析,可通過添加散熱器、風(fēng)扇、通風(fēng)口來緩解潛在的熱問題。

(四)多平臺無縫集成,眾人拾柴火焰高:Celsius Studio的強大之處在于,可以與Cadence的多種實現(xiàn)平臺無縫集成,包括Allegro X Design Platform(用于電路板設(shè)計)、AWR Design Environment(用于微波IC)、Virtuoso System Design Platform(用于定制/模擬電路)和Innovus Implementation System(用于數(shù)字電路),芯片散熱是一個復(fù)雜的工程性問題。Cadence正在集結(jié)過往幾十年的經(jīng)驗,將更多的工具整合在一起,助力熱分析更加便捷。

這些多工具的見解可指導(dǎo)電源整體熱和應(yīng)力分析以及熱量減少策略、布局優(yōu)化以及熱通孔和溫度傳感器布局,讓電氣和機(jī)械/熱工程師可以在同一個環(huán)境中對設(shè)計裝配流程執(zhí)行多階段分析,解決單個封裝上多晶粒堆疊的3D-IC翹曲問題,無需對幾何體進(jìn)行簡化或轉(zhuǎn)換。

Celsius Studio正在成為電子行業(yè)解決熱設(shè)計難題的首選工具,幫助企業(yè)提高產(chǎn)品競爭力,加速產(chǎn)品創(chuàng)新。

●通過采用Celsius Studio,三星半導(dǎo)體在設(shè)計早期階段即獲得了準(zhǔn)確的熱分析結(jié)果,顯著提升了3D-IC和2.5D封裝的設(shè)計效率,將產(chǎn)品開發(fā)周期縮短了30%。

●BAE Systems利用Celsius Studio在MMIC設(shè)計周期內(nèi)實現(xiàn)了快速、準(zhǔn)確的熱分析,大幅提升了RF和熱功率放大器的性能。

●Celsius Studio幫助Chipletz的設(shè)計團(tuán)隊能夠及早獲取詳細(xì)信息,解決散熱問題,并顯著縮短了周轉(zhuǎn)時間。在Chipletz工程團(tuán)隊開發(fā)復(fù)雜設(shè)計時,能夠多次高效且詳細(xì)地運行3D-IC和2.5D封裝的熱仿真。

總的來說,Cadence的Celsius Studio為芯片、封裝、電路板和終端系統(tǒng)提供全方位的熱分析和優(yōu)化提供了一種獨辟蹊徑的做法。

結(jié)語

Cadence Celsius Studio的推出,為當(dāng)今電子行業(yè)的發(fā)展帶來了全新的機(jī)遇。通過將人工智能與傳統(tǒng)仿真技術(shù)相結(jié)合,Celsius Studio將幫助工程師克服日益嚴(yán)峻的散熱挑戰(zhàn),加速創(chuàng)新產(chǎn)品的上市。通過提供精確的熱仿真和高效的設(shè)計優(yōu)化功能,Celsius Studio將成為電子工程師的得力助手,助力他們設(shè)計出更高性能、更可靠的電子產(chǎn)品。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論