突破算力與存儲,云服務(wù)廠商盯上“EDA上云”

傳統(tǒng)的EDA IT架構(gòu)往往采用私有數(shù)據(jù)中心的形式,采用遠程桌面分配給各個客戶端,并自己部署授權(quán)管理、運算節(jié)點和共享文件存儲。但在芯片設(shè)計變得愈發(fā)復雜的趨勢到來后,算力和存儲這兩塊開始出現(xiàn)了瓶頸,芯片設(shè)計要想沿用自建數(shù)據(jù)中心的方式,不僅成本大增,也很難做到云服務(wù)商那樣的水平。

隨著我國集成電路產(chǎn)業(yè)進入黃金發(fā)展期,在5G、人工智能、自動駕駛和邊緣計算等應(yīng)用的驅(qū)使下,設(shè)計工具也開始走向全新的道路。鑒于IC設(shè)計與IT產(chǎn)業(yè)密不可分的關(guān)系,在云端時代提供的諸多便利下,許多芯片設(shè)計公司紛紛將各自的業(yè)務(wù)遷往云端,這其中就包括EDA。

傳統(tǒng)的EDA IT架構(gòu)往往采用私有數(shù)據(jù)中心的形式,采用遠程桌面分配給各個客戶端,并自己部署授權(quán)管理、運算節(jié)點和共享文件存儲。但在芯片設(shè)計變得愈發(fā)復雜的趨勢到來后,算力和存儲這兩塊開始出現(xiàn)了瓶頸,芯片設(shè)計要想沿用自建數(shù)據(jù)中心的方式,不僅成本大增,也很難做到云服務(wù)商那樣的水平。因此不管是EDA軟件商、IC設(shè)計企業(yè)以及代工廠,都開始追求EDA上云,全面交給云服務(wù)商部署托管或是采用混合云等方式。

亞馬遜AWS

2345截圖20201119114036.png

AWS為EDA提供的實例/亞馬遜

為了讓半導體公司及其IP和代工廠伙伴能從AWS受益,亞馬遜提供了一個非常適合EDA的實例z1d。z1d實例具有極高的單線程性能,借助定制的Intel Xeon處理器,內(nèi)核頻率最高可達4.0GHz,每核提供16GB內(nèi)存和本地NVMe存儲,因此無需擔心算力和存儲的問題。此外,AWS還為EDA的各個節(jié)點全部提供了加密,保證每個節(jié)點都能以優(yōu)化安全的形式創(chuàng)建和關(guān)閉。

而這樣安全、高性能且可擴展的EDA也為產(chǎn)品設(shè)計和驗證鋪平了道路,EDA流無論是全面部署還是部分部署都能縮短項目完成的時間,提高上市和產(chǎn)品革新的周期。不僅如此,計算環(huán)境的大小可以自行調(diào)整,以此滿足不同應(yīng)用的需求,降低部署成本。

其實亞馬遜在自己的芯片上就已經(jīng)實現(xiàn)了EDA上云的轉(zhuǎn)變,在收購了以色列芯片制造商Annapurna Labs后,AWS就開始不斷擴大芯片設(shè)計上云的版圖,最終實現(xiàn)了完全基于云端的SoC開發(fā),充分利用7nm工藝,而本地的數(shù)據(jù)中心僅僅只是用來仿真。在亞馬遜自己的Graviton和Inferentia等芯片上,從RTL到GDSII全部實現(xiàn)云上開發(fā)。

就拿Xilinx來說,在與AWS合作的過程中,與混合云與全面上云不同,他們選擇了一種突發(fā)式的云部署方案作為本地數(shù)據(jù)中心的補充。一個項目或工作流可以共存與云端和本地端,數(shù)據(jù)和許可也可以在云端和本地端共享,工作流或工具也可以在本地端和云端交替運行。通過與臺積電和Synopsys在AWS上實現(xiàn)共同協(xié)作,Xilinx也開啟了一條更快實現(xiàn)產(chǎn)品化的道路。

微軟Azure

2345截圖20201119114036.png

Azure為芯片設(shè)計提供的云端環(huán)境/微軟

微軟的Azure也是積極推進EDA上云的云服務(wù)商之一,而且擁有相當龐大的生態(tài)合作伙伴,既包括SiFive、ARM和Silvaco這樣的IP供應(yīng)商,也有Cadence、Synopsys、Mentor Graphics和ASML等EDA軟件供應(yīng)商,還包括臺積電和三星的代工廠。AMD與Menor Graphics合作,成功在Azure上驗證了臺積電7nm工藝芯片的設(shè)計,用于其Radeon顯卡和EPYC處理器,實現(xiàn)了更短的周期和更低的成本。

Mentor Graphics也在K庫上遇到了挑戰(zhàn),比如大量的SPICE仿真,冗長的周轉(zhuǎn)時間和重度運算工作下更大的算力資源需求。而Azure提供了專為HPC開發(fā)的虛擬機類型HC44rs,包含44個核心,每一個核心配有8GB的內(nèi)存。

Azure利用獨有的CycleCloud技術(shù),可以動態(tài)分配資源以尋求最優(yōu)化的使用方式。利用CycleCloud,客戶可以輕松創(chuàng)建、管理和優(yōu)化Azure上的HPC節(jié)點,比如說在20分鐘內(nèi)提供5萬個運算核心。

臺積電也運用微軟的Azure平臺打造了OIP VDE,與Cadence合作,提供給臺積電下游一些IP設(shè)計的客戶進行使用。去年臺積電舉辦的前瞻布局大賽上,臺積電還通過Azure構(gòu)建了參賽學子專屬的VDE,提供給他們12周的云端學習空間。

微軟的EDA本土團隊近兩年來也開始在接觸中國的本土晶圓廠商、工具廠商以及設(shè)計廠商,展開相應(yīng)的合作,比如華大九天等等,從而服務(wù)與中國國內(nèi)的芯片行業(yè)。

阿里云

2345截圖20201119114036.png

阿里云提供的EDA機型配置/阿里巴巴

國內(nèi)近年來設(shè)計上云的動作也不算小,阿里巴巴集團旗下的平頭哥半導體有限公司就在2019年初逐步開展基于設(shè)計上云的嘗試和轉(zhuǎn)移。平頭哥通過設(shè)計上云主要瞄準三個目標,一是通過云端“無限”的資源投入到芯片設(shè)計上,從而實現(xiàn)快速迭代;二是實現(xiàn)高質(zhì)量的驗證過程,保證一次投片成功;最后是構(gòu)建云端原生的芯片生態(tài)。

平頭哥借助阿里云選取了全項目上云并結(jié)合服務(wù)器托管的方案,采用了阿里云的神龍裸金屬服務(wù)器、NAS存儲和E-HPC平臺等。據(jù)實際測試得到的結(jié)果表明,設(shè)計上云實現(xiàn)了10%到50%的性能提升。

我們上面也提到了存儲也是EDA本地端部署的限制之一,此處的限制不單單是指容量,還有IO。阿里云的高速NAS可以為EDA提供極致的性能,支持1億的IOPS,1TBps的吞吐和100PB的容量。阿里云NAS還支持3-1000的存儲節(jié)點擴展,并通過智能運維自動增加和縮減節(jié)點,自動實現(xiàn)負載均衡。

小結(jié)

盡管對于不少中國企業(yè)來說,EDA上云還是近期才興起來的概念,但隨著高性能芯片需求的提升、新工藝對算力要求的增長、上市周期成為決定競爭成敗的關(guān)鍵,EDA上云已經(jīng)成為一個必然的趨勢。

就EDA軟件來說,這種SaaS的服務(wù)模式在國內(nèi)還屬于生長初期,需要進一步推廣才能發(fā)展壯大。而對于云服務(wù)廠商來說,往往都能和與多個EDA軟件商、IP供應(yīng)商或代工廠形成合作,這對更愿意在同一云服務(wù)下使用多種工具和設(shè)計流程的用戶來說同樣是一件好事。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論