亚洲熟伦新五十熟女熟妇,全国亚洲最大的av网站久久久

為什么你的AI芯片設(shè)計總是慢人一步？

2020-09-23 10:54

半導(dǎo)體行業(yè)觀察

邱麗婷

人工智能的興起，為半導(dǎo)體行業(yè)帶來了新的機遇，使得半導(dǎo)體市場發(fā)生了翻天覆地的變化。但想要將人工智能移植到智能手機、車聯(lián)網(wǎng)、IoT等終端，就對硬件的計算能力和能耗提出了更高的要求。就拿移動端硬件來說，完成這些運算必須同時滿足高速度和低功耗的要求。

人類對于人工智能（AI）的探索從未停止過。

從上世紀(jì)八十年代開始，多層神經(jīng)網(wǎng)絡(luò)和反向傳播算法的出現(xiàn)給人工智能行業(yè)點燃了新的火花，到2016年Alpha Go擊敗韓國圍棋九段職業(yè)選手，標(biāo)志著人工智能的又一波高潮來臨。現(xiàn)階段的人工智能領(lǐng)域已經(jīng)全面開花。

AI芯片發(fā)展史

針對這些需求，人工智能核心計算芯片也經(jīng)歷了四次大的變化。

2007年以前，人工智能研究和應(yīng)用經(jīng)歷了數(shù)次起伏，一直沒有發(fā)展成為成熟的產(chǎn)業(yè)；同時受限于當(dāng)時算法、數(shù)據(jù)等因素，這一階段人工智能對于芯片并沒有特別強烈的需求，通用的CPU芯片即可提供足夠的計算能力。

隨著高清視頻、游戲等行業(yè)的發(fā)展，GPU產(chǎn)品取得快速的突破；同時人們發(fā)現(xiàn)GPU的并行計算特性恰好適應(yīng)人工智能算法大數(shù)據(jù)并行計算的要求，如GPU比之前傳統(tǒng)的CPU在深度學(xué)習(xí)算法的運算上可以提高9到72倍的效率，因此開始嘗試使用GPU進行人工智能的計算。

進入2010年后，云計算廣泛推廣，人工智能的研究人員可以通過云計算借助大量CPU和GPU進行混合運算，事實上今天人工智能主要的計算平臺還是云計算。但人工智能業(yè)界對于計算能力的要求快速提升，因此進入2015年后，業(yè)界開始研發(fā)針對人工智能的專用芯片，通過更好的硬件和芯片架構(gòu)，在計算效率、能耗比等性能上得到進一步提升。

AI SoC的基石

由于已經(jīng)發(fā)現(xiàn)傳統(tǒng)架構(gòu)對于AI SoC而言效率低下，因此系統(tǒng)規(guī)范需要進行越來越多的架構(gòu)探索來優(yōu)化設(shè)計，以提高神經(jīng)網(wǎng)絡(luò)處理的吞吐量。FinFET時代的到來促使產(chǎn)品架構(gòu)師和片上系統(tǒng)(SoC)工程師更仔細(xì)地研究每個時鐘周期中執(zhí)行的計算的效率。

越來越多的企業(yè)開始提供精良的神經(jīng)網(wǎng)絡(luò)架構(gòu)，但這些復(fù)雜的功能運行時也使得硅片上的溫度隨之升高，功耗預(yù)算愈發(fā)緊張。此外，由于RTL代碼的性質(zhì)不斷變化，快速發(fā)展的架構(gòu)使得交付進度也更為緊張。面對功耗和上市時間的雙重挑戰(zhàn)，開發(fā)出適合相同芯片面積并在任務(wù)模式下按照預(yù)期吞吐量水平發(fā)揮性能的全芯片布局絕非易事。

設(shè)計人員需要使用構(gòu)成計算電路的構(gòu)建模塊，在元件層面解決實現(xiàn)高性能人工智能(AI)SoC的功耗、性能和面積(PPA)目標(biāo)的問題。布爾邏輯和存儲器存儲元件構(gòu)成的這些元件塊被稱為基礎(chǔ)IP。

目前最流行的深度學(xué)習(xí)技術(shù)是深度神經(jīng)網(wǎng)絡(luò)（DNN），它是許多現(xiàn)代AI應(yīng)用的基礎(chǔ)。自從DNN在語音識別和圖像識別任務(wù)中展現(xiàn)出突破性的成果，使用DNN的應(yīng)用數(shù)量呈爆炸式增長。這些DNN方法被大量應(yīng)用在無人駕駛汽車，癌癥檢測，游戲AI等方面。在許多領(lǐng)域中，DNN目前的準(zhǔn)確性已經(jīng)超過人類。

但在實現(xiàn)DNN時，如果選了錯誤的方式，就可能給項目進度帶來大麻煩。因此，利用能夠在設(shè)計周期內(nèi)為過程校正提供靈活性的基礎(chǔ)IP開展設(shè)計是成功推出產(chǎn)品的必要之舉。

新思科技的基礎(chǔ)IP產(chǎn)品組合中包括HPC設(shè)計套件。該套件是邏輯庫單元和存儲器的集合，已在先進節(jié)點上與EDA工具經(jīng)過共同優(yōu)化，旨在突破任何設(shè)計的PPA極限，并針對支持AI的設(shè)計進行優(yōu)化。

須知，使用EDA供應(yīng)商提供的基礎(chǔ)IP解決方案最重要的優(yōu)勢在于互操作性。這意味著設(shè)計人員可以使用IP附帶的腳本在最尖端的工藝節(jié)點上進行工作渠道清理流程，并且不會浪費增效時間。

新思科技除了供應(yīng)種類豐富且經(jīng)過硅驗證的產(chǎn)品組合用于實現(xiàn)理想PPA目標(biāo)之外，還支持滿足個性化設(shè)計需求的定制服務(wù)，使其業(yè)務(wù)比任何其他產(chǎn)品更靈活。

如何應(yīng)對AI SoC設(shè)計挑戰(zhàn)？

隨著AI SoC的復(fù)雜性不斷增加，除了實現(xiàn)基礎(chǔ)構(gòu)建模塊的簡便同時，優(yōu)化、測試和基準(zhǔn)界定SoC性能的設(shè)計過程也需要工具、服務(wù)和/或?qū)I(yè)知識來優(yōu)化AI系統(tǒng)。在設(shè)計過程中通過定制和優(yōu)化來培育設(shè)計，最終可以決定SoC在市場中能否取得成功。

僅依靠傳統(tǒng)的設(shè)計流程，設(shè)計人員無法得到理想的高性能、市場領(lǐng)先的AI解決方案。他們必須考慮更廣闊范圍的半導(dǎo)體解決方案。

在專業(yè)處理能力方面，融合神經(jīng)網(wǎng)絡(luò)能力的SoC必須同時適應(yīng)異構(gòu)和大規(guī)模并行矩陣乘法運算。異構(gòu)組件需要標(biāo)量、矢量DSP和神經(jīng)網(wǎng)絡(luò)算法能力。

在存儲性能方面，AI模型使用大量存儲，這增加了硅片的成本。訓(xùn)練神經(jīng)網(wǎng)絡(luò)可能需要幾GB到10 GB的數(shù)據(jù)，這需要使用DDR最新技術(shù)，以滿足容量要求。

在實時數(shù)據(jù)連接方面，一旦AI模型經(jīng)過訓(xùn)練并可能被壓縮，就可以通過許多不同的接口IP解決方案執(zhí)行實時數(shù)據(jù)。

同時，盡管復(fù)制人類大腦還有很長的路要走，但人類大腦已被用作構(gòu)建人工智能系統(tǒng)的有效模型，并繼續(xù)由全球領(lǐng)先的研究機構(gòu)建模。

SoC的開發(fā)過程在不斷變化，但本質(zhì)上包括以下標(biāo)準(zhǔn)環(huán)節(jié)：系統(tǒng)規(guī)范和架構(gòu)設(shè)計；邏輯和功能電路設(shè)計；物理設(shè)計、驗證和分析；制造、封裝和測試；以及發(fā)布硅驗證。新增AI功能可能會增加各個環(huán)節(jié)的復(fù)雜性。集成的IP明確規(guī)定了一些理論上的能力上限，但是對設(shè)計進行優(yōu)化可以使實現(xiàn)結(jié)果更接近理論上的最大值。

傳統(tǒng)SoC架構(gòu)的存儲訪問和處理能力無法滿足需求。僅靠添加有效的矩陣乘法加速器或高帶寬存儲器接口的確有所幫助，但不足以成就AI的市場領(lǐng)導(dǎo)者，這就更加堅定了在系統(tǒng)設(shè)計期間專門針對AI進行特定優(yōu)化的理念。

由于已經(jīng)發(fā)現(xiàn)傳統(tǒng)架構(gòu)對于AI SoC而言效率低下，因此系統(tǒng)規(guī)范需要進行越來越多的架構(gòu)探索來優(yōu)化設(shè)計。而因為傳統(tǒng)的架構(gòu)被認(rèn)為效率較低，所以更加需要提供架構(gòu)服務(wù)。

此外，一代接一代的AI SoC正在接受改造，利用經(jīng)驗豐富的設(shè)計團隊進行優(yōu)化和定制。深度學(xué)習(xí)算法包括許多存儲的權(quán)重，理想的情況是將其存儲在片上SRAM中，以便節(jié)省功耗和處理工作量，而通過定制來優(yōu)化SRAM編譯器的功率和密度是一個明顯的趨勢。

定制處理器是新型AI SoC解決方案最受歡迎的IP開發(fā)成果之一。設(shè)計自定義處理器的工具彌足珍貴，它既能確保門級優(yōu)化得到充分利用和重用，也能保證不落后于支持自定義處理器所需的生態(tài)系統(tǒng)。

開發(fā)AI SoC需要市場上一些最具創(chuàng)新性的IP。其中包括快速采用以下新技術(shù)：HBM2e、PCIe5、CCIX，以及最新的MIPI。為了采納這些標(biāo)準(zhǔn)技術(shù)，設(shè)計人員需要支持早期的軟件開發(fā)和性能驗證的先進仿真和原型設(shè)計解決方案。這些工具經(jīng)常被用來實現(xiàn)AI，原因同樣在于設(shè)計的不成熟和復(fù)雜性。

預(yù)先構(gòu)建的AI SoC驗證環(huán)境只能供具有AI SoC開發(fā)經(jīng)驗的人員使用。因此，設(shè)計第二代和后代芯片組的設(shè)計服務(wù)和公司在上市時間方面具有快于先行者的固有優(yōu)勢。設(shè)計人員可以依靠設(shè)計服務(wù)作為利用AI SoC專業(yè)知識的有效方式，從而縮短產(chǎn)品上市時間，并將內(nèi)部設(shè)計團隊解放出來，讓其專心設(shè)計差異化功能。

接口IP的硬化服務(wù)是另一種優(yōu)化工具，可實現(xiàn)更低功耗和更小面積的設(shè)計。硬化IP為SoC騰出空間，為達到更高的AI性能提供了寶貴的片上SRAM和處理器組件。

在AI功能進入新市場時選擇用于集成的IP為AI SoC提供了關(guān)鍵組件。新思科技提供了許多專業(yè)解決方案，包括存儲接口IP、多端口的片上SRAM編譯器以及用于實時數(shù)據(jù)的完整接口選項組合，這三種IP解決方案是下一代AI設(shè)計的關(guān)鍵組件。

總結(jié)

隨著體系結(jié)構(gòu)迅速發(fā)展，并細(xì)化到更具體的應(yīng)用場景中，這種競爭環(huán)境為差異化和系統(tǒng)優(yōu)化創(chuàng)造了機會。需要通過架構(gòu)建模來選擇系統(tǒng)和IP配置替代方案優(yōu)化AI片上系統(tǒng)（SoC）設(shè)計，從而迅速形成具有競爭力的解決方案。新思科技提供的IP產(chǎn)品組合，節(jié)省了芯片設(shè)計商的時間，讓其專心設(shè)計差異化功能。

THEEND

免責(zé)聲明：凡注明為其它來源的信息均轉(zhuǎn)自其它平臺，由網(wǎng)友自主投稿和發(fā)布、編輯整理上傳，對此類作品本站僅提供交流平臺，不為其版權(quán)負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏，概不負(fù)任何法律責(zé)任。若有來源標(biāo)注錯誤或侵犯了您的合法權(quán)益，請作者持權(quán)屬證明與本站聯(lián)系，我們將及時更正、刪除，謝謝。聯(lián)系郵箱：xiali@infoobs.com

本月熱門

精選文章

熱點資訊

如何確保人工智能和機器學(xué)習(xí)項目的安全性

為什么你的AI芯片設(shè)計總是慢人一步？

2024 信息化觀察網(wǎng)

長按掃描二維碼閱讀原文

為什么你的AI芯片設(shè)計總是慢人一步？

最新評論（評論僅代表用戶觀點）

2023年Q1云計算和存儲基礎(chǔ)設(shè)施支出同比增長近15%

行業(yè)前沿 | 6G開啟的芯片春天

做好AI與新文科融合發(fā)展　助力文化強國建設(shè)

存儲市場頹勢或?qū)⒊掷m(xù)至明年，國際大廠“救市”舉措透露哪些信號？

本月熱門

云計算的江湖，風(fēng)云再起

揭秘，IOTE國際物聯(lián)網(wǎng)展2025年巡展預(yù)告!

防勒索病毒攻擊關(guān)鍵措施

匯聚行業(yè)精英，探討前沿技術(shù) 第十九屆汽車涂裝工藝技術(shù)研討會即將啟幕!

網(wǎng)博會革新升級：“區(qū)域頻道”精準(zhǔn)選型引領(lǐng)，引領(lǐng)智能制造新風(fēng)潮

萬億賽道!AI算力趨勢發(fā)展深度分析 2024

精選文章

共筑數(shù)字未來|深度解析數(shù)字化轉(zhuǎn)型與建設(shè)的戰(zhàn)略指南

Intel Cascade Lake和AMD Rome：誰會掌控2019年的數(shù)據(jù)中心市場？

賦能●數(shù)字化轉(zhuǎn)型 | 2019第二屆中國信息技術(shù)主管大會全天智能斬獲榮譽

“龍架構(gòu)”工業(yè)控制器閃耀2024龍芯工業(yè)生態(tài)大會

醫(yī)藥銷售大數(shù)據(jù)分析引擎

數(shù)據(jù)要素X政策寶：引領(lǐng)企業(yè)和政策數(shù)據(jù)服務(wù)的新浪潮

熱點資訊

政策寶閃耀2024數(shù)智融合應(yīng)用論壇，榮獲“數(shù)智融合標(biāo)桿案例”

共筑數(shù)字未來|深度解析數(shù)字化轉(zhuǎn)型與建設(shè)的戰(zhàn)略指南

數(shù)據(jù)要素X政策寶：引領(lǐng)企業(yè)和政策數(shù)據(jù)服務(wù)的新浪潮

政策寶|構(gòu)筑企業(yè)與政策間的高效數(shù)據(jù)通道，跑出惠企助企加速度

政策智能匹配與業(yè)務(wù)線索：企業(yè)騰飛的雙重動力引擎!

如何確保人工智能和機器學(xué)習(xí)項目的安全性

混合云將促進邊緣計算的發(fā)展

為什么你的AI芯片設(shè)計總是慢人一步？

最新評論（評論僅代表用戶觀點）

欄目推薦

2023年Q1云計算和存儲基礎(chǔ)設(shè)施支出同比增長近15%

行業(yè)前沿 | 6G開啟的芯片春天

做好AI與新文科融合發(fā)展 助力文化強國建設(shè)

存儲市場頹勢或?qū)⒊掷m(xù)至明年，國際大廠“救市”舉措透露哪些信號？

本月熱門

精選文章

熱點資訊

如何確保人工智能和機器學(xué)習(xí)項目的安全性

混合云將促進邊緣計算的發(fā)展

為什么你的AI芯片設(shè)計總是慢人一步？

做好AI與新文科融合發(fā)展　助力文化強國建設(shè)

存儲市場頹勢或?qū)⒊掷m(xù)至明年，國際大廠“救市”舉措透露哪些信號？