AI芯片百家爭(zhēng)鳴,誰(shuí)能走到最后?

羅燕珊
有效算力和高性能是AI芯片的關(guān)注焦點(diǎn),通過(guò)提高算力峰值來(lái)提高性能是方法之一,但往往需要付出不小的成本。在AI芯片通用時(shí)代還未到來(lái)之前,針對(duì)不同應(yīng)用場(chǎng)景,很大幾率需要不同的AI芯片來(lái)支持,各家芯片公司正試圖從不同維度突破更具性價(jià)比的“有效算力”。

AI芯片投入大、研發(fā)周期長(zhǎng),創(chuàng)業(yè)公司要博得一席之地并不容易。

算力、算法和數(shù)據(jù)被稱(chēng)作AI發(fā)展的三要素,其中為算力提供支撐的底層硬件便是AI芯片。過(guò)去幾年隨著AI應(yīng)用的發(fā)展,行業(yè)掀起了AI芯片熱潮,一批AI初創(chuàng)芯片公司應(yīng)運(yùn)而生。對(duì)這些公司而言,AI發(fā)展需要專(zhuān)用芯片的加持,當(dāng)下迎來(lái)的是重要的歷史性機(jī)遇,但同時(shí),芯片行業(yè)又是最現(xiàn)實(shí)的行業(yè)之一,投入大、產(chǎn)出慢,更需要能落地并且被市場(chǎng)認(rèn)可的結(jié)果,而這對(duì)很多芯片初創(chuàng)企業(yè)來(lái)說(shuō),并非易事。

峰值算力不等于有效算力

有效算力和高性能是AI芯片的關(guān)注焦點(diǎn),通過(guò)提高算力峰值來(lái)提高性能是方法之一,但往往需要付出不小的成本。在AI芯片通用時(shí)代還未到來(lái)之前,針對(duì)不同應(yīng)用場(chǎng)景,很大幾率需要不同的AI芯片來(lái)支持,各家芯片公司正試圖從不同維度突破更具性價(jià)比的“有效算力”。

地平線曾提出,不應(yīng)該把傳統(tǒng)芯片常用的TOPS作為衡量AI芯片性能的標(biāo)準(zhǔn)。在地平線看來(lái),能夠全面體現(xiàn)AI芯片真實(shí)性能的應(yīng)該是能效、利用率、算法能力的乘積,因此不僅要對(duì)芯片和算法進(jìn)行優(yōu)化,還要對(duì)連接兩者的編譯器等中間環(huán)節(jié)進(jìn)行優(yōu)化,最終達(dá)成全面優(yōu)化。

而鯤云科技認(rèn)為,有可能實(shí)現(xiàn)10倍以上突破的下一代AI芯片指標(biāo)是芯片利用率,即芯片實(shí)測(cè)算力與芯片峰值算力的比值,這需要從計(jì)算平臺(tái)底層架構(gòu)進(jìn)行創(chuàng)新。

CAISA 3.0架構(gòu)圖

鯤云科技日前發(fā)布了首款數(shù)據(jù)流AI芯片CAISA,采用自研的定制數(shù)據(jù)流芯片架構(gòu)(Customized AI streaming Accelerator,CAISA)CAISA 3.0。不同于基于馮諾依曼的指令集架構(gòu),數(shù)據(jù)流架構(gòu)依托數(shù)據(jù)流的流動(dòng)次序控制計(jì)算執(zhí)行次序。鯤云科技表示,該芯片已經(jīng)完成量產(chǎn)。

近日鯤云科技創(chuàng)始人兼CEO牛昕宇在接受InfoQ等媒體采訪時(shí)表示,超越英偉達(dá)的不會(huì)是另外一款GPU。

在牛昕宇看來(lái),芯片行業(yè)的馬太效應(yīng)明顯,除了跟隨已有技術(shù)路線之外,選擇另一條技術(shù)路線來(lái)開(kāi)拓也不失為長(zhǎng)遠(yuǎn)之計(jì)。從官方公布的數(shù)據(jù)來(lái)看,相比現(xiàn)有的指令集芯片,CAISA可以提供更高的算力性價(jià)比,在1/3峰值算力情況下,搭載CAISA芯片的加速卡可實(shí)現(xiàn)英偉達(dá)旗艦產(chǎn)品最高3.91倍的實(shí)測(cè)性能,芯片利用率達(dá)到95.4%,較同類(lèi)產(chǎn)品提升最高11.6倍。

“但創(chuàng)新很難,沒(méi)有既定的人和路線可以模仿,所有事情都要自己去探索,需要在這個(gè)行業(yè)不斷積累和了解,然后繼續(xù)往前走。”牛昕宇坦言,數(shù)據(jù)流這個(gè)路線不止鯤云在走,美國(guó)有Sambanova、Wave Computing和Groq在做,但都還未推出產(chǎn)品。據(jù)稱(chēng),目前鯤云是全球第一家將數(shù)據(jù)流AI芯片落地的廠商,接下來(lái),CAISA數(shù)據(jù)流AI芯片將以加速卡的形態(tài)相繼落地于智能遙感、電力、工業(yè)檢測(cè)、智慧城市等領(lǐng)域。

終端芯片市場(chǎng)機(jī)遇更大

機(jī)器學(xué)習(xí)算法流程又分為訓(xùn)練和推理兩大環(huán)節(jié),不同的環(huán)節(jié)對(duì)AI芯片有不同要求。訓(xùn)練主要在云端進(jìn)行,通常計(jì)算量巨大因此對(duì)性能要求很高,而推理在云、邊緣和終端均可進(jìn)行,更側(cè)重芯片的低成本和低功耗。

集邦咨詢分析師姚嘉洋向InfoQ表示,目前訓(xùn)練芯片方面,英偉達(dá)居于領(lǐng)先位置;推理芯片方面,投入的企業(yè)非常多,重點(diǎn)是要聚焦哪種應(yīng)用場(chǎng)景,如自動(dòng)駕駛、物聯(lián)網(wǎng)與智能型手機(jī)等,不同的終端應(yīng)用所需要的AI運(yùn)算也會(huì)有所不同,如何進(jìn)一步聚焦特定應(yīng)用并加以發(fā)展,會(huì)是AI推理芯片業(yè)者必須要思考的課題。

“因?yàn)楣具€處于比較初期的發(fā)展階段,所以一定會(huì)專(zhuān)注于推理的芯片市場(chǎng),但訓(xùn)練也是人工智能一個(gè)比較大的市場(chǎng),我們會(huì)不斷探索這個(gè)領(lǐng)域的可能性。”被問(wèn)及會(huì)否涉足訓(xùn)練領(lǐng)域時(shí),牛昕宇表示公司現(xiàn)階段還是會(huì)專(zhuān)注于推理。

從行業(yè)現(xiàn)狀來(lái)看,對(duì)于AI芯片企業(yè),尤其是初創(chuàng)企業(yè)而言,終端/邊緣側(cè)的機(jī)會(huì)多于云端。

耐能(Kneron)也是從一開(kāi)始就專(zhuān)注終端市場(chǎng)的AI芯片公司。耐能創(chuàng)始人兼CEO劉峻誠(chéng)日前接受InfoQ采訪時(shí)亦指出,云端市場(chǎng)份額很有可能都被大公司拿下,小公司在這個(gè)領(lǐng)域沒(méi)有太大的機(jī)會(huì)。但終端市場(chǎng)不同,終端下面又細(xì)分了很多子領(lǐng)域,不像云那樣能用一個(gè)架構(gòu)“吃掉”,所以耐能選擇了終端方向,切入消費(fèi)電子領(lǐng)域的AI芯片,比如智能門(mén)鎖、智能門(mén)鈴、IoT、智慧家居等。

德勤預(yù)測(cè),至2024年,邊緣人工智能芯片(執(zhí)行或加速設(shè)備內(nèi),而非遠(yuǎn)程數(shù)據(jù)中心機(jī)器學(xué)習(xí)任務(wù)的芯片或芯片部件)銷(xiāo)量預(yù)計(jì)將超過(guò)15億片,甚至可能遠(yuǎn)遠(yuǎn)超過(guò)這一數(shù)據(jù),年銷(xiāo)量增長(zhǎng)率將達(dá)到20%,是半導(dǎo)體行業(yè)整體長(zhǎng)期預(yù)測(cè)的9%復(fù)合年均增長(zhǎng)率的兩倍以上。而這些邊緣AI芯片很大可能將流向日益增多的消費(fèi)級(jí)設(shè)備,如高端智能手機(jī)、平板電腦、智能音箱及可穿戴設(shè)備等,同時(shí)也將應(yīng)用于多個(gè)企業(yè)市場(chǎng)——機(jī)器人、攝像頭、傳感器及其他物聯(lián)網(wǎng)設(shè)備。

“目前在中國(guó),邊緣計(jì)算芯片最主要的市場(chǎng)仍為智慧安防領(lǐng)域,且落地應(yīng)用布局較為成熟。”德勤在報(bào)告中稱(chēng),未來(lái),隨著技術(shù)進(jìn)步及5G的全面鋪開(kāi),無(wú)人駕駛、智慧家居、智能交通、智能制造等領(lǐng)域可能迎來(lái)更大的增長(zhǎng)空間。但邊緣計(jì)算芯片市場(chǎng)也面臨挑戰(zhàn),終端設(shè)備的電池容量有限,AI芯片必須在能效較低的同時(shí)具備更卓越的計(jì)算性能,才能更好地服務(wù)端側(cè)AI計(jì)算需求。

落地與盈利的終極問(wèn)題

毫無(wú)疑問(wèn),AI芯片投入大、研發(fā)周期長(zhǎng),要博得一席之地并非易事。尤其對(duì)規(guī)模較小的創(chuàng)業(yè)公司來(lái)說(shuō),若沒(méi)有清晰的落地應(yīng)用和商業(yè)模式,就連生存都是問(wèn)題。即將在科創(chuàng)板上市、有望成為AI芯片第一股的寒武紀(jì)也連年虧損。招股書(shū)顯示,2017~2019年間,寒武紀(jì)分別虧損3.81億元、0.41億元和11.79億元,近三年累計(jì)虧損額超過(guò)16億元。

創(chuàng)業(yè)公司還要面對(duì)來(lái)自大公司的壓力,像英特爾、英偉達(dá)和高通這些芯片巨頭近些年都在AI領(lǐng)域持續(xù)布局,谷歌、亞馬遜、百度等互聯(lián)網(wǎng)公司也紛紛借助自有業(yè)務(wù)來(lái)支撐芯片研發(fā)工作和落地。

姚嘉洋認(rèn)為,AI初創(chuàng)企業(yè)在發(fā)展之初,必須先鎖定某一個(gè)AI應(yīng)用痛點(diǎn),在該應(yīng)用發(fā)展起來(lái)后,才有機(jī)會(huì)跟臺(tái)面上的業(yè)者抗衡。

牛昕宇向InfoQ記者表示:“鯤云創(chuàng)立之初就已經(jīng)做了商業(yè)上的思考,像今天我們發(fā)布的(芯片)指標(biāo),其實(shí)好幾年前就已經(jīng)在紙上做過(guò)計(jì)算,大概要達(dá)到這樣的峰值算力才能實(shí)現(xiàn)這部分性能的領(lǐng)先,才有可能打動(dòng)客戶,所以我們才要做這樣的一個(gè)芯片。”

在落地方面,耐能算是一眾初創(chuàng)企業(yè)里做得比較早和成功的,市面上已經(jīng)有十幾款芯片產(chǎn)品在售并且進(jìn)入了不少垂直行業(yè)的標(biāo)桿企業(yè),但它也還未實(shí)現(xiàn)盈利。劉峻誠(chéng)告訴InfoQ,今年公司收入應(yīng)該會(huì)接近千萬(wàn)美元,預(yù)計(jì)明年才能獲利。

“現(xiàn)在行業(yè)是百家爭(zhēng)鳴,后進(jìn)者很多,大家融到的錢(qián)都很多,所以挑戰(zhàn)也會(huì)越來(lái)越大。”劉峻誠(chéng)表示,除了資金,落地速度和擴(kuò)展性也很重要。

此外,有網(wǎng)友對(duì)鯤云芯片評(píng)價(jià)道:“這不是第一個(gè)也不是最后一個(gè)聲稱(chēng)性能超過(guò)英偉達(dá)的,但實(shí)際上,英偉達(dá)的壁壘主要在開(kāi)發(fā)環(huán)境及系統(tǒng)生態(tài)。”對(duì)此,鯤云稱(chēng)公司為用戶提供了簡(jiǎn)單易用的編譯工具鏈,可以更快速地部署和遷移算法,進(jìn)而幫助AI芯片更好地落地。

軟件工具鏈和生態(tài)的打造,一直是專(zhuān)用處理器設(shè)計(jì)的巨大挑戰(zhàn)。設(shè)計(jì)一個(gè)新的專(zhuān)用芯片,做好硬件只是第一步,后續(xù)還需要打造新的軟件工具鏈,包括新的指令集架構(gòu)、編程模型,甚至是新的編程語(yǔ)言。只有提供全棧的軟硬件,才能讓用戶特別是開(kāi)發(fā)者充分利用新硬件的能力。

在軟件工具和生態(tài)上,英偉達(dá)是業(yè)內(nèi)公認(rèn)的絕對(duì)標(biāo)桿,其推出的統(tǒng)一編程框架CUDA已有十幾年的積累,由于完整的配套生態(tài)、良好的易用性和高效的更新迭代速度而廣受機(jī)器學(xué)習(xí)應(yīng)用開(kāi)發(fā)者和框架開(kāi)發(fā)者歡迎。在這方面,AI初創(chuàng)企業(yè)們還有相當(dāng)長(zhǎng)的路要走。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論