AI PC芯片卷出“新趨勢(shì)”

算力的提升只是驅(qū)動(dòng)設(shè)備側(cè)AI算力的第一步,如何使NPU算力真正發(fā)揮效能,以滿足AI大模型的部署要求,仍需要廠商進(jìn)一步細(xì)化架構(gòu)與系統(tǒng)設(shè)計(jì)。

640 (1).png

本文來(lái)自微信公眾號(hào)“中國(guó)電子報(bào)”,作者/張心怡。

雖然蘋果的AI PC預(yù)計(jì)今年晚些時(shí)候才能與消費(fèi)者見(jiàn)面,但在6月11日凌晨進(jìn)行的蘋果WWDC 2024上,蘋果團(tuán)隊(duì)詳細(xì)描繪了Mac系列將具備的AI能力。現(xiàn)場(chǎng)公布的信息顯示,蘋果將為全產(chǎn)品線配置個(gè)人化智能系統(tǒng)Apple Intelligence,將生成式模型置于iPhone、iPad、Mac的核心,根據(jù)“個(gè)人情景(Personal Context)”為用戶提供智能協(xié)助。對(duì)于Mac系列,Apple Intelligence的測(cè)試版本將在今年秋季隨MacOS Sequoia推出,支持配備M1的Mac以及后續(xù)機(jī)型。

無(wú)需創(chuàng)建ChatGPT賬號(hào),即可將GPT-4o運(yùn)用于文檔、PPT、Pages等寫作類APP的創(chuàng)作;基于生成式模型能力一鍵調(diào)整文章的風(fēng)格和語(yǔ)氣;收到的郵件不再顯示前幾行,而是顯示摘要,還能按照重要程度排序;執(zhí)行跨APP的任務(wù)時(shí),只需對(duì)AI助手描述要求,系統(tǒng)就會(huì)對(duì)日歷日程、照片、文件、消息、郵件等信息進(jìn)行語(yǔ)義索引,幫助用戶在不切換APP的前提下完成對(duì)特定信息的檢索、日程規(guī)劃等任務(wù)……蘋果展示的AI PC圖景背后,是蘋果的軟硬件整合能力。蘋果軟件工程高級(jí)副總裁Craig Fedrighi表示,A17 Pro和M系列處理器,為驅(qū)動(dòng)Apple Intelligence提供了堅(jiān)實(shí)的算力基礎(chǔ)。

從微軟的Copilot+PC到蘋果由Apple Intelligence加持的Mac系列,AI正在重塑個(gè)人計(jì)算體驗(yàn),驅(qū)動(dòng)PC向著個(gè)性化、情景化的方向發(fā)展。在這個(gè)過(guò)程中,AI PC處理器也在全維度進(jìn)化。

NPU算力戰(zhàn)火升級(jí)既要好用也要用好

截至2024年6月,主要PC處理器廠商最新產(chǎn)品和架構(gòu)的NPU(神經(jīng)網(wǎng)絡(luò)處理器)算力已經(jīng)來(lái)到40TOPS級(jí)別,最高來(lái)到50TOPS。“卷”NPU算力也成為第三方處理器廠商爭(zhēng)奪AI PC市場(chǎng)份額的重要手段。

而在去年年底之前,NPU甚至還不是PC處理器的標(biāo)配。NPU作為能夠以更低功耗加速AI負(fù)載的處理單元,率先應(yīng)用于手機(jī)。2017年9月,華為推出全球首款內(nèi)置獨(dú)立NPU的手機(jī)處理器麒麟970。同年,蘋果、高通分別將NPU搭載于A11 Bionic處理器和Hexagon DSP(數(shù)字信號(hào)處理器)。這或許也解釋了為什么高通、蘋果這兩件兼具手機(jī)和PC業(yè)務(wù)的Fabless,會(huì)先于英特爾、AMD等傳統(tǒng)PC處理器廠商,將NPU應(yīng)用于PC處理器。2020年,蘋果在M1芯片搭載了NPU,這枚NPU與蘋果手機(jī)處理器A14搭載的NPU類似,算力達(dá)到11TOPS。高通在2020年9月面向PC發(fā)布的Snapdragon 8cx Gen 2 5G處理器,搭載了9TOPS算力的Hexagon NPU。

時(shí)間來(lái)到2023年,面對(duì)生成式AI向設(shè)備側(cè)蔓延的兇猛勢(shì)頭,老牌PC處理器廠商們以AI PC為目標(biāo)市場(chǎng),終于將NPU武裝進(jìn)自家產(chǎn)品線。AMD為2023年發(fā)布的Ryzen Mobile 7040系列處理器的部分型號(hào)配置了NPU,能提供最高10TOPS的算力。英特爾在2023年12月發(fā)布的Meteor Lake處理器首次搭載NPU,算力為11TOPS。

而同一年,蘋果最新PC處理器M2 Ultra的NPU算力已經(jīng)來(lái)到31.6TOPS,高通的驍龍X Elite平臺(tái)NPU算力達(dá)到45TOPS。這讓作為第三方處理器供應(yīng)商的高通占據(jù)了先機(jī)。2024年5月,微軟發(fā)布了“有史以來(lái)速度最快、最智能的Windows PC”Copilot+PC這一全新AI PC品類,45TOPS的高通驍龍X系列處理器成為首批Copilot+PC的處理器。微軟Windows與設(shè)備副總裁帕萬(wàn)·達(dá)武魯里(Pavan Davuluri)認(rèn)為,每臺(tái)Copilot+PC都需要一個(gè)至少能夠處理40TOPS的NPU。

有了微軟劃定的“起跑線”,有著“Wintel”基因的英特爾和它在PC市場(chǎng)的老對(duì)手AMD也不甘落后,在6月的臺(tái)北國(guó)際電腦展上紛紛亮出大招。英特爾宣布下一代AI PC旗艦處理器架構(gòu)Lunar Lake所搭載的NPU能提供48TOPS的AI性能,AMD更是將Ryzen AI 300系列的NPU算力拉到了50TOPS,以倍速提升的算力實(shí)現(xiàn)了與Copilot+PC的適配。

640 (1).png

主要PC處理器廠商最新產(chǎn)品或架構(gòu)中的NPU算力

但算力的提升只是驅(qū)動(dòng)設(shè)備側(cè)AI算力的第一步,如何使NPU算力真正發(fā)揮效能,以滿足AI大模型的部署要求,仍需要廠商進(jìn)一步細(xì)化架構(gòu)與系統(tǒng)設(shè)計(jì)。

比如,在AI推理任務(wù)中,F(xiàn)P16(半精度浮點(diǎn)數(shù))和INT8是常見(jiàn)的數(shù)據(jù)類型。NPU當(dāng)前以INT8數(shù)據(jù)類型為主,運(yùn)行模型所需的計(jì)算和內(nèi)存較少,但犧牲了一定的精度。而FP16有著更高的精度,卻不具備INT8的計(jì)算和內(nèi)存特性。這讓開(kāi)發(fā)者在設(shè)計(jì)計(jì)算方案時(shí),需要對(duì)精度和性能做出平衡。針對(duì)不同數(shù)據(jù)類型的特點(diǎn),AMD采用了塊16位浮點(diǎn)(Block FP16)這一種新的數(shù)據(jù)格式,將FP16的精度與INT8的性能結(jié)合在一起。XDNA2也成為首款支持Block FP16的NPU。

此外,由于CPU和GPU也能夠處理特定的AI任務(wù),如何協(xié)調(diào)這兩類芯片與NPU的計(jì)算負(fù)載,也影響著系統(tǒng)性能的發(fā)揮。例如英特爾的Lunar Lake架構(gòu),就在AI任務(wù)的協(xié)調(diào)上做了工作,CPU、GPU與NPU分別負(fù)責(zé)輕型AI負(fù)載、創(chuàng)作AI和AI助手類任務(wù)。

全天候AI需要更高能效比WoA陣營(yíng)迎來(lái)機(jī)遇

AI PC強(qiáng)調(diào)始終在線,也就意味著設(shè)備端的AI工具全天候在后臺(tái)運(yùn)行。這需要處理器具備更高的能效比,以保證AI PC的續(xù)航能力。除了采用NPU這一能夠用更低功耗處理AI負(fù)載的處理單元,處理器廠商還通過(guò)制程、IPC、減少內(nèi)存訪問(wèn)距離等方式,進(jìn)一步提升處理器的能效比。

芯片的制程越小,則電流傳輸距離越短,功耗也就越小。在最新一代AI PC處理器中,蘋果M4采用臺(tái)積電第二代3nm技術(shù),高通驍龍X Elite和AMD Ryzen AI 300都采用了4nm制程,與當(dāng)前的旗艦型手機(jī)同步。

同時(shí),IPC(即每時(shí)鐘周期執(zhí)行的指令數(shù))越高,意味著CPU在相同頻率下的性能越高。英特爾Lunar Lake性能核的IPC較上一代提升了14%,在相同功耗下能實(shí)現(xiàn)的10~18%的性能提升。AMD Ryzen AI 300系列系列處理器采用的Zen 5架構(gòu)也實(shí)現(xiàn)了16%的IPC提升。

同樣值得注意的是,無(wú)論是Arm架構(gòu)還是X86架構(gòu),都在提升架構(gòu)的集成度,通過(guò)將內(nèi)存整合進(jìn)封裝來(lái)優(yōu)化功耗表現(xiàn)。Arm在5月底推出的終端計(jì)算子系統(tǒng)(CSS)中,采用了系統(tǒng)級(jí)高速緩存(SLC),以減少DRAM帶寬和訪問(wèn)次數(shù),提升系統(tǒng)能效。蘋果M系列處理器,也一直采用封裝級(jí)內(nèi)存,將SoC和DRAM芯片安裝在一起。而此前的大多數(shù)X86處理器,都將主內(nèi)存外置。在Lunar Lake架構(gòu)中,英特爾首次把內(nèi)存集成到封裝內(nèi)。這樣的封裝方式,讓計(jì)算核心以更短距離、更低延遲訪問(wèn)內(nèi)存,將PHY功耗降低了40%。

隨著能效比的重要性日益凸顯,“WoA”(Windows on Arm)也受到了更多OEM廠商的關(guān)注。從架構(gòu)來(lái)看,Arm在功耗和邊緣側(cè)AI推理具有優(yōu)勢(shì)。從生態(tài)來(lái)看,Windows正在深化與原生Arm的適配。據(jù)統(tǒng)計(jì),在運(yùn)行Windows 10和Windows 11的iGPU(集成GPU)筆記本電腦中,用戶在87%的應(yīng)用程序使用時(shí)間中,使用的是原生支持Arm的版本。加上Arm在最新的計(jì)算平臺(tái)中,又面向AI設(shè)備側(cè)的發(fā)展趨勢(shì),進(jìn)一步提升了能效比。比如Arm于5月底推出的終端計(jì)算子系統(tǒng)(CSS)所采用的GPU Arm Immortalis-G925,在提供與上一代產(chǎn)品相當(dāng)?shù)挠螒蛐阅軙r(shí),功耗降低了30%。

當(dāng)前,WoA主要的芯片玩家是高通,但英偉達(dá)和聯(lián)發(fā)科也對(duì)這一市場(chǎng)虎視眈眈。英偉達(dá)在5月宣布,搭載RTX GPU的Windows 11 AI PC將在未來(lái)幾個(gè)月推出,且發(fā)布了幫助開(kāi)發(fā)者在Windows PC優(yōu)化及部署生成式AI模型的開(kāi)發(fā)工具NVIDIA RTX AI Toolkit。而聯(lián)發(fā)科也在近日傳出正在開(kāi)發(fā)基于Arm架構(gòu)的AI PC芯片。摩根士丹利分析師Charlie Chan預(yù)計(jì),WoA AI PC芯片出貨量將在2024年達(dá)到約為200萬(wàn)臺(tái),2025年將增至1500萬(wàn)臺(tái)。

混合AI時(shí)代的隱私挑戰(zhàn)蘋果芯進(jìn)入服務(wù)器

AI PC這一產(chǎn)品類型的核心價(jià)值,是圍繞個(gè)人情境的計(jì)算體驗(yàn),這就需要結(jié)合用戶的個(gè)人數(shù)據(jù)。無(wú)論微軟Copilot+PC主打的Recall功能,還是Apple Intelligence加持的Siri提供的跨APP協(xié)作能力,底層邏輯都是對(duì)用戶信息進(jìn)行語(yǔ)義索引。這也是為什么逐鹿AI PC的處理器廠商,都強(qiáng)調(diào)終端側(cè)AI的概念,如Pavan Davuluri所言,設(shè)備側(cè)AI意味著更快的響應(yīng)時(shí)間、更好的隱私和更低的成本。

但是,如果為了保護(hù)個(gè)人數(shù)據(jù),就限制用戶獲得云端大模型的支持,未免“因噎廢食”。2023年,高通提出了混合AI架構(gòu),也就是根據(jù)模型和查詢需求的復(fù)雜度等因素,選擇不同方式在云端和終端側(cè)之間分配處理負(fù)載。當(dāng)用戶發(fā)起請(qǐng)求時(shí),終端側(cè)神經(jīng)網(wǎng)絡(luò)或基于規(guī)則而運(yùn)行的判決器(arbiter)將決定是否需要使用云端。

而蘋果在WWDC 2024上,展現(xiàn)了混合式AI的具體圖景。當(dāng)用戶向Siri提出專業(yè)問(wèn)題時(shí),Siri會(huì)提示用戶是否詢問(wèn)ChatGPT或者能否把照片、文檔等信息分享給ChatGPT。同時(shí),蘋果各產(chǎn)品線的寫作工具和圖像生成工具,也可以運(yùn)用ChatGPT進(jìn)行創(chuàng)作。

但是,一旦在設(shè)備側(cè)通過(guò)網(wǎng)絡(luò)獲取ChatGPT等部署在服務(wù)器端的大模型服務(wù),就有可能面臨個(gè)人數(shù)據(jù)被服務(wù)器存儲(chǔ)的風(fēng)險(xiǎn)。Craig Fedrighi表示,在傳統(tǒng)方式中,服務(wù)器會(huì)存儲(chǔ)個(gè)人數(shù)據(jù),甚至未經(jīng)同意就使用這些數(shù)據(jù),且用戶難以驗(yàn)證個(gè)人數(shù)據(jù)是否被濫用。

面向個(gè)人數(shù)據(jù)在混合式AI時(shí)代的安全挑戰(zhàn),蘋果推出了私有云計(jì)算技術(shù)(Private Cloud Computing),為服務(wù)器大模型提供芯片級(jí)安全保護(hù)。當(dāng)蘋果設(shè)備判斷用戶的請(qǐng)求無(wú)法用設(shè)備側(cè)AI解決,會(huì)引入基于服務(wù)器的模型來(lái)處理更復(fù)雜的請(qǐng)求,而服務(wù)器端的模型會(huì)在以蘋果芯片(Apple Silicon)打造的服務(wù)器上運(yùn)行,可提供與iPhone相同的芯片級(jí)別的隱私安全保護(hù)。Apple Intelligence會(huì)僅僅將與任務(wù)相關(guān)的數(shù)據(jù)發(fā)給Apple芯片服務(wù)器,同時(shí),獨(dú)立專家能夠檢查服務(wù)器運(yùn)行代碼,以驗(yàn)證用戶的隱私安全是否得到保障。“‘私有云計(jì)算’通過(guò)加密形式,確保iPhone、iPad、Mac可以拒絕與服務(wù)器對(duì)話,除非這個(gè)服務(wù)器的軟件已經(jīng)得到公開(kāi)的安全標(biāo)準(zhǔn)認(rèn)證。”Craig Fedrighi說(shuō)。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論