從智算服務(wù)市場格局看運(yùn)營商競爭策略

魏玥
隨AI大模型的普及度和滲透率不斷提升,推理工作負(fù)載將遠(yuǎn)大于訓(xùn)練工作負(fù)載。火山引擎看準(zhǔn)這一趨勢,將字節(jié)跳動豆包大模型的推理輸入價(jià)格降至0.8厘/千tokens,以期降低客戶試錯(cuò)成本,繁榮AI應(yīng)用生態(tài)。

本文來自微信公眾號“天翼智庫”,作者/魏玥。

依據(jù)IDC發(fā)布的《中國智算服務(wù)市場(2023下半年)跟蹤》報(bào)告,我國智算服務(wù)市場的增量幾乎全部來自GenAI IaaS和智算集成服務(wù)。其中,GenAI IaaS市場由火山引擎、阿里巴巴和商湯科技等引領(lǐng),智算集成服務(wù)市場則是華為一家獨(dú)大,呈現(xiàn)出與公有云和IT集成服務(wù)截然不同的市場格局,但又遵循著與云服務(wù)類似的發(fā)展規(guī)律。

我國智算服務(wù)市場格局

據(jù)IDC統(tǒng)計(jì),2023年下半年,我國智算服務(wù)1市場整體規(guī)模達(dá)到114.1億元,同比增長85.8%。其中,GenAI IaaS市場呈0到1式增長,規(guī)模達(dá)到32.2億元,為整體智算服務(wù)貢獻(xiàn)了59%的增量;Non-GenAI IaaS市場緩慢增長至45.9億元,僅貢獻(xiàn)3%的增量;智算集成服務(wù)2受各地政府大力推進(jìn)智算中心建設(shè)等因素驅(qū)動,市場規(guī)模達(dá)到36.0億元,同比增長129.4%,貢獻(xiàn)了38%的增量。

競爭格局方面,火山引擎、商湯科技和華為的表現(xiàn)引人注目。

GenAI IaaS市場:火山引擎、阿里巴巴、商湯科技、百度和騰訊占據(jù)前五位,份額合計(jì)約70%,市場集中度與公有云IaaS相近。其中,火山引擎和商湯科技這兩家并不屬于公有云第一梯隊(duì)的廠商,份額分別達(dá)到21%和15%,這意味著生成式AI或?qū)⒋呱碌脑凭揞^。

智算集成服務(wù)市場:華為、新華三、百度、寒武紀(jì)和中國電子云占據(jù)前五位,份額合計(jì)約55%,市場集中度遠(yuǎn)高于IT咨詢與集成服務(wù)以及定制化開發(fā)服務(wù)等市場(CR5僅為15%~20%)。其中,華為獨(dú)占超過45%的份額,成為絕對霸主;百度、寒武紀(jì)、中國電子云等主營業(yè)務(wù)各異的非傳統(tǒng)系統(tǒng)集成服務(wù)廠商,也分別取得了2%上下的份額。這或許說明與傳統(tǒng)IT服務(wù)相比,智算集成服務(wù)更加要求供應(yīng)商在資源和服務(wù)等方面擁有差異化優(yōu)勢。

TOP廠商的核心競爭力

1.火山引擎:背靠字節(jié)跳動,火山終于“爆發(fā)”

作為字節(jié)跳動旗下的云廠商,火山引擎依托豐沛智算資源、領(lǐng)先萬卡集群和開放模型平臺等在2023年實(shí)現(xiàn)高速擴(kuò)張,同比增速超過150%,并正通過進(jìn)一步激發(fā)應(yīng)用生態(tài)為增長飛輪注入更多動能。

豐沛智算資源:在人工智能被打上“落地變緩”“負(fù)增長”等這些標(biāo)簽的2022年,火山引擎為滿足抖音等字節(jié)跳動自有業(yè)務(wù),以及自動駕駛和生物信息計(jì)算等新興領(lǐng)域頭部客戶的需求,持續(xù)囤積智算資源,順理成章地在生成式AI爆發(fā)且算力供不應(yīng)求的情況下,成為了智譜AI、月之暗面、Minimax、零一萬物和百川智能等一眾AI初創(chuàng)公司的算力底座。

萬卡集群技術(shù):隨模型參數(shù)量從千億邁向萬億,以及推理需求不斷增長,大模型的算力要求升級,高效率且高穩(wěn)定的萬卡集群成為新一輪智算基礎(chǔ)設(shè)施競賽的必選項(xiàng)。字節(jié)跳動聯(lián)合北京大學(xué)發(fā)表論文3,針對在萬卡集群上訓(xùn)練大模型的效率和穩(wěn)定性問題提出MegaScale生產(chǎn)系統(tǒng)。論文顯示,在12288塊GPU上訓(xùn)練1750億參數(shù)大語言模型時(shí),MegaScale實(shí)現(xiàn)了55.2%的算力利用率(MFU),是英偉達(dá)Megatron-LM的1.34倍。

開放模型平臺:與阿里云、百度智能云等先卷大模型不同,火山引擎首先將匯聚和開放第三方大模型作為重點(diǎn),推出火山方舟MaaS平臺。通過搭建模型需求端和供給側(cè)間的橋梁,火山引擎在幫助模型廠商拓展客戶的同時(shí)也實(shí)現(xiàn)了自身收入增長。

激發(fā)應(yīng)用生態(tài):隨AI大模型的普及度和滲透率不斷提升,推理工作負(fù)載將遠(yuǎn)大于訓(xùn)練工作負(fù)載?;鹕揭婵礈?zhǔn)這一趨勢,將字節(jié)跳動豆包大模型的推理輸入價(jià)格降至0.8厘/千tokens,以期降低客戶試錯(cuò)成本,繁榮AI應(yīng)用生態(tài)。

2.商湯科技:大裝置發(fā)揮大作用

商湯科技2014年以視覺AI起家,2018年開始打造由模型層、深度學(xué)習(xí)平臺和計(jì)算基礎(chǔ)設(shè)施等三部分構(gòu)成的AI基礎(chǔ)設(shè)施——SenseCore商湯AI大裝置。依托大裝置,商湯科技不僅對外提供豐富的AI云產(chǎn)品和行業(yè)解決方案,也實(shí)現(xiàn)了自有“日日新”大模型體系的高速迭代。在“大裝置+大模型”驅(qū)動下,商湯科技2023年生成式AI收入突破11.8億元,同比增長近200%。

前瞻性布局智算中心:商湯科技2020年起陸續(xù)在上海、深圳、廣州、福州、濟(jì)南和重慶等多地建設(shè)智算中心,截至2023年底,上線GPU數(shù)量達(dá)到45000張,總運(yùn)營算力達(dá)到12 EFLOPS。其中,上海臨港智算中心于2020年啟動建設(shè),2022年正式運(yùn)營,24年4月算力規(guī)模達(dá)到8.1 EFLOPS,位居我國乃至全球前列。

打造高效穩(wěn)定萬卡集群:商湯科技已實(shí)現(xiàn)萬卡互聯(lián),集群線性加速比超過90%,同時(shí)保證超30天穩(wěn)定訓(xùn)練不間斷和訓(xùn)練間斷半小時(shí)恢復(fù)。

高性價(jià)比推理服務(wù):商湯科技2023年將推理服務(wù)性價(jià)比提升300%,大幅降低大模型推理單位成本。

3.華為:領(lǐng)先芯片和全棧服務(wù)顯身手

領(lǐng)先AI芯片:在美不斷升級對華半導(dǎo)體出口管制和我國信創(chuàng)進(jìn)程加速的背景下,華為昇騰910B作為少數(shù)可與英偉達(dá)A100等海外高端GPU抗衡的國產(chǎn)AI芯片之一,是華為得以拿下眾多智算中心建設(shè)項(xiàng)目的殺手锏。

全棧智算服務(wù):基于30余年的ICT服務(wù)經(jīng)驗(yàn),華為已形成從規(guī)劃、集成、運(yùn)維到模型使能和人才培養(yǎng)等的端到端智算集成服務(wù),幫助客戶建好和用好智算基礎(chǔ)設(shè)施。

運(yùn)營商競爭策略

回顧云服務(wù)發(fā)展歷程,1.0階段,亞馬遜和阿里巴巴等互聯(lián)網(wǎng)大廠將自有資源和技術(shù)向其他互聯(lián)網(wǎng)企業(yè)開放,順利打開市場;2.0階段,中國電信等運(yùn)營商抓住政企上云機(jī)遇,憑借不斷提升的技術(shù)實(shí)力和長年累積的服務(wù)經(jīng)驗(yàn)實(shí)現(xiàn)規(guī)模擴(kuò)張。

如今,智算服務(wù)1.0因“百模大戰(zhàn)”開啟,火山引擎和商湯科技等對智算資源和技術(shù)早有儲備的企業(yè)占得市場先機(jī)。面對將由行業(yè)大模型帶動的智算服務(wù)2.0,運(yùn)營商已從資源、技術(shù)、產(chǎn)品和服務(wù)等多方面做好準(zhǔn)備,如中國電信規(guī)劃并建設(shè)覆蓋全國的“2+3+7+X”公共智算云池,打造國產(chǎn)萬卡智算集群,加快構(gòu)建“息壤”一體化智算服務(wù)體系和能力等。

然而,由于其他智算服務(wù)提供商,如AI企業(yè)、互聯(lián)網(wǎng)/云廠商和其他央國企等,多同樣具備政企服務(wù)經(jīng)驗(yàn),因此運(yùn)營商在智算服務(wù)2.0將面臨比云服務(wù)2.0更為嚴(yán)峻的競爭環(huán)境。建議:

一是強(qiáng)化安全可信,針對在AI時(shí)代被進(jìn)一步放大的數(shù)據(jù)(含算法、代碼等)隱私與安全問題,依托機(jī)密計(jì)算4等技術(shù),打造可在AI全生命周期內(nèi)保障數(shù)據(jù)和模型等的機(jī)密性與完整性的智算基礎(chǔ)設(shè)施,讓客戶安心使用AI IaaS;

二是繁榮模型生態(tài),秉持開放共贏理念,幫助自研和第三方模型、MaaS平臺與AI應(yīng)用等觸達(dá)客戶;

三是升級集成服務(wù),理解與把握政企客戶對智算基礎(chǔ)設(shè)施的當(dāng)下和長遠(yuǎn)需求,提供從建到用再到后續(xù)升級的高水平全棧服務(wù)。

注釋:

1.IDC將智算服務(wù)定義為以GPU、FPGA、ASIC等AI專用算力為主的基礎(chǔ)設(shè)施服務(wù),主要包括智算集成服務(wù)和智算基礎(chǔ)設(shè)施即服務(wù)(AI IaaS)。其中,AI IaaS市場又分為面向生成式AI的GenAI IaaS和面向渲染、仿真、視聯(lián)網(wǎng)推理等非生成式AI的Non-GenAI IaaS等兩個(gè)細(xì)分市場。

2.智算集成服務(wù)指廠商在幫助客戶建設(shè)私有智算基礎(chǔ)設(shè)施過程中提供的咨詢、集成、開發(fā)、運(yùn)維等專業(yè)和管理服務(wù)。

3.《MegaScale:Scaling Large Language Model Training to More Than 10,000 GPUs》。

4.機(jī)密計(jì)算是一種通過在基于硬件的可信執(zhí)行環(huán)境(TEE)中執(zhí)行計(jì)算來保護(hù)使用中的數(shù)據(jù)的技術(shù)。

THEEND

最新評論(評論僅代表用戶觀點(diǎn))

更多
暫無評論