取代CPU!阿里云重磅發(fā)布殺手锏CIPU,“下一代云計算我要我說了算”!

遙想當年,從無人看好的業(yè)務(wù),到如今一躍成為中國云計算版圖上最耀眼的那顆星,阿里云經(jīng)歷了13年的隱忍和克制,摸著石頭過河,以飛天云操作系統(tǒng)為核心,自研了芯片、服務(wù)器、計算、存儲、網(wǎng)絡(luò)、安全等軟硬一體的新型計算體系架構(gòu)。如今,經(jīng)過多年的沉淀和積累,阿里云終于有了勇氣,去爭奪云計算下一個階段的定義權(quán)。

本文來自物聯(lián)網(wǎng)智庫,作者:今天星期一。

阿里云今年最重要策略是“B2B”,也就是“Back to Basic”,回到云計算的本質(zhì),堅持在技術(shù)的長征路上,不斷取得新的突破。同時,阿里云正式發(fā)布自主研發(fā)的云基礎(chǔ)設(shè)施處理器CIPU,將在未來取代CPU成為新一代云計算的管控和加速中心。

6月13日,阿里云硬件研發(fā)又有了最新進展。在2022阿里云峰會上,阿里云正式發(fā)布了其自主研發(fā)的云基礎(chǔ)設(shè)施處理器CIPU(Cloud infrastructure Procrssing Units),作為一款為新型云數(shù)據(jù)中心設(shè)計的專用處理器,它將在未來取代CPU成為新一代云計算的管控和加速中心。

QQ截圖20211119092508.png

會上,阿里云智能總裁張建鋒表示,阿里云今年最重要策略是“B2B”,也就是“Back to Basic”,回到云計算的本質(zhì),堅持在技術(shù)的長征路上,不斷取得新的突破。同時,他認為云計算進入了一個關(guān)鍵的突破期,“如果我們定義好下一代技術(shù),中國云計算就有超車機會。”

CIPU引領(lǐng)云計算技術(shù)進入新階段

5月26日,阿里發(fā)布2022財年業(yè)績報表,云業(yè)務(wù)同比增長23%,全年收入在抵銷跨分部交易前后分別達到1001.8億元和745.67億元,并創(chuàng)下了11.46億元的盈利數(shù)據(jù)。這是阿里云成立13年以來實現(xiàn)的首次年度盈利,也是阿里云新的歷史性時刻。

遙想當年,從無人看好的業(yè)務(wù),到如今一躍成為中國云計算版圖上最耀眼的那顆星,阿里云經(jīng)歷了13年的隱忍和克制,摸著石頭過河,以飛天云操作系統(tǒng)為核心,自研了芯片、服務(wù)器、計算、存儲、網(wǎng)絡(luò)、安全等軟硬一體的新型計算體系架構(gòu)。如今,經(jīng)過多年的沉淀和積累,阿里云終于有了勇氣,去爭奪云計算下一個階段的定義權(quán)。

張建鋒認為,在過去的十多年間,云計算已經(jīng)經(jīng)歷了兩個發(fā)展階段,從分布式到資源池化,產(chǎn)生了非常多的創(chuàng)新。其中,第一階段是分布式和虛擬化技術(shù)替代了大型機,滿足了當時企業(yè)所需的算力規(guī)模;第二階段出現(xiàn)了資源池化技術(shù),把計算和存儲資源分離,再規(guī)?;幣藕驼{(diào)度,提供了超大規(guī)模的計算和存儲資源池。

QQ截圖20211119092508.png

這兩個階段的演進推動云計算發(fā)展,但它們都是通過軟件定義的方法,基于傳統(tǒng)的以CPU為中心的體系架構(gòu)去做優(yōu)化,已經(jīng)觸及瓶頸。隨著云計算規(guī)模的不斷膨脹,大數(shù)據(jù)應(yīng)用場景的逐漸增多,云計算整體也面臨了多重挑戰(zhàn):

首先,計算和網(wǎng)絡(luò)傳輸時延大。隨著體系結(jié)構(gòu)越來越分布,一個大型的應(yīng)用會分散在多個子系統(tǒng)去部署,這些系統(tǒng)之間就需要高速地去互聯(lián);其次,隨著大數(shù)據(jù)應(yīng)用的不斷增長,IDC內(nèi)部的東西向流量越來越大,數(shù)據(jù)密集型計算也就越來越多;再者,以阿里云為例,其在全球四大洲的27個國家和地區(qū)、84個可用區(qū)、2800個網(wǎng)絡(luò)節(jié)點,運營著上百萬臺服務(wù),服務(wù)著400多萬客戶,系統(tǒng)規(guī)模越來越大、越來越復(fù)雜,也造成了超大規(guī)?;A(chǔ)設(shè)施的復(fù)雜管理問題。

因此張建鋒表示,新一代的云計算要從數(shù)據(jù)中心的內(nèi)部做體系化創(chuàng)新,打破以往的以CPU為中心的體系架構(gòu),進入以CIPU為中心的體系架構(gòu)。而CIPU不僅能在以軟件靈活定義整個基礎(chǔ)設(shè)施,還能通過硬件加速實現(xiàn)性能大幅提升。

實際上,也并非只有阿里云在此賽道上追逐,比如英偉達在2020年10月發(fā)布的DPU(Data Processing Units),側(cè)重于解決數(shù)據(jù)遷移帶寬的問題,能夠從CPU上卸載關(guān)鍵的網(wǎng)絡(luò)、存儲和安全任務(wù),降低CPU的開銷,一經(jīng)面世便引發(fā)了業(yè)界的廣泛熱議。

隨后英特爾也推出了IPU(Infrastructure Processing Units)的概念,強調(diào)虛擬化云化能力,通過網(wǎng)絡(luò)虛擬化、存儲虛擬化、網(wǎng)絡(luò)存儲管理以及安全等功能,加速網(wǎng)絡(luò)基礎(chǔ)設(shè)施,釋放CPU來提高應(yīng)用程序性能??梢姛o論英偉達還是英特爾,都是想要通過軟件定義和硬件加速的方式,替代CPU成為數(shù)據(jù)中心的核心硬件。

比CPU多個I的CIPU到底是什么?

CIPU和CPU表面雖然只是一個“I”的差別,實際上卻是兩個時代的差距。CIPU作為一顆云端專用處理器,主要用于連接服務(wù)器內(nèi)硬件和云上虛擬化資源。底層基礎(chǔ)設(shè)施通過插入CIPU,能夠托管在飛天云操作系統(tǒng)中,進而形成云上的統(tǒng)一虛擬資源池,為客戶提供云上算力。

1.jpg

根據(jù)阿里云表述,CIPU向下接入物理的計算、存儲、網(wǎng)絡(luò)資源,快速云化并進行硬件加速;向上接入飛天云操作系統(tǒng),管控阿里云全球上百萬臺服務(wù)器,讓算力虛擬化損耗降到0,并通過規(guī)?;瘧?yīng)用RDMA網(wǎng)絡(luò)技術(shù),讓訪問云端比訪問本地硬盤更快。從性能上看,實現(xiàn)了計算、存儲和網(wǎng)絡(luò)三類資源的極大提升:

CIPU與計算結(jié)合:快速接入不同類型資源的服務(wù)器,帶來算力的“0”損耗,以及硬件級安全的加固隔離;

CIPU與存儲結(jié)合:對存算分離架構(gòu)的塊存儲接入進行硬件加速,云盤存儲IOPS最高可達300萬,長尾時延降低50%;

CIPU與網(wǎng)絡(luò)結(jié)合:可對高帶寬物理網(wǎng)絡(luò)進行硬件加速,構(gòu)建大規(guī)模彈性RDMA高性能網(wǎng)絡(luò),時延最低可達5us。

更值得一提的是,CIPU作為一顆專門為飛天系統(tǒng)設(shè)計的處理器,對于阿里云從最底層的數(shù)據(jù)中心核心部件到最上層云原生軟件,建立完整的自研技術(shù)體系有著重大裨益。同時,借由“飛天+CIPU”的新一代完整的軟硬件云計算架構(gòu)體系,也使其相比英特爾、英偉達等純硬件廠商更容易展現(xiàn)其優(yōu)勢。

根據(jù)阿里云官方數(shù)據(jù),在通用計算、大數(shù)據(jù)、人工智能等核心場景的計算測試中,該體系展現(xiàn)了優(yōu)越的性能。具體為:

在通用分布式計算領(lǐng)域,Redis性能提升了68%、MySQL提升了60%,Nginx提升了30%;

高吞吐類的互聯(lián)網(wǎng)業(yè)務(wù)上云之后,比自建物理機的集群吞吐量提升了30%,業(yè)務(wù)高峰期延遲下降了90%;

在大數(shù)據(jù)和AI等計算與數(shù)據(jù)雙密集場景下,相比傳統(tǒng)的TCP網(wǎng)絡(luò),彈性RDMA高性能網(wǎng)絡(luò)的吞吐能力提升30%以上;

云原生方面,容器啟動速度快了350%,在Serverless場景下6秒可拉起3000個彈性容器實例。

阿里云在實踐創(chuàng)造中走向前列

張建鋒稱,阿里云核心技術(shù)一直走在世界的前列,這個新興體系是技術(shù)長征路上的新里程碑,這個新型的技術(shù)體系正在定義下一代云計算架構(gòu)。但我們知道,經(jīng)歷了13年的淬煉,這不是一朝一夕的苦勞,而是不斷試煉和嘗試。

就像此次發(fā)布的CIPU,并非阿里云一時的產(chǎn)物。早在2014年,阿里云就開始對各種智能網(wǎng)卡進行了嘗試,最終它在2017年發(fā)布的神龍卡上顯示出了雛形。

從功能上來看,神龍卡類似于AWS發(fā)布的一款名為Nitro的平臺,主要用于消除計算虛擬化消耗。經(jīng)過好幾輪迭代之后神龍卡逐漸加入了編排調(diào)度、硬件加速等更多能力,最終為CIPU的誕生定下了基調(diào)。如今,CIPU已經(jīng)在阿里云內(nèi)部有了較大規(guī)模的應(yīng)用和抗壓測試,為雙十一、阿里集團業(yè)務(wù)等內(nèi)部客戶和最新實例提供了支持。

除此之外,在芯片層面,阿里云是全球支持CPU種類最多的云廠商,基于“一云多芯”戰(zhàn)略對X86、ARM、RISC-V等多種架構(gòu)進行適配,形成標準形態(tài)的算力輸出。

QQ截圖20211119092508.png

去年,阿里云還針對云計算大規(guī)模、高并發(fā)特性,推出自研CPU芯片倚天710。目前,該處理器已在阿里云數(shù)據(jù)中心內(nèi)部規(guī)模化部署,并順利支撐2021年雙11等多個核心業(yè)務(wù)。今年4月,基于倚天710的公共云ECS實例也已上線邀測。

在網(wǎng)絡(luò)層面,阿里云建設(shè)了全球最大規(guī)模的RDMA分布式高性能網(wǎng)絡(luò),CIPU對高帶寬物理網(wǎng)絡(luò)進行硬件加速,實現(xiàn)RDMA技術(shù)的普惠化;在存儲層面,CIPU對存算分離架構(gòu)的塊存儲進行加速,讓云端存儲比本地存儲更快,并擁有極大規(guī)模的資源池;在計算層面,通過CIPU把虛擬化開銷降到0,并提供硬件安全隔離功能。

未來或許真的會如張建鋒所言,“云計算越來越接近進入下一個時代——全新的架構(gòu)定義,全新的軟件界面,硬件加速。我們錯過了PC時代,但云這個時代大家起步是一樣的?,F(xiàn)在是重新定義云的窗口期,如果我們定義好了,中國就可以在下一個技術(shù)時代有自己的一席之地。”

參考資料:

1.《阿里云張建鋒:Back to Basic,定義下一代的云》,阿里云

2.《阿里云首發(fā)CIPU處理器,這次要搶CPU的C位,為OS反向自研》,量子位

3.《剛剛,阿里云亮出殺手锏CIPU,云操作系統(tǒng)的最強搭檔》,智東西

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論