本文來(lái)自微信公眾號(hào)“AI云原生智能算力架構(gòu)”,【作者】AIsoar。
“普慧”算力助力充分釋放數(shù)據(jù)紅利中國(guó)數(shù)字經(jīng)濟(jì)體量有望突破百萬(wàn)億元
當(dāng)前,數(shù)據(jù)對(duì)提高生產(chǎn)效率的乘數(shù)作用不斷凸顯,是最具時(shí)代特征的生產(chǎn)要素,與其他生產(chǎn)要素相比,數(shù)據(jù)具有可復(fù)制、非消耗、邊際成本接近于零等新特性,打破了自然資源有限供給對(duì)增長(zhǎng)的制約,能夠?yàn)榻?jīng)濟(jì)轉(zhuǎn)型升級(jí)提供不竭動(dòng)力。
中國(guó)網(wǎng)民數(shù)量、數(shù)據(jù)資源、數(shù)字化應(yīng)用場(chǎng)景全球領(lǐng)先,14億人口所產(chǎn)生的數(shù)據(jù)資源將支持中國(guó)數(shù)字經(jīng)濟(jì)發(fā)揮規(guī)模經(jīng)濟(jì)、范圍經(jīng)濟(jì)和網(wǎng)絡(luò)經(jīng)濟(jì)優(yōu)勢(shì)。“普慧”算力作為數(shù)字經(jīng)濟(jì)的基礎(chǔ)設(shè)施,可以強(qiáng)有力地推動(dòng)跨層級(jí)、跨地域、跨部門(mén)數(shù)據(jù)匯聚融合、共享交換和開(kāi)發(fā)應(yīng)用,提升數(shù)據(jù)要素的整體流通效能和經(jīng)濟(jì)社會(huì)價(jià)值。
數(shù)據(jù)+“普慧”算力的雙向驅(qū)動(dòng),將充分盤(pán)活數(shù)據(jù)資產(chǎn),釋放“數(shù)據(jù)紅利”,為中國(guó)數(shù)字經(jīng)濟(jì)的發(fā)展提供堅(jiān)實(shí)底座。
據(jù)中國(guó)(深圳)綜合開(kāi)發(fā)研究院技術(shù)團(tuán)隊(duì)預(yù)測(cè),2020-2025年,中國(guó)數(shù)字經(jīng)濟(jì)年均增速將保持在15%左右。
到2025年,數(shù)字經(jīng)濟(jì)規(guī)模將突破80萬(wàn)億元,占GDP比重達(dá)55%。到2030年,數(shù)字經(jīng)濟(jì)體量有望突破百萬(wàn)億元37。
“普慧”!算力推動(dòng)大小模型協(xié)同進(jìn)化,通用人工智能將真正走向落地
中國(guó)是世界人工智能重要領(lǐng)軍國(guó)家之一,各級(jí)政府、科研機(jī)構(gòu)、企業(yè)等都在積極推動(dòng)AI大模型發(fā)展。
例如北京市經(jīng)濟(jì)和信息化局發(fā)布的《2022年北京人工智能產(chǎn)業(yè)發(fā)展白皮書(shū)》中,明確提出支持頭部企業(yè)打造對(duì)標(biāo)ChatGPT的大模型,著力構(gòu)建開(kāi)源框架和通用大模型的應(yīng)用生態(tài)。
此外,智源研究院、清華大學(xué)等單位聯(lián)合研發(fā)了全球最大的智能模型“悟道2.0”,模型參數(shù)規(guī)模達(dá)到了1.75萬(wàn)億38,國(guó)內(nèi)各大科技公司也紛紛推出了自家的大模型產(chǎn)品,AI大模型的競(jìng)賽正在打響。
數(shù)據(jù)、算法、算力三大核心要素是各類(lèi)大模型競(jìng)爭(zhēng)焦點(diǎn),現(xiàn)階段投入商用的大模型參數(shù)量基本在千億級(jí),以百度的“文心一言”為例,其模型參數(shù)量為2,600億。公開(kāi)資料顯示,目前在追趕GPT3.5的中國(guó)團(tuán)隊(duì)約有10個(gè),能夠擁有或持續(xù)獲取算力將是決定未來(lái)競(jìng)爭(zhēng)格局的關(guān)鍵,對(duì)比當(dāng)前國(guó)際頭部大模型團(tuán)隊(duì)1萬(wàn)張H100(約10萬(wàn)A100)的算力規(guī)模來(lái)看,中國(guó)科技公司仍面臨諸多挑戰(zhàn)39。
值得注意的是,AI大模型的真正價(jià)值最終將體現(xiàn)在具體場(chǎng)景中,未來(lái)產(chǎn)業(yè)競(jìng)爭(zhēng)將從“規(guī)模”轉(zhuǎn)向“應(yīng)用”目前大模型訓(xùn)練都在云端實(shí)現(xiàn),所用算力是中心化的,精度要求高且成本高,意味著大模型落地必然會(huì)面臨能耗和性能平衡的難題。
破局之道在于大小模型協(xié)同進(jìn)化,即在利用大參數(shù)訓(xùn)練完大模型之后,通過(guò)高精度壓縮,將大模型轉(zhuǎn)化為端側(cè)可用的小模型,大模型相當(dāng)于超級(jí)大腦,小模型相當(dāng)于垂直領(lǐng)域?qū)<遥餐苿?dòng)AGI落到實(shí)處。而這一過(guò)程中,算力由中心化走向泛在化,由通用化走向智能化,恰恰也是“普慧”算力釋放價(jià)值的過(guò)程。
“普慧”算力作為通用人工智能的核心動(dòng)力,既是幫助科技公司搭建AI模型的“賣(mài)鏟人”,又是檢驗(yàn)算力公司創(chuàng)新能力、制造能力的“試金石”,更是推動(dòng)中國(guó)邁向科技強(qiáng)國(guó)的“加速器”。
在全球算力供給告急的背景下,“普慧”算力正在迎來(lái)規(guī)模化、產(chǎn)業(yè)化發(fā)展機(jī)遇。
“普慧”算力要求安全不容有失,數(shù)據(jù)、算法、算力三位一體
數(shù)據(jù)安全:已上升至國(guó)家立法層面
中國(guó)已將數(shù)據(jù)安全提升至國(guó)家立法的層面,《國(guó)家安全法》《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》及《個(gè)人信息保護(hù)法》等共同構(gòu)筑了數(shù)據(jù)安全保護(hù)的法律法規(guī)框架體系。
推動(dòng)算力發(fā)展過(guò)程中數(shù)據(jù)流動(dòng)和安全發(fā)展的矛盾將逐漸顯現(xiàn),必須嚴(yán)守?cái)?shù)據(jù)安全防線(xiàn),規(guī)避數(shù)據(jù)泄露、數(shù)據(jù)販賣(mài)數(shù)據(jù)濫用等風(fēng)險(xiǎn)。
《全國(guó)一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系算力樞紐實(shí)施方案》強(qiáng)調(diào),“加強(qiáng)對(duì)基礎(chǔ)網(wǎng)絡(luò)、數(shù)據(jù)中心、云平臺(tái)、數(shù)據(jù)和應(yīng)用的一體化安全保障,提高大數(shù)據(jù)安全可靠水平。
具體來(lái)說(shuō),可從數(shù)據(jù)要素全生命周期加強(qiáng)安全防范。在數(shù)據(jù)傳輸流轉(zhuǎn)階段,可以利用區(qū)塊鏈分布式、透明性、可追溯性和不可篡改性等特征,促進(jìn)數(shù)據(jù)流動(dòng)過(guò)程透明化,不斷增強(qiáng)數(shù)據(jù)流動(dòng)的時(shí)效性和安全性。
在數(shù)據(jù)存儲(chǔ)階段,可以不斷提高相關(guān)數(shù)據(jù)設(shè)施的容災(zāi)能力,合理評(píng)估并積極應(yīng)對(duì)不同類(lèi)型、不同級(jí)別數(shù)據(jù)的泄露風(fēng)險(xiǎn);在數(shù)據(jù)訪(fǎng)問(wèn)階段,要加快數(shù)據(jù)清權(quán)確權(quán),建立數(shù)據(jù)權(quán)責(zé)清單,讓各使用主體以規(guī)治數(shù)、按權(quán)用數(shù)、決策循數(shù)。
在數(shù)據(jù)使用、共享階段,要落實(shí)事前可預(yù)防、事中可陽(yáng)斷、事后可溯源的全方位數(shù)據(jù)安全,實(shí)現(xiàn)數(shù)據(jù)“可用不可見(jiàn)”
算法安全:倫理規(guī)范問(wèn)題不可忽視
任何一項(xiàng)新技術(shù)或應(yīng)用的誕生,都必然伴隨著風(fēng)險(xiǎn)和爭(zhēng)議,公開(kāi)資料顯示,ChatGPT已經(jīng)引起美國(guó)、歐盟等關(guān)于人工智能立法的討論,實(shí)際上AI決策難以解釋、不可問(wèn)責(zé)一直是棘手難題,導(dǎo)致了無(wú)人駕駛、手術(shù)機(jī)器人等難以落地,數(shù)字金融欺詐、大數(shù)據(jù)殺熟、牛物特征識(shí)別等更是不斷引發(fā)信任危機(jī)。
隨著ChatGPT等生成式AI走向應(yīng)用,AI在“可解釋性”上面臨的挑戰(zhàn)可能更加嚴(yán)峻,例如,現(xiàn)階段ChatGPT有能力完成各種基于文本的任務(wù),但它不可避免地會(huì)產(chǎn)生-些與事實(shí)不符的內(nèi)容40,原因是ChatGPT在回答問(wèn)題時(shí)只是根據(jù)前一個(gè)單詞“預(yù)測(cè)下一個(gè)單詞”,進(jìn)而生成答案,這一過(guò)程繞不開(kāi)神經(jīng)網(wǎng)絡(luò)運(yùn)行機(jī)理產(chǎn)生的黑箱效應(yīng),運(yùn)行過(guò)程難以解釋部分運(yùn)行結(jié)果的說(shuō)服力也將大打折扣,某種程度上,AI缺乏“可解釋性”帶來(lái)的“不可信”正在阻礙AI大規(guī)模應(yīng)用,也是算力發(fā)展必須克服的難關(guān)。
中國(guó)正在以算法安全可信、高質(zhì)量、創(chuàng)新性發(fā)展為導(dǎo)向,建立健全算法安全治理機(jī)制,構(gòu)建完善算法安全監(jiān)管體系,推進(jìn)算法自主創(chuàng)新,《關(guān)于加強(qiáng)互聯(lián)網(wǎng)信息服務(wù)算法綜合治理的指導(dǎo)意見(jiàn)》《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》等政策文件出臺(tái),中國(guó)開(kāi)始邁向?qū)λ惴ㄟM(jìn)行事前事中全流程、動(dòng)態(tài)規(guī)制與監(jiān)管的“算法法”時(shí)代。
算力安全:戰(zhàn)略地位將進(jìn)一步提高
對(duì)比數(shù)據(jù)安全、算法安全來(lái)看,未來(lái)中國(guó)算力安全的戰(zhàn)略地位有機(jī)會(huì)且有必要進(jìn)一步提升。
在國(guó)家政策層面,算力安全受到的重視程度相對(duì)不足,多以地方政府級(jí)別的政策為主,例如,上海市經(jīng)濟(jì)信息化委發(fā)布了《上海市推進(jìn)算力資源統(tǒng)一調(diào)度指導(dǎo)意見(jiàn)》,提出鼓勵(lì)建設(shè)國(guó)產(chǎn)自主可控、安全可靠的算力基礎(chǔ)設(shè)施和基于國(guó)產(chǎn)自主可控的算力應(yīng)用生態(tài)。
2023年1月,成都發(fā)布全國(guó)首個(gè)算力產(chǎn)業(yè)政策《成都市圍繞超算智算加快算力產(chǎn)業(yè)發(fā)展的政策措施》,直接提出鼓勵(lì)智算中心建設(shè)國(guó)產(chǎn)自主可控、安全可靠的人工智能算力基礎(chǔ)設(shè)施和技術(shù)路線(xiàn)生態(tài),打造全球領(lǐng)先的人工智能計(jì)算平臺(tái)、城市智腦平臺(tái)等,提供普惠算力服務(wù)。
保障算力安全需要國(guó)家從頂層設(shè)計(jì)發(fā)力,推動(dòng)各界共同努力。2022年8月,美國(guó)政府限制英偉達(dá)向中國(guó)出口GPU計(jì)算芯片A100和H100,而高端GPU計(jì)算芯片作為算力核心一旦受限,中國(guó)算力產(chǎn)業(yè)發(fā)展將受到明顯影響。
具體來(lái)說(shuō),高端芯片、數(shù)據(jù)中心、網(wǎng)絡(luò)等基礎(chǔ)設(shè)施是算力產(chǎn)業(yè)可持續(xù)發(fā)展的重要保障,要以核心技術(shù)自主創(chuàng)新為牽引,加快研發(fā)突破,通過(guò)產(chǎn)學(xué)研聯(lián)合攻關(guān)增強(qiáng)算力產(chǎn)業(yè)鏈的穩(wěn)定可控性,不斷提升算力的自主可控水平。
此外,中國(guó)超大型、大型數(shù)據(jù)中心仍有較大發(fā)展空間,需堅(jiān)持適度超前原則,以建代用,盡可能提高算力基礎(chǔ)設(shè)施的承載能力。
“普慧”算力發(fā)展任重道遠(yuǎn)綠色化、場(chǎng)景化、市場(chǎng)化三措并舉
舉措一
算力綠色化關(guān)乎可持續(xù)發(fā)展,吸需提高單位能耗的計(jì)算能力
能量和信息是科技發(fā)展的主線(xiàn),計(jì)算的本質(zhì)是利用能量對(duì)信息進(jìn)行處理加工,信息越多,計(jì)算就越復(fù)雜,需要的能量也越多,當(dāng)能量增長(zhǎng)跟不上近乎無(wú)限擴(kuò)張的信息時(shí),提高能量利用率將成為必然選擇。
從能量和信息轉(zhuǎn)換的角度來(lái)說(shuō),不斷提高單位能耗的計(jì)算能力是算力發(fā)展的重要底層驅(qū)動(dòng)力之一而公開(kāi)資料顯示,目前大約80%的電能消耗只是在維護(hù)計(jì)算機(jī)狀態(tài),只有不到20%的電能消耗在做計(jì)算41。
此外,“雙碳”目標(biāo)背景下,數(shù)據(jù)中心等能耗大戶(hù)帶來(lái)的碳排放問(wèn)題需得到解決,根據(jù)開(kāi)放數(shù)據(jù)中心委員會(huì)測(cè)算,2020年中國(guó)數(shù)據(jù)中心能耗總量為939億千瓦時(shí),碳排放量為6,464萬(wàn)噸,預(yù)計(jì)到2030年,中國(guó)數(shù)據(jù)中心能耗總量將達(dá)到3,800億千瓦時(shí)左右,碳排放增長(zhǎng)率將超過(guò)300%42
因此,算力綠色化不僅符合科技發(fā)展的基本規(guī)律,更關(guān)乎人類(lèi)命運(yùn)共同體前途,已成為全產(chǎn)業(yè)鏈的關(guān)鍵課題。
算力綠色化核心目標(biāo)是提高每瓦功耗所產(chǎn)生的算力,主要發(fā)展思路包括提高綠色能源使用占比、采用創(chuàng)新型制冷技術(shù)降低數(shù)據(jù)中心散熱過(guò)程中能耗、綜合管理IT設(shè)備提高算力利用效率等。
例如,在用能方面,可以提高光伏等新能源系統(tǒng)發(fā)電占比;在降耗方面,可以進(jìn)一步推動(dòng)液冷、溫水水冷取代傳統(tǒng)風(fēng)冷;在提效方面,可以利用服務(wù)器虛擬化等技術(shù)提高設(shè)備使用率。
舉措二
算力場(chǎng)景化面臨知識(shí)壁壘,吸需業(yè)務(wù)、數(shù)據(jù)、算力高效聯(lián)動(dòng)
算力要落地到具體場(chǎng)景中才能真正轉(zhuǎn)化為生產(chǎn)力,而行業(yè)愈是細(xì)分、業(yè)務(wù)愈是復(fù)雜,算力場(chǎng)景化落地面臨的“知識(shí)壁壘”就越高。
例如,大量行業(yè)垂直類(lèi)軟件要求高度凝練總結(jié)行業(yè)經(jīng)驗(yàn)、最佳實(shí)踐等知識(shí),這一知識(shí)軟件化的過(guò)程,經(jīng)常伴隨著非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)占比不斷升高、數(shù)據(jù)負(fù)載從單一負(fù)載轉(zhuǎn)向混合負(fù)載等結(jié)果,會(huì)使得數(shù)據(jù)流通、壓縮存儲(chǔ)、加密解密等對(duì)算力的需求趨向復(fù)雜化和定制化,正倒逼著算力服務(wù)商不斷提高行業(yè)理解力、強(qiáng)化數(shù)據(jù)資產(chǎn)沉淀、提高算力針對(duì)場(chǎng)景化需求的適配度等。
可以預(yù)見(jiàn),隨著各行業(yè)全要素、全流程、全場(chǎng)景邁向數(shù)字化和智能化,數(shù)據(jù)架構(gòu)和業(yè)務(wù)架構(gòu)將不斷向更強(qiáng)大的算力平臺(tái)上遷移,實(shí)現(xiàn)“業(yè)務(wù)、數(shù)據(jù)、算力”之間的高效聯(lián)動(dòng),是保證算力資源按需匹配、精準(zhǔn)賦能的必要前提。
舉措三
算力市場(chǎng)化仍需加強(qiáng),吸需多方共同推動(dòng)算力統(tǒng)一交易
當(dāng)前算力需求增長(zhǎng)確定性高,算力供給規(guī)模相對(duì)有限,通過(guò)市場(chǎng)化交易可以大幅提升算力資源配置效率,是破解算力供需矛盾,推動(dòng)算力產(chǎn)業(yè)生態(tài)進(jìn)入正向循環(huán)的關(guān)鍵。各方仍在積極探索算力交易模式,吸需解決算力歸屬?gòu)?fù)雜、難以度量定價(jià)、區(qū)域發(fā)展不平衡等問(wèn)題。
針對(duì)算力歸屬?gòu)?fù)雜的問(wèn)題,主要原因在于當(dāng)前規(guī)?;懔A(chǔ)設(shè)施大多由多方共建,要求算力建設(shè)方明確劃分算力資源占比,保證算力產(chǎn)權(quán)可溯源;針對(duì)算力難以度量定價(jià)的問(wèn)題,可以提倡由行業(yè)管理部門(mén)和龍頭類(lèi)企業(yè)帶頭建立統(tǒng)一標(biāo)準(zhǔn),為算力定價(jià)提供可靠依據(jù)。
針對(duì)算力區(qū)域發(fā)展不平衡問(wèn)題,在“東數(shù)西算”工程穩(wěn)步推進(jìn)過(guò)程中,各級(jí)地方政府部門(mén)可以結(jié)合區(qū)域算力資源稟賦和市場(chǎng)環(huán)境,“因地制宜”建設(shè)算力基礎(chǔ)設(shè)施,積極融入全國(guó)算力一體化網(wǎng)絡(luò),大力建設(shè)算力供需適配平臺(tái)、算力交易平臺(tái)等,暢通區(qū)域間算力流通、共享、按需分配。