AI大模型通用好還是專用好?專家觀點(diǎn)來了

作為算力供給的重要引擎,人工智能算力基礎(chǔ)設(shè)施在建設(shè)布局等方面迎來“大考”。據(jù)不完全統(tǒng)計(jì),全國有超過30個(gè)城市正在建設(shè)或提出建設(shè)智算中心,基本都是采用“政府主導(dǎo)、企業(yè)承建、聯(lián)合運(yùn)營“的模式。

本文來自微信公眾號(hào)“中國電子報(bào)”,作者/宋婧。

伴隨ChatGPT概念持續(xù)走紅,AI技術(shù)與千行百業(yè)的融合進(jìn)程加速,愈發(fā)多元、復(fù)雜的應(yīng)用場(chǎng)景涌現(xiàn)出來,對(duì)算力服務(wù)提出了更高的要求。在近日舉行的2023中國算力發(fā)展研討會(huì)上,多位業(yè)內(nèi)權(quán)威專家與學(xué)者圍繞ChatGPT下算力的機(jī)遇與挑戰(zhàn),從技術(shù)、生態(tài)等多維度展開深度交流研討,厘清算力產(chǎn)業(yè)的發(fā)展風(fēng)向,并就當(dāng)下人工智能基礎(chǔ)設(shè)施及算力服務(wù)建設(shè)等課題給出應(yīng)對(duì)之策。

算力基礎(chǔ)建設(shè)的關(guān)鍵在于“通專結(jié)合”

作為算力供給的重要引擎,人工智能算力基礎(chǔ)設(shè)施在建設(shè)布局等方面迎來“大考”。據(jù)不完全統(tǒng)計(jì),全國有超過30個(gè)城市正在建設(shè)或提出建設(shè)智算中心,基本都是采用“政府主導(dǎo)、企業(yè)承建、聯(lián)合運(yùn)營“的模式。即由地方財(cái)政統(tǒng)一出資,建成后為各行各業(yè)提供公共算力服務(wù)。在此模式下,智算中心定位于公共服務(wù)設(shè)施,首先要滿足廣泛的應(yīng)用場(chǎng)景,具備普適性,實(shí)現(xiàn)通用。其次,也要能支持部分對(duì)于計(jì)算精度、效率要求高的個(gè)性化應(yīng)用場(chǎng)景,具備高效性,實(shí)現(xiàn)專用。

多位與會(huì)專家指出,“通專”結(jié)合將成為人工智能算力基礎(chǔ)設(shè)施的建設(shè)關(guān)鍵。中科院計(jì)算所研究員張?jiān)迫硎荆珻hatGPT的出現(xiàn)首次實(shí)現(xiàn)了認(rèn)知智能的智慧涌現(xiàn),同時(shí)也讓算力產(chǎn)業(yè)面臨需求上升、多樣化發(fā)展、能耗問題凸顯、使用門檻過高等新挑戰(zhàn)。人工智能算力基礎(chǔ)設(shè)施在變局中求發(fā)展,算力融合、要素協(xié)同、生態(tài)協(xié)作是關(guān)鍵。

360截圖16251112669372.png

科學(xué)計(jì)算最重要的是要提高可信度,人工智能同樣如此。北京應(yīng)用物理與計(jì)算數(shù)學(xué)研究所研究員袁國興指出,要讓模型更可信就得不斷提高模型精度?,F(xiàn)在為了提高精度,模型越來越大,也越來越復(fù)雜,數(shù)據(jù)增量也越來越大。然而超出一定范圍之后,打造一個(gè)通用模型的代價(jià)太高,這就需要通過專用模型來解決問題,所以還是應(yīng)該分類來研究這個(gè)問題。

中國科學(xué)院院士陳潤生建議稱,用大模型學(xué)術(shù)基礎(chǔ)構(gòu)架專業(yè)模型,既能達(dá)到高精度又能實(shí)現(xiàn)小能耗。他認(rèn)為,人工智能算力服務(wù)要有布局也要有分工,不要一擁而上,也不要半途而廢,要避免資源浪費(fèi)。

中國科學(xué)院院士錢徳沛表示,通用還是專用的問題,不止出現(xiàn)在大模型領(lǐng)域,其實(shí)從計(jì)算開始的時(shí)候就一直存在。異構(gòu)是一個(gè)趨勢(shì),不同的事情要用不同的高效工具來做。然而,在現(xiàn)代工業(yè)化體系下,要考慮成本,性能高了,能耗少了,但是設(shè)計(jì)成本、制造成本太高,也不行。要折中,既要達(dá)到高的性能,低的運(yùn)營成本,又要有低的設(shè)計(jì)成本、制造成本,使得全系統(tǒng)成本是低的。在設(shè)計(jì)成本和制造成本容忍的情況下,應(yīng)該盡可能地用更高效的異構(gòu)結(jié)構(gòu)和部件來支持不同的計(jì)算。

中國工程院院士廖湘科認(rèn)為,通用模型可以服務(wù)各行各業(yè),我們需要可以對(duì)標(biāo)ChatGPT的通用大模型,而各行各業(yè)可以根據(jù)行業(yè)實(shí)際需求在通用大模型的基礎(chǔ)上進(jìn)行微調(diào)和推理,定制行業(yè)的專用模型。

專家們認(rèn)為,一方面,人工智能算力基礎(chǔ)設(shè)施應(yīng)具備全精度算力,成為一個(gè)算力“通才”,讓用戶可以根據(jù)AI for Science、AI for industries等實(shí)際應(yīng)用場(chǎng)景調(diào)配算力資源,包括通用算力、專用算力,乃至高性能的算力,來支持自身業(yè)務(wù)的發(fā)展。另一方面,“通專結(jié)合”的人工智能算力基礎(chǔ)設(shè)施是一套綜合性方案,更考驗(yàn)底層架構(gòu)的開放性。既需要不同技術(shù)路線的百花齊放,也需要殊途同歸的適配兼容,以便形成包羅萬象的整體架構(gòu),在降低應(yīng)用遷移門檻的同時(shí),也帶動(dòng)產(chǎn)業(yè)生態(tài)的發(fā)展。

算力網(wǎng)絡(luò)要連接資源更要連接生態(tài)

算力網(wǎng)絡(luò)的發(fā)展也成為當(dāng)下備受矚目的話題。大模型熱潮帶來了龐大的算力需求,導(dǎo)致行業(yè)與區(qū)域算力分布不均問題日益凸顯。對(duì)于算力網(wǎng)絡(luò)建設(shè)而言,將遍布全國的各類型計(jì)算中心統(tǒng)一管理調(diào)度,實(shí)現(xiàn)對(duì)算力、存儲(chǔ)、網(wǎng)絡(luò)以及數(shù)據(jù)等分布資源的整合,只是初級(jí)階段。更重要的建設(shè)環(huán)節(jié),在于整個(gè)產(chǎn)業(yè)生態(tài)的深層連接,即連接人、連接應(yīng)用和服務(wù)。

360截圖16251112669372.png

中國工程院院士鄭緯民坦言:“國內(nèi)很多機(jī)構(gòu)、企業(yè)都在做大模型,每個(gè)參與方都需要有很大的算力支撐,這有可能會(huì)造成算力資源的浪費(fèi),可以合起來組成一個(gè)大的算力,做模型來共享,并讓這個(gè)模型成為新型基礎(chǔ)設(shè)施,但實(shí)現(xiàn)這個(gè)目標(biāo)還有很多問題有待解決,比如怎么才能把不同的模型連接起來,怎么實(shí)現(xiàn)傳輸,怎樣才能既滿足對(duì)算力的要求,又能比較節(jié)省成本。”

“在算力互聯(lián)方面,中國目前有智算網(wǎng)絡(luò)、超算互聯(lián)等不同的方案。其中,超算互聯(lián)網(wǎng)就是以互聯(lián)網(wǎng)的思維運(yùn)營超算中心,并連接產(chǎn)業(yè)生態(tài)中的算力供給、應(yīng)用開發(fā)、運(yùn)營服務(wù)、用戶等各方能力和資源,構(gòu)建一體化超算算力網(wǎng)絡(luò)和服務(wù)平臺(tái)。在算力網(wǎng)絡(luò)建設(shè)大潮當(dāng)中,中國最后走哪條路,怎么把我們國家算力資源連起來,調(diào)度起來用好,發(fā)揮作用,降低它的門檻,都是需要我們研討的話題。”張?jiān)迫f道。

超算互聯(lián)網(wǎng)作為算力網(wǎng)絡(luò)的重要形態(tài),從實(shí)踐層面詮釋了算力網(wǎng)絡(luò)的建設(shè)本質(zhì)。首先是狹義的互聯(lián),即在物理層面,連接不同體系架構(gòu)的算力中心,構(gòu)建可以統(tǒng)一使用、對(duì)外服務(wù)的基礎(chǔ)設(shè)施,實(shí)現(xiàn)資源的調(diào)度、共享。其次是廣義的互聯(lián),即在生態(tài)層面,以互聯(lián)網(wǎng)的思維運(yùn)營超算中心,基于計(jì)算、軟件、應(yīng)用解決方案等資源進(jìn)行深度整合,建立一個(gè)以應(yīng)用服務(wù)為主導(dǎo)的創(chuàng)新型平臺(tái),并通過市場(chǎng)化的運(yùn)營和服務(wù)體系,緊密鏈接上下游,使供需方快速對(duì)接,快速找到各自需要的資源。

“從超算互聯(lián)網(wǎng)的角度,我們期望不僅是把機(jī)器相聯(lián),還是希望把人、設(shè)備、應(yīng)用都聯(lián)起來,核心還是做超算平臺(tái),要讓超算、智算都變得好用。”國家高性能計(jì)算機(jī)工程技術(shù)研究中心副主任曹振南表示。

通過物理及生態(tài)層面的雙重互聯(lián),算力網(wǎng)絡(luò)可進(jìn)一步使能算力服務(wù),合理配置、融合、釋放算力,降低應(yīng)用門檻。讓算力資源從高不可攀的技術(shù)變成普適普惠的服務(wù),支撐國家重大的科研項(xiàng)目、社會(huì)民生以及千行百業(yè)的發(fā)展。

曹振南認(rèn)為,目前無論是超算、智算,在服務(wù)過程中面臨的瓶頸和問題仍然非常多,其中最難的還是應(yīng)用問題。他建議要加強(qiáng)軟硬件協(xié)同發(fā)展,重視算力網(wǎng)絡(luò)的生態(tài)建設(shè)。

國家信息中心信息化和產(chǎn)業(yè)發(fā)展部主任單志廣表示,目前來看,算法和模型是未來有機(jī)會(huì)發(fā)力的地方。ChatGPT是采用集中式的算力來推動(dòng),未來我們或許可以換一條路,比如走下一代分布式路線,可以通過更先進(jìn)的互聯(lián)技術(shù)將國內(nèi)的一些算力基礎(chǔ)設(shè)施更好的連接起來,挖掘更強(qiáng)的計(jì)算能力。

“我們還是要從基本的計(jì)算模式演化規(guī)律和人工智能的發(fā)展規(guī)律上,去做基礎(chǔ)性的探討,避免一哄而上或者現(xiàn)象級(jí)跟風(fēng),否則就只能永遠(yuǎn)跟在別人后面跑,要知道計(jì)算機(jī)領(lǐng)域是隔代競(jìng)爭(zhēng),是越追越遠(yuǎn)的。”單志廣說道。

“我認(rèn)為通用的概念正在發(fā)生變化。”清華大學(xué)教授陳文光表示,人工智能計(jì)算形態(tài)在整個(gè)數(shù)據(jù)中心中占的比例會(huì)越來越大。不過現(xiàn)階段AI算力中心仍處于非常初期的發(fā)展階段,在這個(gè)階段還是應(yīng)該鼓勵(lì)多方探索。

中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心研究員陸忠華表示,隨著AI的發(fā)展,AI服務(wù)的算力需求越來越多了,而且趨勢(shì)是不可阻擋的,我們應(yīng)該去迎接這個(gè)趨勢(shì)。如何滿足大家日益增長的算力需求,在5—8年的時(shí)間里,應(yīng)該努力用好已經(jīng)建設(shè)的超算中心、智算中心,使得已經(jīng)投入建好的中心資源不要浪費(fèi)??梢月氏葒L試在某些領(lǐng)域開展大模型應(yīng)用,鼓勵(lì)生態(tài)建設(shè)。另外,構(gòu)建人工智能基礎(chǔ)設(shè)施體系,不應(yīng)過分強(qiáng)調(diào)一體化布局,還是應(yīng)該在國家政策指導(dǎo)下支持百花齊放,把剩下的交給市場(chǎng)。

中國智能計(jì)算產(chǎn)業(yè)聯(lián)盟秘書長安靜表示,新算力時(shí)代已經(jīng)到來,算力將是未來拉動(dòng)數(shù)字經(jīng)濟(jì)向前發(fā)展的新動(dòng)能,新引擎。與此同時(shí),算力正在成為影響國家綜合治理和國際話語權(quán)的關(guān)鍵要素,國與國的核心競(jìng)爭(zhēng)力正在聚焦于以計(jì)算速度、計(jì)算方法、通信能力、存儲(chǔ)能力為代表的算力,未來誰能掌握先進(jìn)的算力,誰就能掌握發(fā)展的主動(dòng)權(quán)。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論