報(bào)告丨甲子光年:2024人工智能開源大模型生態(tài)研究

方文三
當(dāng)下正處于第四階段,這一階段從2020年開始,代表性事件是GPT-3的發(fā)布,突破了以往模型在自然語(yǔ)言處理領(lǐng)域的限制,為語(yǔ)言模型的進(jìn)一步發(fā)展提供了強(qiáng)有力的基礎(chǔ),也為實(shí)現(xiàn)智能化的語(yǔ)言交互和人機(jī)對(duì)話打開了全新的可能性,是人工智能發(fā)展的一個(gè)關(guān)鍵節(jié)點(diǎn)。

本文來(lái)自微信公眾號(hào)“AI芯天下”,作者/方文三。

大模型的發(fā)展開啟了AIGC時(shí)代,沒(méi)有大模型的AI已經(jīng)是上一代的AI,缺乏競(jìng)爭(zhēng)力的AI;

技術(shù)是AI每次革命性發(fā)展的起點(diǎn),商業(yè)應(yīng)用是發(fā)展的加速器,AI的持久發(fā)展看商業(yè)落地。

人工智能技術(shù)進(jìn)化出七大核心能力,實(shí)現(xiàn)從“解放四肢”到“解放大腦”的升級(jí)。

第一階段AI以邏輯推理為主,AI能力主要聚焦決策和認(rèn)知;

第二階段AI注重概率統(tǒng)計(jì)的建模、學(xué)習(xí)和計(jì)算,AI能力開始聚焦感知、認(rèn)知和決策;

第三階段AI聚焦學(xué)習(xí)環(huán)節(jié),注重大模型的建設(shè),AI能力覆蓋學(xué)習(xí)和執(zhí)行;

第四階段則聚焦執(zhí)行與社會(huì)協(xié)作環(huán)節(jié),開始注重人機(jī)交互協(xié)作,注重人類對(duì)人工智能的反饋訓(xùn)練。

當(dāng)下正處于第四階段,這一階段從2020年開始,代表性事件是GPT-3的發(fā)布,突破了以往模型在自然語(yǔ)言處理領(lǐng)域的限制,為語(yǔ)言模型的進(jìn)一步發(fā)展提供了強(qiáng)有力的基礎(chǔ),也為實(shí)現(xiàn)智能化的語(yǔ)言交互和人機(jī)對(duì)話打開了全新的可能性,是人工智能發(fā)展的一個(gè)關(guān)鍵節(jié)點(diǎn)。

鵬程·盤古模型是全球首個(gè)全開源2000億參數(shù)的自回歸中文預(yù)訓(xùn)練語(yǔ)言大模型,在知識(shí)問(wèn)答、知識(shí)檢索、知識(shí)推理、閱讀理解等文本生成領(lǐng)域表現(xiàn)突出。

文心大模型ERNIE是百度發(fā)布的產(chǎn)業(yè)級(jí)知識(shí)增強(qiáng)大模型,涵蓋了NLP大模型和跨模態(tài)大模型。2019年3月,百度開源了國(guó)內(nèi)首個(gè)開源預(yù)訓(xùn)練模型文心ERNIE 1.0,此后在語(yǔ)言與跨模態(tài)的理解和生成等領(lǐng)域取得一系列技術(shù)突破,并對(duì)外開源與開放了系列模型,助力大模型研究與產(chǎn)業(yè)化應(yīng)用發(fā)展。

通義千問(wèn)的大語(yǔ)言模型已經(jīng)實(shí)現(xiàn)全尺寸開源——包括18億、70億、140億、720億7個(gè)參數(shù),不同規(guī)模和尺寸的模型,可拓寬應(yīng)用場(chǎng)景。

針對(duì)大模型技術(shù),國(guó)內(nèi)企業(yè)與歐美國(guó)家存在差距,主要體現(xiàn)在底層架構(gòu)設(shè)計(jì)和硬件技術(shù)方面。在底層架構(gòu)設(shè)計(jì)方面,國(guó)內(nèi)尚無(wú)類似的底層架構(gòu),大模型的預(yù)訓(xùn)練方面只能“在別人的地基上蓋房子”。

在硬件技術(shù)方面,美國(guó)占據(jù)絕對(duì)領(lǐng)先地位,我國(guó)自研能力不足,對(duì)美國(guó)進(jìn)口依賴程度高,存在“卡脖子”風(fēng)險(xiǎn)。

以下是《2024人工智能開源大模型生態(tài)研究》部分內(nèi)容:

640 (1).png

640 (1).png

640 (1).png

640 (1).png

640 (1).png

640 (1).png

640 (1).png

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論