大模型之難!3年后,數(shù)據(jù)可能會(huì)耗盡?

陳根
專(zhuān)業(yè)小模型具有比通用大模型更快的實(shí)現(xiàn)商業(yè)變現(xiàn)與行業(yè)變革的能力。

本文來(lái)自微信公眾號(hào)“陳述根本”,作者/陳根。

專(zhuān)業(yè)小模型具有比通用大模型更快的實(shí)現(xiàn)商業(yè)變現(xiàn)與行業(yè)變革的能力。

研究機(jī)構(gòu)Epoch AI認(rèn)為,對(duì)數(shù)據(jù)需求急劇增加,以至于可用于訓(xùn)練的高質(zhì)量文本可能會(huì)在2026年耗盡。

大模型的核心三要素就是算法、算力與數(shù)據(jù),而決定著大模型智商水平的核心就是數(shù)據(jù),數(shù)據(jù)就如同人類(lèi)的知識(shí)教育輸入一樣,輸入高質(zhì)量的知識(shí),相對(duì)而言就能產(chǎn)出高質(zhì)量的認(rèn)知。

而大模型對(duì)于數(shù)據(jù)的學(xué)習(xí)能力則取決于算力,當(dāng)算力不斷提升的情況下,就意味著大模型學(xué)習(xí)人類(lèi)數(shù)據(jù)的能力越來(lái)越快,而人類(lèi)社會(huì)所產(chǎn)出高質(zhì)量數(shù)據(jù)的能力將遠(yuǎn)落后于大模型的學(xué)習(xí)能力。

1.png

那么根據(jù)算力演變,以及人類(lèi)社會(huì)產(chǎn)生數(shù)據(jù)能力的模型推算,訓(xùn)練大模型的數(shù)據(jù)將在2026年耗盡這是完全可能,甚至在很多領(lǐng)域會(huì)更快的被耗盡。

因此,從這個(gè)層面來(lái)看,掌握著產(chǎn)業(yè)核心數(shù)據(jù)的公司將是接下來(lái)重點(diǎn)需要關(guān)注的領(lǐng)域。這也正是我一直所說(shuō)的,要關(guān)注行業(yè)垂直領(lǐng)域,擁有著核心數(shù)據(jù)的公司,這些公司在疊加了AI技術(shù)之后,將很快訓(xùn)練出行業(yè)垂直性的專(zhuān)業(yè)小模型。

而從商業(yè)落地價(jià)值實(shí)現(xiàn)的層面來(lái)看,專(zhuān)業(yè)小模型比通用大模型更快的實(shí)現(xiàn)商業(yè)變現(xiàn)與行業(yè)變革的能力。同樣,這也讓我們看到,沒(méi)有掌握核心數(shù)據(jù)的公司,不論是談?wù)摯竽P?,或是談?wù)撔∧P?,本質(zhì)上都只是炒作。因?yàn)闆](méi)有數(shù)據(jù),就不可能訓(xùn)練出相應(yīng)的模型。

THEEND

最新評(píng)論(評(píng)論僅代表用戶(hù)觀點(diǎn))

更多
暫無(wú)評(píng)論