“百模大戰(zhàn)”下半場(chǎng)開打,平臺(tái)將成關(guān)鍵

張申宇
如果說,各大廠商紛紛推出大模型產(chǎn)品形成“百模大戰(zhàn)”的局勢(shì),是大模型這場(chǎng)“戰(zhàn)役”的上半場(chǎng)的話,那么這場(chǎng)“戰(zhàn)役”的下半場(chǎng)將更聚焦在大模型產(chǎn)品的整合能力,以及平臺(tái)化、行業(yè)化的發(fā)展方向。

本文來自鈦媒體,作者/張申宇。

離大模型走進(jìn)人們的視野已經(jīng)過去近一年的時(shí)間,在AI大模型的浪潮下,各大科技企業(yè)爭(zhēng)先恐后的推出了各自的大模型產(chǎn)品。與此同時(shí),各行業(yè)企業(yè)也對(duì)大模型保持著高度關(guān)注。

如果說,各大廠商紛紛推出大模型產(chǎn)品形成“百模大戰(zhàn)”的局勢(shì),是大模型這場(chǎng)“戰(zhàn)役”的上半場(chǎng)的話,那么這場(chǎng)“戰(zhàn)役”的下半場(chǎng)將更聚焦在大模型產(chǎn)品的整合能力,以及平臺(tái)化、行業(yè)化的發(fā)展方向。

下半場(chǎng)開打,平臺(tái)化、行業(yè)化將成關(guān)鍵賽道

從大模型這一年的發(fā)展可以看出,目前各個(gè)廠商的大模型幾乎是“各自為戰(zhàn)”,都通過自身的產(chǎn)品意圖搶占更多的市場(chǎng),以大模型“鼻祖”ChatGPT為例,ChatGPT是個(gè)應(yīng)用,可以看作一個(gè)APP,而GPT4則是個(gè)大模型,構(gòu)建了類似大模型的生態(tài),讓企業(yè)可以以此為基礎(chǔ),打造自身的大模型。

從上述案例可以看出,過去近一年的時(shí)間,各家都將主要精力放在類似“ChatGPT”的產(chǎn)品打磨上,落地點(diǎn)在應(yīng)用側(cè),而對(duì)于企業(yè)側(cè)而言,目前行業(yè)還是較缺乏一個(gè)平臺(tái),讓企業(yè)可以靈活調(diào)用各家大模型產(chǎn)品,或者基于某家的產(chǎn)品開放針對(duì)自身需求的大模型。在神州數(shù)碼副總裁CTO李剛看來,大模型如果想要在企業(yè)側(cè)實(shí)現(xiàn)應(yīng)用的爆發(fā),需要一個(gè),甚至多個(gè)開源、開放的大模型平臺(tái)。

說到企業(yè)級(jí)大模型應(yīng)用,就不得不提一提行業(yè)大模型,鈦媒體觀察發(fā)現(xiàn),目前行業(yè)級(jí)大模型還處于發(fā)展的初級(jí)階段,雖然有很多家企業(yè)推出了行業(yè)大模型,但是應(yīng)用并不很好。

以發(fā)展較快的金融行業(yè)為例,今年3月,彭博首度針對(duì)金融業(yè)推出大型語言模型BloombergGPT,引發(fā)市場(chǎng)對(duì)金融垂直領(lǐng)域大模型的關(guān)注;6月,哥倫比亞大學(xué)聯(lián)合上海紐約大學(xué)推出FinGPT。

在國內(nèi),7月,華為全新發(fā)布盤古大模型,金融行業(yè)大模型正是其中數(shù)個(gè)行業(yè)通用大模型之一;9月,螞蟻集團(tuán)正式發(fā)布自研“螞蟻基礎(chǔ)大模型”,以及在此基礎(chǔ)上進(jìn)行定制的“螞蟻金融大模型”。

李剛對(duì)鈦媒體表示,目前市面上的大模型種類主要分為幾類,一類是通用的基礎(chǔ)大模型,一般來說,這些大模型通過自然語言的語料構(gòu)建數(shù)據(jù)庫,經(jīng)過清洗、訓(xùn)練等操作,打造了基礎(chǔ)大模型,“這類模型,語料庫越大、參數(shù)量越大,能力就越強(qiáng)。”李剛表示。

另一類就是行業(yè)大模型,這類模型具有極強(qiáng)的專業(yè)性,需要大量行業(yè)專業(yè)知識(shí)庫,“目前,這個(gè)行業(yè)知識(shí)庫的語料需控制在20%,不多不少。”李剛強(qiáng)調(diào),“超過20%,訓(xùn)練出來的大模型可能就‘不會(huì)說人話’,造成溝通障礙;少于20%,又不具備行業(yè)的專業(yè)性。”

打造大模型的“PaaS”層

就像云計(jì)算有IaaS、PaaS、SaaS之分一樣,在神州數(shù)碼戰(zhàn)略營(yíng)銷部總經(jīng)理皇甫子喬看來,大模型時(shí)代,企業(yè)也需要一個(gè)類似云時(shí)代PaaS平臺(tái)。

為了給企業(yè)構(gòu)建一個(gè)更好使用大模型的平臺(tái),神州數(shù)碼近日正式發(fā)布了神州問學(xué)平臺(tái),談及平臺(tái)發(fā)布的意義時(shí),李剛對(duì)鈦媒體表示:“以神州問學(xué)平臺(tái)為核心,我們不做基礎(chǔ)大模型,而是做大模型的集成與應(yīng)用開發(fā)交付平臺(tái),從而加速企業(yè)AI創(chuàng)新;我們做大數(shù)據(jù)的服務(wù)伙伴,從而加速企業(yè)數(shù)據(jù)治理升級(jí);我們做生態(tài)紐帶、模型市場(chǎng)、數(shù)據(jù)集市、應(yīng)用商店,從而加速產(chǎn)業(yè)創(chuàng)新與生態(tài)破局。”

今年初,華為云發(fā)布了盤古大模型,并將大模型按照L0、L1、L2進(jìn)行了分級(jí)。按照華為云的分類,L0指基礎(chǔ)大模型,L1指行業(yè)大模型,L2則是指面向更加細(xì)分場(chǎng)景的推理模型。

基礎(chǔ)大模型方面,以圖網(wǎng)絡(luò)大模型為例,一個(gè)大模型可以適配工藝優(yōu)化、時(shí)序預(yù)測(cè)、智能分析等多個(gè)場(chǎng)景,同時(shí)應(yīng)用在金融、煤礦、制造等多個(gè)行業(yè)。

行業(yè)大模型方面,華為云推出了如盤古金融大模型、盤古礦山大模型、盤古電力大模型、盤古制造質(zhì)檢大模型、盤古藥物分子大模型等行業(yè)大模型。

推理模型方面,以在電力行業(yè)為例,華為云基于盤古電力大模型,針對(duì)無人機(jī)電力巡檢細(xì)分場(chǎng)景,通過一次預(yù)訓(xùn)練+下游任務(wù)的微調(diào),推出盤古電力巡檢大模型,解決了無人機(jī)智能巡檢系統(tǒng)(缺陷檢測(cè))中的小樣本學(xué)習(xí)、主動(dòng)學(xué)習(xí)、增量學(xué)習(xí)等問題,解決了海量數(shù)據(jù)標(biāo)注工作量大和缺陷種類繁多的問題。

上述是華為云對(duì)于大模型的理解,以及華為云的一些產(chǎn)業(yè)布局?;诖?,皇甫子喬對(duì)鈦媒體表示,神州數(shù)碼問學(xué)平臺(tái)在幫助企業(yè)從L0到L2行業(yè)應(yīng)用場(chǎng)景落地過的程中,將起到“轉(zhuǎn)換器”的作用,“為企業(yè)提供一個(gè)類似云計(jì)算時(shí)代PaaS平臺(tái)的能力。”皇甫子喬如是說。

無獨(dú)有偶,百度CTO王海峰也曾公開表示,面對(duì)大模型產(chǎn)業(yè)化的挑戰(zhàn),行業(yè)需要類似芯片代工廠模式,采用“集約化生產(chǎn),平臺(tái)化應(yīng)用”的模式,即具有算法、算力和數(shù)據(jù)綜合優(yōu)勢(shì)的企業(yè)將模型生產(chǎn)的復(fù)雜過程封裝起來,通過低門檻、高效率的生產(chǎn)平臺(tái),為千行百業(yè)提供大模型服務(wù)。

據(jù)鈦媒體了解,目前,這一產(chǎn)業(yè)化路徑已在文心大模型產(chǎn)業(yè)實(shí)踐中得到驗(yàn)證,百度與各行業(yè)頭部企業(yè)、機(jī)構(gòu)共建了包括能源、金融、航天、制造、傳媒、城市、社科以及影視等行業(yè)大模型。

更低成本、更低門檻是目標(biāo)

雖然大模型已經(jīng)逐漸向各行各業(yè)滲透,但就現(xiàn)階段大模型發(fā)展來看,對(duì)于企業(yè)級(jí)用戶而言,大模型的使用成本依然讓很多企業(yè)望而卻步。

以GPT-3為例,英偉達(dá)曾披露訓(xùn)練一次1750億參數(shù)的GPT-3需要34天,使用1024張A100 GPU芯片,單次訓(xùn)練成本高達(dá)1200萬美元。為了訓(xùn)練超大規(guī)模的AI模型,微軟甚至為OpenAI構(gòu)建的一臺(tái)排名世界前五的超級(jí)計(jì)算機(jī)。

與此同時(shí),據(jù)國盛證券《ChatGPT需要多少算力》報(bào)告估算,大模型的前期訓(xùn)練成本很高,一次訓(xùn)練的成本超過百萬美元。這個(gè)費(fèi)用不僅涵蓋了模型的架構(gòu)、算法和訓(xùn)練數(shù)據(jù)的選擇,還包括了模型訓(xùn)練所需要的大量計(jì)算資源和時(shí)間成本。而且隨著大模型版本的升級(jí),其訓(xùn)練成本也呈幾何式增長(zhǎng)。

百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏也曾指出:“無論是哪家公司,都不可能靠突擊幾個(gè)月就能做出這樣的大語言模型。深度學(xué)習(xí)、自然語言處理,需要多年的堅(jiān)持和積累,沒法速成。”

面對(duì)如此高額的大模型使用成本和使用門檻,是一般企業(yè)承擔(dān)不起的,也正是如此,目前為止,還沒有一個(gè)真正意義上完善落地的行業(yè)大模型產(chǎn)品面世。對(duì)此,皇甫子喬表示,大模型的使用成本是很多企業(yè)應(yīng)用大模型賦能業(yè)務(wù)的最大阻礙,而神州問學(xué)平臺(tái)的定位就是希望通過開源的形式,讓企業(yè)以更低的選擇成本,使用大模型產(chǎn)品。“神州問學(xué)主要包含兩個(gè)部分,一部分是平臺(tái),另一部分是開箱即用的場(chǎng)景應(yīng)用。”皇甫子喬對(duì)鈦媒體表示,“這兩部分一方面希望集合更多生態(tài)伙伴,共同賦能用戶;另一方面,希望企業(yè)可以更快、更便捷的使用大模型產(chǎn)品。”

將大模型的使用成本和使用門檻降低是行業(yè)內(nèi)的共識(shí),無論是“一卡難求”的GPU,還是高額的電費(fèi),都是現(xiàn)階段企業(yè)應(yīng)用大模型的門檻,而諸如神州問學(xué)、百度千帆、昆侖萬維等,“風(fēng)格迥異”,卻目標(biāo)相同——“助力大模型落地”的平臺(tái)級(jí)產(chǎn)品的涌現(xiàn),以及大模型生態(tài)中合作伙伴的不斷增加,企業(yè)應(yīng)用大模型的門檻和成本必將進(jìn)一步的降低,我們離行業(yè)大模型的普惠也將越來越近。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論