虛擬動點CEO劉耀東:憑動作大模型勇闖AIGC新藍(lán)海

盧夢琪
在通用大模型遍地開花的當(dāng)下,業(yè)內(nèi)達(dá)成共識,大模型落地成功的產(chǎn)業(yè)主要有兩類,一個是設(shè)計、文娛、游戲等創(chuàng)造型產(chǎn)業(yè),另一個是金融、醫(yī)療、法律等高知識密集型行業(yè)。

本文來自微信公眾號“中國電子報”,作者/盧夢琪。

身軀長二丈,面如青靛,發(fā)似朱砂,眼睛暴湛,牙齒橫生……電影《封神》中雷震子的造型令人嘆為觀止。為演繹好這一數(shù)字角色,空間計算動作捕捉技術(shù)派上了大用場,不僅1:1還原真實人形態(tài),動作、神情無一不栩栩如生,惟妙惟肖。

這離不開利亞德·虛擬動點基于AI的空間計算技術(shù)的賦能。在AIGC(生成式人工智能)大幅提升行業(yè)生產(chǎn)效率的當(dāng)下,利亞德·虛擬動點向前再進一步,入局AI大模型,發(fā)布自研LYDIA專業(yè)能力動作大模型。利亞德集團副總裁、CMO,虛擬動點CEO劉耀東在接受《中國電子報》記者專訪時表示,LYDIA已經(jīng)形成了對空間動作數(shù)據(jù)的“認(rèn)知、感知、預(yù)測、生成”等核心能力,在空間計算、動作生成領(lǐng)域率先探索了AIGC的新模式,在影視創(chuàng)作、動畫游戲制作等領(lǐng)域?qū)⒋笥锌蔀椤?/p>

640 (1).png

手握“數(shù)據(jù)資本”入局大模型

從PGC、UGC到AIGC,內(nèi)容產(chǎn)業(yè)經(jīng)歷了一輪又一輪生產(chǎn)力變革。由PGC演進到UGC,雖然犧牲了一定的專業(yè)水平,但大幅提升了生產(chǎn)效率。而AIGC則同時解決了內(nèi)容生產(chǎn)的質(zhì)量和提升生產(chǎn)效率兩大難題。

從需求角度來看,元宇宙、空間計算概念火熱,內(nèi)容產(chǎn)業(yè)已經(jīng)處于需求爆發(fā)的節(jié)點,需要高頻次產(chǎn)出大量符合標(biāo)準(zhǔn)的內(nèi)容。AI大模型時代已經(jīng)到來,其背后是算法、算力、數(shù)據(jù)的綜合比拼。算法、算力可以通過人的訓(xùn)練、擴展數(shù)據(jù)中心得到解決,而數(shù)據(jù)資源則需要一分為二看待。互聯(lián)網(wǎng)上的圖片、文字浩如煙海,但三維空間數(shù)據(jù)卻十分稀缺。

劉耀東表示:“AI時代研發(fā)大模型的瓶頸不再是算法的開發(fā),而是數(shù)據(jù)的積累。多年來,利亞德·虛擬動點在空間計算和動作捕捉領(lǐng)域積累了大量的動作數(shù)據(jù),這是利亞德·虛擬動點能開發(fā)出動作大模型的核心原因。”

記者了解到,LYDIA動作大模型的參數(shù)包括基礎(chǔ)數(shù)據(jù)參數(shù)和核心動作數(shù)據(jù)參數(shù)兩個部分。在基礎(chǔ)數(shù)據(jù)參數(shù)方面,LYDIA參考了當(dāng)今主流的大模型數(shù)據(jù)集,在訓(xùn)練模型對于自然語言理解的過程中達(dá)到了百億級的規(guī)模;在核心動作數(shù)據(jù)參數(shù)方面,擁有多年optitrack光學(xué)動捕的數(shù)據(jù)積累、無標(biāo)記點動捕的數(shù)據(jù)沉淀,以及互聯(lián)網(wǎng)公開視頻中的動作數(shù)據(jù)提煉能力。憑借三種動作數(shù)據(jù)的積累,利亞德·虛擬動點對LYDIA大模型成功進行了動作數(shù)據(jù)的認(rèn)知訓(xùn)練。

“比起動輒花費巨資購買大量數(shù)據(jù)訓(xùn)練的大模型而言,利亞德·虛擬動點深耕空間計算、動作捕捉技術(shù)多年,擁有動作數(shù)據(jù)資源優(yōu)勢,希望能把這些數(shù)據(jù)沉淀出來,用數(shù)據(jù)加速整個空間計算產(chǎn)業(yè)的發(fā)展,可持續(xù)性地精進動作大模型。”劉耀東表示。

專注場景推動商業(yè)化應(yīng)用

輸入“蹲起、向前走并轉(zhuǎn)身”等一個或多個指令,LYDIA大模型就可以連續(xù)生成一個簡單動作、一組復(fù)雜動作以及一系列特征型動作,并完成主流渲染引擎平臺數(shù)據(jù)的打通與調(diào)用。

在2023年底舉行的發(fā)布會上,記者親眼見證了LYDIA大模型對于動作數(shù)據(jù)文件的認(rèn)知理解與描述能力。業(yè)內(nèi)專家對此的評價是,如果一些影視機構(gòu)的專業(yè)創(chuàng)作,或是個人博主的內(nèi)容創(chuàng)作中用到此模型,將如魚得水。

在通用大模型遍地開花的當(dāng)下,業(yè)內(nèi)達(dá)成共識,大模型落地成功的產(chǎn)業(yè)主要有兩類,一個是設(shè)計、文娛、游戲等創(chuàng)造型產(chǎn)業(yè),另一個是金融、醫(yī)療、法律等高知識密集型行業(yè)。

談及利亞德·虛擬動點開發(fā)動作大模型之初的整體設(shè)計和規(guī)劃,劉耀東表示:“我們確實在大模型的定位上做了許多思考。LYDIA是目前全球范圍為數(shù)不多真正實現(xiàn)動作生成的大模型,就是奔著解決某些場景去的,比如影視創(chuàng)作、游戲開發(fā)等。”

區(qū)別于其他通用大模型,LYDIA動作大模型是專業(yè)能力大模型,與前者的能力特點和應(yīng)用領(lǐng)域都不盡相同,但又互為能力補充,實現(xiàn)了場景補齊。LYDIA可實現(xiàn)對空間計算領(lǐng)域動作數(shù)據(jù)的認(rèn)知理解,從而進行高效的動作生成,聚焦對于動作數(shù)據(jù)獲取效率更為看重的行業(yè)場景,比如影視、電商、動畫制作、游戲。同時,LYDIA還支持其他軟件平臺打通和調(diào)用,使其生成的動作文件可以被生態(tài)伙伴用于商業(yè)化。

640 (1).png

目前來看,LYDIA動作大模型的生態(tài)合作圈“朋友遍天下”,不僅吸引了許多頭部云廠商,還包括大量通用模型類廠商和應(yīng)用類廠商。

據(jù)劉耀東介紹,未來利亞德·虛擬動點探索的合作方向之一是如何將LYDIA大模型與通用大模型平臺進行整合,實現(xiàn)資源的平行調(diào)動。

對于商業(yè)合作模式,劉耀東憧憬道:“一是上云,電影公司、高校、直播博主等用戶可以調(diào)用API進行動作生成流程;二是項目制,把動作大模型做私有化部署,用于解決某一用戶的具體使用需求。”

劉耀東表示:“未來在LYDIA大模型商業(yè)化的過程中,我們先釋放一部分能力給用戶試用。通過此過程,盡最大努力加深大家對動作大模型的認(rèn)知,比如讓業(yè)內(nèi)和大眾認(rèn)識到動作大模型在電影創(chuàng)作中能有效提升視覺呈現(xiàn)精度和制作效率等。”

自2023年發(fā)布以空間計算為戰(zhàn)略主體,以AI大模型、硬件設(shè)備、空間數(shù)據(jù)為三大核心的“一體三核”核心能力與發(fā)展戰(zhàn)略以來,利亞德·虛擬動點在AI時代闊步前行,如今推出了LYDIA動作大模型,加速完善AI能力體系。未來,利亞德·虛擬動點繼續(xù)加大科技創(chuàng)新深度和精度,推動AI大模型與空間計算應(yīng)用加速落地。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論