人工智能助力元宇宙向?qū)嵍?,突破困?/h2>

在資源有限的情況下,必須提高生產(chǎn)效率和降低成本,而人工智能技術(shù)的發(fā)展或?qū)⑹瞧凭值年P(guān)鍵。人工智能是能夠貫穿元宇宙各場景的基礎(chǔ)性工具,將助力元宇宙變得高效敏捷、成本低廉、性能強(qiáng)大。

本文來自微信公眾號(hào)“數(shù)字經(jīng)濟(jì)雜志”,作者/杜蘭。

技術(shù)創(chuàng)新是一條彎曲的直線,要經(jīng)過技術(shù)萌芽期、期望膨脹期、泡沫破裂的低谷期、穩(wěn)步爬升的復(fù)蘇期和成熟期。元宇宙作為一種融合多個(gè)技術(shù)的科技愿景,也難免經(jīng)歷這種種階段。全景式的、虛實(shí)共生的元宇宙,在短期內(nèi)難以實(shí)現(xiàn),甚至XR產(chǎn)業(yè)的規(guī)模突破仍有待時(shí)日。但長期來看,我們應(yīng)該對(duì)元宇宙抱有美好的預(yù)期,因?yàn)樵钪婢哂幸蕴撝鷮?shí),推動(dòng)現(xiàn)實(shí)生產(chǎn)力發(fā)展的巨大潛力。

在過去的兩年里,元宇宙一直都是科技圈里的熱門概念。從最初的什么是元宇宙,描繪未來場景,勾勒發(fā)展階段,到探索元宇宙在具體行業(yè)和場景的落地路徑,人們對(duì)元宇宙的認(rèn)識(shí)逐漸回歸理性和現(xiàn)實(shí)。一方面,元宇宙應(yīng)作為數(shù)字經(jīng)濟(jì)的一部分來助力實(shí)體經(jīng)濟(jì)發(fā)展,這已成為國內(nèi)產(chǎn)業(yè)界的共識(shí);另一方面,作為元宇宙入口的VR/AR/XR終端設(shè)備發(fā)展卻始終較為緩慢,近期多個(gè)科技巨頭在發(fā)展受挫后陸續(xù)收縮了相關(guān)的布局,不禁讓人感慨元宇宙諸多掣肘,道阻且長。

2023年1月以來,ChatGPT引發(fā)全球人工智能的新一輪技術(shù)熱潮,這使元宇宙看起來更顯落寞。在這種背景下,我們應(yīng)如何看待元宇宙的現(xiàn)狀和前景?人工智能的發(fā)展又將怎樣推動(dòng)元宇宙的發(fā)展?ChatGPT對(duì)元宇宙又有何意義?我想就此分享一些觀點(diǎn)。

元宇宙的困境:沉浸感與開放度難以兼得

元宇宙到底發(fā)展到哪一步了?我們首先通過好萊塢電影《頭號(hào)玩家》,來看看理想中的元宇宙是什么樣。這部電影中的元宇宙叫做“綠洲”,它已經(jīng)具備了元宇宙的6個(gè)基本要素:虛擬形象和身份、沉浸式體驗(yàn)、社交系統(tǒng)、經(jīng)濟(jì)系統(tǒng)、開放自由的創(chuàng)作以及規(guī)則共識(shí)。每個(gè)要素不但從技術(shù)到應(yīng)用都高度發(fā)達(dá),而且都是虛實(shí)共生的。

我們距離“綠洲”這種理想中的元宇宙有多遠(yuǎn)?在當(dāng)下,主要用戶為青少年的Roblox游戲社區(qū)基本具備了元宇宙各個(gè)要素,尤其是在社交系統(tǒng)、經(jīng)濟(jì)系統(tǒng)、自由開放的創(chuàng)作環(huán)境等方面表現(xiàn)很好,但沉浸式體驗(yàn)感很弱,卡通風(fēng)的人物和場景建模,真實(shí)感遠(yuǎn)遠(yuǎn)不及3A游戲大作,也不完全是VR場景。

與之恰恰相反的是,國內(nèi)外主流的XR設(shè)備一直致力于沉浸感、真實(shí)感的提升,也取得了顯著的進(jìn)步,但卻始終沒有形成像Roblox這樣的用戶規(guī)模和活躍生態(tài)(Roblox2022年Q4日活用戶為5880萬)。

人工智能是提升元宇宙生產(chǎn)效率的關(guān)鍵

在資源有限的情況下,必須提高生產(chǎn)效率和降低成本,而人工智能技術(shù)的發(fā)展或?qū)⑹瞧凭值年P(guān)鍵。人工智能是能夠貫穿元宇宙各場景的基礎(chǔ)性工具,將助力元宇宙變得高效敏捷、成本低廉、性能強(qiáng)大。

第一,人工智能是保障元宇宙人機(jī)交互沉浸式體驗(yàn)的支撐性技術(shù)。元宇宙的高度沉浸體驗(yàn),有賴于終端設(shè)備上的視覺、聽覺、觸覺等感官體驗(yàn)的高度逼真,以及語音、光學(xué)定位、手勢追蹤、動(dòng)作捕捉等人機(jī)交互要非常敏捷智能,這些功能的提升都有賴于AI技術(shù)的支撐。

作為中國人工智能領(lǐng)域的頭部企業(yè),科大訊飛在“智能人機(jī)交互”領(lǐng)域取得了很多突破。過去一年里,我們的語音合成體驗(yàn)實(shí)現(xiàn)大幅提升,在“訊飛有聲”App上,你不但能選擇多種風(fēng)格的合成聲音,還能花幾分鐘時(shí)間讓AI“復(fù)刻”自己的聲音。語音識(shí)別方面,在最復(fù)雜的高噪音、多人說話的場景下,我們從過去的單模態(tài)識(shí)別準(zhǔn)確率39%做到了多模態(tài)的88%,已基本可以大規(guī)模使用。

在此基礎(chǔ)上,我們?cè)诜e極推進(jìn)從“單模態(tài)感知”到“多模態(tài)感知”的系統(tǒng)創(chuàng)新,在復(fù)雜場景的感知、復(fù)雜信息的理解等方面都取得了重大突破?;诙嗄B(tài)語音識(shí)別、視線檢測等多模態(tài)融合技術(shù),科大訊飛推出了“多模態(tài)免喚醒交互系統(tǒng)”,交互響應(yīng)成功率超93%以上、誤喚醒率0.01%,目前已在車載場景實(shí)現(xiàn)定點(diǎn)生產(chǎn)。此外,實(shí)時(shí)手勢識(shí)別技術(shù)實(shí)現(xiàn)了“凌空手寫”,視線追蹤技術(shù)實(shí)現(xiàn)了“眼神打字”,多模感知算法為用戶帶來了更多元、更直接、更沉浸的交互體驗(yàn)。

這些技術(shù)進(jìn)步也為未來元宇宙中的沉浸式人機(jī)交互打下了基礎(chǔ)。只有大幅提升人機(jī)交互的沉浸感、便捷性,才能加速元宇宙XR硬件終端普及,推動(dòng)市場應(yīng)用與技術(shù)發(fā)展產(chǎn)生正向循環(huán),推動(dòng)制造和研發(fā)成本不斷降低。

第二,人工智能是元宇宙世界創(chuàng)建和內(nèi)容生產(chǎn)的助推器。元宇宙中,用戶直接接觸到的對(duì)象主要有虛擬人、虛擬物品和場景、文娛內(nèi)容等。借助人工智能AIGC技術(shù),以人機(jī)耦合的方式來生產(chǎn)這些對(duì)象,將大大提高生產(chǎn)效率和降低成本。

虛擬人是元宇宙落地的先鋒領(lǐng)域,在真正應(yīng)用于元宇宙之前,虛擬人就已廣泛應(yīng)用于媒體、電商、娛樂、運(yùn)營商、旅游、教育、政務(wù)、企業(yè)等很多領(lǐng)域,助力降本增效。還可以打造情感陪伴型虛擬人,為每個(gè)家庭服務(wù)。過去一年,科大訊飛在虛擬人的多模感知、多維表達(dá)、情感貫穿、自主定義等方面取得突破,不但虛擬人的真實(shí)度大幅提升,制作效率也顯著提高,可以快速構(gòu)建3D虛擬人,一句話馬上學(xué)會(huì)你的聲線,可以定制特定的手勢、姿態(tài),整個(gè)過程只需低代碼甚至無代碼。

元宇宙中物品、場景的構(gòu)建也需要人工智能技術(shù)。例如英偉達(dá)通過人工智能技術(shù)用2D圖片快速生成3D模型,而不再需要通過漫長的建模、渲染。Meta開發(fā)的BuilderBot工具,直接說“要一棵樹”,或者“在這兒放一張桌子”,就能用語音指令的方式快速搭建場景。

科大訊飛使用人工智能的語義理解技術(shù),實(shí)現(xiàn)了建筑三維圖紙的自動(dòng)設(shè)計(jì),可以幫助設(shè)計(jì)師把一個(gè)20萬平方米建筑的設(shè)計(jì)周期從60天縮短到15天。在元宇宙中,同樣可以應(yīng)用這項(xiàng)技術(shù)提升數(shù)字建筑的搭建效率。

在文娛內(nèi)容創(chuàng)作方面,用AI寫作、繪畫、作曲、視頻等技術(shù)將大大低元宇宙中人們的創(chuàng)作門檻,提高創(chuàng)作效率,極大地豐富元宇宙中的個(gè)性化內(nèi)容。例如AI繪畫領(lǐng)域,DALL·E、DiscoDiffusion、Midjourney等工具支持文本到圖片的創(chuàng)作,既能生成不同藝術(shù)風(fēng)格的繪畫作品,也能生成以假亂真的攝影作品,把圖像藝術(shù)的創(chuàng)作門檻降到了最低。

第三,人工智能也是元宇宙以虛助實(shí),服務(wù)于民生和產(chǎn)業(yè)發(fā)展的橋梁。從現(xiàn)實(shí)世界到虛擬世界,我們的媒介是數(shù)字人,而從虛擬世界到現(xiàn)實(shí)世界,我們的媒介是機(jī)器人。科大訊飛的“超腦2030計(jì)劃”,旨在打造懂知識(shí)、善學(xué)習(xí)、能進(jìn)化的機(jī)器人,讓機(jī)器人走進(jìn)每個(gè)家庭。當(dāng)然這個(gè)目標(biāo)不是一步完成的,現(xiàn)階段我們會(huì)發(fā)展專業(yè)虛擬人,再到具備多模態(tài)情感理解能力的陪伴虛擬人,同時(shí)發(fā)展仿生機(jī)器人、外骨骼機(jī)器人等硬件技術(shù),最后我們要打造出軟硬件一體,貫穿虛擬世界和現(xiàn)實(shí)世界的陪伴機(jī)器人。在農(nóng)業(yè)、工業(yè)等實(shí)體經(jīng)濟(jì)領(lǐng)域,人工智能也將幫助我們更好地實(shí)現(xiàn)虛實(shí)融合。例如在農(nóng)業(yè)領(lǐng)域,農(nóng)業(yè)生產(chǎn)者可以在虛擬空間里借助智能設(shè)備對(duì)農(nóng)作物和畜禽的生長狀態(tài)進(jìn)行實(shí)時(shí)觀測,制定最佳的農(nóng)作物管理措施,并利用智能設(shè)備落實(shí)這些措施。工業(yè)元宇宙,可以在研發(fā)設(shè)計(jì)環(huán)節(jié),用虛實(shí)共生的可視化方式進(jìn)行模擬驗(yàn)證,優(yōu)化產(chǎn)品全生命周期的制造過程,解決產(chǎn)品試制周期長、制造工藝不穩(wěn)定等問題。也可以更高效地管控整個(gè)生產(chǎn)過程,及時(shí)發(fā)現(xiàn)和診斷故障。

ChatGPT對(duì)元宇宙有重要意義

首先要明確的是,ChatGPT是人工智能的一項(xiàng)技術(shù)和產(chǎn)品,而元宇宙與其說是一項(xiàng)技術(shù),不如說是一個(gè)極為宏大和復(fù)雜的場景,兩者之間并不是直接的此消彼長的關(guān)系。但從技術(shù)角度看,ChatGPT對(duì)元宇宙的發(fā)展又是個(gè)好消息。最近我們訊飛研究院的執(zhí)行院長劉聰在接受新華網(wǎng)專訪時(shí)談到了ChatGPT。這項(xiàng)技術(shù)本質(zhì)上是一個(gè)由浮點(diǎn)數(shù)參數(shù)表示的深度神經(jīng)網(wǎng)絡(luò)大模型,是深度學(xué)習(xí)提出后又一個(gè)里程碑式的技術(shù)革命,已經(jīng)實(shí)現(xiàn)了初步的“智慧涌現(xiàn)”。我們認(rèn)為,在ChatGPT的基礎(chǔ)上,以自然語言處理為代表的人工智能算法有可能重構(gòu)互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的產(chǎn)品形態(tài),促進(jìn)教育業(yè)、醫(yī)療業(yè)、汽車業(yè)、金融業(yè)、消費(fèi)業(yè)、媒體業(yè)、服務(wù)業(yè)和制造業(yè)等眾多產(chǎn)業(yè)的升級(jí),最終帶來對(duì)應(yīng)商業(yè)模式的變革。

如果把元宇宙看作三維空間的互聯(lián)網(wǎng),那么ChatGPT在當(dāng)前互聯(lián)網(wǎng)世界的應(yīng)用也將能夠進(jìn)一步拓展到元宇宙中,加速元宇宙的到來。結(jié)合科大訊飛多年來在深度學(xué)習(xí)算法、大模型技術(shù)、行業(yè)大數(shù)據(jù)、知識(shí)圖譜、多模態(tài)感知、系統(tǒng)工程技術(shù)方面優(yōu)勢積累,通過最近兩個(gè)多月的系統(tǒng)分析和快速驗(yàn)證,我們非常有信心實(shí)現(xiàn)ChatGPT類似的技術(shù)階躍進(jìn)步,并在中文認(rèn)知智能領(lǐng)域達(dá)到國際領(lǐng)先水平。

元宇宙發(fā)展要學(xué)會(huì)沿途下蛋,為真實(shí)世界服務(wù)。我們常說技術(shù)創(chuàng)新是一條彎曲的直線,總是要經(jīng)過技術(shù)萌芽期、期望膨脹期、泡沫破裂的低谷期、穩(wěn)步爬升的復(fù)蘇期和成熟期。元宇宙作為一種融合多個(gè)技術(shù)的科技愿景,也難免經(jīng)歷這種種階段。全景式的、虛實(shí)共生的元宇宙,在短期內(nèi)難以實(shí)現(xiàn),甚至XR產(chǎn)業(yè)的規(guī)模突破仍有待時(shí)日。但長期來看,我們應(yīng)該對(duì)元宇宙抱有美好的預(yù)期,因?yàn)樵钪婢哂幸蕴撝鷮?shí),推動(dòng)現(xiàn)實(shí)生產(chǎn)力發(fā)展的巨大潛力。

當(dāng)泡沫退去,真正想要投身元宇宙的創(chuàng)業(yè)者要堅(jiān)持源于熱愛的初心,要看到星辰大海,才能在創(chuàng)新道路上長期堅(jiān)守。也要學(xué)會(huì)沿途下蛋,為階段性的技術(shù)成果找到應(yīng)用場景和市場,最好是選擇社會(huì)剛需領(lǐng)域或有大量潛在的活躍用戶領(lǐng)域,這樣既能為后續(xù)發(fā)展造血,也能通過應(yīng)用牽引推動(dòng)技術(shù)不斷突破。

科技產(chǎn)生于真實(shí)世界的需求,并且要為真實(shí)世界服務(wù)。只有讓數(shù)字技術(shù)融合實(shí)體經(jīng)濟(jì)發(fā)展,引領(lǐng)讓現(xiàn)實(shí)世界更美好的開拓型元宇宙,摒棄讓人深度沉迷的奶嘴形元宇宙,才能給中國和人類社會(huì)帶來真正意義上的進(jìn)步。

(文︱杜蘭科大訊飛高級(jí)副總裁)

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論