ChatGPT“鑄魂”:人形機(jī)器人“進(jìn)化論”

經(jīng)過(guò)近百年的發(fā)展,從粗糙的外形到越來(lái)越接近人類(lèi)的外表,從沒(méi)有行動(dòng)能力到可以行走、攀爬、跳躍,人形機(jī)器人的進(jìn)化之路越走越快。

360截圖16251112669372.png

熊貓機(jī)器人優(yōu)悠在迪拜世博會(huì)中國(guó)館教游客打太極

本文來(lái)自微信公眾號(hào)“中國(guó)電子報(bào)”,作者/宋婧。

近日,伴隨微軟ChatGPT、谷歌Bard、百度“文心一言”等AI大模型之爭(zhēng)愈演愈烈,生成式AI在全球范圍內(nèi)掀起軒然大波。與此同時(shí),人形機(jī)器人賽道也悄悄升溫了。ChatGPT背后的造物主OpenAI領(lǐng)投人形機(jī)器人公司,引發(fā)投資熱。浙商證券中性預(yù)估,2030年全球人形機(jī)器人市場(chǎng)規(guī)模有望達(dá)855億元,未來(lái)十年市場(chǎng)規(guī)模料將增長(zhǎng)超120倍。多位業(yè)內(nèi)專(zhuān)家指出,依托大型語(yǔ)言模型的訓(xùn)練,機(jī)器對(duì)人類(lèi)意圖的理解有了跨越式的質(zhì)變提升,人形機(jī)器人即將迎來(lái)新一輪“進(jìn)化”。

AI大模型為人形機(jī)器人注入“靈魂”

1928年,在美國(guó)紐約市的一家高級(jí)俱樂(lè)部,一個(gè)由墻板制成的粗糙類(lèi)人形體(頭部、鉸接的手臂和腿)開(kāi)啟了人類(lèi)對(duì)于人形機(jī)器人的無(wú)限想象。這個(gè)類(lèi)人形體被稱(chēng)為“Herbert Televox”,由美國(guó)西屋公司打造,身體的核心部分是Televox控制單元。1928年的廣告是這樣描述Televox的:“這是未來(lái)會(huì)成為仆人的一款新設(shè)備。”

經(jīng)過(guò)近百年的發(fā)展,從粗糙的外形到越來(lái)越接近人類(lèi)的外表,從沒(méi)有行動(dòng)能力到可以行走、攀爬、跳躍,人形機(jī)器人的進(jìn)化之路越走越快。然而,由于算法復(fù)雜度和數(shù)據(jù)規(guī)模的限制,目前,市面上多數(shù)人形機(jī)器人還只能在少量垂直應(yīng)用方向上實(shí)現(xiàn)接近或超越人類(lèi)的智能表現(xiàn),無(wú)法在更加開(kāi)放、復(fù)雜的領(lǐng)域?qū)崿F(xiàn)從“弱人工智能”向“強(qiáng)人工智能”的關(guān)鍵一躍。

民生證券研報(bào)指出,以ChatGPT為代表的AI大模型將為人形機(jī)器人注入“靈魂”,有望大幅推動(dòng)產(chǎn)業(yè)的商業(yè)化落地。“人機(jī)交互最好的載體就是人形機(jī)器人。人形機(jī)器人的發(fā)展離不開(kāi)語(yǔ)音、視覺(jué)、運(yùn)動(dòng)控制等多方面的研究,通過(guò)引入ChatGPT在人形機(jī)器人中的應(yīng)用,人形機(jī)器人與人類(lèi)的交互體驗(yàn)將會(huì)指數(shù)上升。以ChatGPT為代表的語(yǔ)言大模型是人形機(jī)器人的第一個(gè)殺手級(jí)應(yīng)用,代表通用AI賦能通用服務(wù)機(jī)器人的開(kāi)始。”優(yōu)必選科技副總裁、人形機(jī)器人事業(yè)部負(fù)責(zé)人付春江對(duì)《中國(guó)電子報(bào)》記者說(shuō)道。

在他看來(lái),大模型關(guān)鍵技術(shù)可拓展到人形機(jī)器人的視覺(jué)、決策、推理、動(dòng)作等方面,使人形機(jī)器人能部署到更復(fù)雜的開(kāi)放環(huán)境中,使人形機(jī)器人的感知和動(dòng)作形成閉環(huán),讓其能夠在日常生活中發(fā)揮更大作用。比如,可以彌補(bǔ)語(yǔ)言模型和真實(shí)世界的鴻溝,讓它更會(huì)“說(shuō)話”;可以提升模型推理能力,利用環(huán)境反饋形成閉環(huán),讓它可以探索更多應(yīng)用環(huán)境。

Forrester分析師盧冠男在接受《中國(guó)電子報(bào)》記者采訪時(shí)指出,長(zhǎng)期而言,大模型不僅能夠更好地訓(xùn)練機(jī)器人學(xué)習(xí)算法和處理更復(fù)雜和更大規(guī)模的數(shù)據(jù)集,而且有助于機(jī)器人更好地理解人類(lèi)語(yǔ)言、行為和環(huán)境,通過(guò)與包括智能仿生材料在內(nèi)的其他軟硬件技術(shù)發(fā)展的融合,加速人形機(jī)器人在任務(wù)完成、自主學(xué)習(xí)、適應(yīng)能力、仿生體驗(yàn)等領(lǐng)域的進(jìn)化。但在短期內(nèi),ChatGPT并不會(huì)為人形機(jī)器人帶來(lái)實(shí)質(zhì)影響。

盧冠男坦言:“ChatGPT會(huì)改善的AWA(自動(dòng)化辦公助手)的能力。但AWA并不依賴(lài)人形機(jī)器人的形態(tài)呈現(xiàn),更多是以RPA(機(jī)器人流程自動(dòng)化)、NLP(自然語(yǔ)言處理)、DPA(數(shù)字流程自動(dòng)化)和AIOps(智能運(yùn)維)等產(chǎn)品形態(tài)體現(xiàn)。”

新一輪進(jìn)化方向已顯現(xiàn)

人形機(jī)器人的新一輪進(jìn)化方向是怎樣的?在“強(qiáng)人工智能”時(shí)代,人形機(jī)器人又該如何學(xué)習(xí)和進(jìn)步,不斷刷新能力與體驗(yàn)上限?Forrester VP研究總監(jiān)戴鯤在接受《中國(guó)電子報(bào)》記者采訪時(shí)分析說(shuō):“下一代人形機(jī)器人的進(jìn)化方向?qū)⒕劢褂谌齻€(gè)方面:更高的智能水平,實(shí)現(xiàn)自主決策和動(dòng)態(tài)交互;更強(qiáng)的感知能力,獲取環(huán)境與人類(lèi)行為信息,更好地完成任務(wù);更靈活的操控能力,實(shí)現(xiàn)多種姿態(tài)和運(yùn)動(dòng)模式,與人類(lèi)和其他機(jī)器人進(jìn)行協(xié)作。”

360截圖16251112669372.png

正在展示中的達(dá)闥人形機(jī)器人

達(dá)闥創(chuàng)始人、CEO黃曉慶對(duì)《中國(guó)電子報(bào)》記者表示,基于“云(云端大腦)、網(wǎng)(安全網(wǎng)絡(luò))和端(機(jī)器人終端)”架構(gòu)的云端機(jī)器人將會(huì)成為5G時(shí)代的“殺手級(jí)”的應(yīng)用,如果可以量產(chǎn)出會(huì)做飯、會(huì)清潔、會(huì)對(duì)話、會(huì)照顧老人小孩的家庭保姆級(jí)機(jī)器人,這將會(huì)是數(shù)萬(wàn)億的市場(chǎng)。

機(jī)器人的“云”大腦通過(guò)在云、邊、端分布式算法、算力和大數(shù)據(jù)形成機(jī)器人智能;通過(guò)5G等無(wú)線安全高速“網(wǎng)”絡(luò)連接云端大腦和機(jī)器人本體;機(jī)器人本體在“端”側(cè)完成各種任務(wù)。云端大腦通過(guò)人工增強(qiáng)、多模態(tài)融合AI和數(shù)字孿生等先進(jìn)技術(shù),實(shí)現(xiàn)機(jī)器人智能地自我學(xué)習(xí)、不斷進(jìn)化與成長(zhǎng)。

黃曉慶指出,ChatGPT的出現(xiàn),恰恰證明機(jī)器人需要一個(gè)云端大腦。因?yàn)镃hatGPT是不可能裝在一個(gè)小小的計(jì)算機(jī)里的,它必須裝在一個(gè)云里面,變成個(gè)云服務(wù)。ChatGPT本身是單模態(tài)的,所以它無(wú)法支持機(jī)器人。而基于多模態(tài)的人工智能大模型要能夠支持多模態(tài),文字、語(yǔ)言、視覺(jué)、運(yùn)動(dòng)都要支持,這就是達(dá)闥在做的RobotGPT。

“人形機(jī)器人是一個(gè)多任務(wù)、通用型機(jī)器人平臺(tái),未來(lái)它在工業(yè)生產(chǎn)、社會(huì)服務(wù)等領(lǐng)域?qū)⒂蟹浅6嗟膽?yīng)用場(chǎng)景。”付春江說(shuō)道。他認(rèn)為,具身智能是人形機(jī)器人下一階段的重點(diǎn)進(jìn)化方向,ChatGPT可以認(rèn)為是人類(lèi)創(chuàng)造出一個(gè)超級(jí)語(yǔ)言大腦,人形機(jī)器人是超級(jí)大腦載體,ChatGPT通過(guò)人形機(jī)器人與物理世界發(fā)生聯(lián)系,交流和互動(dòng),根據(jù)物理世界中真實(shí)的反饋,利用比如強(qiáng)化學(xué)習(xí)來(lái)學(xué)習(xí)在世界游走,抓取行為,推理和決策的能力,學(xué)會(huì)在現(xiàn)實(shí)世界里生存。

多模態(tài)大語(yǔ)言模型(LLM)可以ChatGPT發(fā)展成GPT-X(GPT-4,GPT-5...),給予GPT-X視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)、味覺(jué)和嗅覺(jué),具身智能給予GPT-X身體。GPT-X使人形機(jī)器人和人類(lèi)及周?chē)h(huán)境交互自然,依托于GPT-X強(qiáng)大的自主學(xué)習(xí)能力,人形機(jī)器人走進(jìn)千家萬(wàn)戶和服務(wù)各行各業(yè)就會(huì)成為現(xiàn)實(shí)。

距離規(guī)?;慨a(chǎn)還有多遠(yuǎn)?

人形機(jī)器人是全球科技創(chuàng)新領(lǐng)域最重要的一個(gè)方向,也是機(jī)器人的最高級(jí)形態(tài)。戴鯤分析稱(chēng),與普通機(jī)器人相比,人形機(jī)器人一方面可以通過(guò)面部表情、語(yǔ)音和身體語(yǔ)言等多種方式來(lái)與人類(lèi)進(jìn)行交流,更加自然和準(zhǔn)確地理解人類(lèi)情感,更好地適應(yīng)人類(lèi)需求,特別是在人口老齡化加速,對(duì)精神陪伴和物理陪護(hù)需求日益增加的社會(huì)背景下具有日益增加的迫切性。

另一方面,一般情況下人形機(jī)器人具備常規(guī)的普通機(jī)器人所沒(méi)有的靈活性和柔韌性,如手腕關(guān)節(jié)的運(yùn)動(dòng)和抓取力度等,從而更好地完成特殊場(chǎng)景的操作任務(wù)。技術(shù)層面的穩(wěn)定性與可靠性及用戶需求層面的仿生體驗(yàn)真實(shí)性與安全性都是人形機(jī)器人需要解決的關(guān)鍵問(wèn)題。

隨著科技的發(fā)展及社會(huì)生產(chǎn)對(duì)效率要求的提高,人形機(jī)器人產(chǎn)業(yè)發(fā)展迎來(lái)窗口期。弗若斯特沙利文預(yù)測(cè),到2026年,全球人形機(jī)器人市場(chǎng)規(guī)模將達(dá)到80億美元;高盛預(yù)計(jì),到2035年,在藍(lán)海市場(chǎng)情景下,人形機(jī)器人市場(chǎng)能夠達(dá)到1540億美元的規(guī)模,接近截至2021年全球電動(dòng)汽車(chē)市場(chǎng)及全球智能手機(jī)市場(chǎng)的1/3。

360截圖16251112669372.png

特斯拉人形機(jī)器人

放眼國(guó)際市場(chǎng),波士頓動(dòng)力Atlas機(jī)器人憑借優(yōu)異的運(yùn)動(dòng)性能引領(lǐng)技術(shù)發(fā)展;特斯拉推出的人形機(jī)器人“擎天柱”驚艷四座,特斯拉CEO埃隆·馬斯克稱(chēng)擎天柱未來(lái)產(chǎn)量可達(dá)數(shù)百萬(wàn)臺(tái),預(yù)計(jì)價(jià)格不到2萬(wàn)美元;亞馬遜、三星等也紛紛注資賽道。

再看國(guó)內(nèi),小米自研的首款全尺寸人形機(jī)器人CyberOne(鐵大)已經(jīng)做好了面向海外市場(chǎng)的準(zhǔn)備;優(yōu)必選自主研發(fā)的大型人形機(jī)器人Walker X和熊貓機(jī)器人優(yōu)悠等已經(jīng)出現(xiàn)在世博會(huì)、兩會(huì)等重要場(chǎng)合,正在沖刺人形機(jī)器人第一股;達(dá)闥推出的人形機(jī)器人Gingerxr-1,已經(jīng)發(fā)展到2.0的版本,柔性關(guān)節(jié)從1.0版本的34個(gè)增加至41個(gè),續(xù)航時(shí)間超過(guò)24小時(shí),還能切換不同角色,通過(guò)視覺(jué)和語(yǔ)音感知人類(lèi)情緒。

盡管賽道競(jìng)爭(zhēng)火熱,付春江坦言,人形機(jī)器人要從“可用”走向“實(shí)用”,并達(dá)到理想的商業(yè)化狀態(tài),在軟件或AI方面,需要解決人形機(jī)器人多維感知和決策能力,解決通用智能問(wèn)題,來(lái)滿足半結(jié)構(gòu)化環(huán)境的適應(yīng)能力和完成任務(wù)能力。在硬件方面,要解決高功率密度,實(shí)現(xiàn)低能耗,關(guān)鍵元器件性能提升,整機(jī)量產(chǎn)導(dǎo)入和成本控制。

比如,制約人形機(jī)器人運(yùn)動(dòng)性能的關(guān)鍵模塊——伺服驅(qū)動(dòng)器占據(jù)了一半以上的整機(jī)成本。盡管近年來(lái),在多方努力下,人形機(jī)器人的核心零部件成本一直在穩(wěn)步下降,像優(yōu)必選已經(jīng)率先將雙足真人尺寸人形機(jī)器人的成本降至10萬(wàn)美元以下,但要讓人形機(jī)器人真正走進(jìn)千家萬(wàn)戶仍然任重道遠(yuǎn)。

再比如,制作柔性關(guān)節(jié)需要用的減速器長(zhǎng)期被國(guó)外機(jī)器人“四大家族”壟斷。人形機(jī)器人所用的減速器體積更小、重量更輕,而且材質(zhì)也不相同。達(dá)闥自主研發(fā)生產(chǎn)的智能柔性關(guān)節(jié)(SCA),在同樣性能下,體積只有傳統(tǒng)伺服器系統(tǒng)的1/10。

與此同時(shí),人形機(jī)器人對(duì)軟件方面的關(guān)鍵技術(shù)依賴(lài)度極高。AI算法及軟件平臺(tái)能力決定了最終人形機(jī)器人的核心服務(wù)能力。過(guò)去傳統(tǒng)機(jī)器人架構(gòu)下,人形機(jī)器人產(chǎn)業(yè)化部署面臨智能化水平低、價(jià)格高、難量產(chǎn)、隱私安全和數(shù)據(jù)保護(hù)無(wú)法保障等難題。

不過(guò),黃曉慶指出,這些難題都將隨著“云—網(wǎng)—端”架構(gòu)的推廣而得以解決。一個(gè)可為智能機(jī)器人共享的云端大腦,將支持海量的機(jī)器人共同進(jìn)行訓(xùn)練和學(xué)習(xí),不斷進(jìn)化,最終實(shí)現(xiàn)機(jī)器人通用智能服務(wù)。

ChatGPT、多模態(tài)融合AI的RobotGPT等先進(jìn)技術(shù),將從“質(zhì)”上促進(jìn)機(jī)器人從“功能”進(jìn)階到“智能”,讓機(jī)器人智能地自我學(xué)習(xí)、不斷進(jìn)化與成長(zhǎng)。如同手機(jī)“功能機(jī)”向“智能機(jī)”的升級(jí),伴隨新一輪進(jìn)化,人形機(jī)器人將走入千家萬(wàn)戶,真正改變我們的生活。

賽迪顧問(wèn)報(bào)告顯示,盡管目前各家人形機(jī)器人仍處于原型機(jī)研發(fā)的早期階段,但它所帶來(lái)的潛在技術(shù)變革和對(duì)某些生產(chǎn)生活場(chǎng)景的改變值得高度關(guān)注。目前較有潛力的人形機(jī)器人發(fā)展方向主要面向制造業(yè)、航天探索、生活服務(wù)業(yè)、高??蒲械?,預(yù)計(jì)2025年,人形機(jī)器人將有望實(shí)現(xiàn)制造業(yè)場(chǎng)景應(yīng)用的突破,小批量應(yīng)用于電子、汽車(chē)等生產(chǎn)制造環(huán)境。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論