ChatGPT時(shí)代下,人形機(jī)器人能做“人”嗎 ?

陳根
由于人形機(jī)器人技術(shù)上的困難,在實(shí)際生活中,我們看到的或者是用到的機(jī)器人,大部分并非人形。而ChatGPT的爆火,給了人形機(jī)器人一次新的機(jī)會(huì)。當(dāng)前,人形機(jī)器人領(lǐng)域正呈現(xiàn)一片熱鬧非凡的景象,并朝著真正意義上的“人形”一路奔去。

本文來自微信公眾號“根新未來”,作者/陳根。

打造出跟人類本身具有相同形象的機(jī)器人,一直是人類的夢想。畢竟,在很多人第一印象里,機(jī)器人應(yīng)當(dāng)是類似于人形的機(jī)器。尤其是20世紀(jì)中葉,科幻作品中大量出現(xiàn)“仿人機(jī)器人”的形象,形塑了人們對于機(jī)器人的想象。這種機(jī)器人往往被設(shè)計(jì)為擁有四肢、軀干、頭部,甚至五官,與人類尺寸相當(dāng)。

當(dāng)然,由于人形機(jī)器人技術(shù)上的困難,在實(shí)際生活中,我們看到的或者是用到的機(jī)器人,大部分并非人形。而ChatGPT的爆火,給了人形機(jī)器人一次新的機(jī)會(huì)。當(dāng)前,人形機(jī)器人領(lǐng)域正呈現(xiàn)一片熱鬧非凡的景象,并朝著真正意義上的“人形”一路奔去。

360截圖16251112669372.png

為什么需要人形機(jī)器人?

相較于其他形態(tài)的機(jī)器人,人形機(jī)器人具有特殊的意義。

一方面,人形機(jī)器人能夠更好地充當(dāng)人類的勞動(dòng)力,馬斯克不止一次強(qiáng)調(diào),人類文明所面臨的最大風(fēng)險(xiǎn)之一就是人力短缺,人類更應(yīng)該將精力放在腦力勞動(dòng)而不是體力勞動(dòng)上。然而,要讓機(jī)器人更好地充當(dāng)人類勞動(dòng)力,就需要讓機(jī)器人也適應(yīng)我們?nèi)祟惖纳?。因?yàn)槲覀兊纳鐣?huì)是根據(jù)人類本身來設(shè)計(jì)的,而一個(gè)像是人類的機(jī)器人,就能夠很好滿足這一條件。

比如,我們之所以把機(jī)器人做成人形,不用輪胎而用雙腳行走,正是為了適應(yīng)移動(dòng)時(shí)的環(huán)境。人類希望機(jī)器人的活動(dòng)范圍不被局限于路面上——為了方便直立行走的人類,我們周遭盡是樓梯和門扉,生活空間中存在著許多可以在步行過程中跨越的高低差。盡管如今全社會(huì)都為了照顧輪椅使用者而努力推廣無障礙設(shè)施,但人的行動(dòng)范圍里仍免不了存在障礙物。因此,對于機(jī)器人來說,僅僅像掃地機(jī)那樣避開地板上的障礙物顯然是不夠的,機(jī)器人還要時(shí)不時(shí)上下樓梯。

人形機(jī)器人能夠?qū)?yīng)我們的社會(huì)而生,才能實(shí)現(xiàn)最高效率的勞動(dòng)力。也就是說,把機(jī)器人做成“人形”的理由之一,就在于機(jī)器人執(zhí)行任務(wù)時(shí)所處的環(huán)境其實(shí)是遷就人類的體型建造起來的。衣服、桌椅、杯子、手機(jī)、汽車等等,人們眼中的這個(gè)世界,全都是為了方便人類這種“人形”生物才如此設(shè)計(jì)的。如果出現(xiàn)了新形態(tài)的機(jī)器人,人們就必須重新設(shè)計(jì)一套機(jī)器人能夠適應(yīng)的全新環(huán)境。

另一方面,則是需求所致。在很多領(lǐng)域,機(jī)器人作為服務(wù)者,只有人類的外表才更容易被接受。比如,產(chǎn)后護(hù)理、幼兒陪伴、老人看護(hù)等——人類與人形機(jī)器人更容易產(chǎn)生情感上的交流,這就是“恐怖谷”效應(yīng)的第一段曲線上升部分。“恐怖谷”效應(yīng)由日本現(xiàn)代仿真機(jī)器人教父森政弘于1970年提出:當(dāng)仿真機(jī)器人的外觀與動(dòng)作相似,但并非完美擬合時(shí),人類作為觀察者會(huì)產(chǎn)生厭惡反應(yīng)。

比如,我們對人形機(jī)器人或玩偶的好感度,會(huì)隨其仿真度提高而增加,當(dāng)仿真度達(dá)到一定比例時(shí),當(dāng)我們看到既不像人類也不像典型機(jī)器人的仿真機(jī)器人時(shí),情感會(huì)突然逆轉(zhuǎn),本能覺得不正常并產(chǎn)生厭惡和恐懼等回避反應(yīng)。只有當(dāng)仿真度繼續(xù)提高,我們的情感反應(yīng)才會(huì)再度回轉(zhuǎn)。

舉個(gè)例子,當(dāng)我們聽到走廊里傳來家人的腳步聲時(shí),往往會(huì)立刻知道“是誰回來了”。有時(shí),我們能隔著老遠(yuǎn)就認(rèn)出朋友的身影。人的行走步態(tài)看似相近,但其實(shí)大相徑庭——身高和體重各不相同,各年齡段的肌肉量也有所差異。我們區(qū)分誰是誰,憑借的可不僅僅是臉型、體型等靜態(tài)外觀。我們不僅能通過靜態(tài)的肢體特征認(rèn)人,還能通過肢體的運(yùn)動(dòng)特征認(rèn)人。

從這個(gè)角度來看,比起用輪胎滑行的機(jī)器人,用雙足走路、會(huì)發(fā)出腳步聲的機(jī)器人更容易被人注意到,從而更讓人有安全感。

360截圖16251112669372.png

人形機(jī)器人為什么難做“人”?

二十一世紀(jì),AI技術(shù)的快速發(fā)展曾讓人形機(jī)器人獲得了一次質(zhì)的躍遷,但當(dāng)AI的技術(shù)進(jìn)展放緩之后,人形機(jī)器人的發(fā)展也逐漸慢下來,甚至可以說舉步維艱。

從技術(shù)角度來看,一個(gè)人形機(jī)器人身上集合了超過200種不同的技術(shù):它必須會(huì)聽、會(huì)看、會(huì)移動(dòng)、做動(dòng)作、抓取物體、開門、爬樓梯,必要時(shí)還要背起人類或幫助人類走動(dòng)。所以,這意味著在考慮賦予它何種類型的智能之前,要先掌握光學(xué)、力學(xué)、水力學(xué)、電子學(xué)、材料學(xué)、齒輪傳動(dòng)和驅(qū)動(dòng)系統(tǒng)。其中,最迫切的問題之一是平衡:人類因?yàn)橛袃?nèi)耳,所以總能保持平衡,一旦發(fā)生平衡障礙,內(nèi)耳會(huì)進(jìn)行矯正。人形機(jī)器人沒有這種工具,它必須能夠自主控制驅(qū)動(dòng)它的力量。

于是,龐大的研發(fā)成本,讓不少機(jī)器人公司都陷入了財(cái)政危機(jī)。Pepper、ASIMO、Atlas作為人形機(jī)器人行業(yè)先驅(qū),或告別市場,或找不到合適的應(yīng)用場景。

由于缺乏商業(yè)價(jià)值,本田在2018年逐步停止了人形機(jī)器人的研發(fā)工作,曾經(jīng)風(fēng)靡一時(shí)的Asimo機(jī)器人也開始慢慢退役,不再進(jìn)行演出和展覽。停止研發(fā)的原因,主要是缺乏商業(yè)性,龐大的研發(fā)成本使公司無法賺取足夠的利潤。而對于大部分人來說,人形機(jī)器人表演已經(jīng)失去了新鮮感。

雖然近年來,產(chǎn)研界關(guān)于人形機(jī)器人的動(dòng)作明顯增多,但對于人形機(jī)器人來說,依然缺少一個(gè)重大突破推動(dòng)人形機(jī)器人的發(fā)展進(jìn)入下一個(gè)階段。當(dāng)前的人形機(jī)器人不僅價(jià)格高昂,而且實(shí)際的產(chǎn)品體驗(yàn)往往欠佳。

一方面,當(dāng)前的人形機(jī)器人在硬件層面所牽涉到的很重要的一個(gè)問題,就是靈活性。由于機(jī)器人是由機(jī)械零部件組裝而成,而這些機(jī)械零部件跟人體的骨骼與神經(jīng)控制系統(tǒng)有很大不同,要想讓人形機(jī)器人到達(dá)類人這樣的靈活度,或者說至少要讓人形機(jī)器人看起來像個(gè)人,那么要達(dá)到這樣的效果,在硬件層面還需要很長的一段路要走。

另一方面,是當(dāng)前的人形機(jī)器人只能對標(biāo)準(zhǔn)化問題的程序進(jìn)行回復(fù),跟智能幾乎沒有什么關(guān)系,超出標(biāo)準(zhǔn)化的問題,人工智能就不再智能,而變成了“智障”。也就是說,當(dāng)前的AI,在很大程度上還只能做一些數(shù)據(jù)的統(tǒng)計(jì)與分析,包括一些具有規(guī)則性的讀聽寫工作,還不具備邏輯性、思考性,而在控制整個(gè)硬件軀體方面更是處于起步階段。

因?yàn)槿梭w的神經(jīng)控制系統(tǒng)是一個(gè)非常奇妙系統(tǒng),是人類幾萬年來訓(xùn)練下所形成的,顯然,當(dāng)前的人形機(jī)器人不論是在單純的AI思考性方面,還是在與機(jī)器人硬件的協(xié)調(diào)控制方面,都還只是處于起步階段。

360截圖16251112669372.png

人形機(jī)器人的新拐點(diǎn)

當(dāng)然,不論我們是否接受,人與機(jī)器人共同生活與協(xié)作,都將是未來社會(huì)的一種常規(guī)模式。這也是為什么科技巨頭燒錢都要進(jìn)入這個(gè)行業(yè)的原因。

比如,以家電產(chǎn)品“出圈”的戴森就進(jìn)入了人形機(jī)器人領(lǐng)域,目前,戴森已發(fā)布的是一款能拿起漂白劑、夾起盤子的機(jī)械臂。而戴森的愿景是,在未來10年內(nèi)推出可以做家務(wù)的人形機(jī)器人。憑借在掃地機(jī)器人、吹風(fēng)機(jī)和吸塵器等產(chǎn)品在家庭服務(wù)領(lǐng)域積累的經(jīng)驗(yàn)和技術(shù),戴森計(jì)劃以自己的優(yōu)勢技術(shù)來打造一個(gè)家用保姆人形機(jī)器人。

再比如汽車大廠比如特斯拉,2022年,特斯拉帶來了Tesla Bot人形機(jī)器人“擎天柱”原型機(jī)的全球首秀。在發(fā)布環(huán)節(jié)中,人形機(jī)器人從幕后緩緩走上前臺(tái),并向臺(tái)下觀眾揮手致意,做出多個(gè)簡單動(dòng)作。馬斯克表示,特斯拉機(jī)器人最初的定位是替代人們從事重復(fù)枯燥、具有危險(xiǎn)性的工作,但遠(yuǎn)景目標(biāo)是讓其服務(wù)于千家萬戶的日常工作。事實(shí)上,機(jī)器人“擎天柱”有明確的生產(chǎn)目標(biāo),就是成為特斯拉工廠的生產(chǎn)力。因此公司在大規(guī)模量產(chǎn)的同時(shí)也在控制成本。為了達(dá)成這個(gè)目標(biāo),特斯拉引入了大量的造車經(jīng)驗(yàn),用在該產(chǎn)品的生產(chǎn)上。

此外,還有以優(yōu)必選科技和波士頓動(dòng)力等為代表的純機(jī)器人公司。其中,近期,深圳優(yōu)必選科技就向港交所提交招股說明書、沖刺人形機(jī)器人第一股?,F(xiàn)在,ChatGPT的橫空出世,人工智能被認(rèn)為迎來了繼AlphaGo之后再次實(shí)現(xiàn)質(zhì)的突破。隨著AI賦能愈發(fā)強(qiáng)大,人形機(jī)器人或許也將迎來應(yīng)用加速落地的新拐點(diǎn)。

ChatGPT的爆發(fā)為人形機(jī)器人解鎖了更多場景,比如ChatGPT背后的大模型技術(shù),結(jié)合后將進(jìn)一步提升機(jī)器人的智能程度——根據(jù)研究人員做的心智測試,結(jié)果發(fā)現(xiàn),ChatGPT已經(jīng)擁有9歲小孩的心智了。從智能的本質(zhì)來看,人類心智與人工智能只不過是這個(gè)世界的兩套智能,而這兩套智能的本質(zhì)都是通過有限的輸入信號來歸納、學(xué)習(xí)并重建外部世界特征的復(fù)雜“算法”。

因此,理論上來看,只要我們持續(xù)地對人工智能進(jìn)行教育,用龐大的數(shù)據(jù)訓(xùn)練人工智能,人工智能遲早可以運(yùn)行名為“自我意識”的算法。

人工智能能夠通過心智測試并不意外,今天的ChatGPT雖然只有9歲小孩的心智,但在更龐大的數(shù)據(jù)的訓(xùn)練下,在未來,人工智能將擁有真正與人類相似的思考和心智。人形機(jī)器人的應(yīng)用領(lǐng)域也將從教育及娛樂進(jìn)一步拓展到健康養(yǎng)老、消殺、物流等賽道,機(jī)器人從自動(dòng)化到自主化智能的轉(zhuǎn)變將帶來重大發(fā)展機(jī)遇。

如果說,作為自動(dòng)執(zhí)行工作的機(jī)器裝置,近年來,隨著人工智能交互技術(shù)的應(yīng)用,人形機(jī)器人的智能化程度有了顯著的提升。那么現(xiàn)在,全世界矚目的ChatGPT則為人形機(jī)器人加了一把火,或許,隨著ChatGPT的到來,人形機(jī)器人也將迎來一個(gè)新的發(fā)展拐點(diǎn)。

THEEND

最新評論(評論僅代表用戶觀點(diǎn))

更多
暫無評論