想機(jī)器人跑得更快,讓人工智能來(lái)控制

AI時(shí)代前沿
使用人工智能開發(fā)控制器軟件的一個(gè)很大的優(yōu)勢(shì)是,減少了浪費(fèi)在物理上的時(shí)間。人工編程讓機(jī)器人在各種可能的情況下如何行動(dòng)是非常困難的,而且這個(gè)過(guò)程很繁瑣,如果機(jī)器人在特定的地形上發(fā)生故障,人類工程師就需要確定故障的原因,并手動(dòng)調(diào)整機(jī)器人控制器。

四足機(jī)器人對(duì)于大家來(lái)說(shuō)應(yīng)該已經(jīng)不再陌生,盡管大多數(shù)人還只能從媒體或者企業(yè)的演示視頻中看到它們的身影,但我們相信它們已經(jīng)從科幻電影的屏幕中走了出來(lái)。當(dāng)然那些機(jī)器人工程師們?nèi)栽谘芯咳绾巫屵@些機(jī)器擁有更多的功能,讓它們真正走入人們生活中。

現(xiàn)在,麻省理工學(xué)院(MIT)的一組研究人員表示,改善機(jī)器人功能的一種方法可能是使用人工智能幫助教機(jī)器人如何走路和跑步。

以往,當(dāng)工程師們?cè)陂_發(fā)控制有腿機(jī)器人運(yùn)動(dòng)的軟件時(shí),他們會(huì)編寫一套規(guī)則,規(guī)定機(jī)器應(yīng)該如何響應(yīng)特定的輸入。因此,如果機(jī)器人的傳感器檢測(cè)到y(tǒng)腿上有x個(gè)力,它就會(huì)通過(guò)給電機(jī)a供電來(lái)施加力矩b,以此類推。對(duì)這些參數(shù)進(jìn)行編碼既復(fù)雜又耗時(shí),但它可以讓研究人員對(duì)機(jī)器人進(jìn)行精確和可預(yù)測(cè)的控制。

另一種方法是使用機(jī)器學(xué)習(xí)(ML)——更進(jìn)一步來(lái)說(shuō),這種方法被稱為強(qiáng)化學(xué)習(xí)(RL),通過(guò)反復(fù)試驗(yàn)來(lái)發(fā)揮作用。通過(guò)給你的AI模型一個(gè)稱為“獎(jiǎng)勵(lì)功能”的目標(biāo)(例如,盡可能快地移動(dòng)),然后讓它自行想出如何從零開始實(shí)現(xiàn)這個(gè)結(jié)果。這需要很長(zhǎng)時(shí)間,但可以讓AI在虛擬環(huán)境中進(jìn)行實(shí)驗(yàn),就可以加快時(shí)間。這就是為什么強(qiáng)化學(xué)習(xí)是開發(fā)電子游戲中人工智能的流行方式。

MIT的工程師們就是使用這種技術(shù),他們?yōu)樽约旱乃淖銠C(jī)器人研究項(xiàng)目“迷你獵豹”(Mini Cheetah)開發(fā)了一種新的控制軟件。通過(guò)強(qiáng)化學(xué)習(xí),他們能夠?yàn)闄C(jī)器人實(shí)現(xiàn)3.9米/秒的最高速度,達(dá)到大約14公里/小時(shí)。

2345截圖20211028093243.png

迷你獵豹跑步的步態(tài)有點(diǎn)笨拙。事實(shí)上,它看起來(lái)就像一只小狗在木地板上抓來(lái)抓去的加速。但是工程師認(rèn)為,這是因?yàn)槿斯ぶ悄艹怂俣戎鉀](méi)有優(yōu)化任何其他東西。

深度學(xué)習(xí)找到了一種跑得快的方法,但由于其獎(jiǎng)勵(lì)功能不明確,它沒(méi)有理由選擇一種“看起來(lái)自然”或人類喜歡的步態(tài)。這個(gè)模型當(dāng)然可以用來(lái)指導(dǎo)開發(fā)一種更流暢(真實(shí))的運(yùn)動(dòng)形式,但目前整個(gè)努力的重點(diǎn)只在優(yōu)化速度。

使用人工智能開發(fā)控制器軟件的一個(gè)很大的優(yōu)勢(shì)是,減少了浪費(fèi)在物理上的時(shí)間。人工編程讓機(jī)器人在各種可能的情況下如何行動(dòng)是非常困難的,而且這個(gè)過(guò)程很繁瑣,如果機(jī)器人在特定的地形上發(fā)生故障,人類工程師就需要確定故障的原因,并手動(dòng)調(diào)整機(jī)器人控制器。

通過(guò)使用模擬器,工程師可以將機(jī)器人置于任何的虛擬環(huán)境中——從堅(jiān)實(shí)的路面到光滑的碎石——并讓它自己解決問(wèn)題。事實(shí)上,麻省理工學(xué)院的研究小組表示,他們的模擬器能夠在3個(gè)小時(shí)內(nèi)快速完成以往需要100天的蹣跚行走和跑步。

一些研發(fā)有腿機(jī)器人的公司已經(jīng)在使用這些方法來(lái)設(shè)計(jì)新的控制器。不過(guò),以知名的波士頓動(dòng)力公司(Boston Dynamics)為代表的一些公司仍然依賴更傳統(tǒng)的方法。因?yàn)樵摴緦?duì)開發(fā)非常具體而精準(zhǔn)的動(dòng)作感興趣,比如在其精心編排的視頻中可以看到雙足或四足機(jī)器人進(jìn)行各種跳躍、翻轉(zhuǎn)、跨越障礙甚至舞蹈動(dòng)作。

2345截圖20211028093243.png

目前,波士頓動(dòng)力公司的“獵豹”機(jī)器人保持著四足機(jī)器人的最高時(shí)速紀(jì)錄,達(dá)到45.5公里/小時(shí),比博爾特還快。然而,獵豹的紀(jì)錄也許很快會(huì)被超越。畢竟它不僅比麻省理工學(xué)院的迷你獵豹更大,而且這個(gè)紀(jì)錄還是在跑步機(jī)上實(shí)現(xiàn)的,同時(shí)安裝了一個(gè)杠桿以保持穩(wěn)定性。如果沒(méi)有這些優(yōu)勢(shì),人工智能驅(qū)動(dòng)下的“小獵豹”也許會(huì)很快追上來(lái)。

23db02224f10487cad85133f97287965.gif

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無(wú)評(píng)論