未來方向之一?UC伯克利大牛研發(fā)出可基于AI深度“自學(xué)”的低成本機(jī)器人

Evelyn Zhang
未來的機(jī)器人將具有反應(yīng)性和動(dòng)態(tài)性。他們將能夠安全地與人類一起工作,而不會(huì)打斷或誤傷他們,而不是提前計(jì)劃他們的行動(dòng),他們將使用相機(jī)和傳感器實(shí)時(shí)導(dǎo)航世界。

低成本、安全性、專為AI設(shè)計(jì)、VR控制……加州大學(xué)伯克利分校一個(gè)機(jī)器人研究團(tuán)隊(duì)最新研發(fā)的Blue機(jī)器人,無疑讓許多人瞥見了未來機(jī)器人的發(fā)展方向之一。

據(jù)數(shù)據(jù)顯示,全球機(jī)器人銷售在過去五年中翻了一番,但今天在工廠和倉(cāng)庫(kù)中部署的機(jī)器人,性能和配置幾乎與我們幾十年前的機(jī)器人相同。它們既強(qiáng)大又精確,但購(gòu)買成本高昂,對(duì)人類來說也很危險(xiǎn)。

(截圖自:UC Berkely Youtube視頻)

Blue看起來有點(diǎn)像孩子筆下稚嫩的機(jī)器人繪圖:它是由笨重的3D打印部件制成的,有一對(duì)帶有鉗子的人形機(jī)器人手臂,每只手臂有7個(gè)自由度。

Blue機(jī)器人自身重量?jī)H為8.7千克,連續(xù)有效荷載為2千克??梢栽诜墙Y(jié)構(gòu)化的環(huán)境中執(zhí)行人類熟悉的日?;顒?dòng),如疊衣服、泡咖啡……

它可以支持研究者使用VR進(jìn)行控制,這一過程對(duì)訓(xùn)練AI機(jī)器人算法非常重要。讓操作員揮動(dòng)手臂,然后可以將手臂一前一后揮動(dòng)。在研究者通過VR設(shè)備操控機(jī)器人的同時(shí),AI算法能夠?qū)π袨檫M(jìn)行模仿學(xué)習(xí),相當(dāng)于人類為機(jī)器人減少了很多試錯(cuò)的過程,讓機(jī)器人快速掌握某項(xiàng)技能。它還可以訓(xùn)練使用人工智能操縱物體,這種控制方法在機(jī)器人中仍然非常罕見。

負(fù)責(zé)該項(xiàng)目的機(jī)器人專家、UC伯克利大牛Pieter Abbeel希望改變這一點(diǎn),他說Blue已經(jīng)做到從頭開始構(gòu)建,以利用最近AI改進(jìn)的專業(yè)知識(shí)與積累。“人工智能越來越強(qiáng)大這一事實(shí)讓我們有機(jī)會(huì)重新思考——如何設(shè)計(jì)機(jī)器人,”Abbeel稱,“近幾年,AI已經(jīng)取得了長(zhǎng)足的發(fā)展,這讓現(xiàn)在的機(jī)器人在軟件層面變得更加智能,但硬件上卻原地踏步了很多年。我們需要為如今的AI時(shí)代開發(fā)新的機(jī)器人硬件……降低造價(jià)對(duì)推進(jìn)機(jī)器人研究也至關(guān)重要。”

基于這些想法,伯克利機(jī)器人學(xué)習(xí)實(shí)驗(yàn)室中的來自不同領(lǐng)域的超過15位研究人員為Blue機(jī)器人開發(fā)了一個(gè)低成本類直驅(qū)驅(qū)動(dòng)(Quasi-Direct Drive,QDD)控制器,構(gòu)建了完整的設(shè)計(jì)范式,可以達(dá)成不受限的自動(dòng)化控制;機(jī)器人可以支持流行的基于AI的控制方法;他們也為機(jī)器人自身的設(shè)計(jì)和機(jī)器人的生產(chǎn)過程做了詳細(xì)考慮,以便降低它的成本。

Abbeel解釋說,目前使用的大多數(shù)機(jī)器人都是功能強(qiáng)大而操作準(zhǔn)確的。他們的動(dòng)作是預(yù)定義的,他們只是一遍又一遍地重復(fù)相同的動(dòng)作,無論是將貨物托盤、焊接車或緊固螺絲擰入智能手機(jī)的邊邊角角。

相比之下,未來的機(jī)器人將具有反應(yīng)性和動(dòng)態(tài)性。他們將能夠安全地與人類一起工作,而不會(huì)打斷或誤傷他們,而不是提前計(jì)劃他們的行動(dòng),他們將使用相機(jī)和傳感器實(shí)時(shí)導(dǎo)航世界。

“如果你看一下傳統(tǒng)的機(jī)器人,它們的設(shè)計(jì)都是圍繞著非常高精度和重復(fù)運(yùn)動(dòng)的原理,”Abbeel說。“但你不一定需要亞毫米級(jí)的可重復(fù)性。”(能夠一次又一次地執(zhí)行相同的任務(wù),并且運(yùn)動(dòng)差異小于一毫米。)“人類沒有亞毫米級(jí)的可重復(fù)性。相反,我們用眼睛和觸覺感受,通過反饋來完成工作。”

Abbeel和他的團(tuán)隊(duì),研究員Stephen McKinley和研究生David Gealy希望Blue能以同樣的方式運(yùn)作。它有一個(gè)帶有深度感應(yīng)攝像頭的中央視覺模塊,其手臂由帶橡皮筋的電機(jī)控制,使其具有靈活性。如果你推動(dòng)工業(yè)機(jī)器人手臂,就像推著磚墻一樣。但是Blue在擁擠的地鐵車?yán)锔袷且粋€(gè)人:推擠它,它會(huì)“識(shí)相”地移到一邊。

這使得Blue能夠更安全地工作,但也適用于使用強(qiáng)化學(xué)習(xí)的研究,強(qiáng)化學(xué)習(xí)是一種在機(jī)器人學(xué)中變得流行的AI訓(xùn)練方法。強(qiáng)化學(xué)習(xí)的工作原理是要求代理人完成一項(xiàng)任務(wù),并在任務(wù)完成時(shí)給予獎(jiǎng)勵(lì)。這基本上是反復(fù)試驗(yàn),代理人開始時(shí)不知道如何完成目標(biāo),然后慢慢地自學(xué)。

Pieter Abbeel認(rèn)為,一旦機(jī)器人通過模仿學(xué)習(xí)掌握了某種技能,它們可以更快地通過強(qiáng)化學(xué)習(xí)不斷將這項(xiàng)技能進(jìn)化,進(jìn)而達(dá)到趨于完美的,這可比普通的編程或者強(qiáng)化學(xué)習(xí)要有效得多。

使用具有強(qiáng)化學(xué)習(xí)的傳統(tǒng)機(jī)器人可能是昂貴的。它們?nèi)狈`活性使它們變脆且易損。此外,強(qiáng)化學(xué)習(xí)需要時(shí)間來產(chǎn)生結(jié)果,并且由于機(jī)器人很昂貴,成本的迅速攀升與積累可能很快就會(huì)讓人打退堂鼓。

傳統(tǒng)的工業(yè)機(jī)器人為了順利進(jìn)行重復(fù)性生產(chǎn)任務(wù),通常具備較高的精度和強(qiáng)度,但這就無法保證人類在旁邊工作時(shí)的安全性,同時(shí)也無法勝任更加靈活的工作。因此,協(xié)作機(jī)器人在近幾年應(yīng)運(yùn)而生,旨在將機(jī)器人(精確)的重復(fù)性能和人的能力結(jié)合起來,同時(shí)為了能夠與人類共同工作,協(xié)作機(jī)器人大多進(jìn)行了防夾傷、防碰撞的設(shè)計(jì)。但協(xié)作機(jī)器人的售價(jià)也常常在數(shù)萬美元以上。

這就讓我們見到了Blue可能會(huì)有所作為、大展身手的另一個(gè)領(lǐng)域。在Blue到來之前,伯克利的研究機(jī)器人是由 Willow Garage 建造的 PR2,它也有一對(duì)手臂和鉗子,但制作成本昂貴,在40萬美元左右。相比之下,Blue的材料清單價(jià)格僅為3,000美元。Abbeel表示,該團(tuán)隊(duì)尚未確定最終價(jià)格,但他們希望將目標(biāo)鎖定在5,000美元的范圍內(nèi)。據(jù)其官方介紹,Blue機(jī)器人具備7個(gè)自由度的雙臂機(jī)器人,量產(chǎn)之后價(jià)格有望控制在2000美元以下。

“當(dāng)你愿意放棄亞毫米精度時(shí),這就成為可能,因?yàn)槟銜?huì)意識(shí)到你不需要基于AI的控制,”Abbeel說。

許多其他研究實(shí)驗(yàn)室和初創(chuàng)公司也在瞄準(zhǔn)這種新模式,希望教會(huì)機(jī)器人如何使用人工智能。Abbeel是其中一家的總裁,一家名為Embodied Intelligence的創(chuàng)業(yè)公司。Kindred AI是一家制造機(jī)器人的公司,可以在倉(cāng)庫(kù)中挑選物品。 Elon Musk創(chuàng)立的研究實(shí)驗(yàn)室OpenAI使用機(jī)器人手完成了類似的工作,谷歌也在探索機(jī)器人的AI培訓(xùn)。

不過,一些專家對(duì)Blue對(duì)業(yè)界、市場(chǎng)的吸引力程度持懷疑態(tài)度。他們注意到它與Baxter并沒有什么不同——Baxter是另一個(gè)帶有手臂和鉗子的協(xié)同機(jī)器人。去年,Baxter、Rethink Robotics兩家機(jī)器人明星公司都倒閉了,引起一片唏噓聲。

英偉達(dá)的機(jī)器人研究員Ankur Handa表示,Blue的鉗子限制了它可以執(zhí)行的任務(wù)范圍,即使使用AI控制,它的精確度也會(huì)出現(xiàn)問題。“總的來說,我不認(rèn)為他們提供任何特別新的東西,”Handa補(bǔ)充說,Blue機(jī)器人仍然是制造更便宜的機(jī)器人的一步。

但Abbeel看好Blue的未來。該機(jī)器人目前正在小批量生產(chǎn),但Abbeel希望擴(kuò)大規(guī)模,最終轉(zhuǎn)向委托給Berkeley Open Arms外包制造,以實(shí)現(xiàn)大規(guī)模的量產(chǎn)。第一批目標(biāo)客戶將是研究實(shí)驗(yàn)室和大學(xué),其中機(jī)器人目前在團(tuán)隊(duì)之間共享,就像20世紀(jì)60年代的計(jì)算機(jī)一樣。提供更便宜的機(jī)器人將使它們?cè)诟鼜V泛的場(chǎng)景中變得可用,從而提高機(jī)器人研究的產(chǎn)量。

據(jù)悉,2017年,Pieter Abbeel就與陳曦(Peter Chen)、段巖(Rocky Duan)和張?zhí)旌疲═ianhao Zhang)創(chuàng)立了Embodied Intelligence(如今公司名:COVARIANT.AI),旨在借助深度模仿學(xué)習(xí)(Deep Imitation Learning)、深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning),開發(fā)AI軟件幫助機(jī)器人更輕易、高效地學(xué)會(huì)復(fù)雜的操作。

更重要的是,Abbeel希望Blue能夠?yàn)槲磥淼募矣脵C(jī)器人提供一個(gè)藍(lán)圖:低成本,靈活,適合人類使用的東西。“這種設(shè)計(jì)完全符合我們的想法,”他說。“未來仍然存在很多挑戰(zhàn),并不像我們認(rèn)為這個(gè)特定的機(jī)器人會(huì)走進(jìn)家家戶戶。(但)這是一種將我們引向新方向的設(shè)計(jì)范式。”

 

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論