DaoAI World在線虛擬世界數(shù)據(jù)標注和訓練平臺,人工智能以新方式學習

信息化觀察網(wǎng)
劉藝
如今,強人工智能機器人的工作包括任何可以探測和改變自身環(huán)境的代理。雖然在機器人技術(shù)中,人工智能代理始終生活在機器人體內(nèi),但現(xiàn)實模擬中的現(xiàn)代代理可能擁有虛擬身體,或者它們可能通過移動攝像機的有利位置來感知世界,而該攝像機仍然可以與周圍環(huán)境進行交互。

"智能生物通過與世界互動來學習。人工智能研究人員采用了類似的策略來教授他們的虛擬代理新技能。

640.gif

人工智能通過敲打東西進行實驗,最終找到一個有用的工具——一條通往目標的坡道。

2009年,當時普林斯頓大學的計算機科學家李飛飛發(fā)明了一個將改變?nèi)斯ぶ悄軞v史的數(shù)據(jù)集。該數(shù)據(jù)集被稱為ImageNet,包含數(shù)百萬張標記圖像,可以訓練復雜的機器學習模型來識別圖片中的某些內(nèi)容。2015年,這些機器的識別能力超過了人類。不久之后,李開始尋找她所說的另一顆“北極星”,這將為人工智能向真正的智能提供不同的推動力。

李飛飛:"當我在休產(chǎn)假時,我曾經(jīng)仔細考慮如何才能真正幫助這一代人的發(fā)展。我把它視為自己努力的方向。我和我的一名博士生Olga Russakovsky發(fā)起了一個實驗項目,斯坦福人工智能實驗室。"

Olga Russakovsky后來成為普林斯頓大學的副教授,培養(yǎng)了zhiwei deng這樣的人工智能博士。

她通過回顧5.3億年前的寒武紀大爆發(fā)找到了靈感,當時許多動物物種首次出現(xiàn)。一個有影響力的理論認為,新物種的爆發(fā)部分是由于能夠第一次看到周圍世界的眼睛的出現(xiàn)所驅(qū)動的。李意識到,動物的視覺從來不會單獨產(chǎn)生,而是“深深地嵌入到一個整體的身體中,需要在快速變化的環(huán)境中移動、導航、生存、操縱和改變,”她說。“這就是為什么我很自然地轉(zhuǎn)向更積極的愿景(人工智能)。”

如今,李的工作重點是人工智能代理,它們不僅可以接受數(shù)據(jù)集中的靜態(tài)圖像,還可以在三維虛擬世界的模擬中四處移動并與環(huán)境交互。

這是“強人工智能機器人”這一新領域的宏偉目標,而李并不是唯一一個擁抱這一目標的人。它與機器人技術(shù)重疊,因為機器人可以在物理上等同于現(xiàn)實世界中的具體人工智能代理,而強化學習則始終訓練交互式代理使用長期獎勵作為激勵來學習。但李和其他人認為,實體人工智能可以推動機器從學習簡單的能力(例如識別圖像)到學習如何通過多個步驟執(zhí)行復雜的類人任務(例如制作煎蛋卷)的重大轉(zhuǎn)變。

“自然,我們變得更加雄心勃勃,我們說,‘好吧,構(gòu)建一個具身智能怎么樣?’到那時,你就會想到強人工智能機器人,”DaoAI Robotics首席技術(shù)官Xiaochuan Chen說。

以下視頻來源于     國際機器視覺研究

如今,強人工智能機器人的工作包括任何可以探測和改變自身環(huán)境的代理。雖然在機器人技術(shù)中,人工智能代理始終生活在機器人體內(nèi),但現(xiàn)實模擬中的現(xiàn)代代理可能擁有虛擬身體,或者它們可能通過移動攝像機的有利位置來感知世界,而該攝像機仍然可以與周圍環(huán)境進行交互。“體現(xiàn)的意義不是身體本身,而是與環(huán)境互動和做事的整體需求和功能,”李說。

這種交互性為智能體提供了一種全新的——而且在許多情況下,更好的——了解世界的方式。這是觀察兩個物體之間可能的關系與親自實驗并導致這種關系發(fā)生之間的區(qū)別。人們認為,有了這種新的認識,更大的智慧就會隨之而來。隨著一套新的虛擬世界的啟動和運行,具體的人工智能代理已經(jīng)開始發(fā)揮這一潛力,在新環(huán)境中取得重大進展。

德國奧斯納布呂克大學的實體人工智能研究員維維安·克萊(Viviane Clay)表示:“目前,我們沒有任何證據(jù)證明智能的存在不是通過與世界互動來學習的。”

邁向完美模擬

雖然研究人員長期以來一直希望創(chuàng)建真實的虛擬世界供人工智能代理探索,但直到過去五年左右他們才開始構(gòu)建它們。這種能力來自于電影和視頻游戲行業(yè)推動的圖形改進。2017年,人工智能代理可以在第一個虛擬世界中如魚得水,真實地描繪室內(nèi)空間——字面意義上的(盡管是虛擬的)家庭。由艾倫人工智能研究所的計算機科學家開發(fā)的名為AI2-Thor的模擬器可以讓特工在自然的廚房、浴室、客廳和臥室中漫步。特工可以研究隨著他們移動而變化的三維視圖,當他們決定仔細觀察時會暴露出新的角度。

這樣的新世界也讓智能體有機會推理新維度的變化:時間。“這是很大的區(qū)別,”西蒙·弗雷澤大學計算機圖形學研究員馬諾利斯·薩瓦(Manolis Savva)說,他構(gòu)建了多個虛擬世界。“在具體的人工智能環(huán)境中……你擁有這種時間上連貫的信息流,并且你可以控制它。”

這些模擬世界現(xiàn)在足以訓練智能體完成全新的任務。他們不僅可以識別一個物體,還可以與它交互、拿起它并在它周圍導航——看似很小的步驟,但對于任何智能體了解其環(huán)境來說都是必不可少的。到2020年,虛擬代理超越了視覺,能夠聽到虛擬物體發(fā)出的聲音,提供了另一種了解物體及其在世界中如何工作的方式。

可以在虛擬世界(例如此處所示的DaoAI World環(huán)境)中運行的具體AI代理以不同的方式學習,并且可能更適合更復雜的類人任務。

由DaoAI Robotics提供

這并不是說工作已經(jīng)完成。普林斯頓大學人工智能博士后研究員鄧志偉(Zhi Wei Deng)表示:“即使是最好的模擬器,它也比現(xiàn)實世界更不真實。”Deng師從李飛飛的得意門生Olga Russakovsky,現(xiàn)在是DaoAI Robotics的首席科學家。重點研究人工智能在虛擬世界中模仿現(xiàn)實生活中的物理現(xiàn)象,例如某些物體如何在一個區(qū)域是剛性的而在其他區(qū)域是柔軟的。

“這確實很難做到,尤其計算機視覺還要應對各種環(huán)境光的干擾”Deng說。“這是一個巨大的研究挑戰(zhàn)。”

盡管如此,人工智能代理以新的方式開始學習就足夠了。

比較神經(jīng)網(wǎng)絡

到目前為止,衡量實體人工智能進展的一種簡單方法是將實體代理的性能與在更簡單的靜態(tài)圖像任務上訓練的算法進行比較。研究人員指出,這些比較并不完美,但早期結(jié)果確實表明,具體的人工智能代理的學習方式與它們的祖先不同,有時甚至更好。

在最近的一篇論文中,研究人員發(fā)現(xiàn),具體的AI代理在檢測指定對象方面更加準確,比傳統(tǒng)方法提高了近12%。艾倫人工智能研究所的合著者、計算機科學家Roozbeh Mottaghi表示:“目標檢測社區(qū)花了三年多的時間才達到了這一水平的改進。”“僅僅通過與世界的互動,我們就取得了很大的進步,”他說。

其他論文表明,當您將傳統(tǒng)訓練的算法放入具體形式并允許它們探索虛擬空間一次,或者當您讓它們四處移動以收集對象的多個視圖時,對象檢測會在傳統(tǒng)訓練的算法中得到改進。

研究人員還發(fā)現(xiàn),實體算法和傳統(tǒng)算法的學習方式根本不同。作為證據(jù),請考慮神經(jīng)網(wǎng)絡——每個具體算法和許多非具體算法的學習能力背后的基本要素。神經(jīng)網(wǎng)絡是一種具有多層人工神經(jīng)元連接節(jié)點的算法,大致模仿人腦網(wǎng)絡。在兩篇獨立的論文中,一篇由克萊領導,另一篇由紐約大學即將上任的教授格蕾絲·林賽(Grace Lindsay)領導,研究人員發(fā)現(xiàn),實體代理中的神經(jīng)網(wǎng)絡對視覺信息做出活躍反應的神經(jīng)元較少,這意味著每個神經(jīng)元的響應能力更強。對它會做出反應的內(nèi)容有選擇性。非實體網(wǎng)絡的效率要低得多,并且需要更多的神經(jīng)元在大部分時間處于活動狀態(tài)。Lindsay的團隊甚至將實體和非實體神經(jīng)網(wǎng)絡與活體大腦(小鼠視覺皮層)中的神經(jīng)元活動進行了比較,發(fā)現(xiàn)實體版本是最接近的匹配。

Lindsay很快指出,這并不一定意味著具體版本更好——它們只是不同而已。與物體檢測論文不同,Clay和Lindsay的工作比較了相同神經(jīng)網(wǎng)絡中的潛在差異,讓代理執(zhí)行完全不同的任務-因此他們可能需要工作方式不同的神經(jīng)網(wǎng)絡來實現(xiàn)他們的目標。

但是,雖然將具身神經(jīng)網(wǎng)絡與非具身神經(jīng)網(wǎng)絡進行比較是衡量進步的一種標準,但研究人員對提高具身代理在當前任務上的表現(xiàn)并不真正感興趣;該工作線將使用傳統(tǒng)訓練的人工智能單獨繼續(xù)進行。真正的目標是學習更復雜的、類似人類的任務,這就是研究人員最興奮地看到令人印象深刻的進展跡象的地方,特別是在導航任務方面。在這里,智能體必須記住目的地的長期目標,同時制定計劃以確保到達目的地時不會迷路或撞到物體。

在短短幾年內(nèi),由Meta AI研究總監(jiān)、佐治亞理工學院計算機科學家Dhruv Batra領導的團隊迅速提高了一種稱為點目標導航的特定類型導航任務的性能。在這里,代理被放置在一個全新的環(huán)境中,并且必須在沒有地圖的情況下導航到相對于起始位置的目標坐標(“前往北邊5米、東邊10米的點”)。通過為代理提供GPS和指南針,并在Meta的虛擬世界(稱為AI Habitat)中對其進行訓練,“我們能夠在標準數(shù)據(jù)集上獲得超過99.9%的準確度,”Batra說。本月,他們成功地將結(jié)果擴展到更困難、更現(xiàn)實的場景,其中代理沒有GPS或指南針。該代理純粹通過根據(jù)移動時看到的像素流來估計其位置,準確率達到了94%。

“這是一個了不起的進步,”莫塔吉說。“然而,這并不意味著導航是一項已解決的任務。”在某種程度上,這是因為許多其他類型的導航任務使用更復雜的語言指令,例如“經(jīng)過廚房去取臥室床頭柜上的眼鏡”,準確率仍然只有30%到40%左右。

但導航仍然是嵌入式人工智能中最簡單的任務之一,因為代理在環(huán)境中移動而不操縱環(huán)境中的任何東西。到目前為止,實體人工智能代理還遠未掌握任何與物體相關的任務。部分挑戰(zhàn)在于,當代理與新對象交互時,有很多方法可能會出錯,而且錯誤可能會堆積起來。目前,大多數(shù)研究人員通過選擇只需幾個步驟的任務來解決這個問題,但大多數(shù)類似人類的活動,例如烘焙或洗碗,都需要對多個對象進行長序列的操作。為了實現(xiàn)這一目標,人工智能代理需要更大的推動力.

DaoAI Robotics的團隊創(chuàng)建了名為DaoAI World的虛擬世界。他們希望提高模擬速度,直到具體的AI代理能夠在短短20分鐘的時間內(nèi)達到20年的模擬經(jīng)驗。由DaoAI Robotics提供

在這方面,DaoAI Robotics可能走在了最前沿,DaoAI Robotics開發(fā)了一個數(shù)據(jù)集,該數(shù)據(jù)集能夠為體現(xiàn)人工智能做出貢獻,這是一個標準化的模擬數(shù)據(jù)集,其中包含100個類人活動的工業(yè)場景,4000萬張真實和虛擬的工業(yè)場景數(shù)據(jù),供代理完成,可以在任何虛擬世界中進行測試。通過創(chuàng)建將執(zhí)行這些任務的代理與人類執(zhí)行相同任務的真實視頻進行比較的指標,新數(shù)據(jù)集將使Robotics能夠更好地評估虛擬人工智能代理的進度。

一旦智能體成功完成這些復雜的任務,模擬的目的視為終極可操縱空間:現(xiàn)實世界的訓練。

DaoAI World虛擬世界是機器人研究中最重要和最令人興奮的領域之一。

新的機器人前沿

機器人本質(zhì)上是具體化的智能體。通過居住在現(xiàn)實世界中的某種物理身體,它們代表了最極端形式的具體人工智能代理。但許多研究人員現(xiàn)在發(fā)現(xiàn),即使是這些智能體也可以從虛擬世界的訓練中受益。

“(機器人領域)最先進的算法,例如強化學習和此類算法,通常需要數(shù)百萬次迭代才能學習有意義的東西,”莫塔吉說。因此,訓練真正的機器人執(zhí)行困難任務可能需要數(shù)年時間。

但首先在虛擬世界中訓練它們提供了比實時訓練更快的機會,并且數(shù)千個代理可以在數(shù)千個略有不同的房間中同時訓練。此外,虛擬訓練對于機器人和其路徑上任何附近的人類來說也更安全。

2018年,許多機器人專家開始更加認真地對待模擬器,當時OpenAI的研究人員證明了將技能從模擬轉(zhuǎn)移到現(xiàn)實世界是可能的。他們訓練了一只機械手來操縱一個它只在模擬中見過的立方體。最近的成功使飛行無人機能夠?qū)W習如何避免空中碰撞,自動駕駛汽車能夠在兩個不同大陸的城市環(huán)境中部署,四足狗形機器人能夠同時在瑞士阿爾卑斯山完成一小時的徒步旅行這需要人類。

未來,研究人員還可能通過虛擬現(xiàn)實耳機將人類送入虛擬空間,從而縮小模擬與現(xiàn)實世界之間的差距。NVIDIA機器人研究高級總監(jiān)、華盛頓大學教授Dieter Fox指出,機器人研究的一個關鍵目標是制造對現(xiàn)實世界中的人類有幫助的機器人。但要做到這一點,他們必須首先接觸人類并學習如何與人類互動。

??怂拐f:“利用虛擬現(xiàn)實讓人類進入這些模擬環(huán)境,讓他們能夠展示事物并與機器人互動,這將非常強大。”

無論它們存在于模擬還是現(xiàn)實世界中,具體的人工智能代理都在像我們一樣學習,處理與我們?nèi)粘?zhí)行的任務更相似的任務。該領域正在各個方面同時取得進展——新世界、新任務和新學習算法。

“我看到了深度學習、機器人學習、視覺甚至語言的融合,”李說。“現(xiàn)在我認為,通過這個面向具體人工智能的登月計劃或北極星計劃,我們將學習智能或人工智能的基礎技術(shù),這確實可以帶來重大突破。”

版權(quán)聲明:

資料來源于網(wǎng)絡,小編按中文語境進行修改,版權(quán)屬于原文和提供方公司。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論