造完“大模型”,“具身智能”將引領(lǐng)AI下一個浪潮?

AI真正賦能到各行各業(yè)、智能機器人走進(jìn)千家萬戶的時代正在到來,伴隨著技術(shù)的突破帶來性價比提高,在未來,具身智能滲透率將有望加速提升。

本文來自微信公眾號“科技云報到”。

資深機器人專家Eric Jang不久前曾預(yù)言:“ChatGPT曾在一夜之間出現(xiàn)。我認(rèn)為,有智慧的機器人技術(shù)也將如此。”

3月13日深夜,一段人形機器人的視頻開始熱傳。

在視頻中,F(xiàn)igure的人形機器人,可以完全與人類流暢對話,理解人類的意圖,同時還能理解人的自然語言指令進(jìn)行抓取和放置,并解釋自己為什么這么做。

而其背后,就是OpenAI為其配置的大型語言模型。由于OpenAI模型還支持多模態(tài)輸入,因此可為Figure提供高級視覺和語言智能。

而Figure本身,成立于2022年。從OpenAI宣布介入與之合作,到今天它們共同推出一個能夠自主對話和決策的機器人,只有13天。

具身智能的發(fā)展,顯然正在加速。

640.jpg

具身智能

進(jìn)化速度超越想象

在去年的ITF World 2023半導(dǎo)體大會上,英偉達(dá)創(chuàng)始人兼CEO黃仁勛表示,人工智能下一個浪潮將是“具身智能”(Embodied Intelligence),是能理解、推理、并與物理世界互動的智能系統(tǒng),AI與機器人的融合,具有很好的想象空間。

他還介紹了英偉達(dá)的多模態(tài)具身智能系統(tǒng)Nvidia-VIMA,能在視覺文本提示的指導(dǎo)下,執(zhí)行復(fù)雜任務(wù)、獲取概念、理解邊界、甚至模擬物理學(xué),標(biāo)志著AI能力的顯著進(jìn)步。

此外,在特斯拉召開2023年年度股東大會上,馬斯克展示了人形機器人Optimus的全新型號,和具身智能機器人幾乎劃等。

馬斯克表示,人形機器人將是今后特斯拉主要的長期價值來源,他也認(rèn)為,以具身智能機器人為代表的產(chǎn)品有望成為AI的下一浪潮。

1950年,圖靈在他的論文——《Computing Machinery and Intelligence》中首次提出了具身智能的概念。

具身智能(Embodied AI)指的是,有身體并支持物理交互的智能體,如智能服務(wù)機器人、自動駕駛汽車等,具身智能機器人指的是,像人一樣能夠與環(huán)境交互感知、自助規(guī)劃、決策、行動、執(zhí)行任務(wù)的機器人。

它包含人工智能領(lǐng)域幾乎所有的技術(shù),包括機器視覺、自然語言理解、認(rèn)知和推理、機器人學(xué)、博弈倫理、機器學(xué)習(xí)等,橫跨多個學(xué)科方向,是AI的集大成者。

2023年是生成式AI的爆發(fā)之年,也被業(yè)內(nèi)人士稱為“機器人覺醒之年”。ChatGPT等生成式AI與人形機器人行業(yè)結(jié)合,開啟了具身智能的時代。

今天,在大語言模型的普及和GPT-4等前沿模型的推動下,我們似乎見證了人工智能領(lǐng)域的一個新時代,人機交流也變得前所未有的流暢和無縫。

據(jù)2023年5月GGII發(fā)布的報告預(yù)測,預(yù)計到2026年,人形機器人在全球服務(wù)機器人市場中的滲透率預(yù)計將達(dá)到3.5%,市場規(guī)模超過20億美元。

各大科技公司和學(xué)術(shù)界的頂尖學(xué)者也不斷涌入這一領(lǐng)域的研究與產(chǎn)品開發(fā)當(dāng)中。

然而,在繁榮熱潮的背后,潛在的困境卻也如影隨形。盡管ChatGPT等模式革命性地變革了AI領(lǐng)域,但它們在理解力、聯(lián)想力和交互能力等方面,仍然未能完全滿足公眾的期望。

這促使我們對看似毫無阻礙的進(jìn)步進(jìn)行重新評估,同時希望經(jīng)過不懈努力,人們能攻克實現(xiàn)真正的具身智能所面臨的復(fù)雜挑戰(zhàn)。

當(dāng)機器人遇上大模型

近年來,國內(nèi)多家企業(yè)發(fā)布了自主研發(fā)的人形機器人。人形機器人是所有機器人里最復(fù)雜的一類,“具身智能”對機器人來說意味著什么?當(dāng)大模型和機器人相結(jié)合,會發(fā)生哪些變化?

在“具身智能”的狀態(tài)下,機器人具備自主學(xué)習(xí)和計劃能力,遇到障礙和困難可以自主反應(yīng)、快速解決。

目前國內(nèi)已有200多個大模型,實際上人形機器人是一個載體,當(dāng)大模型和人形機器人相結(jié)合時,機器人可以幫助AI大模型感知物理世界,操作環(huán)境上下文;機器人利用多模態(tài)感知控制自己的身體,完成復(fù)雜的任務(wù)。

2023年上半年,以ChatGPT為代表的大語言模型爆炸式“出圈”,大語言模型以及結(jié)合視覺等多種傳感器的復(fù)雜多模態(tài)模型的成熟,是實現(xiàn)機器人完成具身智能的關(guān)鍵先決條件。

最為關(guān)鍵的一點是,成熟的“AI大模型”使機器人可以從程序執(zhí)行導(dǎo)向轉(zhuǎn)向任務(wù)目標(biāo)導(dǎo)向,向通用機器人的發(fā)展邁出堅實步伐。

通俗點來說,“大模型”與機器人的融合,讓發(fā)展已久的機器人能真正地長出“腦子”。

機器人的“云大腦”通過在云、邊、端分布式算法、算力和大數(shù)據(jù)形成機器人智能,通過5G等無線安全高速網(wǎng)絡(luò)連接云端大腦和機器人本體:機器人本體在“端”側(cè)完成各種任務(wù)。

云端大腦通過人工增強、多模態(tài)融合AI和數(shù)字生成等先進(jìn)技術(shù),實現(xiàn)機器人智能地自我學(xué)習(xí)、不斷進(jìn)化與成長。

AI真正賦能到各行各業(yè)、智能機器人走進(jìn)千家萬戶的時代正在到來,伴隨著技術(shù)的突破帶來性價比提高,在未來,具身智能滲透率將有望加速提升。

根據(jù)高盛預(yù)測,在理想狀態(tài)下,若機器人軟硬件在短期內(nèi)產(chǎn)生重大技術(shù)突破,實現(xiàn)具身智能的同時年均降本達(dá)到20%,人形機器人全球市場空間有望在2035年達(dá)到1540億美元,接近2021年智能汽車的市場空間,2025-2035年復(fù)合增長率達(dá)到94%。

若是在樂觀情況下,人形機器人的出貨量有望在2035年達(dá)到100萬臺,市場空間2025-2035年復(fù)合增長率有望達(dá)到59%。

人形機器人的時代

正在到來

2023年11月2日,工信部印發(fā)《人形機器人創(chuàng)新發(fā)展指導(dǎo)意見》(以下簡稱《意見》)為人形機器人發(fā)展指明方向。

《意見》中指出,到2025年,人形機器人創(chuàng)新體系初步建立,“大腦、小腦、肢體”等一批關(guān)鍵技術(shù)取得突破,確保核心部組件安全有效供給。整機產(chǎn)品達(dá)到國際先進(jìn)水平,并實現(xiàn)批量生產(chǎn)。

2024年1月17日,AI研究實驗室Midjourney創(chuàng)始人大衛(wèi)·霍爾茨(David Holz)在社交媒體的一篇帖子寫道:“我們有理由期待,到2040年,地球上將有10億個人形機器人。到2060年,世界上將會有1000億人形機器人。”這預(yù)示著人形機器人的新時代正在到來。

近年來,具身智能在學(xué)術(shù)界的關(guān)注度持續(xù)升溫,在CoRL(機器人學(xué)習(xí)大會)上,具身智能領(lǐng)域的論文數(shù)量呈現(xiàn)出快速增長的趨勢。

而在2023年初舉行的IROS(智能機器人及系統(tǒng)國際會議)上,具身智能也被作為一個極為重要的議題進(jìn)行了深入探討。

在2023年8月18日的世界機器人大會人形機器人技術(shù)與產(chǎn)業(yè)發(fā)展論壇上,2000年圖靈獎獲得者、中國科學(xué)院院士、清華大學(xué)交叉信息研究院院長姚期智指出,通用人工智能(AGI)的未來發(fā)展需要具備具身實體,與真實物理世界交互以完成各種任務(wù)。

只有這樣,才能為產(chǎn)業(yè)帶來更大的價值。

隨著中國社會老齡化程度將逐漸加深,勞動力短缺問題日益凸顯,同時中國制造業(yè)勞動力總量下降,人工成本上升,因此“機器替代人”成為了重要趨勢。

目前,全球工業(yè)機器人部署量穩(wěn)定增長,中國已成為世界最大的機器人市場。人形機器人在結(jié)構(gòu)上與人類相似,未來有望覆蓋、替換所有原本需要人類勞動力的作業(yè)場景。

根據(jù)賽迪顧問的報告,盡管目前各家人形機器人仍處于原型機研發(fā)的早期階段,但是其帶來的潛在技術(shù)變革以及對某些生產(chǎn)生活場景的改變值得高度關(guān)注。

人形機器人在制造業(yè)、航天探索、生活服務(wù)業(yè)、高校科研等領(lǐng)域具有較大的發(fā)展?jié)摿ΓA(yù)計到2025年,人形機器人將有望實現(xiàn)在制造業(yè)場景應(yīng)用的突破,小批量應(yīng)用于電子、汽車等生產(chǎn)制造環(huán)境。

在中國,智能制造領(lǐng)域?qū)⒊蔀槿诵螜C器人首個實現(xiàn)大規(guī)模應(yīng)用的領(lǐng)域。人形機器人將圍繞工業(yè)制造、商用服務(wù)和家庭陪伴三大場景,重新定義人工智能時代的工人,把人類從重復(fù)性勞動中解放出來。

商用服務(wù)場景是人形機器人最快應(yīng)用的市場,而家庭落地場景則是人形機器人最具潛力的應(yīng)用市場。

近日,美國科技公司英偉達(dá)宣布成立通用具身智能體研究實驗室GEAR。

去年以來,包括中國電科21所、智元機器人、科大訊飛、小鵬汽車、傅利葉智能在內(nèi)的多家國內(nèi)企業(yè)相繼發(fā)布了自主研發(fā)的具身智能機器人,并有多家企業(yè)擬在今年實現(xiàn)具身智能的商業(yè)化落地。

業(yè)界普遍認(rèn)為,2024年有望成為具身智能商業(yè)落地元年。

虛擬世界,與現(xiàn)實世界形成鮮明對比,提供了一個更為精密和可控的環(huán)境,使得智能體能夠進(jìn)行更加大膽和創(chuàng)新的行為。

這不僅是對人類智能的延伸,更是一個通用人工智能誕生和發(fā)展的舞臺,為超越人類智能水平的AI提供了理想的試驗場和成長空間。

或許,這也是各大科技公司對具身智能與虛擬世界寄予厚望的深層次原因。

這預(yù)示著,一個更加智能、更加互聯(lián)的未來正向我們走來。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論