工業(yè)機器人,或成為大模型落地首站?

人形機器人在2023年吸足了業(yè)界的眼球,資本對它們的青睞也顯而易見。但由于迄今為止,還沒有一個真正落地,甚至能正常運行展示的產品出現(xiàn),大批廠商并沒有輕易入局,而是在觀望先鋒企業(yè)是否能做出落地產品,再隨后跟上。因此人形機器人與其說掀起了一波浪潮,不如說是雷聲大,雨點小。

本文來自微信公眾號“高工移動機器人”,作者/Levi.。

人形機器人在2023年吸足了業(yè)界的眼球,資本對它們的青睞也顯而易見。但由于迄今為止,還沒有一個真正落地,甚至能正常運行展示的產品出現(xiàn),大批廠商并沒有輕易入局,而是在觀望先鋒企業(yè)是否能做出落地產品,再隨后跟上。因此人形機器人與其說掀起了一波浪潮,不如說是雷聲大,雨點小。

在年末回望,真正稱得上今年業(yè)界的最大風口的,無疑是人工智能。

從資本的風向來看,人工智能可以說是2023年幾乎唯一的亮點。由于全球經濟形勢并不景氣,疊加地緣政治的因素影響,資本進入了寒冬期。

知名投融資分析機構PitchBook的數據顯示,2023年上半年全球風投資金總額只有1739億美元,同比下降48%,融資次數也下降19%。到了第三季度,情況并沒有改善,全球融資額同比下降了31%。

而人工智能卻逆勢上升,第三季度全球人工智能企業(yè)融資額同比增長27%,達到了179億美元,甚至超過了其他硬科技賽道的融資總額。

這也難怪某資本行業(yè)從業(yè)者說:“今年科技賽道只有兩條,AI和其他。”

從產業(yè)端來看,盡管以Chatgpt為代表的AI大模型風頭無兩,但落地場景成謎,由于目前大模型在文字、圖像生成領域表現(xiàn)出色,許多人認為這一波AI更可能首先在服務或設計行業(yè)落地。

但實際上,高工移動機器人發(fā)現(xiàn),許多移動機器人企業(yè)認為人工智能是助推工業(yè)移動機器人爆發(fā)的關鍵技術,目前正在將人工智能的最新進展接入到他們的產品體系中,而且其中數家企業(yè)強調“這絕對不是噱頭”。

有業(yè)內人士就表示:“你說今年行業(yè)沒有亮點,我是不同意的。年初開始,AI對我們啟發(fā)非常大,我覺得這個是行業(yè)進化的機會,是能夠真正促使移動機器人爆發(fā)的變革。”

或許這波人工智能革命,首先落地的行業(yè),將會是工業(yè)移動機器人。

01

大模型如何賦能工業(yè)機器人?

在年初被大模型革命性的能力震撼過后,業(yè)界人士目前已經回歸理性,AI大模型的具體落地場景,能夠帶來多少收益,成為行業(yè)關心的核心。

據高工移動機器人走訪,人工智能目前主要在三個領域加持工業(yè)機器人:

1、人機交互。一直以來,機器人的控制、調度與排障都需要熟悉相關知識的專業(yè)人員,這意味著高企的人力成本。由于大模型在自然語言處理與生成、語音識別等面向領域的算法驚人進展,在人工智能的加持下,現(xiàn)場工作人員能直接用自然語言,讓大模型生成代碼操控機器人,因此與機器人的交互能夠實現(xiàn)低代碼,甚至無代碼的人機協(xié)作。

同時,與傳統(tǒng)的人機交互方式不同,操作者能夠輸入多模態(tài)指令(比如圖片、文字與語言),并且通過多輪命令修正機器人的行動。

實際上,這也是科技巨頭試圖落地大模型的主要途徑之一。谷歌在3月時,推出的PaLM-E著重用自然語言指揮機器人抓取米餅;阿里在4月時就透露,正在實驗將千問大模型接入工業(yè)機器人,用自然語言遠程指揮機器人工作,并且放出了工程師實際操作的視頻。

2、視覺檢測。業(yè)內人士表示,盡管圖像識別是人工智能最主要的應用領域之一,但直到今年,AI+在機器視覺領域的應用有了革命性的進展。據其介紹,過去應用人工智能,他們需要大量的圖片標注,各種各樣的瑕疵樣本,但還是會有從未見過的新瑕疵出現(xiàn),無論是訓練的算力、部署的時間或是需要的人力成本都非常高。

現(xiàn)在由于大模型的出現(xiàn),他們只需要提供良品樣本,就能在消耗極小的算力下,在更短的時間完成在產線上的部署。與此同理,相比目前普遍運用的技術,移動機器人在例如強光等室內外復雜場景下,識別周邊環(huán)境以及避障能力也得到了提升。

3、具身智能。由于大模型的發(fā)展,機器人理解與處理多模態(tài)信息的能力也得到了空前提高。機器人作為一個多傳感的集成設備,能夠同時通過視覺、觸覺等方式獲取信息,因此在視覺識別出某個原料后,就能根據材質調整夾取的力度或者加工的動作。

值得一提的是,如果冷靜地觀察人工智能以及機器人行業(yè)的發(fā)展,其實會發(fā)現(xiàn),工業(yè)機器人與人工智能的融合,已經有相當長的歷程,許多企業(yè)也摸索出了多條落地的路徑。

某家老牌機器人企業(yè)的負責人告訴高工移動機器人,他們早在2017年前后,就開始探索人工智能在移動機器人上的應用,那個時候做的還是比較簡單的語言識別的人機交互,可以用自然語言命令某個機器人移動到某個地點,進行某個動作。

今年以來Chatgpt領銜的大模型狂潮,與其說是徹底改變了工業(yè)界應用人工智能的路徑,不如說是讓企業(yè)探索這些路徑的速度更快,想象空間更大。

當然,這并不意味著大模型是個噱頭,它確實革命性地提高了人工智能的部署、迭代與進化速度。

某機器人企業(yè)產品線負責人就表示:“舉個例子,大模型讓機器人具備意圖分析的能力,這相比之前就有巨大的差距。以前,你要很精確地告訴它,它要具體做ABCD的動作。但現(xiàn)在的話,它能夠識別意圖,你告訴它AB它就會主要詢問你是否要做CD動作。當能夠識別操作者的意圖后,就意味著我們能夠用更少的關鍵詞錄入,更短的訓練時間,機器人自己就能進行關聯(lián)和分析,讓人工智能自主來處理。”

過去多年的研發(fā)與實踐經驗積累,以及保障人工智能運作的數字基礎設施的持續(xù)建設(例如邊緣計算技術、數據庫、大數據平臺等)讓工業(yè)界能夠在大模型的崛起后,迅速擁抱新興技術,或許可能成為人工智能大模型率先落地并獲得收益的行業(yè)。

02

AI+工業(yè)時代為何還未到來?

盡管未來前景很美好,但大模型在工業(yè)界的落地之旅其實還是崎嶇難行。

這主要出于三方面的原因:

1、目前大模型的研制還處于初步階段,大部分企業(yè)無力進行探索。高工移動機器人發(fā)現(xiàn),許多企業(yè)都認為大模型肯定在工業(yè)領域大有可為,也已經投入了人力物力進行研究,但他們都表示需要的成本太高,因此只能是巨頭們的游戲,以目前中國機器人企業(yè)的實力,從底層開始構筑基礎模型近乎不可能。“我們是不想搞嗎?不是啊,我們太弱太小了,沒辦法啊!”

2、訓練數據缺乏。眾所周知,人工智能大模型需要大量數據訓練,但在工業(yè)領域,許多企業(yè)的數字化改造還是非常初步的階段,無法提供足夠訓練人工智能的數據。況且,工業(yè)界的數據是各個廠商非常核心的資源,不可能共享出來,更不可能開放供外部的大模型訓練使用,因此人工智能無法發(fā)揮它的全部實力。

另一方面,制造業(yè)中的細分場景紛繁復雜也讓企業(yè)難以提供足夠的訓練數據。即使是同一個細分賽道中,同一生產鏈條上也會有相差甚遠的場景,它們產生的數據與對人工智能的需求也各不相同。

有企業(yè)負責人就曾說過:“制造業(yè)遠看是個萬億級的市場,近看就是一萬個億級的賽道。”這也意味著,要么針對不同的場景收集不同的數據,要么就在不同場景使用同一個通用的大模型。但前者的成本太高,也不一定有足夠的數據;后者則很難適配相差甚遠的不同場景。

3、成本依然居高不下。工業(yè)領域對每項技術的首要衡量標準就是投入產出比,對成本的核算非常仔細。

拋去雇傭訓練大模型所需要的工程師團隊的人力成本,而大模型目前的訓練成本依然很高,人工智能需要進行計算,那么就需要相應的硬件成本,每日維持還需要高額的算力成本,盡管沒有一個精確的數字,但這是大部分企業(yè)無法承擔的費用。以Openai為例,僅在Chatgpt上,他們每日就要燒70萬美元維護,因此需要包括微軟在內的巨頭提供源源不斷的融資輸血,這是絕大部分企業(yè)無法做到的。

此外,目前業(yè)界對它的使用還處于初步階段,大模型還沒有表現(xiàn)出它在降本增效方面的能力。在大模型高昂的成本之下,產出卻依然成謎。直白而言,人機交互、具身智能這些功能,到底能為企業(yè)節(jié)約多少錢?提高多少效率?目前來看,企業(yè)其實很難算清楚,因此,目前工業(yè)界對大模型的普遍態(tài)度,還是認為需要時間探索。

每一個使用過Chatgpt的人,都不會懷疑人工智能將引發(fā)下一波科技浪潮;每一個了解機器人的人,也必然相信工業(yè)界的終極形態(tài)應該是全自動的智能工廠。AI與機器人的共同點就在此,大家都相信它們是科技發(fā)展的彼岸,但如何跨過中間的鴻溝,還要多久才能跨越?這些都猶未可知。

但或許,我們離未來只有一步之遙。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論