3D機器視覺的無限視界——場景爭奪戰(zhàn)微光將至

多年積壓的市場痛點與剛需,在國家發(fā)布諸多利好政策下,推動3D機器視覺產(chǎn)業(yè)發(fā)展,同時工業(yè)制造智能化升級的市場需求旺盛,政策、需求“雙動力”打開了3D機器視覺市場藍海。

本文來自微信公眾號“CPS中安網(wǎng)”,作者/羅超。

3D所造,無限視界。

這是另一個視界,以前我們所說機器視覺,通常是指2D的視覺系統(tǒng),即通過攝像頭拍到一個平面的照片,然后通過圖像分析或比對來識別物體,能看到物體一個平面上特征。

過于“平面”的2D機器視覺,在AI初探階段和應(yīng)用上半場,是主流也可發(fā)揮幾大應(yīng)用價值;而當(dāng)轉(zhuǎn)型深水區(qū),痛點應(yīng)用場景與深挖數(shù)據(jù)價值,就難以繼任了。

專攻場景,那為了更加透明與徹底的“開眼看世界”,3D機器視覺,隨即而至。

01.

3D機器視覺,入安防

而關(guān)于這一切,可追本溯源。

對于3D的AI機器,被大眾所關(guān)注,還源于蘋果公司2017年iPhone X中首次搭載3D結(jié)構(gòu)光技術(shù),其技術(shù)原理是通過近紅外激光器向物體投射具有一定結(jié)構(gòu)特征的光線,再由專門的紅外攝像頭進行采集獲取物體的三維結(jié)構(gòu),通過運算對信息進行深入處理成像。

該技術(shù)經(jīng)過多年輪轉(zhuǎn)與進化,依然沿用至今,可見3D機器視覺技術(shù),還是早晨七八點中的太陽,仍然升起中。

除了最為人所知的結(jié)構(gòu)光技術(shù),3D機器視覺另外兩大技術(shù)方向是雙目視覺、ToF(飛行時間法)。

之于安防,從平面到立體的視覺革命也可追溯,雙目技術(shù)應(yīng)用也在2017年左右,頭部企業(yè)的雙目攝像機初出茅廬,而發(fā)展至今連很多智能門禁產(chǎn)品也采用雙目技術(shù)來增加視覺的立體感。

既然是安防行業(yè)應(yīng)用最為成熟的3D機器視覺雛形,還是有必要介紹下,何為雙目視覺。

它的原理就像我們?nèi)说膬芍谎劬?,用兩個視點觀察同一景物,以獲取在不同視角下的感知圖像,然后通過三角測量原理計算圖像的視差,來獲取景物的三維信息。

這絕非1+1=2的兩個攝像頭簡單堆料,而是從三維角度在視覺中的立體感知,所以,很多雙目攝像機就僅僅只是多了個攝像頭的視覺場景而已,這絕非本文探討之處。

江河入海流,安防要流入AIoT汪洋大海,在機器視覺的征途,才萬里長征第一步。

而接下來的一步,是著力提升圖像視頻類感知的深度和緯度,一改2D時代過于依賴于光照和顏色/灰度變化,提升測量精度易受變量照明條件制約能力,同時,讓4K等超高清真正規(guī)?;?,這是3D的擅長,在主動光技術(shù)、空間三維數(shù)據(jù)、背景分離等方面帶來質(zhì)變。

那隨之而解的問題是,安防中的2D與3D場景應(yīng)用,有何不同。

其一,是光線,2D攝像頭在光線較暗的場景下成像質(zhì)量非常差,尤其是需要附加類似智能分析的功能時,分析效率存在較大問題,會有很多錯檢、漏檢,雖然會有紅外光進行補充,但實際上在紅外上做智能分析會缺失很多信息。

其二,是人體特征檢測,2D只有XY這樣的平面信息,缺乏深度數(shù)據(jù),無法對目標(biāo)進行精準(zhǔn)定位與持續(xù)跟蹤。

最后,目標(biāo)重疊的時候,2D攝像頭很難把分析目標(biāo)從背景中分離出來。而且2D無法做活體檢測,人臉識別中,如果沒有3D的活體檢測,很容易受到照片與視頻的偽裝攻擊。

為此,3D機器視覺入安防,視界前所未見。

首先,3D是主動光技術(shù),可以在完全無光照環(huán)境下正常的工作。在強光、逆光環(huán)境下也能達到較好成像效果。

第二,可以獲取空間中的三維數(shù)據(jù),包括尺寸測量,空間中人、車的位置,身高、體重、距離、速度等,都可以精準(zhǔn)的計算出來。

另外還可以進行背景分離,實現(xiàn)實時的、動態(tài)的人體人像摳圖,在進行智能分析時去除背景干擾,提高算法分析準(zhǔn)確率。

還可以進行活體檢測與識別,在家庭安防、車內(nèi)安防等私密場景中,我們只需要一些深度信息,即可以實現(xiàn)這種安全監(jiān)控與行為分析。

總之,人工智能的核心任務(wù)之一就是讓機器能夠像人一樣感知世界、理解世界。

人類對于世界的理解主要依靠視覺,視覺信息占人腦處理信息比重高達85%,聲音及其他感官占15%,處理視覺信息的神經(jīng)元也在人腦中占面積最大。

并且,人眼是非常典型的三維相機,人腦處理的也是立體的視覺信息,正是由于人類具備立體視覺能力,在生物進化過程中才能躲避天敵、圍捕打獵、使用工具等,實現(xiàn)與三維世界的準(zhǔn)確交互。

要讓機器像人一樣,先要具備人眼一樣的立體感知能力,還要有能夠處理和理解三維信息的大腦算法,即三維全棧技術(shù)的相機和算法兩個方面。

3D機器視覺,打開新的成長空間,開啟另一個視界。

02.

一片藍海,搶票市場“入場券”

心在桃園外,兀自笑春風(fēng),3D機器視覺以場景為靶心,技術(shù)能力的進階之風(fēng)將吹滿地,看其市場,可謂“滿城盡帶黃金甲”。

一來,新基建的幾年在疫情肆虐下,盡管AI科技向善,為戰(zhàn)疫寫下了濃墨重彩一筆,但3D機器視覺的應(yīng)用卻鮮而有之,這一市場,仍然是方興未艾。

多年積壓的市場痛點與剛需,在國家發(fā)布諸多利好政策下,推動3D機器視覺產(chǎn)業(yè)發(fā)展,同時工業(yè)制造智能化升級的市場需求旺盛,政策、需求“雙動力”打開了3D機器視覺市場藍海。

這一片藍海,究竟有多大?據(jù)GGII數(shù)據(jù)預(yù)測,2025年中國機器視覺市場總規(guī)模將達到468.74億元,其中2D視覺市場規(guī)模將超過360億元。

數(shù)據(jù)還顯示,2021年我國3D視覺市場增速超過100%,預(yù)計到2023年3D視覺市場規(guī)模將達到35億元左右,到2025年3D機器視覺市場規(guī)模將超過100億元。

從數(shù)據(jù)中可以看出,2D視覺技術(shù)仍是當(dāng)下主流,但3D視覺技術(shù)則是未來趨勢。

目前,金融支付、智能門鎖、軌道交通、智能汽車等領(lǐng)域都對3D傳感器以及3D算法有著極大的需求,保守估計已成千億級藍海市場。

海闊天空任魚躍,盡管是市場藍海,但謹(jǐn)慎者也不乏一眾,認為3D機器視覺仍然處于長尾市場,需求還需培育中。

同時,算法的高山,還得再攀登。就像建筑一幢高樓,人們在感概華麗外殼的同時,更應(yīng)該注意到它打下的牢固地基。目前市面上基于3D視覺的應(yīng)用可千姿百態(tài),而如何從“同質(zhì)化”中獲取獨樹一幟的體驗,還得看核心功底,即背后的算法了。

03.

圍捕打獵,場景爭奪戰(zhàn)一觸即發(fā)

專攻賽道后,很多3D機器視覺廠家盡管先行一步,但后繼者前仆后繼,如圍捕打獵,在場景之中,定勝負。

其實可以看到這一市場格局或現(xiàn)狀,為客戶創(chuàng)造價值,這仿佛是每家AI企業(yè)不變的企業(yè)愿景和努力方向,但真正做到的,卻并不多,這也是很多AI企業(yè)光有技術(shù)卻無場景落地的尷尬現(xiàn)狀。

關(guān)于三維機器視覺在安防應(yīng)用場景,從技術(shù)端可以從視頻結(jié)構(gòu)化和識別技術(shù)上突破,來反哺場景,實現(xiàn)技術(shù)價值。

以識別技術(shù)為例來看,3D機器視覺的這個三維不僅體現(xiàn)在數(shù)據(jù)收集上,在識別算法上,采用的也是針對三維數(shù)據(jù)的人臉識別算法,因此在準(zhǔn)確率、安全性等方面都應(yīng)提升。

作為蘋果同源結(jié)構(gòu)光技術(shù),基于結(jié)構(gòu)光能夠保證在近距離情況下的極高精度,用于識別的三維深度感知技術(shù)在4K分辨率5米范圍內(nèi),精度達到1mm誤差,人臉重建精度保持在平均1.5mm以內(nèi),三維人像識別錯誤率可做到十億分之一??梢詫⒅亟ň茸龅胶撩准?,且移動設(shè)備幀率達到40幀/秒。

這個精度,保證了可以動態(tài)采集并重建場景中的三維信息,同時提高對身份信息的采集和管控效率結(jié)構(gòu)光深度感知、三維實時高精度重建、三維跟蹤識別及感知等技術(shù)方向,再進一步。

當(dāng)然,從應(yīng)用端來看,智能所向往是安防業(yè)務(wù)從事后查證向事前預(yù)警前移的需求變化。

而行業(yè)邏輯是越是高清,越是數(shù)據(jù)量豐富與立體的感知,越能為最終智能決策與分析,提供最優(yōu)感知源,這也是3D機器視覺可以破局之道。

在智能時代誰都不可能一肩擔(dān)起,生態(tài)共創(chuàng)與共建,是放之四海而皆準(zhǔn)的另一法則,征途不易,除了自身加強還得廣結(jié)良友,與之為伴,一榮俱榮。

除了三維機器視覺的千萬場景的遍地開花需要生態(tài)之力,在行業(yè)壁壘的破局中,也如此。

現(xiàn)階段3D視覺行業(yè)的核心難點集中在產(chǎn)業(yè)鏈匹配并不完善,由于三維機器視覺仍屬于較前沿的技術(shù),供應(yīng)鏈匹配上存在技術(shù)難度高、標(biāo)準(zhǔn)不統(tǒng)一等諸多問題,整合產(chǎn)業(yè)鏈?zhǔn)?D視覺產(chǎn)業(yè)化應(yīng)用的必要路徑。

3D視覺技術(shù)棧和產(chǎn)業(yè)鏈相比2D更長,3D視覺技術(shù)棧包括深度感知、三維重建和三維應(yīng)用,每個環(huán)節(jié)都有較高的技術(shù)門檻,要做3D機器視覺全棧技術(shù)的企業(yè),只能低作堰、淺淘灘。

歸根結(jié)底,無限之界、無限視界,3D機器視覺場景爭奪與排位賽,必然又是一次洗禮。遠行至遠方,每一步,都鏗鏘。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論