近十年來,機(jī)器視覺技術(shù)在各行各業(yè)的應(yīng)用日趨廣泛。日常消費(fèi)場(chǎng)景里,自助結(jié)賬、刷臉支付、3D虛擬試衣等應(yīng)用逐步普遍;在工業(yè)場(chǎng)景里,除了傳統(tǒng)的安防監(jiān)控和考勤識(shí)別以外,機(jī)器視覺技術(shù)還應(yīng)用到物件識(shí)別、精密自動(dòng)化、進(jìn)出庫管理等功能上。在其他物聯(lián)網(wǎng)場(chǎng)景下,更不乏智慧醫(yī)療、智慧政務(wù)、在線教育等應(yīng)用,讓后疫情時(shí)代下的生活更加便捷和安全。這些智能應(yīng)用和場(chǎng)景不僅需要“類腦智能”的人工智能技術(shù),更需要一雙看得懂世界的“慧眼”——機(jī)器視覺。
在近期由深圳眾智技服科技有限公司主辦的“Ai賦能”第二屆國(guó)際攝像頭技術(shù)應(yīng)用大會(huì)上,近兩千名來自視覺技術(shù)領(lǐng)域的上下游企業(yè)代表齊聚一堂,探討AI賦能下視覺技術(shù)市場(chǎng)的發(fā)展前景及市場(chǎng)機(jī)遇。
一、車聯(lián)網(wǎng)
7月初國(guó)際標(biāo)準(zhǔn)組織3GPP宣布R16標(biāo)準(zhǔn)凍結(jié),這標(biāo)志著5G第一個(gè)演進(jìn)版本標(biāo)準(zhǔn)完成,5G商用也進(jìn)入了深水區(qū)。與此同時(shí),車聯(lián)網(wǎng)相關(guān)政策頻出,汽車行業(yè)“四化”深入推進(jìn),車聯(lián)網(wǎng)發(fā)展日益提速。在技術(shù)、政策等因素的綜合推動(dòng)下,規(guī)模超千億元的中國(guó)車聯(lián)網(wǎng)市場(chǎng)正面臨更大發(fā)展機(jī)遇。深圳中科龍智數(shù)字技術(shù)有限公司總經(jīng)理張偉偉認(rèn)為,AI和5G將是車聯(lián)網(wǎng)行業(yè)的兩大驅(qū)動(dòng)力。
一方面,AI聚焦于視覺感知和盲區(qū)輔助,可進(jìn)一步優(yōu)化視頻錄像及遠(yuǎn)程監(jiān)控的精度,還可以實(shí)現(xiàn)碰撞預(yù)警、駕駛員監(jiān)控、盲區(qū)輔助、泊車輔助等功能,為安全駕駛保駕護(hù)航。
另一方面,5G將驅(qū)動(dòng)遠(yuǎn)程操控和遠(yuǎn)程駕駛的發(fā)展。例如在采礦場(chǎng)景里,就可以通過現(xiàn)場(chǎng)8個(gè)以上的高清攝像頭收集現(xiàn)場(chǎng)視頻,并通過現(xiàn)場(chǎng)搭建的5G通信終端設(shè)備把相關(guān)數(shù)據(jù)實(shí)時(shí)回傳到遠(yuǎn)程控制臺(tái),讓遠(yuǎn)程控制中心可實(shí)時(shí)掌握現(xiàn)場(chǎng)信息,更迅速地優(yōu)化操作流程。與此同時(shí),采礦現(xiàn)場(chǎng)的工人也可以通過攝像頭與遠(yuǎn)程控制中心進(jìn)行通信,大大減少了信息孤島的情況,提高了采礦現(xiàn)場(chǎng)的安全系數(shù)。而在遠(yuǎn)程駕駛方面,可以讓無人駕駛技術(shù)應(yīng)用在建筑工地上,例如自動(dòng)開槽、挖掘、裝車、傾卸等應(yīng)用上,以減少人工成本和提高施工安全系數(shù)。
張偉偉強(qiáng)調(diào):“今年上半年各行各業(yè)發(fā)展波動(dòng)較大,但AI和5G產(chǎn)業(yè)的發(fā)展路徑變化不大,正是說明了AI+5G是大勢(shì)所趨。因此車聯(lián)網(wǎng)上的攝像頭需求必定會(huì)增加,業(yè)界應(yīng)該保持投入和創(chuàng)新?!?/span>
二、3D視覺
視覺技術(shù)發(fā)展已經(jīng)歷了三個(gè)階段:從黑白到彩色、從模擬到數(shù)字、從普清到高清,下一個(gè)發(fā)展風(fēng)口,便是從2D到3D。
“事實(shí)上,人類對(duì)物品的視覺成像自古以來都是3D形式,因?yàn)槲覀兛梢猿醪礁兄锲返某叽?、體積、距離等幾何數(shù)據(jù)?!鄙钲趭W比中光科技有限公司高級(jí)戰(zhàn)略BD總監(jiān)彭勛祿解釋道,“但如今我們看到的絕大部分圖像、視頻都是通過2D攝像機(jī)平面成像,這和人類的本能視覺上有較大的差異。因此,3D攝像機(jī)立體成像,將會(huì)是越來越接近人類本能視覺的一種先進(jìn)技術(shù)!”
來自奧比中光的數(shù)據(jù)可知,搭載了3D成像技術(shù)的終端產(chǎn)品將迅猛增長(zhǎng)。例如在中國(guó)市場(chǎng)里,擁有3D成像功能的智能手機(jī)(安卓),2018-2023年復(fù)合增長(zhǎng)率為151%,出貨量將從2018年的0.1億臺(tái)上升至2023年的11.2億臺(tái)。其次,智能安防市場(chǎng)的復(fù)合成長(zhǎng)率為83%,2023年的市場(chǎng)規(guī)模將達(dá)到453億元。緊接著,智能門鎖/智能門禁、AR/VR、智能POS機(jī)、互聯(lián)網(wǎng)設(shè)計(jì)及家裝的2018-2023年復(fù)合增長(zhǎng)率都在50%以上,發(fā)展勢(shì)頭迅猛。
除了以上已經(jīng)應(yīng)用了3D成像的場(chǎng)景外,未來還有哪些新場(chǎng)景值得關(guān)注?彭勛祿表示,(1)后疫情時(shí)代下,3D人臉識(shí)別+人體測(cè)溫方案需求很大;(2)在物流領(lǐng)域,智能量方手持終端可在0.2秒內(nèi)精確測(cè)出貨物尺寸,也是物流公司的剛需產(chǎn)品;(3)在地產(chǎn)行業(yè),房屋空間的三維重建,可以為客戶提供3D實(shí)景沉浸式體驗(yàn),看房-買房-裝修的一站式服務(wù)不再是“口號(hào)”;(4)在特殊場(chǎng)景里,如刑偵,3D成像可以實(shí)行犯罪現(xiàn)場(chǎng)的三維實(shí)景重建,不僅大大提高數(shù)據(jù)的全面性和精準(zhǔn)度,還保留了現(xiàn)場(chǎng)細(xì)節(jié),大大提高了刑偵破案的效率。此外,還有智慧養(yǎng)老、智慧金融、智慧監(jiān)舍等場(chǎng)景,也是奧比中光正在發(fā)力的領(lǐng)域。
三、裸視3D
聊到3D成像,必然少不了助視3D和裸視3D之間的話題,3DVSTAR總經(jīng)理?xiàng)顏嗆娬J(rèn)為,5G時(shí)代催生3D移動(dòng)互聯(lián)時(shí)代來臨,其中最大的特色就是裸視3D。
“與目前主流的光屏障式技術(shù)引起的裸眼3D不同,3DVSTAR的裸視3D技術(shù)升級(jí)為無棱矩陣技術(shù),3D視覺效果會(huì)更真實(shí)?!睏顏嗆姳硎荆?DVSTAR即將發(fā)布一款手機(jī)周邊產(chǎn)品——3D相機(jī),可以進(jìn)行3D拍攝、3D直播?!?/span>
楊亞軍預(yù)測(cè),隨著3D技術(shù)普及,3D內(nèi)容消費(fèi)市場(chǎng)爆發(fā),3D拍攝和交互功能都將成為眾多與視覺相關(guān)消費(fèi)電子產(chǎn)品的標(biāo)配。在鏡頭模組方面,3D內(nèi)容的拍攝和交互都較2D時(shí)代的需求量有較大提升,各種鏡頭品類如多攝模組、3D結(jié)構(gòu)光鏡頭、3DToF鏡頭等,乃至整個(gè)產(chǎn)業(yè)都將迎來發(fā)展高峰期。
四、在線教育
今年疫情爆發(fā)以來,“上網(wǎng)課”成為一個(gè)全民熱議的話題。無論是中小學(xué)生的義務(wù)教育,還是成年人的各種培訓(xùn)、活動(dòng),“線上化教育”已飛進(jìn)尋常百姓家。
事實(shí)上,在線教育并不是一個(gè)新興的行業(yè)。只是在疫情期間“宅經(jīng)濟(jì)”成為常態(tài),比以往多出幾百倍、幾千倍的使用者、從業(yè)者一下子涌入在線教育領(lǐng)域,使得行業(yè)內(nèi)一些缺點(diǎn)和短板迅速被暴露出來。例如,平臺(tái)的不穩(wěn)定性、教育效果的不確定性、師生的交互度低等。
針對(duì)以上難點(diǎn),360Ai影像事業(yè)部圍繞AI視覺算法技術(shù),提供了一個(gè)“網(wǎng)課助手”的解決方案。據(jù)360總經(jīng)理張焰介紹,這款“網(wǎng)課助手”是通過攝像頭采集課堂圖像信息,識(shí)別學(xué)生上課時(shí)的表情、手勢(shì)、姿態(tài)等指標(biāo)分析,輔助改善學(xué)生上網(wǎng)課易走神及課堂效果難以評(píng)估等問題。
“目前來看,這款助手的效果不錯(cuò)。下一步我們將結(jié)合人臉姿態(tài)識(shí)別等技術(shù),讓教師的形象更卡通有趣,吸引更多低齡孩童產(chǎn)生學(xué)習(xí)的興趣;同時(shí)也讓教師在課堂上實(shí)現(xiàn)更多創(chuàng)新好玩的想法,不再是簡(jiǎn)單枯燥地講課件,讓AI+攝像頭給在線教育帶來更五花八門的內(nèi)容和形式?!睆堁嬲f道。
五、生物識(shí)別
在生物識(shí)別方面,多位主講嘉賓從最初的指紋識(shí)別和語音識(shí)別、到如今盛行的人臉識(shí)別,到未來可能興起的虹膜識(shí)別、聲紋識(shí)別、靜脈識(shí)別等技術(shù),都作了詳盡的分享。其中人臉識(shí)別應(yīng)用更被看好,所涉及的攝像頭模組潛力較大。
深圳阜時(shí)科技有限公司市場(chǎng)總監(jiān)王李東子認(rèn)為,企業(yè)在推出生物識(shí)別的產(chǎn)品前,需要從研發(fā)和消費(fèi)者的維度去關(guān)注產(chǎn)品的價(jià)值。一方面,研發(fā)的維度上,①可量化的生物特征要能夠用通用的數(shù)學(xué)模型來表述;②特征提取、識(shí)別算法開銷要合理可控;③體驗(yàn)良好,不需要用戶可以配合;④成本可控,具有批量生產(chǎn)性;⑤本地一站式處理,因?yàn)檫h(yuǎn)程、云端的效率較低。另一方面,在用戶維度上,要安全、便利和性價(jià)比。
“所以我認(rèn)為,未來的生物識(shí)別市場(chǎng)將會(huì)興起多模態(tài)統(tǒng)合的生物識(shí)別模組。例如金融、商業(yè)強(qiáng)調(diào)高安全性,家居市場(chǎng)更側(cè)重體驗(yàn)、安全性要求中等,入門級(jí)市場(chǎng)最看重成本,管用即可?!蓖趵顤|子分享道。
廣州圖語信息科技有限公司CEO黃晉認(rèn)為,未來人臉識(shí)別發(fā)展將有三個(gè)方向:一是研究可解釋模型,以解決深度學(xué)習(xí)安全性的隱患;二是設(shè)計(jì)集成專門硬件,增加多維活體化信息;三是高度集成化的模組,以方便應(yīng)用系統(tǒng)的集成。
小結(jié)
不難看出,AI賦能下視覺技術(shù)市場(chǎng)前景廣闊,但并非一家企業(yè)單打獨(dú)斗就能成功的,需要產(chǎn)業(yè)鏈上下的協(xié)同合作。對(duì)此,會(huì)上還舉行了“VTA視覺技術(shù)應(yīng)用聯(lián)盟”的揭牌儀式。
來自聯(lián)盟發(fā)起方之一的深圳眾智技服創(chuàng)始人毛成表示,當(dāng)下機(jī)器視覺技術(shù)在終端手機(jī)、無人機(jī)、安防、汽車領(lǐng)域已經(jīng)發(fā)展成熟,但智能家居、醫(yī)療、智慧城市、教育、攝像頭等領(lǐng)域目前還停留在比較初級(jí)階段。如何加速推動(dòng)視覺技術(shù)在各個(gè)新興領(lǐng)域的應(yīng)用,成為現(xiàn)在行業(yè)的重中之重。尤其是在中美貿(mào)易糾紛的大背景下,國(guó)內(nèi)一些優(yōu)秀企業(yè),像華為、??低?、大華、歐菲光電等企業(yè)受到美國(guó)頻頻封殺,視覺及視覺應(yīng)用和技術(shù)行業(yè)已經(jīng)成為主要打擊目標(biāo)。對(duì)此,視覺產(chǎn)業(yè)鏈上下更需要提高警惕、抱團(tuán)發(fā)展,加強(qiáng)供需雙方的溝通,實(shí)現(xiàn)信息共享、資源互補(bǔ),進(jìn)一步推動(dòng)攝像頭產(chǎn)業(yè)的跨界融合。