在智能分析、生物識(shí)別等技術(shù)發(fā)展的背景下,近年來(lái)人臉識(shí)別技術(shù)已成為視頻監(jiān)控、智能家居、金融支付等行業(yè)的主要應(yīng)用趨勢(shì)。隨著人工智能技術(shù)在各個(gè)行業(yè)的逐步應(yīng)用和落地,由與技術(shù)革新相對(duì)應(yīng)的人臉識(shí)別技術(shù)研究及標(biāo)準(zhǔn)化工作也受到了廣泛關(guān)注。本文將從國(guó)際人臉識(shí)別技術(shù)研究及標(biāo)準(zhǔn)化工作出發(fā),探析國(guó)際人臉識(shí)別技術(shù)和標(biāo)準(zhǔn)化發(fā)展趨勢(shì)以及對(duì)我國(guó)人臉識(shí)別技術(shù)研究及標(biāo)準(zhǔn)化工作借鑒意義。一、國(guó)際人臉識(shí)別技術(shù)研究組織概述人臉識(shí)別技術(shù)是目前主流的人工智能算法落地應(yīng)用之一。人臉識(shí)別算法按識(shí)別流程主要包括人臉圖像捕獲、預(yù)處理、特征提取、人臉比對(duì)、活體檢測(cè)以及人臉對(duì)抗檢測(cè)等方面。獲取的人臉圖像經(jīng)過(guò)模型訓(xùn)練實(shí)現(xiàn)人臉識(shí)別的過(guò)程稱為人臉視圖解析過(guò)程。人臉根據(jù)任務(wù)需求包括1:1人臉驗(yàn)證、1:N人臉庫(kù)對(duì)比匹配和多張相同人臉進(jìn)行人臉聚類。活體檢測(cè)是判斷當(dāng)前視圖內(nèi)人臉是否采用物理面具或者其他非真實(shí)人臉模具進(jìn)行人臉識(shí)別。人臉對(duì)抗檢測(cè)是采用生成對(duì)抗樣本越過(guò)活體鑒別對(duì)人臉識(shí)別技術(shù)進(jìn)行破防檢測(cè)。在國(guó)際主流人臉識(shí)別技術(shù)研究中,除人臉識(shí)別算法外,前端人臉數(shù)據(jù)增強(qiáng)、人臉數(shù)據(jù)加密存儲(chǔ)、行業(yè)內(nèi)人臉識(shí)別管理技術(shù)也是國(guó)內(nèi)外研究重點(diǎn)之一。國(guó)外人臉識(shí)別技術(shù)研究涵蓋院校和知名企業(yè)兩大類,主要通過(guò)組織或參加國(guó)際人臉相關(guān)類競(jìng)賽獲得了巨大曝光度。舉辦競(jìng)賽類學(xué)校和組織包括美國(guó)斯坦福大學(xué)、美國(guó)馬薩諸塞大學(xué)、美國(guó)華盛頓大學(xué)以及美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院(NIST)等。我國(guó)科技類公司包括依圖科技、商湯科技、曠視科技、云叢科技都表現(xiàn)不俗,近年來(lái)一直處于競(jìng)賽領(lǐng)先地位。國(guó)際上美國(guó)、法國(guó)、俄羅斯、立陶宛、加拿大、日本等國(guó)家院校和公司表現(xiàn)也十分搶眼。1.斯坦福大學(xué)美國(guó)斯坦福大學(xué)是最早研究人臉識(shí)別技術(shù)的院校之一。華人科學(xué)家李飛飛教授在2009年的CVPR上發(fā)表了論文《ImageNet: A Large-Scale Hierarchical Image Database》,次年開啟了連續(xù)數(shù)年的ImageNet挑戰(zhàn)賽,極大的推動(dòng)了全世界人工智能行業(yè)發(fā)展。近期,斯坦福大學(xué)與Facebook旗下數(shù)據(jù)挖掘公司合作,采集100萬(wàn)人臉數(shù)據(jù)根據(jù)人員的年齡、性別、種族、面部朝向和面部表情等因素進(jìn)行識(shí)別,取得了較好的識(shí)別準(zhǔn)確率。2.美國(guó)馬薩諸塞大學(xué)美國(guó)馬薩諸塞大學(xué)對(duì)人臉識(shí)別最重要的貢獻(xiàn)之一是開源了知名的人臉檢測(cè)數(shù)據(jù)庫(kù)FDDB和人臉識(shí)別數(shù)據(jù)集LFW。FDDB數(shù)據(jù)集是從Wild數(shù)據(jù)集面部拍攝的2845個(gè)圖像集中的5171個(gè)面部的注釋,數(shù)據(jù)集采用橢圓型人臉標(biāo)簽。主要用于研究無(wú)約束人臉檢測(cè)問(wèn)題的人臉區(qū)域數(shù)據(jù)集。評(píng)估方式包括長(zhǎng)方形和橢圓兩種形式。LFW數(shù)據(jù)集包含13233張人臉圖像,涉及5749位全世界知名人士,其中1680人具有兩張或兩張以上不同場(chǎng)景下圖片,每張圖片采用統(tǒng)一尺寸,LFW數(shù)據(jù)集主要應(yīng)用于非限制環(huán)境下的人臉識(shí)別。3.美國(guó)華盛頓大學(xué)2016年IEEE計(jì)算機(jī)視覺(jué)與模式識(shí)別會(huì)議(CVPR2016)上發(fā)布了由美國(guó)華盛頓大學(xué)計(jì)算機(jī)科學(xué)與工程實(shí)驗(yàn)室維護(hù)的MegaFace基準(zhǔn)數(shù)據(jù)集競(jìng)賽初始結(jié)果。該數(shù)據(jù)集是繼LFW后首個(gè)百萬(wàn)級(jí)人臉規(guī)模數(shù)據(jù)集,涉及690572個(gè)人員。測(cè)試規(guī)模是LFW的100倍以上,識(shí)別率研究提升難度更大。最早是由俄羅斯Vocord公司獲得第一名。4.美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院(NIST)NIST是由美國(guó)商務(wù)部主管為美國(guó)工業(yè)和國(guó)防部提供測(cè)試技術(shù)的研究機(jī)構(gòu)。主要負(fù)責(zé)美國(guó)國(guó)家計(jì)量基準(zhǔn)與標(biāo)準(zhǔn),參與美國(guó)標(biāo)準(zhǔn)化技術(shù)委員會(huì)制定標(biāo)準(zhǔn)等工作。其重要的一項(xiàng)人臉識(shí)別測(cè)試數(shù)據(jù)集是FRVT測(cè)評(píng),由于其不對(duì)外開放數(shù)據(jù)只接受SDK評(píng)測(cè),并且屬于相對(duì)獨(dú)立的第三方評(píng)測(cè)機(jī)構(gòu)不受商業(yè)因素影響,因此在國(guó)際上具有一定的公正性。FRVT測(cè)評(píng)的特點(diǎn)不設(shè)置截至日期,定期開放不同企業(yè)提交的測(cè)試結(jié)果,可從測(cè)試精度、速度以及存儲(chǔ)、可靠性等各個(gè)算法進(jìn)行評(píng)測(cè)。FRVT數(shù)據(jù)集主要涵蓋Child exploitation、Visa images、Mugshot images、Selfie images、Webcam images、wild images等數(shù)據(jù)集,測(cè)試較為復(fù)雜,挑戰(zhàn)性大。二、國(guó)際人臉識(shí)別技術(shù)研究發(fā)展趨勢(shì)隨著云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)、人工智能等計(jì)算機(jī)科學(xué)技術(shù)的飛速發(fā)展以及人臉識(shí)別技術(shù)在實(shí)際應(yīng)用領(lǐng)域的不斷拓新。全球人臉識(shí)別行業(yè)規(guī)模以非常高的速度增長(zhǎng)。根據(jù)全球第二大市場(chǎng)研究咨詢公司Markets and Markets預(yù)測(cè),新冠疫情后全球人臉識(shí)別市場(chǎng)規(guī)模將從2020年的38億美元增長(zhǎng)至2025年的85億美元,預(yù)計(jì)期間復(fù)合年增長(zhǎng)率(CAGR)約為19.0%。其中安防監(jiān)控、零售與電子商務(wù)、金融服務(wù)是推動(dòng)市場(chǎng)增長(zhǎng)的主要因素。同時(shí),人臉識(shí)別類相關(guān)專利申請(qǐng)書也達(dá)到了1374件。隨著人臉識(shí)別技術(shù)的廣泛應(yīng)用,一些新的技術(shù)不斷發(fā)展。國(guó)際上人臉識(shí)別技術(shù)的主要研究重點(diǎn)包括人臉識(shí)別基礎(chǔ)算法、芯片和傳感器。1.基礎(chǔ)算法技術(shù)基礎(chǔ)性研究可解決應(yīng)用算法層面的瓶頸。人臉識(shí)別技術(shù)從最早的基于特征臉、幾何特征方法、支持向量機(jī)到深度學(xué)習(xí)算法,經(jīng)歷了幾代的發(fā)展。在目前主流的深度學(xué)習(xí)算法中,基礎(chǔ)算法熱點(diǎn)包括深度學(xué)習(xí)模型結(jié)構(gòu)設(shè)計(jì)、損失函數(shù)設(shè)計(jì)、特征加速等。模型設(shè)計(jì)的重點(diǎn)是權(quán)重少、計(jì)算小、速度快。如何設(shè)計(jì)高效的神經(jīng)網(wǎng)絡(luò)是研究重點(diǎn)之一。損失函數(shù)設(shè)計(jì)是反映模型設(shè)計(jì)水平的評(píng)價(jià)指標(biāo)之一,主要用于反饋訓(xùn)練數(shù)據(jù)集的真實(shí)水平和具有合理的可求解梯度。目前,深度學(xué)習(xí)領(lǐng)域的兩個(gè)重要分支分別是設(shè)計(jì)強(qiáng)大復(fù)雜的網(wǎng)絡(luò)模型和高效穩(wěn)定的結(jié)果輸出。2.芯片研制人臉識(shí)別技術(shù)的發(fā)展得益于神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展。而神經(jīng)網(wǎng)絡(luò)技術(shù)依賴于大規(guī)模數(shù)據(jù)處理能力,也就是芯片算力。目前大部分人臉識(shí)別產(chǎn)品均采用通用芯片進(jìn)行處理。由于人臉識(shí)別算法對(duì)算力資源要求較高,一般采用CPU、ARM等芯片進(jìn)行視頻處理獲取人臉圖片。對(duì)獲取的人臉圖片進(jìn)行人臉解析過(guò)程是人臉識(shí)別技術(shù)的關(guān)鍵,由于CPU對(duì)多任務(wù)處理能力效率低下,因此該過(guò)程一般采用專用處理芯片包括GPU顯示核心、FPGA現(xiàn)場(chǎng)可編程門陣列、ASIC專用集成電路、DSP數(shù)字信號(hào)處理等。2020年來(lái),由于新冠疫情以及資源短缺,全球陷入芯片緊缺狀態(tài),目前已從汽車行業(yè)蔓延到多數(shù)計(jì)算機(jī)產(chǎn)品行業(yè)。因此,突破芯片限制仍是目前國(guó)際上需要解決的重要課題之一。3.傳感器技術(shù)傳統(tǒng)的二維人臉識(shí)別技術(shù)已經(jīng)取得了實(shí)戰(zhàn)性應(yīng)用,但隨著信息安全技術(shù)的發(fā)展,活體檢測(cè)以及人臉對(duì)抗性攻防技術(shù)也是現(xiàn)在研究重點(diǎn)之一。而解決該類算法攻擊的重要途徑之一是采用更為復(fù)雜的前端采集傳感器,如基于3D結(jié)構(gòu)光、雙目立體視覺(jué)和TOF技術(shù)的三維人臉采集和近紅外人臉采集傳感器。如常見(jiàn)的Iphone Face ID主要采用3D結(jié)構(gòu)光技術(shù),可應(yīng)用于消費(fèi)者行業(yè),如人臉支付、新零售、智能物流等。
三、人臉識(shí)別標(biāo)準(zhǔn)化現(xiàn)狀1.人臉識(shí)別標(biāo)準(zhǔn)化國(guó)際組織概述人臉識(shí)別國(guó)際標(biāo)準(zhǔn)化方面,人臉識(shí)別標(biāo)準(zhǔn)化工作主要屬于 ISO/IEC JTC1/SC37的工作范疇,其重點(diǎn)關(guān)注人臉識(shí)別基礎(chǔ)標(biāo)準(zhǔn),如圖示、圖標(biāo)、符號(hào)、樣本質(zhì)量等,以及數(shù)據(jù)交換格式及符合性測(cè)試方法等。其它國(guó)外關(guān)注人臉識(shí)別的先進(jìn)組織包括IEEE消費(fèi)電子協(xié)會(huì)(Institute of Electrical and Electronics Engineers,IEEE)、美國(guó)消費(fèi)者協(xié)會(huì)(Consumer Technology Association,CTA)等,其關(guān)注的方向在于生物特征識(shí)別呈現(xiàn)攻擊檢測(cè)、人臉生物特征識(shí)別信息的性能評(píng)估等方面。ITU國(guó)際電信聯(lián)盟標(biāo)準(zhǔn)(International Telecommunication Union,ITU)與生物識(shí)別標(biāo)準(zhǔn)相關(guān)的工作組包括ITU-T SG17安全標(biāo)準(zhǔn)工作組下設(shè)的Q9和Q10。Q9主要關(guān)注在通信應(yīng)用環(huán)境中應(yīng)用生物特征識(shí)別及其標(biāo)準(zhǔn)化工作。隨著生物特征識(shí)別技術(shù)在電子商務(wù)、電子健康和移動(dòng)支付領(lǐng)域中的廣泛應(yīng)用,該工作組同樣關(guān)注生物特征數(shù)據(jù)的隱私保護(hù)、可靠性和安全性等各方面的挑戰(zhàn)。Q10關(guān)注身份管理架構(gòu)和機(jī)制,部分標(biāo)準(zhǔn)項(xiàng)目與基于生物特征識(shí)別身份認(rèn)證相關(guān)。近年來(lái),ITU-T SG16媒體工作組基于視頻監(jiān)控、機(jī)器視覺(jué)等應(yīng)用場(chǎng)景、功能需求、業(yè)務(wù)需求、性能需求以及安全需求,在Q12、Q21等課題組先后開展人臉識(shí)別標(biāo)準(zhǔn)的研究和制定。2.人臉識(shí)別標(biāo)準(zhǔn)制修訂概述人臉識(shí)別技術(shù)作為生物特征識(shí)別技術(shù)的分支,也是應(yīng)用最普遍的生物特征識(shí)別技術(shù),有眾多生物特征識(shí)別領(lǐng)域相關(guān)的標(biāo)準(zhǔn)可參考。ISO/IEC人臉識(shí)別國(guó)際標(biāo)準(zhǔn)統(tǒng)計(jì)情況見(jiàn)表1。表1 ISO/IEC國(guó)際人臉識(shí)別標(biāo)準(zhǔn)統(tǒng)計(jì)表
序號(hào) | 標(biāo)準(zhǔn)編號(hào) | 標(biāo)準(zhǔn)名稱(英文) | 標(biāo)準(zhǔn)標(biāo)準(zhǔn)(中文) |
1 | ISO/IEC 19794—5:2011 | Information technology —Biometric data interchange formats — Part 5:Face image data | 信息技術(shù)生物特征識(shí)別數(shù)據(jù)交換格式第 5 部分:人臉圖像數(shù)據(jù) |
2 | ISO/IEC 29109—5:2019 | Information technology — Conformance testing methodology for biometric data interchange formats defined in ISO/IEC 19794 — Part 5:Face image data | 信息技術(shù) ISO/IEC 19794中定義的用于生物特征識(shí)別數(shù)據(jù)格式的生物特征數(shù)據(jù)交換格式的符合性測(cè)試方法第 5 部分:人臉圖像數(shù)據(jù) |
3 | ISO/IEC TR 29794—5:2010 | Information technology —Biometric sample quality — Part 5:Face image data | 信息技術(shù)生物特征樣本質(zhì)量第 5 部分:人臉圖像數(shù)據(jù) |
4 | ISO/IEC 39794—5:2019 | Information technology —Extensible biometric data interchange formats — Part 5:Face image data | 信息技術(shù)可擴(kuò)展生物特征識(shí)別數(shù)據(jù)交換格式第 5 部分:人臉圖像數(shù)據(jù) |
5 | ISO/IEC 24779—5:2020 | Information technology —Cross—jurisdictional and societal aspects of implementation of biometric technologies —Pictograms, icons and symbols for use with biometric systems — Part 5:Face applications | 信息技術(shù)司法和社會(huì)領(lǐng)域交叉的生物特征識(shí)別技術(shù)的實(shí)現(xiàn)生物特征識(shí)別系統(tǒng)中使用的圖標(biāo)、圖示和符號(hào)第 4 部分:人臉應(yīng)用 |
6 | ISO/IEC AWI 24357 | Performance evaluation of face image quality algorithms | 人臉圖像質(zhì)量算法的性能評(píng)價(jià) |
7 | SO/IEC WD 24358 | Face—aware capture subsystemspecifications | 人臉識(shí)別采集子系統(tǒng)規(guī)范 |
8 | ISO/WD 37183 | Smart community infrastructures — Guidance on smart transportation using face recognition | 智能社區(qū)基礎(chǔ)設(shè)施-使用人臉識(shí)別智能交通指南 |
序號(hào) | 標(biāo)準(zhǔn)編號(hào) | 標(biāo)準(zhǔn)名稱(英文) | 標(biāo)準(zhǔn)標(biāo)準(zhǔn)(中文) |
1 | IEEE Std2790—2020 | Biometric Liveness Detection | 生物特征識(shí)別呈現(xiàn)攻擊檢測(cè) |
2 | EEE P2884 | Performance Evaluation of Biometric Information:Facial Recognition | 生物特征識(shí)別信息性能評(píng)估:人臉識(shí)別 |
表3 國(guó)外其他含人臉識(shí)別相關(guān)內(nèi)容標(biāo)準(zhǔn)制修訂情況
序號(hào) | 標(biāo)準(zhǔn)編號(hào) | 標(biāo)準(zhǔn)名稱(英文) | 標(biāo)準(zhǔn)標(biāo)準(zhǔn)(中文) |
1 | ISO/IEC 2382-37:2017 | Information technology — Vocabulary — Part 37: Biometrics | 信息技術(shù)術(shù)語(yǔ)第 37 部分:生物特征識(shí)別 |
2 | ISO/IEC 19784 | Information technology — Biometric application programming interface | 信息技術(shù)生物特征識(shí)別應(yīng)用程序接口(系列標(biāo)準(zhǔn)) |
3 | ISO/IEC 19785 | Information technology — Common Biometric Exchange Formats Framework | 信息技術(shù)公用生物特征識(shí)別交換格式框架(系列標(biāo)準(zhǔn)) |
4 | ISO/IEC 19795 | Information technology — Biometric performance testing and reporting | 信息技術(shù)生物特征識(shí)別性能測(cè)試和報(bào)告(系列標(biāo)準(zhǔn)) |
5 | ISO/IEC 24708:2008 | Information technology — Biometrics — BioAPI Interworking Protocol | 信息技術(shù)生物特征識(shí)別 BioAPI 互通協(xié)議 |
6 | ISO/IEC 24709 | Information technology — Conformance testing for the biometric application programming interface (BioAPI) | 生物特征識(shí)別應(yīng)用程序接口(BioAPI)的符合性測(cè)試(系列標(biāo)準(zhǔn)) |
7 | ISO/IEC 30107-1:2016 | ISO/IEC 30107-1:2016 Information technology — Biometric presentation attack detection | 信息技術(shù)生物特征識(shí)別呈現(xiàn)攻擊檢測(cè)第 1 部分:框架 |
8 | ISO/IEC 30137:2019 | INFORMATION TECHNOLOGY — USE OF BIOMETRICS IN VIDEO SURVEILLANCE SYSTEMS | 信息技術(shù)-在視頻監(jiān)控系統(tǒng)中使用生物識(shí)別 |