近日,中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所機(jī)器人視覺(jué)研究組在遮擋行人重識(shí)別領(lǐng)域取得新進(jìn)展,提出了一種遮擋行人重識(shí)別算法。該研究成果在線發(fā)表于工業(yè)信息領(lǐng)域國(guó)際期刊IEEE Transactions on Industrial Informatics(中國(guó)科學(xué)院一區(qū)Top類,IF:12.3)。
行人重識(shí)別指通過(guò)非重疊攝像頭檢索同一個(gè)行人目標(biāo),是行人檢測(cè)和行人跟蹤的重要環(huán)節(jié),可用于視頻監(jiān)控、交通管理、智能安防、刑事偵查、多機(jī)協(xié)同檢測(cè)等。然而,大多數(shù)現(xiàn)有的行人重識(shí)別方法都基于目標(biāo)在圖像中完整可見(jiàn)的假設(shè),由于真實(shí)場(chǎng)景中存在汽車、廣告牌、樹(shù)木等遮擋物,導(dǎo)致識(shí)別目標(biāo)難以匹配。
科研人員針對(duì)這一問(wèn)題提出了一種基于Transformer注意力機(jī)制的遮擋行人重識(shí)別算法。研究中發(fā)現(xiàn)在利用Transformer提取行人特征時(shí),淺層網(wǎng)絡(luò)提取的特征分布在局部目標(biāo)區(qū)域;中間層網(wǎng)絡(luò)的注意力集中在可見(jiàn)行人部分;高層網(wǎng)絡(luò)的注意力聚焦全局行人特征。基于這一發(fā)現(xiàn),研究團(tuán)隊(duì)提出了跳連接聚合Transformer網(wǎng)絡(luò)(SCAT),利用中間層特征、高層特征和細(xì)粒度局部特征來(lái)增加特征多樣性,提升遮擋行人目標(biāo)的重識(shí)別精度。在多個(gè)數(shù)據(jù)集上驗(yàn)證了所提方法的有效性,包括遮擋數(shù)據(jù)集、部分?jǐn)?shù)據(jù)集和全身數(shù)據(jù)集。
研究成果得到了國(guó)家自然科學(xué)基金委員會(huì)、中國(guó)科學(xué)院青年創(chuàng)新促進(jìn)會(huì)和機(jī)器人學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室的大力支持。