編號:CYYJ01677
篇名:基于多粒度空間混亂的細粒度圖像分類算法
作者:宋思雨 苗奪謙
關(guān)鍵詞: 細粒度圖像分類 空間混亂 多粒度 深度學(xué)習(xí) 數(shù)據(jù)增強 卷積神經(jīng)網(wǎng)絡(luò) 弱監(jiān)督學(xué)習(xí) 局部區(qū)域
機構(gòu): 同濟大學(xué)電子與信息工程學(xué)院 同濟大學(xué)嵌入式系統(tǒng)與服務(wù)計算教育部重點實驗室
摘要: 細粒度圖像分類是計算機視覺領(lǐng)域一個具有挑戰(zhàn)性的任務(wù),在實際場景中具有很高的應(yīng)用價值。其中不同子類別的物體整體輪廓差異較小,微小的判別性局部區(qū)域是分類的關(guān)鍵。然而,這些重要的局部區(qū)域的尺度可能不同,不能用單一的標準去衡量它們。為了解決這個問題,本文提出了多粒度空間混亂模塊來幫助神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)如何尋找到不同尺度的判別性細節(jié)。該模塊首先將圖片劃分為不同粒度的局部區(qū)域,然后隨機打亂并重組構(gòu)成新的輸入圖片。經(jīng)過處理的圖片具有區(qū)域無關(guān)性,從而迫使網(wǎng)絡(luò)更好地在不同粒度層次下尋找有判別力的局部區(qū)域并從中學(xué)習(xí)特征。在3個廣泛使用的細粒度圖像分類數(shù)據(jù)集上的實驗證明本文提出的模塊可以有效地幫助網(wǎng)絡(luò)尋找判別性局部區(qū)域從而提升了準確率并且網(wǎng)絡(luò)不需要圖片的任何部位標注信息。