背景
suliaogenjuqikejiangjiexingfenweikejiangjiesuliaohebukejiangjiesuliao。bukejiangjiesuliaozhipinyouyujiagedilian,zairichangshenghuozhongbeiguangfanshiyong。raner,daduoshubukejiangjiedesuliaozhipinbunengjishiyouxiaodichuli。zaochenghuanjingyanzhongwuran,zaochengshengtaipohuai、作物減產、shipinanquanwenti。muqian,kejiangjiesuliaodetuiguangyingyongcaiganggangqibu,xuduobuhegedesuliaozhipinhunrushichang。zhegeishichangjianguandailailehendadekunnan,yincixunsushibiebukejiangjiehekejiangjiesuliaoshizaibixing。
高光譜成像技術因其無損、無汙染、低耗、**等優點,在質量控製、定量分析、定ding性xing鑒jian定ding等deng方fang麵mian得de到dao了le廣guang泛fan應ying用yong。普pu通tong塑su料liao聚ju合he物wu具ju有you不bu同tong的de光guang譜pu特te征zheng,因yin此ci利li用yong可ke見jian近jin紅hong外wai波bo段duan對dui塑su料liao聚ju合he物wu進jin行xing識shi別bie是shi可ke行xing的de。塑su料liao光guang譜pu信xin息xi采cai集ji技ji術shu的de進jin步bu也ye推tui動dong了le光guang譜pu數shu據ju挖wa掘jue方fang法fa的de創chuang新xin。常chang用yong主zhu成cheng分fen分fen析xi、小波變換提取敏感特征,再用偏最小二乘判別分析、支持向量機、隨機森林等方法進行分類。然而,傳統的機器學習方法通常需要人工進行特征提取和分類器設計,難以靈活地處理分類任務。
與傳統機器學習相比,深度學習具有端到端特征,避免了複雜的特征工程。代表性的模型是卷積神經網絡(Convolutional neural networks, CNN)和殘差網絡(Residual networks, ResNet)。利用ResNet中提出的殘差連接直接連接不同的網絡層,在保證良好網絡性能的同時可以加深網絡。然而,當CNN或ResNet的de深shen度du和he寬kuan度du固gu定ding時shi,由you於yu卷juan積ji核he不bu容rong易yi根gen據ju實shi際ji數shu據ju的de特te點dian進jin行xing有you效xiao調tiao整zheng,其qi表biao示shi能neng力li將jiang受shou到dao限xian製zhi。動dong態tai卷juan積ji是shi在zai靜jing態tai卷juan積ji的de基ji礎chu上shang改gai進jin的de非fei線xian性xing運yun算suan。它ta可ke以yi解jie決jue深shen度du學xue習xi模mo型xing適shi應ying性xing差cha的de問wen題ti,更geng有you效xiao地di提ti取qu數shu據ju特te征zheng。同tong時shi,動dong態tai卷juan積ji計ji算suan是shi高gao效xiao的de,因yin為wei並bing行xing卷juan積ji核he通tong過guo聚ju合he共gong享xiang輸shu出chu通tong道dao,這zhe不bu會hui增zeng加jia網wang絡luo的de深shen度du和he寬kuan度du。在zai網wang絡luo中zhong引yin入ru動dong態tai卷juan積ji可ke以yi在zai特te征zheng識shi別bie過guo程cheng中zhong自zi適shi應ying捕bu獲huo特te征zheng。
為此,我們提出了一種塑料高光譜數據挖掘方法,主要貢獻如下:
(1)設計了白色可降解和不可降解塑料的識別策略。
(2)提出了一種基於動態殘差網絡(Dy-ResNet)的高光譜數據挖掘模型。在模型優化過程中引入殘差模塊,避免梯度消失;引入動態卷積層,提高模型的自適應性和表示能力。
(3)Dy-ResNet有效區分了白色可降解塑料和不可降解塑料。為食品領域中可降解和不可降解塑料的識別提供思路。
試驗設計
東北電力大學門洪教授團隊利用GaiaSorter高光譜成像係統(江蘇雙利合譜公司)獲取了17類可降解塑料和不可降解塑料共計1020個樣本的高光譜影像(圖1)。其波長範圍為380 ~ 1038 nm,波段數為520。在每個樣本的高光譜圖像的中心區域選擇一個像素大小為60 × 60的采樣區域作為感興趣區域,獲取其平均光譜,並對其進行SG濾波和SNV預處理。
CNN主要由卷積層、池(chi)化(hua)層(ceng)和(he)全(quan)連(lian)接(jie)層(ceng)組(zu)成(cheng),其(qi)中(zhong)全(quan)連(lian)接(jie)層(ceng)的(de)核(he)心(xin)操(cao)作(zuo)是(shi)卷(juan)積(ji)和(he)池(chi)化(hua)。卷(juan)積(ji)提(ti)取(qu)了(le)多(duo)波(bo)段(duan)高(gao)光(guang)譜(pu)特(te)征(zheng),同(tong)時(shi)充(chong)分(fen)保(bao)持(chi)了(le)特(te)征(zheng)之(zhi)間(jian)的(de)位(wei)置(zhi)關(guan)係(xi)。池(chi)化(hua)可(ke)以(yi)減(jian)小(xiao)特(te)征(zheng)圖(tu)的(de)大(da)小(xiao),可(ke)以(yi)保(bao)留(liu)最(zui)關(guan)鍵(jian)的(de)信(xin)息(xi),有(you)效(xiao)防(fang)止(zhi)網(wang)絡(luo)過(guo)擬(ni)合(he)。同(tong)時(shi),通(tong)過(guo)池(chi)化(hua)可(ke)以(yi)減(jian)少(shao)網(wang)絡(luo)中(zhong)的(de)節(jie)點(dian)數(shu)量(liang),有(you)效(xiao)提(ti)高(gao)了(le)網(wang)絡(luo)的(de)計(ji)算(suan)效(xiao)率(lv)。ResNet由兩個卷積層組成,卷積核大小為3 × 3,填充和步長為1(圖2)。將原始特征與挖掘特征相結合,可以有效避免塑料高光譜圖像深度特征提取中的特征退化問題。
本ben文wen將jiang靜jing態tai卷juan積ji層ceng替ti換huan為wei動dong態tai卷juan積ji層ceng,在zai不bu增zeng加jia網wang絡luo深shen度du和he寬kuan度du的de前qian提ti下xia提ti高gao了le計ji算suan效xiao率lv。根gen據ju卷juan積ji核he的de自zi適shi應ying性xing,動dong態tai卷juan積ji層ceng具ju有you魯lu棒bang的de表biao示shi能neng力li。動dong態tai卷juan積ji層ceng結jie構gou如ru圖tu3所示。首先,對全局位置信息進行平均池化壓縮;然後,將壓縮後的信息通過全連接層映射到激活層,其中ReLU為激活函數。激活信息通過全連接層映射到softmax層。最後,softmax層輸出K個權值用於核聚合。K表示參與核聚合的卷積核的個數,K的增加會導致模型的複雜度增加。在大多數情況下,softmax層的輸出值相對稀疏,因此隻有一小部分卷積核可以跨層優化,導致神經網絡在訓練過程中收斂緩慢。因此,減少softmax層中的注意力是必要的,這樣可以使訓練更有效。計算公式如1所示,當T = 1時,公式為原始softmax層。利用Dy-kernel自適應提取高光譜數據的特征,然後依次通過BN和ReLU得到最終輸出。
|
|
(1) |
本文提出了自適應提取塑料高光譜數據特征的Dy-ResNet方法,該方法主要由包含動態卷積層的殘差塊組成。圖4顯示了Dy-ResNet的結構,包括一個卷積層、一個BN層、四個動態卷積殘差塊(DR-block)、兩個池化層、一個flatten層和一個全連接層。

圖1 高光譜塑料檢測係統

圖2 殘差塊結構

圖3 動態卷積層結構

圖4 Dy-ResNet的結構
結論
在動態卷積層中,參數K和T顯著影響穩定性和精度。如果K過大,雖然模型具有更強的表達能力,但優化所有卷積核和注意力更加困難,網絡更容易出現過擬合。在softmax層中,T控製了注意力權值的稀疏性,適當的T可以使模型在早期訓練中更有效。因此,有必要確定K和T的最優值。如圖5所示,當K較小時,模型的訓練時間和分類穩定性都較好。然而,K的數量限製了動態卷積核的自適應能力,降低了模型的分類精度和F1-score。當K設置為4時,既保證了模型的分類性能,又充分考慮了訓練時間。T越大,模型的穩定性越高。但是,當T過於大時,模型的分類性能會下降,因此將T設為31。

圖5 不同參數的動態卷積層
可降解和不可降解塑料的分類結果如表1所示。雖然Dy-ResNet、ResNet、Dy-CNN和CNN模型都取得了很好的分類效果,但提出的Dy-ResNet模型的識別效果更好。Dy-ResNet模型的識別準確率為99.06%,F1-score為98.86%,Kappa為97.73%。此外,對比CNN和ResNet模型的分類結果可以看出,殘差連接的引入更有助於挖掘高光譜數據的深層特征。Dy-ResNet模型的精度、F1-score和Kappa分別比ResNet模型高1.53%、1.85%和3.71%,表明動態卷積層可以有效提高模型在高光譜數據挖掘中的適應性和表征能力。
不同模型的混淆矩陣如圖6所示。可以看出,四種分類模型的分類效果都很好,說明該分類模型是有效的。此外,可以看到Resnet、Dy-CNN和CNN模型將一些不可降解塑料預測為可降解塑料,這可能是由於訓練集中樣本數量不平衡造成的。然而,Dy-Resnet模型可以避免由於訓練集各類別樣本數量不平衡而導致的錯誤預測。
表1 四種網絡模型的2-分類實驗結果

圖6 四種方法對可降解塑料和不可降解塑料的分類結果。Dy-ResNet(a), Dy-CNN(b), ResNet(c), CNN(d)
為了進一步驗證Dy-ResNet在塑料識別中的有效性,分別使用Dy-ResNet、ResNet、Dy-CNN和CNN模型對17種樣品進行分類。4個模型在全連接層的輸出神經元數量從2個變為17個,4個模型的其他結構和超參數不變。17種塑料的分類結果見表2。總體而言,DyResNet的分類性能優於其他模型,其準確率為89.76%,F1-score為89.68%,Kappa為89.13%。與CNN相比,Dy-ResNet中的殘差連接可以有效提取塑料高光譜圖像的深層特征。在5個獨立實驗中,Dy-ResNet的模型精度最高,表明其具有*好的識別穩定性。殘差連接和動態卷積層的引入可以有效地提高模型的穩定性。
測試集樣本的預測標簽與實際標簽形成的混淆矩陣如圖7所示。可以看出,這四種模型都能有效識別標記為0、6、7、8、9、11、12、13、14、15的樣本。但值得注意的是,四種模型在識別標簽2和標簽10的樣品時存在一些錯誤,主要是將標簽2的樣品部分歸類為標簽3,將標簽10的樣品部分歸類為標簽11。這主要是由於,除了碳酸鈣外,標簽2和標簽3對應的樣品在成分材料上是相同的。除澱粉外,標簽10和11對應的樣品在組成材料上是相同的。上述樣品中相似的成分使得所收集的高光譜圖像難以區分,這就是它們被錯誤分類的原因。
表2 四種網絡模型的17種分類實驗結果


圖7 四種方法對17種塑料的分類結果。Dy-ResNet(a), Dy-CNN(b), ResNet(c), CNN(d)
合理解釋本研究提出的方法在塑料識別任務中取得良好的效果十分必要。Grad-CAM可用於可視化基於CNN模型的模型識別過程。如圖8(a)所示,在區分可降解和不可降解塑料時,Dy-ResNet提取的特征光譜波段分布在可見光和近紅外範圍內。此外,用於識別不可降解塑料的關鍵特征主要分布在580 ~ 860 nm範圍內,用於識別可降解塑料的關鍵特征主要分布在680 ~ 1030 nm範圍內。如圖8(b)所示,Dy-ResNet提取的特征光譜波段在區分17種塑料時也分布在可見光和近紅外範圍內。總體而言,用於識別塑料種類的特征光譜波段主要集中在560 ~ 860nm範圍內。然而,每種塑料的特征光譜波段的分布範圍是不同的。例如,標記為15的樣品的特征光譜波段主要集中在可見光範圍,而標記為12的樣品的特征光譜波段主要集中在近紅外範圍。因此,選擇380 ~ 1038 nm光譜波段進行塑料識別,有助於充分探索不同塑料在不同光譜波段的特性。

圖8 用於塑料識別的特征光譜可視化。2分類實驗(a), 17分類實驗(b)
作者信息
門洪,博士,東北電力大學自動化工程學院教授,博士生導師。
主要研究方向:智能感知與模式識別。
參考文獻:
Xia, X., Wang, M., Shi, Y., Huang, Z., Liu, J., Men, H., & Fang, H. (2023). Identification of white degradable and non-degradable plastics in food field: A dynamic residual network coupled with hyperspectral technology. Spectrochim Acta A Mol Biomol Spectrosc, 296, 122686.
https://doi.org/10.1016/j.saa.2023.122686
地址:無錫市梁溪區南湖大道飛宏路58-1-108
電話:
郵箱:
地址:北京市海澱區中關村大街19號
電話:
郵箱:
地址:陝西省西安市高新區科技一路40號盛方科技園B座三層東區
電話:
郵箱:
地址:成都市青羊區順城大街206號四川國際大廈七樓G座
電話:
郵箱:
地址:深圳市龍華區民治梅龍路
電話:
郵箱: