背景
水分含量(Moisture content, MC)和脂肪酸含量(Fatty acid content, FAC)是大米品質的重要指標,影響大米的存儲和食用品質。因此,建立一種快速、準確、無損的MC和FAC檢測方法至關重要。
可見/jinhongwaiguangpukeyixiangyingyangpinzhongdemouxiehanqingjituan,congerhuodeyangpinzhongdeneibuhuaxuexinxi。gaijishuyibeiyongyujiancenongchanpinzhongdeshuifenhezhifangsuanhanliang。tongshi,yukejianguang/近紅外光譜相比,高光譜成像(Hyperspectral imaging, HSI)技術具有光譜與圖像相結合的優勢。利用每個像素點的光譜預測水稻的MC和FAC,形成水稻的MC和FAC的可視化分布,使檢測結果更加直觀。但是,HSI技術也存在數據量大、實時性差等缺點,難以在實際中應用。然而,這些問題可以通過數據降維和特征波長選擇來解決。
本研究的目的是結合HSI技術與化學計量學方法,建立一種快速簡便的水稻MC和FAC檢測方法。(1)采用不同的預處理方法對大米和精米的光譜進行預處理,建立了MC和FAC的全波段預測模型。最後根據模型性能確定*佳預處理方法。(2)采用兩種變量選擇方法篩選大米和精米在900~1700 nm區域的MC和FAC的顯著波長。(3)比較了MC和FAC模型在大米和精米中的性能,並分析了稻殼對MC和FAC模型性能的影響。(4)利用*佳模型預測每個像素點的MC和FAC,實現水稻樣品MC和FAC的可視化。
試驗設計
浙江農林大學孫通副教授團隊利用GaiaField-N17E高光譜成像係統(江蘇雙利合譜)獲取了13個水稻品種的大米和精米高光譜影像(圖1)。近紅外高光譜成像儀的光譜範圍為900~1700 nm,空間分辨率為640像素,波段數為512,光譜分辨率為5 nm。對獲得的高光譜影像利用OTSU方法獲取其前景像素,並計算大米和精米平均光譜。
預處理可以去除高頻隨機噪聲和基線漂移等噪聲,提高模型性能。本研究采用了5種預處理方法,包括多元散射校正(MSC)、標準正態變量變換(SNV)、Savitzky-Golay(SG)平滑、SG+一階導數和SG導數。根據全波段模型的性能,選擇最合適的預處理方法。為提高計算速度,減少數據冗餘,本研究采用競爭自適應重加權采樣(CARS)和連續投影算法(SPA)選擇大米/精米中MC和FAC的顯著波長。

圖1高光譜成像係統
結論
大米和精米在900~1700 nm波長範圍內的原始反射光譜如圖2所示。從圖2可以看出,大米和精米的光譜在900~1400 nm波長範圍內具有相同的趨勢。然而,大米的反射光譜逐漸增加,而精米的反射光譜在1400~1700 nm波長範圍內趨於穩定。此外,大米光譜的反射率值普遍高於精米。這可能是由於大米和精米的顏色、光滑度和透明度不同造成的。在960、1200和1450 nm處有三個明顯的峰。960 nm左右的峰值可能是由水和碳水化合物中O-H二階泛音的協同作用引起的。1200 nm左右的峰值與樣品的MC有關,1450 nm左右的峰值歸因於O-H拉伸第一泛音。

圖2 大米(a)和精米(b)樣品的原始光譜
采用5種預處理方法對大米和精米樣品的光譜進行處理,利用PLSR算法建立MC和FAC的估測模型。由表1可知,在“大米-水分”模型中,SNV和SG-2預處理效果更好。采用SNV預處理建立的模型R2較高,達到0.9682。但該模型不穩定,魯棒性較差。因此,SG-2模型的性能優於SNV模型。在“大米-脂肪酸”模型中,SG-2是*佳的預處理方法。對於“精米-水分”模型,SG-2預處理的R2較高。綜上所述,在“大米-水分”、“精米-水分”和“大米-脂肪酸”3種預測模型中,SG-2是*佳的預處理方法。而在“精米-脂肪酸”模型中,SG平滑是*好的預處理方法,模型的R2p和RMSEP分別為0.8427和1.7806。
從表1可以看出,大米中MC的(de)模(mo)型(xing)性(xing)能(neng)優(you)於(yu)精(jing)米(mi)。這(zhe)是(shi)因(yin)為(wei)稻(dao)殼(ke)含(han)有(you)水(shui)分(fen),其(qi)吸(xi)水(shui)能(neng)力(li)高(gao)於(yu)精(jing)米(mi)。因(yin)此(ci),當(dang)大(da)米(mi)樣(yang)品(pin)經(jing)過(guo)水(shui)處(chu)理(li)後(hou),稻(dao)殼(ke)比(bi)精(jing)米(mi)吸(xi)收(shou)更(geng)多(duo)的(de)水(shui)分(fen)。因(yin)此(ci),大(da)米(mi)光(guang)譜(pu)中(zhong)含(han)有(you)的(de)水(shui)分(fen)信(xin)息(xi)比(bi)精(jing)米(mi)光(guang)譜(pu)中(zhong)含(han)有(you)的(de)水(shui)分(fen)信(xin)息(xi)更(geng)多(duo)。相(xiang)比(bi)之(zhi)下(xia),精(jing)米(mi)中(zhong)FAC的模型性能優於大米。稻殼主要由纖維素、半纖維素、木(mu)質(zhi)素(su)等(deng)成(cheng)分(fen)組(zu)成(cheng),其(qi)中(zhong)不(bu)含(han)脂(zhi)肪(fang)酸(suan)。稻(dao)殼(ke)中(zhong)存(cun)在(zai)的(de)幹(gan)擾(rao)信(xin)息(xi)會(hui)影(ying)響(xiang)建(jian)模(mo)過(guo)程(cheng)中(zhong)脂(zhi)肪(fang)酸(suan)的(de)預(yu)測(ce)。因(yin)此(ci),得(de)到(dao)的(de)光(guang)譜(pu)信(xin)息(xi)可(ke)能(neng)會(hui)受(shou)到(dao)穀(gu)殼(ke)的(de)幹(gan)擾(rao),導(dao)致(zhi)精(jing)米(mi)的(de)預(yu)測(ce)精(jing)度(du)降(jiang)低(di)。
表1 不同預處理方法下樣品中水分和脂肪酸的PLS模型預測結果

由於采用SG或SG-2預處理的MC和FAC模型效果*好,因此對這些光譜進行了CARS和SPA特征優選。由表2可以看出,相較於CARS,SPA選擇更少的重要波長,使實際應用更容易,同時SPA模型的RPD值較高,模型精度較高。此外,SPA模型的性能優於全波段模型,這表明SPA選擇的波長幾乎包含了MC或FAC的所有有效信息。與全波段模型的結果相似,SPA模型對大米中MC的預測精度高於精米,而對大米中FAC的預測精度低於精米。“大米-水分”、“精米-水分”、“大米-脂肪酸”的*佳模型為“SG2-SPA-PLS”,“精米-脂肪酸”的*佳模型為“SG-SPA-PLS”。
SPA選擇的波長如表3所示。MC模型選擇的964.17、965.74、975.16、978.29、1373.75和1395.72 nm波長與水分波長相似,歸功於O-H拉伸的第一、第二和第三泛音。對於FAC模型,選擇的1095.99、1387.87和1516.56 nm波長歸功於C-H的一、二泛音和-CH2基團的拉伸,選取的939.06、964.17和967.31 nm波長主要來自於O-H鍵的彎曲振動。
表2 使用選定波長的樣品中水分和脂肪酸的PLS模型預測結果

表3 由SPA選擇的波長

通過Fearn(1996)提出的方法驗證稻殼對MC和FAC預測精度的影響。在95%置信水平下計算區間是否包含0。如果它包含0,則偏差在5%的水平上沒有顯著差異。由表4可知,大米和精米中MC的預測誤差計算區間均為0,而FAC的不為0。這表明大米與精米中FAC的預測誤差存在顯著差異,因此稻殼對FAC的預測精度有一定的影響。
表4 大米和精米的水分和脂肪酸含量在95%置信水平上存在顯著差異

圖3為不同水分梯度下水稻樣品MC的可視化結果。可以看出,水稻樣本的MC越高,可視化圖像中的紅色區域越大,而水稻樣本的MC越低,可視化圖像中的藍色區域越大。這與大米樣本的實際MC一致,說明MC模型對每個像素的MC預測是準確的。此外,可視化圖像中大米樣品的MC分布不均勻,這可能是由於樣品處理過程中吸濕不均勻造成的。圖4為大米樣品FAC可視化結果。FAC模型可以準確預測每個像素的FAC。可視化可以直觀地反映水稻中MC和FAC的空間變化,可以在像元水平上了解MC和FAC的分布情況。因此,在儲存前檢驗和儲存監測中,可以在很小的範圍內檢測到異常的MC和FAC,從而保證了大米的質量安全。

圖3 大米含水量可視化圖

圖4 大米脂肪酸含量可視化圖
作者信息
孫通,博士,浙江農林大學光機電工程學院副教授,碩士生導師。
主要研究方向:農林產品光譜智能檢測技術研究及裝備開發。
參考文獻:
Song, Y., Cao, S., Chu, X., Zhou, Y., Xu, Y., Sun, T., Zhou, G., & Liu, X. (2023). Non-Destructive Detection of Moisture and Fatty Acid Content in Rice using Hyperspectral Imaging and Chemometrics. Journal of Food Composition and Analysis, 11.
https://doi.org/10.1016/j.jfca.2023.105397
地址:無錫市梁溪區南湖大道飛宏路58-1-108
電話:
郵箱:
地址:北京市海澱區中關村大街19號
電話:
郵箱:
地址:陝西省西安市高新區科技一路40號盛方科技園B座三層東區
電話:
郵箱:
地址:成都市青羊區順城大街206號四川國際大廈七樓G座
電話:
郵箱:
地址:深圳市龍華區民治梅龍路
電話:
郵箱: