茶樹是全球重要的經濟作物,具有龐大的消費市場,但茶苗的繁育與生長受到不良氣候條件等因素的限製,導致茶樹扡插苗生長緩慢、成cheng本ben高gao昂ang,從cong而er製zhi約yue了le優you良liang品pin種zhong的de推tui廣guang與yu產chan業ye化hua水shui平ping。扡qian插cha苗miao的de地di上shang部bu和he根gen係xi生sheng物wu量liang是shi衡heng量liang其qi生sheng長chang發fa育yu質zhi量liang的de重zhong要yao指zhi標biao,因yin此ci,如ru何he快kuai速su、準確地監測其生長過程對於提高成活率和苗木管理水平具有重要意義。
傳統的人工稱重方法在測定茶樹扡插苗生物量時具有破壞性且效率低,難以滿足高通量、無(wu)損(sun)檢(jian)測(ce)的(de)需(xu)求(qiu)。近(jin)年(nian)來(lai),高(gao)光(guang)譜(pu)成(cheng)像(xiang)技(ji)術(shu)因(yin)其(qi)能(neng)夠(gou)同(tong)時(shi)獲(huo)取(qu)樣(yang)品(pin)的(de)結(jie)構(gou)和(he)化(hua)學(xue)信(xin)息(xi),被(bei)廣(guang)泛(fan)應(ying)用(yong)於(yu)作(zuo)物(wu)性(xing)狀(zhuang)監(jian)測(ce)。已(yi)有(you)研(yan)究(jiu)表(biao)明(ming),光(guang)譜(pu)信(xin)息(xi)與(yu)植(zhi)物(wu)的(de)生(sheng)理(li)、生化特征存在緊密聯係,可用於反映植株的養分含量、激*水平及生理狀態。結合機器學習和深度學習的方法,能夠進一步提升高光譜數據的建模精度與穩定性。
因此,該研究提出利用高光譜成像技術結合深度學習方法,對茶樹扡插苗的地上部和根係生物量進行快速、無損預測,以解決傳統方法耗時、破壞性強的問題,為茶樹優良品種的高*篩選和精細化育苗管理提供新的技術途徑和數據支撐。
作者信息:丁兆堂;山東省農業科學院
期刊來源:Scientia Horticulturae
研究內容
本研究旨在利用高光譜成像技術結合深度學習模型,實現對茶樹扡插苗地上部和根係生物量的快速、無損與精準預測,以解決傳統人工稱重方法破壞性強、效(xiao)率(lv)低(di)的(de)問(wen)題(ti)。研(yan)究(jiu)過(guo)程(cheng)中(zhong),首(shou)先(xian)采(cai)集(ji)不(bu)同(tong)生(sheng)長(chang)階(jie)段(duan)茶(cha)樹(shu)扡(qian)插(cha)苗(miao)葉(ye)片(pian)與(yu)嫩(nen)梢(shao)的(de)高(gao)光(guang)譜(pu)反(fan)射(she)數(shu)據(ju),並(bing)對(dui)光(guang)譜(pu)數(shu)據(ju)進(jin)行(xing)預(yu)處(chu)理(li),以(yi)去(qu)除(chu)噪(zao)聲(sheng)和(he)散(san)射(she)效(xiao)應(ying)並(bing)增(zeng)強(qiang)光(guang)譜(pu)與(yu)生(sheng)理(li)指(zhi)標(biao)的(de)相(xiang)關(guan)性(xing)。隨(sui)後(hou),提(ti)取(qu)關(guan)鍵(jian)光(guang)譜(pu)特(te)征(zheng)波(bo)段(duan),減(jian)少(shao)冗(rong)餘(yu)信(xin)息(xi)並(bing)突(tu)出(chu)與(yu)生(sheng)物(wu)量(liang)密(mi)切(qie)相(xiang)關(guan)的(de)變(bian)量(liang)。在(zai)建(jian)模(mo)環(huan)節(jie),利(li)用(yong) Mask R-CNN 網絡對扡插苗進行圖像與光譜特征融合,構建CNN-GRU生物量預測模型。研究建立了一種高*可靠的檢測方法,為茶樹優良品種的篩選、扡插苗的生長監測以及智能化育苗管理提供了新的技術途徑與數據支撐。
實驗設計
茶樹扡插苗選用了三個品種:‘玉金香(YJX)’、‘中白1號(ZB)’和‘中茗6號(ZM)’。為了獲取不同生長期的茶扡插苗,實驗每25天進行一次,共進行了10次。每次試驗1個穴盤(含32株扡插苗),共收獲扡插苗960株(3個品種× 32株扡插苗× 10個試驗)。
為了測定扡插苗的生長情況,對960條扡插苗的枝條和根係進行破壞性分析,並采集高光譜數據,將枝條和根係置於105 ℃烘箱中20 min,然後將烘箱溫度調至90 ℃幹燥至恒重,最後用電子秤記錄重量
本研究采用了高光譜成像技術來監測茶扡插苗從扡插到成長為幼苗過程中生物量的變化(見圖1a)。高光譜成像采集係統包括成像光譜相機(Gaia field pro-v10,江蘇雙利合譜技術有限公司),四個鹵素燈、電腦、校正白板、黑色背景。高光譜相機所拍攝圖像的光譜範圍在可見-近紅外波段(391-1010 nm),光譜範圍為1101 × 960像素,可測量360個ge波bo段duan的de光guang譜pu反fan射she率lv。為wei了le避bi免mian光guang譜pu相xiang機ji內nei部bu暗an電dian流liu的de影ying響xiang,提ti高gao高gao光guang譜pu圖tu像xiang的de信xin噪zao比bi,對dui獲huo取qu的de原yuan始shi高gao光guang譜pu圖tu像xiang進jin行xing黑hei白bai白bai色se校xiao正zheng。利li用yong高gao光guang譜pu相xiang機ji采cai集ji了le960株扡插苗的高光譜數據,每幅高光譜圖像包含8株扡插苗作為一個模型樣本,得到包括120個高光譜圖像的總數據集。通過結合成熟葉片和莖葉的光譜信息以及深度學習和機器學習算法,對莖葉和根係的生物量進行了評估(見圖1b)。

圖1. 圖像采集與流程圖的結合。(a) 圖像采集 (b) 數據處理流程圖
為了增加模型訓練的數據量,120張圖像通過兩種不同的數據增強方法進行處理:旋轉(90°、180°和270°)和翻轉(水平和垂直),圖像數量增加到720張。這些圖像通過Labelme軟ruan件jian進jin行xing手shou動dong標biao注zhu。首shou先xian,對dui成cheng熟shu葉ye片pian和he莖jing葉ye區qu域yu分fen別bie用yong不bu同tong顏yan色se的de標biao簽qian進jin行xing標biao注zhu和he分fen類lei,其qi中zhong綠lv色se代dai表biao莖jing葉ye,紅hong色se代dai表biao成cheng熟shu葉ye片pian。未wei標biao注zhu的de區qu域yu被bei視shi為wei背bei景jing。圖tu2展示了成熟葉片和莖葉的標注圖像。隨後,將這些標注圖像輸入到Mask R-CNN中進行訓練。

圖2. 標注圖像 (a) 標注成熟葉片和莖葉的圖像;(b) 標注完成的成熟葉片和莖葉圖像
Mask R-CNN網絡被用於獲取莖葉和成熟葉片的麵積。圖3展示了Mask R-CNN網絡的結構圖。Mask R-CNN 網絡主要分為五個結構:Backbone、區域建議網絡(RPN)、感興趣區域對齊(ROI Align)、邊框回歸(Box Regression)以及分類與掩膜(Classification and Mask)。通過5折交叉驗證將標記的圖像劃分為訓練集和測試集。所采用的學習率為0.001,Epoch為20,Batch大小為1。

圖3. Mask R-CNN的結構圖。
由於高光譜采集儀器及環境因素的影響,在成熟葉片和嫩梢的光譜中存在散射效應、隨機噪聲和係統噪聲。因此,本研究對其光譜數據進行了 MSC、S-G 和一階導數(1-D)預處理。另外為了減少數據計算量並提高後續建模的準確性,本研究采用了連續投影算法(SPA)、競爭自適應重加權采樣算法(CARS)和不確定性變量消*算法(UVE)來選擇具有代表性的光譜波段作為特征波段。
在模型的建立方麵,構建了卷積神經網絡與門控循環單元(CNN-GRU)網絡模型和傳統機器學習模型。CNN-GRU模型網絡結構如圖4所示。首先,為了更好地提取數據的底層特征,使用CNN來提取數據特征。然後,數據被輸入到一個5×5的濾波器中進行卷積。經過4次卷積、平均池化、序列擴展和展平後,數據被輸入到GRU網絡中。在這裏,一維光譜數據與莖葉和根係生物量數據被GRU網絡結合,用於回歸預測。此外,在CNN網絡中,步長為1,填充為“same”(填充值由算法根據卷積核大小內部計算),輸入數據通道為1。經過3次門控循環後,預測數據被輸入到全連接層,並通過回歸器輸出。

圖4. CNN-GRU的結構圖。
為了進一步驗證CNN-GRU網絡的性能,使用了SVR、RFR和PLSR三種機器學習方法和CNN、LSTM兩種深度學習方法作為對比模型,CNN和LSTM網絡的層數均設置為16層。為了防止模型的過擬合,在訓練過程中確定了超參數,支持向量回歸機的核函數為多項式核函數,RFR的樹的數量為200,PLSR的隱變量為18。在本研究中,用6種方法分別建立了以地上部、成熟葉和地上部、根係生物量為指標的回歸模型。
為了進一步保證算法的準確性,本研究采用五重交叉驗證,將數據集分成五部分,依次取其中4個作為訓練數據,1個作為測試數據,重複五次,然後對結果進行平均,為了更準確地評價回歸模型的性能,使用決定係數(R2)、均方根誤差(RMSE)、歸一化均方根誤差(NRMSE)和相對百分比偏差(RPD)來評價模型的性能。為了評估Mask R-CNN模型的光譜信息提取性能,使用精度,召回率和F1得分來評估模型的性能。
通過實驗室方法測定了茶扡插苗的莖葉和根係生物量。結果顯示,三種品種的扡插苗莖葉萌發時間相同,均在第25天開始萌發。然而,中茗6號(ZM)的生根時間最早,從第125天開始生根;中茗6號的莖葉和根係生長量*大,莖葉生長量約為1.7克,根係生長量約為0.6克。在200–225天期間,莖葉和根係的生長速度最快;中白1號(ZB)的生根時間最晚,從第175天開始生根;玉金香(YJX)的莖葉和根係生長量最小,莖葉生長量約為0.8克,根係生長量約為0.1克。
對成熟葉片和莖葉的分割結果進行了比較和分析,結果顯示,Mask R-CNN能夠以高精度分割成熟葉片和莖葉。其中,成熟葉片光譜的提取效果優於莖葉光譜,提取精度達到97.8%。莖葉光譜的提取精度為91.5%。成熟葉片和莖葉光譜的提取精度均超過90%。因此,Mask R-CNN模型能夠準確且高*地從茶扡插苗圖像中提取成熟葉片和莖葉的光譜信息。
對Mask R-CNN模型提取的成熟葉片和枝條原始光譜分別采用MSC、1-D和S-G算法進行預處理,如圖5所示,與原始光譜相比,MSC、1-D和S-G聯合預處理後光譜曲線的波峰和波穀更加突出,提高了光譜的分辨率和靈敏度,有利於提高後期建立回歸模型的準確性。

圖5. 原始光譜與MSC、1D和S-G預處理後的光譜對比。(a) 莖葉光譜 + 莖葉生物量;(b) 莖葉光譜 + 根係生物量;(c) 成熟葉片光譜 + 莖葉生物量;(d) 成熟葉片光譜 + 根係生物量。
為了消*無關波段對模型準確性的影響,在基於莖葉光譜選擇莖葉生物量特征波段的方法中,UVE選擇的特征波段數量最多,達到212個波長,而SPA選擇的特征波段數量最少,僅為8個波長;在基於莖葉光譜選擇根係生物量特征波段的方法中,UVE選擇的特征波段數量最多,為135個波長,SPA選擇的特征波段數量最少,為6個波長;在基於成熟葉片光譜選擇莖葉生物量特征波段的方法中,UVE選擇的特征波段數量最多,為69個波長,SPA選擇的特征波段數量最少,為14個波長;在基於成熟葉片光譜選擇根係生物量特征波段的方法中,UVE選擇的特征波段數量最多,為90個波長,SPA選擇的特征波段數量最少,為17個波長。
在基於莖葉光譜評估莖葉生物量時,UVE算法的建模效果優於CARS和SPA,UVE+CNN-GRU提供了*佳的估算模型(Rp²=0.90,RMSEP=0.12,RPD=2.43)。CARS算法的建模效果較差,CARS+PLSR模型的效果最差(Rp²=0.50,RMSEP=0.32,RPD=1.36)。
在基於成熟葉片光譜評估莖葉生物量時,UVE算法的建模效果優於CARS和SPA,UVE+CNN-GRU提供了*佳的估算模型(Rp²=0.78,RMSEP=0.16,RPD=2.13)。SPA算法的建模效果較差,SPA+PLSR模型的效果最差(Rp²=0.48,RMSEP=0.29,RPD=1.00)。在基於成熟葉片光譜評估根係生物量時,SPA算法的建模效果優於UVE和CARS,SPA+LSTM提供了*佳的估算模型(Rp²=0.65,RMSEP=0.05,RPD=1.67)。CARS算法的建模效果較差,CARS+PLSR模型的效果最差(Rp²=0.39,RMSEP=0.10,RPD=1.22)。圖6展示了四種*佳估算模型的預測值與實際值的散點圖。

圖6. 四種*佳估算模型的預測值與實際值的散點圖。(a) 莖葉光譜 + UVE + CNN-GRU;(b) 成熟葉片光譜 + UVE + CNN-GRU;(c) 莖葉光譜 + SPA + CNN;(d) 成熟葉片光譜 + SPA + LSTM。
本研究提出了一種利用高光譜成像技術監測茶扡插苗莖葉生長和根係生長的方法。首先,通過Mask R-CNN提取茶扡插苗成熟葉片的光譜和莖葉的光譜。隨後,利用MSC、S-G濾波和1-D對光譜進行預處理,並通過UVE、CARS和SPA篩選特征波段。最後,采用CNN-GRU網絡構建莖葉和根係生物量的預測模型。研究結果表明:(1)Mask R-CNN能*確提取成熟葉片(*確率=97.8%)和嫩梢(*確率=91.5%)的光譜特征;(2)通過UVE方法篩選獲得的嫩梢(212個)和根係(105個)生物量特征波段,較CARS和SPA方法更具豐富性;(3)基於嫩梢光譜構建的UVE+CNN-GRU模型(Rp²=0.90,RMSEP=0.12,RPD=2.43)對嫩梢生物量的估算效果*優,表明該模型預測結果可靠,與實際值誤差較小;(4)基於成熟葉片光譜構建的SPA+LSTM模型(Rp²=0.65,RMSEP=0.05,RPD=1.67)對根係生物量的估算效果*佳,證明該模型可用於茶樹扡插苗根係狀況評估,為根係生長監測提供了有效手段。
地址:無錫市梁溪區南湖大道飛宏路58-1-108
電話:
郵箱:
地址:北京市海澱區中關村大街19號
電話:
郵箱:
地址:陝西省西安市高新區科技一路40號盛方科技園B座三層東區
電話:
郵箱:
地址:成都市青羊區順城大街206號四川國際大廈七樓G座
電話:
郵箱:
地址:深圳市龍華區民治梅龍路
電話:
郵箱: