應用方向:
高(gao)光(guang)譜(pu)成(cheng)像(xiang)技(ji)術(shu)憑(ping)借(jie)其(qi)強(qiang)大(da)的(de)空(kong)間(jian)和(he)光(guang)譜(pu)信(xin)息(xi)獲(huo)取(qu)能(neng)力(li),已(yi)成(cheng)為(wei)植(zhi)物(wu)產(chan)品(pin)地(di)理(li)來(lai)源(yuan)識(shi)別(bie)與(yu)質(zhi)量(liang)控(kong)製(zhi)的(de)前(qian)沿(yan)工(gong)具(ju)。根(gen)據(ju)研(yan)究(jiu),高(gao)光(guang)譜(pu)技(ji)術(shu)結(jie)合(he)深(shen)度(du)學(xue)習(xi)模(mo)型(xing),可(ke)以(yi)實(shi)現(xian)枸(gou)杞(qi)的(de)地(di)理(li)來(lai)源(yuan)精(jing)準(zhun)分(fen)類(lei),準(zhun)確(que)率(lv)高(gao)達(da)95.63%。通過特征波長提取,不僅顯著提高了分析效率,還增強了數據的科學解釋性。此外,高光譜與化學分析(如NMR)的結合,能夠進一步揭示樣品化學成分與光譜特征的關聯,為複雜樣品的快速、非破壞性檢測提供創新解決方案。
背景:
枸杞以其卓越的營養價值和顯著的藥用功效享譽全球,尤其是在抗氧化、*炎、免(mian)疫(yi)調(tiao)節(jie)和(he)抗(kang)腫(zhong)瘤(liu)等(deng)方(fang)麵(mian)表(biao)現(xian)突(tu)出(chu)。這(zhe)些(xie)特(te)性(xing)與(yu)其(qi)地(di)理(li)來(lai)源(yuan)密(mi)切(qie)相(xiang)關(guan),地(di)理(li)來(lai)源(yuan)不(bu)僅(jin)決(jue)定(ding)了(le)其(qi)化(hua)學(xue)成(cheng)分(fen)和(he)藥(yao)用(yong)效(xiao)果(guo),還(hai)顯(xian)著(zhu)影(ying)響(xiang)市(shi)場(chang)價(jia)值(zhi)。因(yin)此(ci),快(kuai)速(su)、準(zhun)確(que)地(di)識(shi)別(bie)枸(gou)杞(qi)的(de)地(di)理(li)來(lai)源(yuan)對(dui)於(yu)質(zhi)量(liang)控(kong)製(zhi)和(he)市(shi)場(chang)調(tiao)節(jie)至(zhi)關(guan)重(zhong)要(yao)。傳(chuan)統(tong)的(de)地(di)理(li)來(lai)源(yuan)識(shi)別(bie)方(fang)法(fa)主(zhu)要(yao)依(yi)賴(lai)於(yu)物(wu)理(li)化(hua)學(xue)特(te)性(xing)或(huo)感(gan)官(guan)評(ping)價(jia),但(dan)這(zhe)些(xie)方(fang)法(fa)通(tong)常(chang)依(yi)賴(lai)專(zhuan)家(jia)經(jing)驗(yan),缺(que)乏(fa)客(ke)觀(guan)性(xing)和(he)*確性。近年來,現代分析技術(如近紅外光譜、超高光譜成像(HSI)、核磁共振(NMR)和液相色譜-飛行時間質譜)在地理來源鑒定中顯示出強大優勢。其中,HSI提供了豐富的光譜和空間信息,NMR在成分識別與定量分析中表現突出。然而,這些方法單獨使用時存在一定局限性,如數據複雜性高、維度大,導致傳統機器學習模型難以有效處理。
為(wei)克(ke)服(fu)上(shang)述(shu)挑(tiao)戰(zhan),深(shen)度(du)學(xue)習(xi)技(ji)術(shu)被(bei)引(yin)入(ru)到(dao)分(fen)析(xi)過(guo)程(cheng)。這(zhe)些(xie)方(fang)法(fa)能(neng)夠(gou)從(cong)高(gao)維(wei)數(shu)據(ju)中(zhong)自(zi)動(dong)提(ti)取(qu)特(te)征(zheng),能(neng)夠(gou)有(you)效(xiao)利(li)用(yong)光(guang)譜(pu)與(yu)空(kong)間(jian)特(te)征(zheng),從(cong)而(er)顯(xian)著(zhu)提(ti)升(sheng)地(di)理(li)來(lai)源(yuan)的(de)分(fen)類(lei)精(jing)度(du)。同(tong)時(shi),SHAP解釋模型的引入解決了深度學習的“黑箱”問題,增強了結果的可解釋性。因此,該研究通過將HSI和NMR技術與深度學習技術相結合,用於識別枸杞的地理來源。具體目標包括:(i) 通過將HSI數據與SHAP方法相結合,改進ResNet-34模型,實現枸杞地理來源的判定;(ii) 利用NMR技術識別枸杞的地理來源及其特定地理標記(GI);(iii) 建立枸杞地理標記物與HSI數據中提取的特征波長之間的關聯。
實驗設計
1.1材料與方法
(1)樣品製備
幹gan燥zao後hou的de枸gou杞qi樣yang品pin由you中zhong國guo寧ning夏xia農nong業ye產chan品pin質zhi量liang標biao準zhun與yu檢jian測ce技ji術shu研yan究jiu所suo下xia屬shu的de農nong業ye產chan品pin質zhi量liang監jian測ce中zhong心xin提ti供gong。所suo有you枸gou杞qi樣yang品pin均jun采cai自zi四si個ge主zhu要yao產chan區qu的de當dang地di農nong場chang,包bao括kuo寧ning夏xia同tong心xin縣xian(TX)和寧夏中寧縣(ZN,品種分別為ZN1和ZN2)、青海諾木洪(NMH)以及青海德令哈(DLH)。
寧夏地區的枸杞樣品於2022年6月下旬至7月上旬采收,青海地區的樣品則於2022年9月完成采收。不同產地和品種的枸杞均采用人工手工采摘的方式,從每棵枸杞樹的東、南、西、北四個方向分別采摘,以保證采樣的全*性xing。為wei確que保bao數shu據ju分fen析xi的de一yi致zhi性xing並bing減jian少shao潛qian在zai偏pian差cha,每mei個ge產chan地di的de樣yang品pin經jing過guo嚴yan格ge篩shai選xuan,盡jin量liang保bao持chi大da小xiao均jun勻yun。采cai摘zhai完wan成cheng後hou,枸gou杞qi在zai自zi然ran條tiao件jian下xia日ri曬shai幹gan燥zao數shu日ri。最zui終共獲得525份樣品(每個產地n=105)。樣品的兩麵分別標記為A麵和B麵,其RGB圖像如圖1所示。隨後,所有樣品均迅速冷凍保存於-80°C環境中,以保持其生化和物理特性。
圖1. 不同地理和品種產地的代表性枸杞樣品的RGB圖像
(2)HSI和1H核磁共振(NMR)采集和數據預處理
HSI數據采集及光譜預處理:HSI數據在可見光-近紅外(VNIR)高光譜成像係統(GaiaField-V10E,江蘇雙利合譜科技有限公司,江蘇無錫,中國)上獲取。該係統由高光譜成像儀(GaiaField-V10E)、透鏡(HSIA-OL23)、光源(HSIA-LS-T-200 W)、標準漫射參考板(HSIA-CT-400×400,雙利合譜,中國)和安裝有SpecView軟件的計算機組成。將枸杞樣品放置在離透鏡35 cm的工作台上。分別采集枸杞兩側的HSI數據,記為A麵和B麵。然後對枸杞的高光譜數據進行黑白校正。為了減少光譜外圍噪聲波動的影響,校正後的高光譜圖像中初始6個波長被*除。隨後,對枸杞高光譜數據進行了準確的分割處理。每個枸杞被指定為一個獨特的興趣區域,以方便深入分析。
1H NMR采集及光譜預處理:在完成所有枸杞樣品的HSI數據采集後,從每個地理產地和品種中隨機挑選30個枸杞樣品,迅速在液氮中冷凍,並使用研缽和研杵將其研磨成細粉。每個樣品中取100 mg的粉末,溶解於甲醇-氯仿-水的混合溶劑中,體積比為4:4:6。混合液通過渦旋混合1分鍾以確保充分混勻,然後在冰浴中冷卻15分鍾以促進相分離。冷卻後,溶液在4°C條件下離心10分鍾。小心將上清液轉移至5 mL的Eppendorf管中,並使用樣品濃縮器蒸發30分鍾後,進行24小時的冷凍幹燥,以去除殘留的甲醇和水。幹燥殘渣用600μL的氘化磷酸鹽緩衝液(100 mM,pH = 5.7)重新溶解,該緩衝液中含有0.05%的TSP(鈉鹽3-(三甲基矽基)丙酸-2,2,3,3-d4)。混合液再渦旋混合5分鍾後,在10,000 g × 4 °C條件下離心10分鍾。最後,將550 μL的上清液轉移至5 mm NMR管中,用於采集1H NMR光譜數據。
所有枸杞樣品的1H NMR光譜均使用850 MHz的Bruker AVANCE III核磁共振波譜儀(Bruker公司,德國卡爾斯魯厄)采集,配備CPTCI探頭,工作頻率為850.32 MHz。1H NMR光譜通過ZGPR脈衝序列采集,參數設定如下:溫度為298 K,譜寬為14 KHz,數據點數為32 K,弛豫延遲為4.0秒,采集時間為1.9秒,共64次掃描。
所有枸杞樣品的1H NMR光譜數據均通過MestReNova軟件(V14.0.0,Mestrelab Research,西班牙)進行預處理。處理步驟包括傅裏葉變換、相位和基線校正,以及利用TSP的單峰信號(δ0)對光譜進行對齊。在δ0-10範圍內,將光譜分割為寬度為0.002 ppm的區間,並移除殘留甲醇峰(δ3.35-3.37)和水峰(δ4.75-4.90)的幹擾信號。對TSP峰(δ0)進行歸一化處理,使其峰強值為9,便於後續的定量分析。最終,將積分數據導入SIMCA 14.1軟件進行全*的多變量統計分析。
(3)枸杞的地理來源鑒定
傳統機器學習:采用邏輯回歸(LR)和采用基於徑向基函數核函數的非線性支持向量機(SVM)進行枸杞產地的識別。為了優化SVM模型的性能,使用網格搜索方法調整懲罰因子(C)和核參數(γ)。具體來說,懲罰因子C從20.1變化到250,核參數γ從2 - 15調整到2 - 10。
改進的ResNet-34:與傳統機器學習算法相比,深度學習模型在分類任務中表現出更高的準確性,這主要歸因於其能夠自動從高維數據中提取更全*的特征。這種優勢在高精度地理來源識別中得到了驗證。如今,ResNet被廣泛應用於各種分類任務。考慮到HSI數據的複雜性和高維性,以及模型的性能要求,本研究選擇了一種改進版的ResNet-34架構。
表1展示了改進版ResNet-34的架構,說明其由五個模塊組成,每個模塊包含36個卷積層,最終連接至一個全連接層。與原始ResNet相比,最顯著的區別在於初始卷積層Conv1_x的修改。傳統的2D卷積層被替換為3D卷積層,以更好地適應枸杞HSI數據的複雜性。Conv1_x層包含三個3D卷積子層和一個2D卷積子層,各自配備不同尺寸的卷積核:3 × 3 × 17、3 × 3 × 11、3 × 3 × 7(3D卷積)和3 × 3(2D卷積)。每次卷積操作均應用修正線性單元(ReLU)激*函數。這一架構調整的動機是利用HSI數據中固有的多波段圖像特性,這不僅提供了豐富的空間和光譜信息,也顯著增加了數據的複雜性和體量。整個枸杞HSI數據集(包括A麵和B麵)隨機分為訓練集(占70%)和測試集(占30%)。訓練集用於優化改進版ResNet-34模型的參數,測試集則用於評估模型的預測性能。在本研究中,學習率、批量大小、訓練周期數、損失函數和優化器分別設置為0.001、16、200、交叉熵損失和Adam。這些參數的選擇旨在有效處理具有64 × 64像素空間維度和114個光譜波段的圖像。
特征波長提取:雖然HSI提供了豐富的光譜和空間信息,但其高維性和共線性以及冗餘性對計算效率和模型魯棒性構成了重大挑戰。此外,深度學習模型的“黑箱”性質(其特征是缺乏固有的可解釋性)進一步使其應用複雜化。為了解決這些問題,有必要對預處理後的光譜進行特征提取,以盡量減少非相關變量的影響,消*冗餘信息,從而提高模型的計算效率和性能。
利用SHAP技術對模型輸出進行解析,提取了400 - 1040 nm光譜範圍內的特征波長。計算SHAP值,得到各光譜波段各數據點的貢獻分數,這些SHAP值代表各光譜波段對模型的重要程度。該方法不僅揭示了HSI數據中每個光譜波段對全球範圍內預測結果的重要性,而且還描繪了其在每個HSI區域內的影響。在本研究中,迭代選取貢獻率最高的5%以內的光譜波段圖像作為模型的訓練數據,每一步遞增5%,直到模型的預測精度接近於原始模型。
(4)統計分析
所有NMR積分數據隨後通過SIMCA 14.1軟件進行多變量統計分析。在此之前,數據進行了單位方差縮放,以突出微量成分的差異。使用偏最小二乘判別分析(PLS-DA)來揭示不同產地之間的組成差異,隨後應用正交偏最小二乘判別分析(OPLS-DA)以識別枸杞的地理或品種標誌物。PLS-DA和OPLS-DA模型的性能通過模型參數R2X、R2Y和Q2進行評估。此外,為了檢測潛在的過擬合,模型進行了200次置換檢驗。
枸杞中各成分的定量通過比較每種成分特征峰的積分與內標物(TSP)的積分實現,濃度以平均值 ± 標準偏差(SD)表示,基於三次重複實驗獲得。在本研究中,構建了一個四維火山圖以展示倍數變化、p值、*對相關係數(r)和投影變量重要性(VIP)。枸杞的地理標誌(GI)標誌物基於以下嚴格標準進行識別:倍數變化不在0.8–1.2範圍內,p < 0.05,|r| > 0.90,且VIP值位於前5%。
為了分析同一枸杞樣品中NMR數據與HSI數據之間的相關性,計算了它們的Pearson相關係數。此外,使用精度評估了LR、SVM和改進的ResNet-34模型在識別枸杞地理起源方麵的性能。
1.2.結果與討論
(1)基於HSI數據的枸杞產地識別
圖2顯示了不同地理產地的枸杞樣品A麵和B麵的平均反射率。不同產地的枸杞樣品中相似的光譜趨勢表明相似的化學成分,而光譜強度的差異表明不同成分的濃度不同。同時,圖2a和b顯示了枸杞樣品的A麵和B麵光譜差異很小,這一發現意味著從單側采集HSI數據是一種可行的方法,因為盡管樣本兩側的外部和內部特征存在潛在變化,但它不會引入重大誤差。在400 - 560nm的可見光光譜中,枸杞樣品的光譜反射率明顯較低,曲線重疊,這可能是由於枸杞的紅色表麵在該波長範圍內反射的光較少。相反,在560 - 850nm波長範圍內,枸杞表麵的反射率逐漸增加,光譜曲線呈現出微小的差異。雖然不同產地的枸杞樣品的反射率曲線開始出現差異,但差異仍然很小。枸杞在922 nm和985 nm處有小穀,在963 nm處有小峰,這些特征表明了O-H拉伸的第二和*一泛音。
圖2.來自不同地理和品種產地的枸杞樣品的(a)A麵和(b)B麵平均反射光譜
盡(jin)管(guan)不(bu)同(tong)地(di)理(li)來(lai)源(yuan)或(huo)品(pin)種(zhong)的(de)枸(gou)杞(qi)在(zai)光(guang)譜(pu)上(shang)存(cun)在(zai)差(cha)異(yi),但(dan)不(bu)能(neng)通(tong)過(guo)視(shi)覺(jiao)比(bi)較(jiao)來(lai)有(you)效(xiao)區(qu)分(fen)。此(ci)外(wai),相(xiang)似(si)的(de)顏(yan)色(se)和(he)形(xing)狀(zhuang)增(zeng)加(jia)了(le)視(shi)覺(jiao)區(qu)分(fen)的(de)難(nan)度(du)。因(yin)此(ci),選(xuan)擇(ze)合(he)適(shi)的(de)分(fen)類(lei)策(ce)略(lve)對(dui)其(qi)進(jin)行(xing)準(zhun)確(que)分(fen)類(lei)就(jiu)變(bian)得(de)至(zhi)關(guan)重(zhong)要(yao)。為(wei)了(le)獲(huo)得(de)更(geng)好(hao)的(de)分(fen)類(lei)結(jie)果(guo),本(ben)研(yan)究(jiu)采(cai)用(yong)了(le)機(ji)器(qi)學(xue)習(xi)技(ji)術(shu)。表(biao)2顯示了線性(LR)和非線性(SVM)模型對枸杞地理來源識別的分類結果。在A側和B側的測試數據集上,LR和SVM模型對枸杞產地的分類準確率均未超過90%,但當使用一側數據訓練的模型對枸杞產地進行識別時,LR模型和SVM模型的預測準確率分別達到95.24%和99.43%。總體結果表明,機器學習結合HSI技術有效地識別了枸杞的起源。此外,通過從枸杞的任何一側收集HSI數據,可以實現可靠的地理來源追溯。

考慮到LR和SVM模型的分類準確率不足90%,引入深度學習對高維HSI數據進行進一步分析。正如之前的研究所指出的那樣,深度學習模型需要大量的訓練數據集。因此,我們將來自枸杞兩側的HSI數據納入了包含730個樣本的訓練數據集和包含320個樣本的測試數據集。為了避免同一枸杞樣品的A麵或B麵被分配至不同的數據集(從而影響驗證結果的完整性),同一樣品的兩麵被策略性地分配至相同數據集。基於RGB圖像和全光譜HSI數據構建的ResNet-34與改進版ResNet-34模型的混淆矩陣分別展示於圖3a和b及圖3c和d中。矩陣對角線上的值表示正確分類的樣本數和真實陽性率,而非對角線上的值則對應誤分類樣本數和假陰性率。值得注意的是,當以HSI數據為輸入時,改進版ResNet-34模型在所有產地(TX、NMH、DLH、ZN1和ZN2)中實現了95.63%的最高分類準確率。這一結果較傳統機器學習方法(LR和SVM)提高了6.26%。這一性能提升歸因於HSI數據提供的豐富空間和光譜信息。改進版ResNet-34模型中3D和2D卷積層的結合,能夠有效利用光譜和空間特征圖,從而*大化模型的預測準確性。
圖3.在測試數據集上使用ResNet-34模型(a和b)和改進的ResNet-34模型(c和d)對五種枸杞樣品進行地理來源識別的混淆矩陣
總的來說,改進的ResNet-34模型在基於起源的五種不同類型的枸杞分類中顯示出較高的準確性。然而,通過3D卷積運算利用全譜HSI數據增加了計算需求和複雜性。此外,深度學習模型固有的“黑箱”特征在可解釋性方麵提出了挑戰。為了減少信息冗餘並提高模型的可解釋性,我們使用SHAP來識別HSI數據中對地理起源識別貢獻*大的光譜帶區域。SHAP值代表了每個光譜波段對模型預測能力的貢獻。對枸杞地理來源分類有重要貢獻的光譜波段主要從633 nm延伸到1040 nm。隨著光譜波段的增加,該模型對枸杞地理來源的識別精度逐漸提高(圖4)。實際上,在保留35%的光譜波段(n = 39)的情況下,該模型的分類精度仍然保持在95.63%的高水平,與全光譜HSI數據的分類精度相當。光譜波段的減少也導致運行時間減少29.9%。該方法不僅有效地提高了處理速度,而且提高了產地識別的效率,在準確性和計算效率之間取得了平衡。
圖4.利用改進的ResNet-34對不同波段子集的枸杞產地識別數據集精度進行測試
(2)枸杞的地理來源及標記物的NMR鑒定
枸杞樣品的一維1H NMR提供了詳細的光譜分布,通過分析峰強度和化學位移來辨別成分組成和濃度的差異,有助於識別地理來源。在δ0.8 ~ δ3.5的高場區,主要與氨基酸和有機酸有關,但差異不大。但在丙氨酸(δ1.48)和一種未知成分(δ1.51)濃度上存在顯著差異,其中寧夏枸杞(TX、ZN1和ZN2)含量顯著高於青海枸杞(NMH和DLH)。δ3.5 ~ δ5.5的中低場區以各種糖類為主,δ6.0 ~ δ10.0的低場區以芳香族化合物為主。通過比較化學位移和耦合常數與數據庫中的條目,包括FooDB和HMDB,以及與先前報告的相關性,從枸杞的核磁共振光譜中確定了62個組分。
對枸杞的化學成分分析顯示其含有豐富的氨基酸、有機酸、糖類、核苷和其他生物活性化合物。枸杞的氨基酸和有機酸含量特別豐富,十幾種氨基酸和五種有機酸的濃度在0.1至1mg /g之(zhi)間(jian)。這(zhe)些(xie)成(cheng)分(fen)可(ke)能(neng)提(ti)供(gong)各(ge)種(zhong)健(jian)康(kang)益(yi)處(chu),例(li)如(ru)產(chan)生(sheng)免(mian)疫(yi)刺(ci)激(ji)作(zuo)用(yong),增(zeng)強(qiang)抗(kang)氧(yang)化(hua)能(neng)力(li),並(bing)保(bao)持(chi)健(jian)康(kang)的(de)代(dai)謝(xie)率(lv)。具(ju)體(ti)而(er)言(yan),異(yi)亮(liang)氨(an)酸(suan)是(shi)一(yi)種(zhong)支(zhi)鏈(lian)氨(an)基(ji)酸(suan),已(yi)被(bei)證(zheng)明(ming)可(ke)以(yi)通(tong)過(guo)影(ying)響(xiang)器(qi)官(guan)、細胞和反應性物質來增強免疫係統,並可能上調宿主防禦肽(如β-防禦素)的(de)表(biao)達(da),這(zhe)對(dui)先(xian)天(tian)免(mian)疫(yi)和(he)適(shi)應(ying)性(xing)免(mian)疫(yi)至(zhi)關(guan)重(zhong)要(yao)。甜(tian)菜(cai)堿(jian)是(shi)枸(gou)杞(qi)的(de)一(yi)種(zhong)獨(du)特(te)標(biao)記(ji)物(wu),已(yi)被(bei)證(zheng)明(ming)可(ke)以(yi)通(tong)過(guo)增(zeng)強(qiang)抗(kang)氧(yang)化(hua)活(huo)性(xing)和(he)減(jian)少(shao)炎(yan)症(zheng)介(jie)質(zhi)來(lai)減(jian)輕(qing)四(si)氯(lv)化(hua)碳(tan)(CCl4)誘導的肝損傷。有機酸,包括羥基丁酸、乙酸、蘋果酸和檸檬酸,對枸杞的感官特性(如味道、風味和顏色)有重要影響。枸杞是一種久負盛名的中*藥和滋補食品,其主要成分是枸杞多糖,尤其是枸杞多糖是枸杞中最有價值的功能成分之一。最近的研究表明,LBP具有一係列的生物活性,包括眼神經保護、抗衰老特性、抗氧化作用和免疫調節作用。在本研究中,LBP由半乳糖、鼠李糖、α-木糖、β-木糖、α-葡萄糖和β-葡萄糖組成,其濃度差異很大,在不同地理產地的濃度範圍為0.19 ~ 103.95 mg/g。此外,盡管咖啡酸、肉桂酸和維生素B6等芳香化合物的濃度很低(含量超過0.1 mg/g),但它們對人體健康起著至關重要的作用,包括抗氧化和抗*texing,yijijianshaojiaolvhezengqiangshijiaogongneng。suiranbutongchandidegouqizaichengfenshangcunzaixianzhuchayi,danbunengjinjintongguomucebijiaolaiquedingqidililaiyuan。yinci,caiyongduoyuantongjifenxilaiquedingmeigeqiyuandeduteGI標記。
圖5展示了基於枸杞NMR數據的OPLS-DA得分圖和對應的火山圖 ,分別針對不同產地的枸杞樣品進行成對比較,並附上模型參數,包括R²X、R²Y和Q²值。圖5a展示了不同中國省份枸杞樣品的比較分析。其中,OPLS-DA得分圖(圖5a左圖)顯示寧夏和青海樣品沿預測成分(橫軸)呈現顯著分離。模型的高擬合度(R²Y = 0.871)和預測能力(Q² = 0.833)表明該模型在區分地理來源方麵的有效性。火山圖(圖5a右圖)用於探索寧夏和青海枸杞的地理標記物(GI標記)。根據“材料與方法”部分中詳細描述的篩選標準,地理標記物被篩選出來(見圖5a右圖)。結果表明,青海枸杞的穀氨酸(Glu)、蘋果酸(MA)和脯氨酸(Pro)含量分別是寧夏樣品的1.96倍、1.91倍和1.68倍。而寧夏枸杞則以二羥基丙酮(DHA)含量顯著較高,其水平是青海枸杞的2.7倍。
其中,穀氨酸(Glu)以其多方麵的生理作用而被廣泛認可,包括抗氧化、應對脅迫以及作為內源性*癌劑的作用,其衍生物在癌症治*中的潛力也備受關注。脯氨酸(Pro)不僅是蛋白質的重要組成部分,還顯著參與細胞對滲透壓和脫水脅迫的響應。此外,脯氨酸是枸杞中最豐fudeyoulianjisuan,jizuoweishentoutiaojieji,yezuoweikangyanghuajifahuizuoyong。qinghaigouqizhongxianzhujiaogaodeguansuanhepuansuannongdujiangzengqiangqikangyanghuaheshentoutiaojiegongneng
圖5. 基於枸杞NMR數據的OPLS-DA評分圖(左圖)和相應的火山圖(右圖)
圖5b和圖5c分別展示了寧夏和青海省內不同縣域枸杞樣品的比較分析。OPLS-DA得分圖(圖5b和圖5c左圖)顯示TX和ZN以及NMH和DLH樣品在預測成分(橫軸)上呈現出顯著分離。模型參數表明區分地理來源的有效性:TX與ZN的R²Y = 0.967,Q²= 0.936,NMH與DLH的R²Y = 0.966,Q²= 0.936,進一步驗證了模型的預測能力和可靠性。火山圖(圖5b右圖)及統計數據揭示,ZN枸杞中包括1-甲基尿酸、膽堿、甜菜堿、咖啡酸、穀氨酸(Glu)、鳥苷、核糖內酯、蘇糖醇和絲氨酸在內的多種營養成分濃度顯著高於TX樣品,而蔗糖、甲酸和3-甲基黃嘌呤在ZN樣品中的濃度顯著低於TX。豐富的營養成分及獨特的香氣賦予ZN枸杞更強的抗氧化活性、減少炎症介質及神經保護作用,這在以往研究中也得到了驗證。NMH與DLH樣品的火山圖(圖5c右圖)分析發現了17種顯著差異的成分,包括乙醛酸、蘋果酸、α/β-半乳糖醛酸、異亮氨酸、1-磷酸半乳糖、異丁酸、蔗糖、α/β-木糖、鼠李糖、肉桂酸、麥芽糖、古羅糖酸內酯、麥芽三糖、精氨酸和氨基葡萄糖6-硫酸酯。其中,有13種成分在NMH枸杞中的濃度顯著高於DLH樣品。尤其是乙醛酸、異亮氨酸和異丁酸在NMH樣品中的濃度分別是DLH樣品的4.0倍、2.09倍和2.64bei。yanjiubiaoming,yiliangansuanzaitiaojiexiantianmianyiheshiyingxingmianyizhongqizhongyaozuoyong。yidingsuanzuoweiyizhongduanlianzhifangsuan,youyiliangansuandengzhiliananjisuanfajiaochansheng,yibeizhengmingkehuanjieDSS誘導的慢性結腸炎。這種作用主要歸因於其增強腸道屏障功能的能力,從而突顯NMH枸杞在胃腸健康領域的潛在治*優勢。
寧ning夏xia中zhong寧ning縣xian因yin其qi獨du特te的de地di理li和he氣qi候hou條tiao件jian,為wei枸gou杞qi的de高gao品pin質zhi種zhong植zhi提ti供gong了le得de天tian獨du厚hou的de自zi然ran環huan境jing。然ran而er,不bu同tong品pin種zhong的de枸gou杞qi在zai化hua學xue和he營ying養yang成cheng分fen上shang存cun在zai差cha異yi。OPLS-DA模型清晰地將ZN1與ZN2沿橫軸分離(圖5d左圖),並表現出穩健的模型參數(R²Y = 0.898,Q²= 0.846)。通過四項篩選標準,火山圖(圖5d右圖)中鑒定出5種顯著差異成分。葡萄糖胺6-磷酸和古羅糖酸內酯在ZN1中的濃度高於ZN2,而賴氨酸、綠原酸和肉桂酸則表現出相反趨勢。其中,葡萄糖胺6-磷lin酸suan作zuo為wei葡pu萄tao糖tang胺an的de衍yan生sheng物wu,在zai針zhen對dui中zhong度du至zhi重zhong度du膝xi骨gu關guan節jie炎yan患huan者zhe的de臨lin床chuang試shi驗yan中zhong,被bei證zheng明ming能neng夠gou顯xian著zhu緩huan解jie疼teng痛tong並bing改gai善shan功gong能neng活huo動dong。賴lai氨an酸suan是shi人ren體ti必bi需xu氨an基ji酸suan,無wu法fa由you人ren體ti自zi身shen合he成cheng,具ju有you廣guang泛fan的de健jian康kang益yi處chu,包bao括kuo促cu進jin正zheng常chang生sheng長chang、幫助肉堿生成以及減輕焦慮。此外,賴氨酸在癌症治*中的潛力也備受關注。研究表明,賴氨酸的代謝影響組蛋白短鏈化,這是一種表觀遺傳修飾,從而調控癌症免疫。
(3)地理標誌與HSI特征波長相關性分析
HSI和NMR都證明了在確定枸杞的地理起源方麵的有效性。NMR,特別是與多元統計分析相結合,成為識別GI標記物的有力工具。它提供了可以用來區分不同來源的化學信息的深度。然而,盡管在HSI中通常采用特征波段選擇的做法,但這些特征波長與樣品中特定成分之間的相關性通常仍未被探索。這一差距可能會限製HSI數據在潛在化學變化方麵的可解釋性。此外,雖然NMR提ti供gong了le豐feng富fu的de生sheng化hua見jian解jie,但dan它ta麵mian臨lin著zhe挑tiao戰zhan,例li如ru食shi品pin基ji質zhi樣yang品pin製zhi備bei的de複fu雜za性xing,以yi及ji相xiang關guan成cheng本ben可ke能neng令ling人ren望wang而er卻que步bu。這zhe些xie因yin素su可ke能neng會hui阻zu礙ai快kuai速su、無損、高通量分析的實施,而這對於高*、kekuozhandegouqiyuanchandisuyuanguochengzhiguanzhongyao。weilejiejuezhexiexianzhi,kaifajiehezheliangzhongjishudeyoudian,tongshijinliangjianshaogeziquediandecelveshizhiguanzhongyaode。gaizonghefangfaweigouqichandijiandingtigongleyizhonggengquan*、更有效的方法。
通過HSI-NMR Pearson相關分析,成功地揭示了枸杞特征波長與GI標記之間的相關性(圖6)。不同產地枸杞的GI標記在單個光譜波段上表現出顯著的相關性,p值<0.001,Pearson相關係數(R)在自由度為150時超過0.264。在633 ~ 768 nm範圍內,大部分物質與枸杞的紅色光譜具有明顯的相關性,這與枸杞的天然紅色相一致。對於不同省份的枸杞,以633.6 nm、665.6 nm和980 nm為中心的HSI波段與GI標記物呈極顯著相關(p < 0.001)。其中,633.6 nm的HSI波段與脯氨酸(δ1.98)、蘋果酸(δ2.37)和咖啡酸(δ7.33)密切相關。665.6 nm處與穀氨酸(δ2.08)密切相關,980 nm處與二羥丙酮(δ4.44)和葫蘆巴堿(δ9.13)相關。研究表明,以643 nm為中心的波段與氨基酸的第三和第四泛音區域有關,包括脯氨酸和穀氨酸。此外,976 nm至987 nm的波長範圍對應於油營養物中C-H(CH/CH2/CH3)鍵的第三泛音區域和O-H鍵的第三泛音區域。隨後,利用663.6 nm、665.6 nm和980 nm三個最顯著相關波段的圖像,利用改進的ResNet-34建立了枸杞起源分類模型。僅使用三個波長的光譜圖像來區分寧夏和青海枸杞樣品的準確率達到95%。在不同縣域的枸杞 GI標記物(TX-ZN和NMH-DLH)中,特定生物標記物與HSI波段之間存在顯著正相關(p值<0.001)。異亮氨酸(δ0.96)、精氨酸(δ1.68)、蘋果酸、膽堿(δ3.21)、1-甲基尿酸(δ3.33)、絲氨酸(δ3.96)、果糖(δ4.12)、綠原酸(δ7.19)和咖啡酸作為GI標記與以633.6 nm為中心的HSI波段相連。穀氨酸(665.6 nm)、蘇糖醇(δ3.64)、硫酸氨基葡萄糖(δ4.91)和α-木糖(δ5.19)均與980 nm處的譜帶相對應。對於不同品種的枸杞(ZN1 ~ ZN2),賴氨酸和綠原酸在633.6 nm處與HSI波段呈顯著相關(p值<0.001)。古洛內酯(δ4.73)和葡萄糖胺6磷酸(δ5.45)在801 nm和719.3 nm處與HSI波段的相關性較弱(p < 0.05)。ZN1和ZN2品種的鑒定準確率較低,為93.75%,主要是由於其種植地點較近。當比較全光譜HSI數據和SHAP提取的特征波長時,使用與GI標記物高度相關的光譜圖像,運行時執行時間分別顯著降低46.26%和33.99%。這表明有針對性的光譜圖像分析方法可以在不影響精度的情況下提高*率。

圖6.枸杞地理標誌標記的HSI-NMR Pearson係數相關圖
本研究結果表明,GI標記物與HSI特(te)征(zheng)波(bo)長(chang)的(de)相(xiang)關(guan)性(xing)有(you)效(xiao)地(di)闡(chan)明(ming)了(le)光(guang)譜(pu)波(bo)段(duan)與(yu)枸(gou)杞(qi)化(hua)學(xue)成(cheng)分(fen)之(zhi)間(jian)的(de)聯(lian)係(xi)。這(zhe)種(zhong)相(xiang)關(guan)性(xing)不(bu)僅(jin)增(zeng)強(qiang)了(le)我(wo)們(men)對(dui)枸(gou)杞(qi)光(guang)譜(pu)特(te)征(zheng)的(de)理(li)解(jie),而(er)且(qie)強(qiang)調(tiao)了(le)開(kai)發(fa)便(bian)攜(xie)式(shi)多(duo)光(guang)譜(pu)設(she)備(bei)的(de)潛(qian)力(li)。該(gai)裝(zhuang)置(zhi)可(ke)提(ti)供(gong)一(yi)種(zhong)無(wu)創(chuang)、低成本、高通量的地理來源鑒定方法。
結論
本研究提出了一種將HSI和NMR技術與深度學習相結合,用於準確識別枸杞的地理來源及其GI的新方法。改進的ResNet-34模型通過整合3D和2D卷積層,在利用HSI數據進行產地識別中實現了95.63%的分類準確率。此外,采用SHAP方法選擇特征波長,與使用全光譜HSI數據的分類準確率相當,但運行時間縮短了29.9%。研究還表明,基於枸杞不同側麵數據訓練的模型具有魯棒性,且模型性能未受到顯著影響。通過NMR分析,研究識別並定量分析了62種成分,並通過多變量統計分析確定了各地理來源的GI標記。通過皮爾遜相關係數評估GI標記與HSI特征波長的相關性,增強了HSI數據的可解釋性,從而獲得了更準確且有意義的科學洞察。相比SHAP模型,本研究的方法進一步將運行時間縮短了33.99%。這些研究結果對於開發便攜式多光譜設備具有重要意義,可提供一種快速、準確且經濟高*的解決方案,用於枸杞產地的識別,從而促進植物產業中的質量控製和溯源管理。
推薦產品
作者簡介
通訊作者:馮江華,廈門大學電子科學與技術學院,博導
參考文獻
論文引用自一區文章:Chengcheng He , Xin Shi , Haifeng Lin , Quanquan Li , Feng Xia, Guiping Shen,Jianghua Feng , The combination of HSI and NMR techniques with deep learning for identification of geographical origin and GI markers of Lycium barbarum L. (2024) Food Chemistry 461.140903