—— 摘(zhai)要 ——
研究人員對檢測馬鈴薯晚疫病(Phytophthora infestans)的高光譜成像越來越感興趣。由于在野外條件下,尤其是在疾病早期,很難獲得疾病發展的準確光譜特征,以前的工作主要集中在受控條件下的實驗室測量。然而,試驗結果從實驗室外推到田間環境被證明是困難的。本試驗評估了實驗室高光譜數據在馬鈴薯晚疫病田間檢測模型中的應用。試驗是從六個分離的葉盤構建了一個高光譜訓練庫,其中包含8585個光譜,標記為健康類別和疾病發展的五個進展階段。經過平滑和歸一化處理后,70.0%的數據接受了邏輯回歸模型的訓練,30.0%的數據留作驗證。然后,在高和低染病壓力下,對田間條件下兩個馬鈴薯品種(對晚疫病敏感和抗性)拍攝的12幅高光譜圖像進行分類。實驗室數據的分類準確率為94.1%,這不足以使用實驗室收集的數據集檢測田間癥狀。當通過包含一階導數和采用新的歸一化策略改變光譜預處理時,新模型導致80.8%的較低分類準確率,在標記的實驗室光譜上得到驗證,但能夠在田間條件下檢測癥狀。視覺疾病評分與田間疾病模型分類結果之間的相關性得出R2值為0.985。可以得出的結論是,訓練一個實驗室數據模型用于田間疾病檢測是可行的。
—— 引言 ——
作物病害仍然是馬鈴薯生產中的主要產量限制因素。致病疫霉菌(Phytophthora infestans (Mont.) de Bary)引起馬鈴薯晚疫病,是最臭名昭著的病原體之一。為了減少與該疾病相關的巨大社會經濟消耗和環境成本,科學家們正在尋求精確施用農藥,這需要關于整個田間作物病害狀況的高質量、高分辨率數據支撐。
本研究的目的是評估基于實驗室數據訓練的機器學習模型在田間疾病檢測中的適用性。實現這一目的的目標是:(a)基于實驗室測量構建標記的高光譜訓練庫,(b)基于該數據集訓練機器學習疾病檢測模型;(c)在野外條件下拍攝的全新、未標記的高光譜圖像上驗證該模型;(d)實施替代特征選擇和預處理,以提高模型在野外疾病檢測中的性能。
—— 材料(liao)和方(fang)法(fa) ——
實(shi)驗(yan)室測量
圖1顯示了實(shi)驗室條件下(xia)高光譜(pu)測(ce)量的(de)(de)實(shi)驗裝置。一臺推(tui)掃(sao)式高光譜(pu)相機(ji)(ji),能夠在400-1000 nm光譜(pu)范圍(wei)內(nei)測(ce)量224個波段的(de)(de)反(fan)射率(FX10e相機(ji)(ji),芬蘭(lan),奧盧),相機(ji)(ji)放置在一個帶(dai)有透明蓋(gai)子的(de)(de)保護性塑料盒(he)內(nei)。傳(chuan)感(gan)(gan)器的(de)(de)位置應與移(yi)動(dong)方向垂(chui)直(zhi),從(cong)天頂的(de)(de)角度直(zhi)接向下(xia)測(ce)量。傳(chuan)感(gan)(gan)器盒(he)兩(liang)側安裝了兩(liang)個500 W鹵鎢(wu)燈(deng),為高光譜(pu)相機(ji)(ji)提(ti)供額(e)外(wai)照明。
從Bintje品種(zhong)的不同馬鈴薯植(zhi)株(zhu)上(shang)收獲六片(pian)(pian)(pian)分(fen)離的葉片(pian)(pian)(pian),使用釘書釘(不刺(ci)穿植(zhi)物組織)將(jiang)(jiang)其連接到泡(pao)沫塑(su)料托盤上(shang)。其中(zhong)三片(pian)(pian)(pian)葉子(zi)接種(zhong)了一(yi)種(zhong)致病疫霉菌孢子(zi)溶液(isolate EU36),另外三片(pian)(pian)(pian)作為對(dui)照(zhao)。這些托盤在100.0%濕(shi)度(du)和19°C溫度(du)下培養3天,然后將(jiang)(jiang)每個托盤放(fang)在傳(chuan)送帶上(shang)對(dui)葉片(pian)(pian)(pian)進(jin)行高光(guang)譜掃描。
病原體在(zai)3天(tian)后達(da)到(dao)活體營養階段(duan),可見(jian)病變(bian)剛剛開始形成(cheng)(cheng),但(dan)沒有壞死營養或(huo)孢子形成(cheng)(cheng)。在(zai)理想條(tiao)(tiao)件(jian)下,這個階段(duan)距(ju)離新(xin)孢子形成(cheng)(cheng)大(da)概有1-4天(tian)。此時,葉片相對較(jiao)大(da)面積沒有受到(dao)影響。在(zai)每(mei)次測量之(zhi)前,獲取(qu)白(bai)色參(can)(can)考(kao)(kao)(kao)掃(sao)描(100.0%反(fan)射率(lv)瓷(ci)磚(zhuan))和暗參(can)(can)考(kao)(kao)(kao)值(zhi)(通過(guo)關閉相機快門(men)實(shi)現)。白(bai)色參(can)(can)考(kao)(kao)(kao)用于(yu)補償(chang)照(zhao)明條(tiao)(tiao)件(jian)的變(bian)化(hua),而暗參(can)(can)考(kao)(kao)(kao)用于(yu)補償(chang)傳(chuan)感器的背景信號。
圖(tu)1 實(shi)(shi)驗室條件(jian)下用于離體葉片實(shi)(shi)驗的高光譜傳感器實(shi)(shi)驗裝置
田(tian)間測量
田間數據在位于比利時Kruishoutem的跨省馬鈴薯栽培研究中心(PCA)/國際馬鈴薯栽培研究中心進行收集,遵循Appeltans等人(Appeltans et al., 2020)描述的方法。使用一個長為3m的可移動鋁制測量架從研究中心的致病疫霉菌品種試驗中進行了 12 次掃描。測量架位于作物上方,測量高度為作物冠層上方300mm。掃描是通過使用電動機和傳動帶將移動到作物冠層上進行的,使用與實驗室測量相同的方法進行白色和暗參考測量。這些掃描對應于兩個馬鈴薯品種:Agria,抗晚疫病品種;Fontane,易感晚疫病品種。
對于每個(ge)品種,在(zai)晚熟生長階段(duan)選(xuan)擇感染(ran)程度高和低的地塊(kuai),然后于2020年(nian)7月30日(ri)在(zai)每個(ge)地塊(kuai)的三個(ge)位置進行(xing)(xing)掃描,四(si)個(ge)地塊(kuai)總共(gong)進行(xing)(xing)12次(ci)掃描(表(biao)1)。表(biao)1顯示了四(si)個(ge)測(ce)量地塊(kuai)中每個(ge)地塊(kuai)的葉面積(ji)感染(ran)百分比(bi)。注意(yi),Agria-A的葉面積(ji)感染(ran)率在(zai)2020年(nian)7月20日(ri)時為(wei)2.5%,而Agria-B為(wei)32.5%,但在(zai)7月30日(ri)測(ce)量時它們是(shi)(shi)相同(tong)的。值得注意(yi)的是(shi)(shi),測(ce)量是(shi)(shi)在(zai)盛夏進行(xing)(xing)的,平均最高氣溫為(wei)30°C,幾(ji)乎(hu)沒有降水,這會使受感染(ran)的葉片迅速(su)干燥,并(bing)限制感染(ran)的傳(chuan)播。
表(biao)1 2020年(nian)測量的田間(jian)小區中感染葉面積的百分比
四個(ge)地塊各進行三(san)次掃描(miao),其中兩個(ge)是Agria品種(Agria-A和(he)Agria-B),兩個(ge)是Fontane品種(Fontane-A和(he)Fontane-B)。附錄'-A'和(he)'-B'分別對應于較(jiao)低的感染和(he)較(jiao)高(gao)的感染
高光譜庫
訓練數據集是通過選擇一個感興趣的區域獲得的,該區域覆蓋一片葉子的7張小葉,包含健康和染病組織。高光譜訓練數據集的光譜屬于健康和染病組(zu)織(zhi),根據近紅外區域的反射率情況在疾病進展過程中自動標記,“健康”對應于高光譜庫中的668 nm波段的反射率介于0和0.17之間;疾病分五個階段,第一階段0.17-0.19,第二階段0.19-.21,第三階段0.21-0.23,第四階段0.23-0.25,第五階段高于0.25。這個過程產生了8585個光譜的訓練庫。對應于健康(kang)和疾病五(wu)個階段的每個訓練集占整個訓練集的百分比分別為86.2%、4.7%、3.3%、2.00%、2.1%和1.7%。
建模(mo)
圖2顯示了用于實現實驗室疾病檢測(ce)(ce)模型和田間疾病檢測(ce)(ce)模型的建模過程。實驗室疾病檢測模型是一種經過微調的模型,用于在實驗室條件下拍攝的高光譜圖像上檢測疾病。對田間疾病檢測模型進行了微調,以便在田間條件下拍攝的高光譜圖像上檢測癥狀。兩個模型都在實驗室條件下采集的同一數據集上進行訓練。第一個預處理步驟是使用白色參考值和暗參考值校正實驗室原始光譜數據。然后,去除411nm以下和990nm以上的譜帶,因為它們含有太多的噪聲。503 nm及以下波段附近的噪聲和反射輕微升高是由于接種用藍色聚苯乙烯泡沫塑料托盤產生的高“藍色”反射。使用scikit-learn軟件包中的Savitzky-Golay平滑函數對數據進行平滑,然后通過將光譜除以850和900 nm之間的平均反射率進行歸一化。
圖2 疾病檢測建(jian)模圖,顯示最(zui)終工(gong)作流程以及實(shi)現(xian)此最(zui)終工(gong)作流程所需的步驟
使用scikit-learn Python軟件包的train_test_split算法將該數據集分開,70.0%(6006個光譜)用于訓練,30.0%(2579個光譜)用于模型驗證。這70.0%用于使用scikit-learn Python軟(ruan)件包的LogisticRegressionCV函數來訓練邏輯回歸模型,從而產生一個有監督的機器學習分類器,該分類器能夠將每個圖像像素分為六個類別之一:健康、階段1、階段2、階段3、階段4和階段5。LogisticRegressionCV函數有12個可能的C參數值作為輸入(0.1,0.5,1,1.5,2,4,10,15,20,30,50,100),算法從中自動選擇最佳C值。在這種情況下,算法保留了10的C值。這個經過訓練的模型被稱為實驗室疾病檢測模型。
使(shi)用實(shi)(shi)驗(yan)室模型(xing)(xing)(xing)對實(shi)(shi)驗(yan)室數據進行分(fen)類后(hou),進行模型(xing)(xing)(xing)調整(zheng)使(shi)模型(xing)(xing)(xing)更適合田間數據的(de)(de)分(fen)類。從現在起,這種(zhong)(zhong)新(xin)的(de)(de)、經過調整(zheng)的(de)(de)模型(xing)(xing)(xing)被(bei)稱(cheng)為“田間疾(ji)(ji)病檢(jian)測模型(xing)(xing)(xing)”。為了開發這種(zhong)(zhong)田間疾(ji)(ji)病檢(jian)測模型(xing)(xing)(xing),通過將光(guang)譜(pu)除(chu)以850-900 nm的(de)(de)平(ping)均反射(she)率進行歸一(yi)(yi)(yi)化,并進行Savitzky-Golay平(ping)滑,計(ji)算一(yi)(yi)(yi)階(jie)導(dao)數以消除(chu)陰影(ying)效應。測試(shi)了一(yi)(yi)(yi)系列波段組合、植被(bei)指數、特征選擇(ze)和光(guang)譜(pu)預處理(li)步驟(包括1-3階(jie)導(dao)數)。一(yi)(yi)(yi)階(jie)導(dao)數被(bei)證明是消除(chu)陰影(ying)影(ying)響的(de)(de)唯一(yi)(yi)(yi)可行的(de)(de)預處理(li)策(ce)略。因(yin)此,最終模型(xing)(xing)(xing)在第一(yi)(yi)(yi)次推導(dao)后(hou)使(shi)用了整(zheng)個光(guang)譜(pu)范圍。
—— 結果(guo) ——
這項工作的(de)主(zhu)要(yao)結果是發現,基(ji)于實驗室尺度的(de)訓(xun)練數(shu)據集,可以訓(xun)練一種機(ji)器學習算法來檢測田(tian)間下(xia)的(de)晚疫病癥(zheng)狀。然而,建模過程并不(bu)簡(jian)單,需(xu)要(yao)進行(xing)修改,使(shi)最(zui)終(zhong)模型僅在(zai)田(tian)間條(tiao)件下(xia)可用(但不(bu)再在(zai)實驗室條(tiao)件下(xia)可用)。
圖3顯(xian)示(shi)了(le)馬(ma)鈴薯晚(wan)(wan)疫(yi)病(bing)(bing)菌(jun)感染期間(歸一化和平滑后(hou))高光(guang)譜(pu)(pu)輪(lun)廓(kuo)的(de)(de)(de)(de)(de)(de)發展。圖3A顯(xian)示(shi)了(le)健(jian)康馬(ma)鈴薯組織的(de)(de)(de)(de)(de)(de)光(guang)譜(pu)(pu)輪(lun)廓(kuo)。在(zai)680 nm處,葉綠素吸(xi)收導致反射(she)率(lv)(lv)的(de)(de)(de)(de)(de)(de)典型(xing)下降(jiang)是顯(xian)而易(yi)見的(de)(de)(de)(de)(de)(de)。紅(hong)邊區(qu)(qu)(qu)(qu)域(yu)(yu)(yu)(700到(dao)780 nm之(zhi)(zhi)間)的(de)(de)(de)(de)(de)(de)形(xing)(xing)狀(zhuang)非常清晰,在(zai)從(cong)(cong)可(ke)見光(guang)區(qu)(qu)(qu)(qu)域(yu)(yu)(yu)到(dao)近(jin)紅(hong)外區(qu)(qu)(qu)(qu)域(yu)(yu)(yu)的(de)(de)(de)(de)(de)(de)過渡(du)過程中(zhong),反射(she)率(lv)(lv)急劇上升。在(zai)可(ke)見光(guang)區(qu)(qu)(qu)(qu)域(yu)(yu)(yu),綠色(se)波段(duan)(近(jin)550nm)的(de)(de)(de)(de)(de)(de)高反射(she)率(lv)(lv)清晰可(ke)見。圖3B顯(xian)示(shi)了(le)馬(ma)鈴薯晚(wan)(wan)疫(yi)病(bing)(bing)病(bing)(bing)變的(de)(de)(de)(de)(de)(de)光(guang)譜(pu)(pu)輪(lun)廓(kuo)。紅(hong)邊區(qu)(qu)(qu)(qu)域(yu)(yu)(yu)的(de)(de)(de)(de)(de)(de)形(xing)(xing)狀(zhuang)更不明(ming)確,呈現(xian)出(chu)更為平緩的(de)(de)(de)(de)(de)(de)傾斜。與正常光(guang)譜(pu)(pu)相(xiang)比,綠色(se)區(qu)(qu)(qu)(qu)域(yu)(yu)(yu)的(de)(de)(de)(de)(de)(de)反射(she)率(lv)(lv)降(jiang)低(di)。圖3C顯(xian)示(shi)了(le)馬(ma)鈴薯晚(wan)(wan)疫(yi)病(bing)(bing)病(bing)(bing)變的(de)(de)(de)(de)(de)(de)橫截面相(xiang)對應的(de)(de)(de)(de)(de)(de)光(guang)譜(pu)(pu)。在(zai)這里,可(ke)以看到(dao)光(guang)譜(pu)(pu)特(te)征(zheng)從(cong)(cong)健(jian)康組織到(dao)疾病(bing)(bing)組織的(de)(de)(de)(de)(de)(de)轉(zhuan)變。比較圖3A-C中(zhong)不同感染階段(duan)的(de)(de)(de)(de)(de)(de)光(guang)譜(pu)(pu),可(ke)見光(guang)區(qu)(qu)(qu)(qu)域(yu)(yu)(yu)的(de)(de)(de)(de)(de)(de)反射(she)率(lv)(lv)在(zai)綠色(se)區(qu)(qu)(qu)(qu)域(yu)(yu)(yu)降(jiang)低(di),在(zai)紅(hong)色(se)和藍色(se)區(qu)(qu)(qu)(qu)域(yu)(yu)(yu)增加,在(zai)近(jin)紅(hong)外區(qu)(qu)(qu)(qu)域(yu)(yu)(yu)增加,這表明(ming)隨著(zhu)晚(wan)(wan)疫(yi)病(bing)(bing)病(bing)(bing)變的(de)(de)(de)(de)(de)(de)發展,875 nm之(zhi)(zhi)前的(de)(de)(de)(de)(de)(de)反射(she)率(lv)(lv)值降(jiang)低(di),875 nm之(zhi)(zhi)后(hou)的(de)(de)(de)(de)(de)(de)反射(she)率(lv)(lv)增加。
圖(tu)4更為明顯和詳細地描述(shu)了(le)這一(yi)發(fa)展(zhan),圖(tu)4描繪了(le)本研(yan)究中開(kai)發(fa)的(de)馬鈴薯晚疫病預測模型(xing)的(de)每個類別訓練集(ji)的(de)光(guang)譜。通過(guo)計(ji)算混淆矩陣來(lai)評估(gu)建模精度和分類錯誤。實(shi)驗室模型(xing)實(shi)現(xian)了(le)94.1%的(de)建模精度,在更改模型(xing)特征以用于(yu)田(tian)間(jian)疾病檢測后,該(gai)精度降至80.8%。
圖5顯示(shi)了在高(gao)光(guang)譜庫上訓練的(de)(de)實驗室(shi)邏輯回(hui)歸疾(ji)病(bing)檢測模型的(de)(de)混(hun)淆(xiao)矩(ju)陣(zhen)。由(you)于訓練數據是(shi)從單個感(gan)興趣的(de)(de)區域中選(xuan)擇(ze)的(de)(de),然后自動(dong)標(biao)記,因此相對(dui)較(jiao)多的(de)(de)訓練樣本對(dui)應于“健(jian)康”類。在評估整體模型準確性(xing)時,這一點(dian)很(hen)重(zhong)要,因為可能存在對(dui)健(jian)康標(biao)簽(qian)分(fen)類的(de)(de)偏見。然而(er),從混(hun)淆(xiao)矩(ju)陣(zhen)來(lai)看,很(hen)明顯,無(wu)論(lun)類別如何,幾乎沒有錯(cuo)誤分(fen)類。
圖3 疾病(bing)進展過程中高光(guang)譜特征(zheng)的(de)發展。A健康馬鈴(ling)薯組(zu)織的(de)高光(guang)譜特征(zheng),B馬鈴(ling)薯晚(wan)疫病(bing)病(bing)變的(de)高光(guang)譜特征(zheng),C馬鈴(ling)薯晚(wan)疫病(bing)病(bing)變橫截面像素對(dui)應的(de)高光(guang)譜曲(qu)線
圖(tu)4 高光譜(pu)訓練庫(ku)中(zhong)每個(ge)疾病進展等(deng)級的馬鈴薯葉片光譜(pu)圖(tu),平(ping)均光譜(pu)以粗體顯示。
圖5 根據(ju)全譜實驗室(shi)數據(ju)訓(xun)練的邏(luo)輯回歸疾(ji)病(bing)檢(jian)測模型對應的混淆矩陣(zhen)。階(jie)段(duan)(duan)(duan)1至5代表基(ji)于668 nm波段(duan)(duan)(duan)的侵(qin)染性(xing)支原體疾(ji)病(bing)進展(zhan)階(jie)段(duan)(duan)(duan)
表2 從混淆矩陣得出(chu)的(de)感染(ran)性支(zhi)原體實驗室疾病檢(jian)測模型的(de)診斷(duan)(以比率給出(chu))
TPR真陽(yang)性(xing)(xing)(xing)率(lv)、TNR真陰(yin)性(xing)(xing)(xing)率(lv)、PPV精密度(du)(du)/陽(yang)性(xing)(xing)(xing)預測值、NPV陰(yin)性(xing)(xing)(xing)預測值、FPR假陽(yang)性(xing)(xing)(xing)率(lv)、FNR假陰(yin)性(xing)(xing)(xing)率(lv)、FDR假發現(xian)率(lv)、ACC準(zhun)確度(du)(du)
實驗(yan)室(shi)模(mo)(mo)(mo)型的(de)整體模(mo)(mo)(mo)型精度為94.1%。表2顯示(shi)了從混淆(xiao)矩陣(圖5)得出的(de)每類實驗(yan)室(shi)疾病檢測模(mo)(mo)(mo)型的(de)診斷結(jie)(jie)果。每個類別的(de)檢測準確率為95.0%或更高(gao)。第2階段和第3階段的(de)假(jia)陰性(xing)率(FNR)最高(gao),分(fen)別為15.0%和12.0%,表明這一數量的(de)群體被錯誤(wu)分(fen)類。注意,錯誤(wu)分(fen)類是模(mo)(mo)(mo)型錯誤(wu)標記特定光譜的(de)結(jie)(jie)果。
為(wei)了(le)(le)進(jin)一步評(ping)估分(fen)(fen)類性(xing)(xing)能(neng),通過(guo)對用(yong)于高光(guang)譜庫建(jian)設的(de)(de)(de)高光(guang)譜圖像(xiang)(xiang)的(de)(de)(de)每(mei)個(ge)像(xiang)(xiang)素進(jin)行(xing)分(fen)(fen)類來生成分(fen)(fen)類圖像(xiang)(xiang)。研(yan)究(jiu)并檢查了(le)(le)該圖是否(fou)存在異常,還研(yan)究(jiu)了(le)(le)疾(ji)病(bing)(bing)(bing)(bing)在整個(ge)葉片中的(de)(de)(de)傳(chuan)播(bo)。圖6顯(xian)示(shi)了(le)(le)實驗(yan)室模(mo)型對藍色泡沫塑料托(tuo)盤(pan)(pan)的(de)(de)(de)高光(guang)譜圖像(xiang)(xiang)進(jin)行(xing)的(de)(de)(de)分(fen)(fen)類,托(tuo)盤(pan)(pan)中含(han)有接種了(le)(le)馬鈴薯(shu)晚(wan)疫病(bing)(bing)(bing)(bing)菌的(de)(de)(de)馬鈴薯(shu)植株的(de)(de)(de)分(fen)(fen)離葉片。圖6A顯(xian)示(shi)了(le)(le)完全(quan)分(fen)(fen)類的(de)(de)(de)圖像(xiang)(xiang),而(er)圖6B顯(xian)示(shi)了(le)(le)單個(ge)感染性(xing)(xing)瘧原蟲(chong)病(bing)(bing)(bing)(bing)變(bian)(bian)的(de)(de)(de)特(te)寫。圖6C顯(xian)示(shi)了(le)(le)分(fen)(fen)離葉片托(tuo)盤(pan)(pan)的(de)(de)(de)正常RGB圖像(xiang)(xiang),僅疊(die)(die)加(jia)了(le)(le)階段(duan)1和階段(duan)2像(xiang)(xiang)素。圖6D顯(xian)示(shi)了(le)(le)病(bing)(bing)(bing)(bing)變(bian)(bian)的(de)(de)(de)特(te)寫RGB圖像(xiang)(xiang),再次與1期和2期疾(ji)病(bing)(bing)(bing)(bing)像(xiang)(xiang)素疊(die)(die)加(jia),以可視化高光(guang)譜相機檢測到(dao)的(de)(de)(de)病(bing)(bing)(bing)(bing)變(bian)(bian)(1至5期)覆蓋的(de)(de)(de)區域大于RGB圖像(xiang)(xiang)中肉眼可見的(de)(de)(de)深棕色斑點。
為(wei)(wei)了評估(gu)在(zai)實(shi)驗室(shi)條(tiao)件(jian)下訓練(lian)的(de)(de)疾病(bing)檢(jian)測(ce)模型(xing)在(zai)野外條(tiao)件(jian)下的(de)(de)性(xing)能,為(wei)(wei)野外條(tiao)件(jian)下測(ce)量(liang)(liang)的(de)(de)所有高(gao)光譜(pu)圖(tu)像(xiang)(xiang)(xiang)構建了分類(lei)圖(tu)像(xiang)(xiang)(xiang),通(tong)過檢(jian)查田間高(gao)光譜(pu)圖(tu)像(xiang)(xiang)(xiang)上可見的(de)(de)晚疫病(bing)癥狀分類(lei)來評估(gu)模型(xing)性(xing)能。圖(tu)7顯(xian)(xian)示(shi)(shi)了在(zai)野外條(tiao)件(jian)下測(ce)量(liang)(liang)的(de)(de)12幅高(gao)光譜(pu)圖(tu)像(xiang)(xiang)(xiang)的(de)(de)代表(biao)性(xing)圖(tu)像(xiang)(xiang)(xiang)的(de)(de)logistic回歸(gui)實(shi)驗室(shi)疾病(bing)檢(jian)測(ce)模型(xing)分類(lei)(表(biao)1)。圖(tu)7A顯(xian)(xian)示(shi)(shi)了從(cong)高(gao)光譜(pu)數據立方體中(zhong)獲取(qu)的(de)(de)RGB圖(tu)像(xiang)(xiang)(xiang)。請注意(yi),RGB圖(tu)像(xiang)(xiang)(xiang)中(zhong)的(de)(de)白色(se)區域代表(biao)土(tu)壤像(xiang)(xiang)(xiang)素,由于這些區域的(de)(de)低反(fan)射率(lv)和(he)大量(liang)(liang)噪聲(sheng),這些像(xiang)(xiang)(xiang)素看起(qi)來很亮。在(zai)歸(gui)一化(hua)步驟中(zhong),該低反(fan)射率(lv)被轉換為(wei)(wei)高(gao)反(fan)射率(lv)(未顯(xian)(xian)示(shi)(shi)數據)。盡管(guan)視覺疾病(bing)評估(gu)(表(biao)1)證實(shi)了癥狀的(de)(de)存在(zai),但實(shi)驗室(shi)模型(xing)并未成功識(shi)別(bie)疾病(bing)。
圖6 實驗室條件下,在感染馬(ma)鈴薯晚疫病菌3天后測(ce)量的(de)(de)托盤分(fen)離馬(ma)鈴薯葉片的(de)(de)高光(guang)譜(pu)圖像(xiang)分(fen)類(lei)。A分(fen)類(lei)圖像(xiang),B感染支原體(ti)病變特寫,C階(jie)(jie)段1和階(jie)(jie)段2疊加(jia)在超立方(fang)體(ti)的(de)(de)正(zheng)常RGB圖像(xiang)上,顯示可見的(de)(de)深(shen)棕色病變,周圍有疾病檢測(ce)模型(xing)分(fen)類(lei)的(de)(de)紅色和黃色區域
圖(tu)7 使(shi)用實驗室(shi)檢(jian)測(ce)模型對田間采集的12次掃描的代表性高光譜圖(tu)像進行分類。A為RGB圖(tu)像,B分類圖(tu)像
在調整建模和預處理策(ce)略以開發田(tian)(tian)間(jian)(jian)疾(ji)病(bing)檢測模型后,再(zai)次(ci)生(sheng)成田(tian)(tian)間(jian)(jian)掃描(miao)的(de)(de)(de)(de)分(fen)類圖(tu)像,以重(zhong)新(xin)評估(gu)模型性(xing)(xing)能。圖(tu)8顯(xian)示了(le)在野外(wai)條件下(xia)進(jin)行(xing)的(de)(de)(de)(de)12次(ci)掃描(miao)的(de)(de)(de)(de)代表(biao)性(xing)(xing)高光譜圖(tu)像(表(biao)1),按照改進(jin)的(de)(de)(de)(de)田(tian)(tian)間(jian)(jian)疾(ji)病(bing)檢測模型進(jin)行(xing)分(fen)類。田(tian)(tian)間(jian)(jian)疾(ji)病(bing)檢測模型的(de)(de)(de)(de)分(fen)類精(jing)度(du)降(jiang)低(從94.1%降(jiang)至(zhi)80.8%),但提(ti)高了(le)田(tian)(tian)間(jian)(jian)測量(liang)的(de)(de)(de)(de)分(fen)類性(xing)(xing)能。圖(tu)8A顯(xian)示了(le)從超立方體導出的(de)(de)(de)(de)RGB圖(tu)像。圖(tu)8B顯(xian)示了(le)分(fen)類結果。很難區分(fen)第(di)(di)一階(jie)段、第(di)(di)三階(jie)段和第(di)(di)五階(jie)段之(zhi)間(jian)(jian)的(de)(de)(de)(de)疾(ji)病(bing),但第(di)(di)四階(jie)段的(de)(de)(de)(de)分(fen)類似乎準確地(di)涵蓋了(le)田(tian)(tian)間(jian)(jian)視覺上(shang)存在的(de)(de)(de)(de)癥狀。
結果表明,盡管調整后的疾病檢測模型在田間條件下表現合理(圖8),但它無法對原始實驗室數據集進行分類(圖9)。圖9顯示了通過田間疾病(bing)檢(jian)測(ce)模型對離體葉片數據集(在實驗室獲得)的分類。
為了表明該模型在田間條件下繪制疾病圖譜的有效性,由訓練有素的技術人員將分類圖像與傳統的視覺評分進行比較。圖10將田間疾病檢測模型的分類與田間技術人員確定的疾病評分進行了比較。技術人員的結果與方程式1的模型結果之間存在線性回歸,R2值(zhi)為0.985。
y = 0.7894x ? 1.8175 (方程式1)
y為(wei)模型(xing)結(jie)果,x為(wei)技術(shu)人員的(de)結(jie)果。這表明技術(shu)人員獲得(de)的(de)結(jie)果高估了(le)作(zuo)物的(de)病(bing)害嚴(yan)(yan)重程(cheng)(cheng)(cheng)度,或者模型(xing)低估了(le)病(bing)害嚴(yan)(yan)重程(cheng)(cheng)(cheng)度。注(zhu)意,由(you)于(yu)僅(jin)包(bao)括4個(ge)(ge)圖(tu)(對應于(yu)12個(ge)(ge)高光譜圖(tu)像),且只(zhi)有(you)3個(ge)(ge)不(bu)同的(de)疾病(bing)嚴(yan)(yan)重程(cheng)(cheng)(cheng)度,該R2值僅(jin)指示模型(xing)輸出和視覺評分結(jie)果之間的(de)相(xiang)關性,還需要進一步確認(ren)。
圖(tu)(tu)8 使用田間(jian)采(cai)集的12次掃描的代(dai)表性(xing)高光譜圖(tu)(tu)像的經(jing)調整的田間(jian)邏(luo)輯(ji)回歸檢測模型對高光譜圖(tu)(tu)像進行(xing)分(fen)類。A超立方體(ti)獲得的RGB圖(tu)(tu)像,B分(fen)類圖(tu)(tu)像
圖9 使用(yong)改進的(de)田間邏輯(ji)回歸疾病檢測(ce)模(mo)型(xing)對實驗室數據進行(xing)分類(lei)。A分離的(de)土豆(dou)葉的(de)托盤,B病損特寫
圖10 技(ji)術人(ren)員和田間疾病檢測模型(xing)測量的四個地塊的平均(jun)疾病嚴重程度的比(bi)較。
—— 結論 ——
當前工(gong)作(zuo)的結果強調(diao)了(le)利用實驗(yan)(yan)室(shi)(shi)(shi)(shi)數(shu)(shu)據(ju)(ju)訓(xun)練(lian)(lian)馬鈴(ling)薯晚(wan)疫病菌(jun)田(tian)(tian)間(jian)(jian)(jian)疾病檢(jian)(jian)測模型(xing)(xing)(xing)的困難(nan)性。期(qi)間(jian)(jian)(jian)開(kai)發了(le)兩(liang)個(ge)模型(xing)(xing)(xing),一(yi)(yi)個(ge)模型(xing)(xing)(xing)能(neng)夠(gou)(gou)對(dui)實驗(yan)(yan)室(shi)(shi)(shi)(shi)數(shu)(shu)據(ju)(ju)進(jin)行(xing)分(fen)類(lei),準(zhun)確率為94.1%,但無法(fa)對(dui)田(tian)(tian)間(jian)(jian)(jian)條(tiao)(tiao)件(jian)(jian)下拍攝的圖像進(jin)行(xing)分(fen)類(lei),另一(yi)(yi)個(ge)模型(xing)(xing)(xing)經(jing)(jing)過調(diao)整(zheng),在(zai)(zai)田(tian)(tian)間(jian)(jian)(jian)條(tiao)(tiao)件(jian)(jian)下表(biao)現(xian)(xian)更(geng)好,但準(zhun)確率降(jiang)低了(le)80.8%,并(bing)高估(gu)了(le)實驗(yan)(yan)室(shi)(shi)(shi)(shi)掃(sao)描的癥狀。經(jing)(jing)過實驗(yan)(yan)室(shi)(shi)(shi)(shi)訓(xun)練(lian)(lian)的模型(xing)(xing)(xing)在(zai)(zai)實驗(yan)(yan)室(shi)(shi)(shi)(shi)數(shu)(shu)據(ju)(ju)方面表(biao)現(xian)(xian)良(liang)好,能(neng)夠(gou)(gou)在(zai)(zai)實驗(yan)(yan)室(shi)(shi)(shi)(shi)檢(jian)(jian)測到(dao)早期(qi)的、可(ke)(ke)見的癥狀。然而,該模型(xing)(xing)(xing)無法(fa)對(dui)田(tian)(tian)間(jian)(jian)(jian)數(shu)(shu)據(ju)(ju)進(jin)行(xing)分(fen)類(lei)。經(jing)(jing)過調(diao)整(zheng)的田(tian)(tian)間(jian)(jian)(jian)檢(jian)(jian)測模型(xing)(xing)(xing)(也根據(ju)(ju)實驗(yan)(yan)室(shi)(shi)(shi)(shi)數(shu)(shu)據(ju)(ju)進(jin)行(xing)了(le)訓(xun)練(lian)(lian))能(neng)夠(gou)(gou)在(zai)(zai)田(tian)(tian)間(jian)(jian)(jian)條(tiao)(tiao)件(jian)(jian)下對(dui)感染后(hou)期(qi)進(jin)行(xing)分(fen)類(lei),但在(zai)(zai)實驗(yan)(yan)室(shi)(shi)(shi)(shi)數(shu)(shu)據(ju)(ju)上表(biao)現(xian)(xian)不(bu)佳,突出(chu)了(le)兩(liang)種數(shu)(shu)據(ju)(ju)類(lei)型(xing)(xing)(xing)之間(jian)(jian)(jian)的差異。可(ke)(ke)以(yi)(yi)得(de)出(chu)結論,根據(ju)(ju)實驗(yan)(yan)室(shi)(shi)(shi)(shi)數(shu)(shu)據(ju)(ju)開(kai)發一(yi)(yi)個(ge)在(zai)(zai)一(yi)(yi)定程度(du)上適用于田(tian)(tian)間(jian)(jian)(jian)條(tiao)(tiao)件(jian)(jian)的模型(xing)(xing)(xing)是困難(nan)的,但并(bing)非不(bu)可(ke)(ke)能(neng)。作(zuo)者(zhe)建(jian)議考慮創建(jian)一(yi)(yi)個(ge)高光譜訓(xun)練(lian)(lian)庫(ku),將田(tian)(tian)間(jian)(jian)(jian)數(shu)(shu)據(ju)(ju)或至少溫室(shi)(shi)(shi)(shi)和實驗(yan)(yan)室(shi)(shi)(shi)(shi)數(shu)(shu)據(ju)(ju)融(rong)合在(zai)(zai)一(yi)(yi)起。這(zhe)種混合模型(xing)(xing)(xing)結合了(le)實驗(yan)(yan)室(shi)(shi)(shi)(shi)條(tiao)(tiao)件(jian)(jian)下收(shou)集早期(qi)疾病發展(zhan)信息(xi)的優勢,以(yi)(yi)及獲(huo)得(de)田(tian)(tian)間(jian)(jian)(jian)數(shu)(shu)據(ju)(ju)的噪(zao)聲和干(gan)擾因素信息(xi)的優勢。
原文信(xin)息(xi):
Appeltans, S., Pieters, J.G. & Mouazen, A.M. . Precision Agriculture, 2021: 1-18.
擴展閱讀:
?
?
?
?