(2)用于識(shí)別霉變花生的波長(zhǎng)特征(WFs)
在不同波長(zhǎng)和尺度下,計(jì)算了每個(gè)樣本光譜的小波系數(shù),圖 5 展示了健康與霉變花生樣本的平均光譜結(jié)果。隨后,通過(guò)計(jì)算不同類別小波系數(shù)之間的 J-M 距離,生成了一張指示W(wǎng)Fs光譜敏感性和區(qū)分能力的尺度圖(圖 6)。在本研究中,頂部 1% 元素的閾值 J-M 值為 1.70,基于該閾值篩選出五個(gè)對(duì)霉變花生高度敏感的小波特征區(qū)域(圖 6 中的橙*區(qū)域)。如圖 6 所示,這些敏感特征區(qū)域主要集中在 1000–1500 納米的波長(zhǎng)范圍內(nèi)。該波長(zhǎng)區(qū)域的光譜曲線形狀在健康與霉變花生之間表現(xiàn)出顯著差異(圖 4)。在每個(gè)特征區(qū)域中,選取 J-M 距離*大的點(diǎn),*終選擇了五個(gè)用于區(qū)分霉變與健康花生的小波特征。它們的具體波長(zhǎng)和尺度見(jiàn)表 1 。
1005納米、1045納米和1410納米的波段分別與花生中的纖維素、油脂和水分有關(guān),這些是花生的主要組成部分。在其他波段中,1422納米和1518納米與1430納米和1510納米相似,與總**感染有關(guān)。1430納米波段可以歸因于蔗糖/淀粉的O?H伸縮**泛音,而1510納米對(duì)應(yīng)于O?H變形羥基和C?O伸縮的第三泛音,這可以歸因于角質(zhì)層和β-葡聚糖。

圖5.不同尺度下健康與霉變花生平均光譜的小波系數(shù)

圖6.用于提取WFs的連續(xù)小波分析的J-M距離尺度圖
(3)通過(guò)SPA進(jìn)行*佳波段選擇
每個(gè)類別的樣本按照2:1的比例被隨機(jī)分為校準(zhǔn)和驗(yàn)證數(shù)據(jù),并根據(jù)RMSE選擇*佳波段的數(shù)量。校準(zhǔn)和驗(yàn)證數(shù)據(jù)的隨機(jī)分割導(dǎo)致了在不同實(shí)現(xiàn)中選擇的波長(zhǎng)有所變化;因此,為了選擇*佳波段,樣本分割和SPA程序被重復(fù)執(zhí)行。在進(jìn)行了五次樣本分割和SPA程序后,比較了產(chǎn)生的五組波長(zhǎng),并選擇了至少有3組共同認(rèn)同的波長(zhǎng)。*終,確定了七個(gè)波長(zhǎng)(1005納米、1208納米、1450納米、1927納米、2078納米、2190納米和2251納米)作為識(shí)別霉變花生的*佳波段,如圖4所示。我們可以看到,在*佳波段和WFs之間只有一個(gè)共同的波段(1005納米)。這主要是由于兩種方法的選擇標(biāo)準(zhǔn)不同,CWT主要捕捉光譜形狀的差異,而SPA主要選擇具有*小共線性的波段。在其他波段中,1208納米對(duì)應(yīng)于淀粉分子吸收相關(guān)的C?H**泛音和**泛音以及C?H組合;1450納米波段可以歸因于花生中的蛋白質(zhì)含量;1927納米波段,與1930納米相似,可能歸因于淀粉的O?H伸縮/HOH變形組合;2078納米波段,與2090納米相似,與總**感染有關(guān)。其他波段,2190納米和2251納米,更接近2200納米和2270納米,可能分別歸因于?CHO的C–H伸縮/C=O伸縮組合和纖維素的O?H伸縮/C?O伸縮組合。
(4)WFs性能評(píng)估
使用五個(gè)WFs和七個(gè)*佳波段作為輸入變量,結(jié)合PLS-DA和SVM建立了分類模型。對(duì)于WFs和*佳波段,PLS-DA的理想LVs數(shù)量分別為3和6。對(duì)于SVM參數(shù)(C,σ),采用了基于網(wǎng)格的方法和五折交叉驗(yàn)證進(jìn)行優(yōu)化,WFs和*佳波段的*優(yōu)SVM模型對(duì)應(yīng)的(C,σ)分別為(1,0.5)和(100,0.5)。然后,對(duì)花生仁中的每個(gè)像素進(jìn)行了分類,使用SVM對(duì)HY(健康與霉變)的分類結(jié)果可見(jiàn)于圖7。

圖7.使用SVM對(duì)訓(xùn)練數(shù)據(jù)集進(jìn)行逐像素分類的結(jié)果,其中(a)使用*佳波段,(b)使用WFs;對(duì)測(cè)試數(shù)據(jù)集進(jìn)行逐像素分類的結(jié)果,其中(c)使用*佳波段,(d)使用WFs
在逐像素分類后,使用受**污染的像素?cái)?shù)量與總花生像素?cái)?shù)量的比率來(lái)確定花生仁是否受到污染。比率低于0.05、0.1和0.15的閾值分別被認(rèn)為是健康花生。圖8顯示了β=0.15和SVM時(shí)HY的核尺度分類結(jié)果,定量結(jié)果如表2所示。從圖8中我們可以看到,對(duì)于訓(xùn)練數(shù)據(jù),無(wú)論使用WFs還是*佳波段,兩種分類器和閾值都能正確識(shí)別健康和霉變花生。相比之下,對(duì)于測(cè)試數(shù)據(jù),如表2所示,WFs在使用兩種分類器的三個(gè)閾值上的整體準(zhǔn)確度上都優(yōu)于*佳波段。此外,使用WFs的靈敏度和特異性高于或等于使用*佳波段,表明WFs在健康和霉變花生分類中的性能更佳。CWT能夠在不同尺度上分離吸收特征,將狹窄和寬的吸收特征分別分離到低尺度和高尺度。這種特性的好處是可以實(shí)現(xiàn)對(duì)WFs的**調(diào)查,從而能夠選擇*佳的光譜特征。

圖8.使用SVM對(duì)訓(xùn)練數(shù)據(jù)集進(jìn)行核尺度分類的結(jié)果,其中(a)使用*佳波段,(b)使用WFs;對(duì)測(cè)試數(shù)據(jù)集進(jìn)行核尺度分類的結(jié)果,其中(c)使用*佳波段,(d)使用WFs。白色圓圈表示被誤分類的花生仁

在此,我們使用了一個(gè)閾值來(lái)確定花生仁是否霉變。理論上,較小的閾值更好,因?yàn)樗梢员苊鈱⒚棺兊幕ㄉ`判為健康的花生。相反,較小的閾值可能會(huì)增加將健康花生仁誤判為霉變的風(fēng)險(xiǎn),這可能會(huì)導(dǎo)致因錯(cuò)誤丟棄而造成的經(jīng)濟(jì)損失。因此,確定閾值至關(guān)重要??紤]到使用0.05、0.1和0.15的不同分類器的整體分類結(jié)果,本文推薦使用0.1作為折中的閾值。但是,未來(lái)應(yīng)該探索一種可靠的閾值確定方法。此外,盡管本研究表明,通過(guò)結(jié)合CWT和高光譜成像技術(shù),有可能以相對(duì)較高的準(zhǔn)確度識(shí)別霉變花生,但本研究得到的特征和模型可能仍不適合實(shí)際應(yīng)用于多樣化的花生。不過(guò),本研究中描述的特征提取和建模方法可以作為開(kāi)發(fā)核心算法的參考。
結(jié)論
健康和霉變的花生在對(duì)短波紅外光的光譜響應(yīng)上表現(xiàn)出顯著差異。在本研究中, CWT被應(yīng)用于高光譜分類框架中,以提取特征來(lái)識(shí)別霉變花生。確定了五個(gè)WFs用于將花生分類為健康或霉變。本文展示的結(jié)果表明,WFs結(jié)合PLS-DA或SVM有希望識(shí)別出花生仁上的霉變——測(cè)試數(shù)據(jù)的準(zhǔn)確度至少為96.19%。這比使用由SPA獲得的*佳波段進(jìn)行分類的性能更好。未來(lái)的研究應(yīng)包括更多樣化和不同種類的花生樣本,建立霉變嚴(yán)重程度評(píng)估方法,對(duì)不同霉菌的霉變花生進(jìn)行分類,并建立更可靠的閾值確定方法。這些改進(jìn)可以增強(qiáng)所選WFs的魯棒性。
推薦產(chǎn)品
GaiaSorter
作者簡(jiǎn)介(人名+單位+博導(dǎo)/碩導(dǎo))
通訊作者:蔣金豹,中國(guó)礦業(yè)大學(xué),博士生導(dǎo)師
參考文獻(xiàn)
論文引用自二區(qū)文章:Xiaotong Qi, Jinbao Jiang, Ximin Cui, Deshuai Yuan (2019). Moldy Peanut Kernel Identification Using Wavelet Spectral Features Extracted from Hyperspectral Images. Food Analytical Methods. https://doi.org/10.1007/s12161-019-01670-w