基于高光譜成像技術(shù)的大曲還原糖含量預(yù)測(cè)及其可視化
大曲主要以生料小麥為原料,通過自然網(wǎng)羅制曲環(huán)境中的微生物接種發(fā)酵,微生物在曲坯中此消彼長(zhǎng),自然積溫轉(zhuǎn)化并風(fēng)干而成的一種多酶多菌的微生態(tài)制品[1-3]。大曲是白酒生產(chǎn)過程中的關(guān)鍵材料,大曲的好壞直接影響白酒品質(zhì)[4]。在發(fā)酵過程中,還原糖的含量是大曲質(zhì)量評(píng)價(jià)的重要指標(biāo)。因此,實(shí)時(shí)檢測(cè)還原糖含量對(duì)生產(chǎn)優(yōu)質(zhì)大曲至關(guān)重要。大曲還原糖含量的常規(guī)檢測(cè)方法為化學(xué)方法,需要用化學(xué)試劑對(duì)樣品進(jìn)行復(fù)雜而緩慢的實(shí)驗(yàn),且會(huì)對(duì)大曲樣品造成不可逆轉(zhuǎn)的破壞。因此,實(shí)現(xiàn)大曲還原糖含量的快速無(wú)損檢測(cè)具有重要意義。
高光譜成像技術(shù)作為一種新興的快速無(wú)損檢測(cè)技術(shù)[5]。它將機(jī)器視覺與光譜技術(shù)相結(jié)合,采集目標(biāo)對(duì)象的二維圖像和一維光譜信息,從而獲取高分辨率的圖像和光譜數(shù)據(jù)[6]。區(qū)別于一般測(cè)量技術(shù)中對(duì)單點(diǎn)物質(zhì)含量進(jìn)行測(cè)量的方法,利用高光譜成像技術(shù)獲得的光譜與圖像信息能夠?qū)崿F(xiàn)物質(zhì)含量變化的空間分析[7]。近年來(lái),高光譜成像技術(shù)以其無(wú)損、綠色、高效等優(yōu)點(diǎn)逐步引起食品領(lǐng)域研究人員的關(guān)注[8-10],高光譜成像技術(shù)與化學(xué)計(jì)量學(xué)方法結(jié)合,被廣泛用于各種物質(zhì)含量檢測(cè)及可視化,如冬小麥氮素營(yíng)養(yǎng)指標(biāo)[11]、羊肉中飽和脂肪酸含量[12]、水稻籽粒直鏈淀粉含量[13]和馬鈴薯葉片葉綠素含量[14]。以上對(duì)物質(zhì)含量檢測(cè)方面的研究均取得了較好的結(jié)果,但在大曲物質(zhì)檢測(cè)方面,還沒有將高光譜無(wú)損技術(shù)應(yīng)用于大曲還原糖含量檢測(cè)的相關(guān)研究報(bào)道。
因此,本研究以濃香型大曲為研究對(duì)象,針對(duì)大曲還原糖含量這一重要指標(biāo),提出一種基于高光譜成像技術(shù)、圖像處理技術(shù)結(jié)合統(tǒng)計(jì)學(xué)方法對(duì)不同發(fā)酵時(shí)間的大曲還原糖含量進(jìn)行檢測(cè)的方法。研究?jī)?nèi)容如下:首先,采集大曲樣本對(duì)應(yīng)的高光譜圖像;使用標(biāo)準(zhǔn)正態(tài)變量校正(standard normal variables,SNV)、卷積平滑(smoothing convolution,SG)、多元散射校正(multiplicative scatter correction,MSC)對(duì)大曲樣本的高光譜數(shù)據(jù)進(jìn)行預(yù)處理;采用主成分分析(principal component analysis,PCA)中的載荷系數(shù)法、連續(xù)投影法(successive projections algorithm,SPA)以及PCA-SPA算法分別提取了樣本的特征波長(zhǎng);建立了基于全波長(zhǎng)和特征波長(zhǎng)的偏最小二乘回歸(partial least squares regression,PLSR)和最小支持向量機(jī)(least squares support vector machine,LS-SVM)模型,預(yù)測(cè)大曲的還原糖含量;采用最優(yōu)預(yù)測(cè)模型對(duì)不同發(fā)酵時(shí)間的大曲樣本進(jìn)行了還原糖含量可視化。
1 材料和方法
1.1 樣品制備
以四川宜賓某酒廠生產(chǎn)的大曲為樣本,該大曲發(fā)酵周期為22 d。為獲取不同發(fā)酵時(shí)期的大曲樣品,在發(fā)酵過程中每天從曲房預(yù)設(shè)位置分別取6個(gè)樣品,共獲得132個(gè)大曲樣品。采集的大曲樣品用于后續(xù)高光譜圖像采集與還原糖含量測(cè)定。
1.2 儀器與設(shè)備
對(duì)大曲近紅外高光譜數(shù)據(jù)進(jìn)行采集的系統(tǒng)由芬蘭FX17系列高光譜相機(jī)、2個(gè)150 W鹵素光源、電控移動(dòng)平臺(tái)、計(jì)算機(jī)組成。其中FX17系列相機(jī)光譜范圍900~1 700 nm,采樣間隔3.58 nm,共采集224個(gè)波段,采集方式為推掃式,分辨率640×181像素,采樣曝光時(shí)間4.02 ms,掃描速度16.57 mm/s。
1.3 高光譜圖像獲取
采集數(shù)據(jù)時(shí)將曲塊碾成曲粉,用勺子取曲粉樣品于石英器皿中,填充至與邊緣平齊的位置,再將石英器皿放置在電控移動(dòng)平臺(tái)的中心位置進(jìn)行數(shù)據(jù)采集,得到132組大曲樣本的原始高光譜數(shù)據(jù)。
提取的高光譜數(shù)據(jù)經(jīng)過黑白校正,才能轉(zhuǎn)化為表征每個(gè)樣品的反射率[15]。此外,黑白校正可以消除樣本形狀的差異以及高光譜相機(jī)中存在暗電流引起的噪聲[16]。校正公式如公式(1)所示:
(1)
式中:I,校正后反射光譜率;I0,原始高光譜數(shù)據(jù);B,暗電流數(shù)據(jù);W,標(biāo)準(zhǔn)白板數(shù)據(jù)。
校正后選取大曲樣本的感興趣區(qū)域(region of interest,ROI),將ROI的光譜數(shù)據(jù)進(jìn)行平均處理后作為大曲樣本的原始高光譜數(shù)據(jù),原理如圖1所示。使用圖像處理方法檢測(cè)培養(yǎng)皿的邊緣,由邊緣得到培養(yǎng)皿中心坐標(biāo);并以中心坐標(biāo)為圓心,繪制直徑為161像素的圓形掩膜;提取掩膜區(qū)域的光譜數(shù)據(jù),進(jìn)行平均處理,得到該ROI的光譜反射率。每個(gè)樣本提取一個(gè)ROI,求得每個(gè)ROI內(nèi)所有像素點(diǎn)的平均光譜,得到132組光譜數(shù)據(jù)。
a-高光譜數(shù)據(jù);b-提取的ROI;c-ROI內(nèi)每個(gè)像素點(diǎn)的光譜曲線;d-ROI平均光譜曲線
圖1 ROI光譜提取
Fig.1 ROI spectrum extraction
1.4 大曲還原糖測(cè)定
采用直接滴定法測(cè)定,此方法常用于食品中還原糖含量的測(cè)定。除去樣品中的蛋白質(zhì)后,以亞甲藍(lán)為指示劑,在加熱條件下滴定校準(zhǔn)的堿性酒石酸銅溶液(用標(biāo)準(zhǔn)還原糖溶液校準(zhǔn)),根據(jù)消耗量計(jì)算還原糖含量。省略了相關(guān)的溶液制備方法和具體的滴定過程,樣品的還原糖含量按公式(2)計(jì)算:
(2)
式中:X,樣品的還原糖含量,g/100 g;m1,還原糖的質(zhì)量,mg;m,樣品的質(zhì)量,g;F,系數(shù),1;10,試樣溶液的體積,mL;250,定容體積,mL;1 000為換算系數(shù)。
2 數(shù)據(jù)分析方法
2.1 光譜數(shù)據(jù)預(yù)處理
由于暗電流、環(huán)境光等因素的影響,采集的原始光譜中摻雜了與樣本無(wú)關(guān)的信息。采用合適的光譜預(yù)處理算法可以有效減弱各種因素對(duì)還原糖原始光譜數(shù)據(jù)的影響,提高預(yù)測(cè)模型的穩(wěn)定性和預(yù)測(cè)能力[17-18]。本文采用MSC、SG、SNV共3種預(yù)處理方法。
2.2 特征波長(zhǎng)篩選
獲取的大曲高光譜樣本的數(shù)據(jù)量大,波段數(shù)量多,且相鄰波長(zhǎng)圖像高度相關(guān),含有很多冗余信息和干擾信息,會(huì)影響建模的效率[19]。因此需要采用合適的方法篩選與表征指標(biāo)高度相關(guān)的特征波長(zhǎng),以增加模型的魯棒性和泛化性[20]。本文采取PCA算法與SPA進(jìn)行特征波長(zhǎng)提取。
2.2.1 PCA
PCA是一種常見的數(shù)據(jù)分析方式,常用于高維數(shù)據(jù)的降維,可用于提取數(shù)據(jù)的主要特征分量。PCA得到的每個(gè)主成分都是原始數(shù)據(jù)中所有變量的線性組合。使用PCA載荷系數(shù)提取光譜特征波長(zhǎng)步驟如下:首先使用PCA算法計(jì)算光譜數(shù)據(jù)的主成分;然后,選擇前幾個(gè)貢獻(xiàn)率大的主成分對(duì)應(yīng)的載荷因子;最后,根據(jù)閾值選擇載荷因曲線對(duì)應(yīng)的波長(zhǎng)作為特征波長(zhǎng)。具有較大載荷因子的波長(zhǎng)對(duì)應(yīng)于光譜曲線中的重要峰谷[21]。本文使用PCA提取特征波長(zhǎng)的目的是去除數(shù)據(jù)中不相關(guān)或信息含量低的波長(zhǎng),以降低數(shù)據(jù)維度。
2.2.2 SPA算法
SPA算法是一種使矢量空間共線性最小化的前向變量選擇算法,可以將有效的信息從大量的光譜數(shù)據(jù)中篩選出來(lái),找到光譜變量之間共線性最小的特征波長(zhǎng)[22]。本文使用SPA提取特征波長(zhǎng)的目的是找到光譜變量之間共線性最小的特征波長(zhǎng),優(yōu)化建模條件。
2.2.3 PCA-SPA算法
本研究使用了一種新興的特征波長(zhǎng)提取算法。該算法由PCA和SPA組成,稱為PCA-SPA算法[23]。使用該算法時(shí)先用PCA通過主成分的載荷系數(shù)提取光譜特征波長(zhǎng),然后在此基礎(chǔ)上使用SPA算法進(jìn)行特征波長(zhǎng)的二次提取。使用PCA-SPA算法的目的是確定還原糖的特征波長(zhǎng),構(gòu)建更穩(wěn)定、更簡(jiǎn)單的檢測(cè)模型。
2.3 數(shù)學(xué)模型的建立與評(píng)價(jià)
本研究分別采用PLSR和LS-SVM模型建立還原糖含量檢測(cè)模型。兩種模型均可用于探索光譜維度X(大曲的光譜數(shù)據(jù))與含量Y(大曲還原糖含量)之間的潛在關(guān)系。通過校正集決定系數(shù)校正集均方根誤差(root mean square error of calibration,RMSEC),預(yù)測(cè)集決定系數(shù)預(yù)測(cè)集均方根誤差(root mean square error of prediction set,RMSEP)對(duì)大曲還原糖含量預(yù)測(cè)模型的準(zhǔn)確性和預(yù)測(cè)能力進(jìn)行評(píng)價(jià)分析。其中決定系數(shù)和越接近于1越好,均方根誤差RMSEC和RMSEP越接近于0越好[24]。
2.4 還原糖含量可視化
為直觀測(cè)定指標(biāo)的含量分布情況,為大曲樣品的ROI中還原糖的含量進(jìn)行可視化處理。提取大曲樣本高光譜圖像每個(gè)像元的光譜反射率,依據(jù)檢測(cè)模型計(jì)算每個(gè)像元的還原糖含量。由于大曲還原糖含量在0.8~10 g/100 g,為了將不同發(fā)酵期間的大曲樣本感興趣區(qū)域內(nèi)各像素點(diǎn)的還原糖含量用偽彩色圖顯示,需要將各像素點(diǎn)的大曲還原糖含量數(shù)值映射到0~255灰度圖像的范圍期間。然后對(duì)灰度圖像進(jìn)行偽彩色處理形成還原糖含量的可視化分布圖。還原糖含量的可視化彩色分布圖直觀的顯示出還原糖含量的二維分布,可以更好的觀察不同發(fā)酵時(shí)期的大曲還原糖含量及其分布情況。
3 結(jié)果與分析
3.1 大曲還原糖含量的變化
本研究采用Kennard-Stone(KS)算法將132個(gè)大曲光譜數(shù)據(jù)分為訓(xùn)練集(100)和預(yù)測(cè)集(32),如表1所示。
表1 大曲樣品還原糖含量統(tǒng)計(jì)表
Table 1 Statistics of reducing sugar content in Daqu samples
3.2 大曲樣品的光譜特征
由于光譜曲線的首尾波長(zhǎng)噪聲較大,為保證數(shù)據(jù)的準(zhǔn)確性,去掉首尾10個(gè)波長(zhǎng)的數(shù)據(jù)。圖2顯示了大曲在不同發(fā)酵時(shí)期的204個(gè)波段的平均光譜反射率曲線。
圖2 原始光譜圖
Fig.2 Original spectrogram
在波長(zhǎng)范圍內(nèi),光譜曲線表現(xiàn)出相同的吸收帶和反射峰,但不同帶的反射率不同,這主要是由于大曲在不同發(fā)酵時(shí)期的物質(zhì)組成存在差異。近紅外波長(zhǎng)范圍內(nèi)的吸收峰都是由O—H、C—H、N—H等共價(jià)鍵的吸收引起的。O—H作用于980 nm左右的波長(zhǎng),這是因?yàn)樗淖饔?;C—H作用于1 210 nm附近的波長(zhǎng),這歸功于脂肪;N—H作用于1 442 nm附近的波長(zhǎng),這是由于蛋白質(zhì)[12]。
3.3 基于全波長(zhǎng)光譜預(yù)測(cè)大曲還原糖的含量
基于原始光譜(無(wú)處理)和3種預(yù)處理的204個(gè)波長(zhǎng),分別建立PLSR和LS-SVM預(yù)測(cè)模型,建模效果如表2所示。
表2 PLSR和LS-SVM模型全光譜建模效果
Table 2 Full spectrum modeling effect of PLSR and LS-SVM models
經(jīng)過SNV預(yù)處理所建立的PLSR模型效果最佳,預(yù)測(cè)集決定系數(shù)為0.905 2,RMSEP為0.544 1 g/100 g,優(yōu)于其他方法。后續(xù)建模分析均基于SNV算法預(yù)處理后的樣本光譜進(jìn)行分析,經(jīng)SNV預(yù)處理后的樣本光譜曲線如圖3所示。
圖3 SNV預(yù)處理結(jié)果
Fig.3 SNV pretreatment results
3.4 模型優(yōu)化
3.4.1 基于SPA提取特征波長(zhǎng)的大曲還原糖預(yù)測(cè)模型
對(duì)SNV算法預(yù)處理后的204個(gè)波段的樣本光譜進(jìn)行SPA特征波長(zhǎng)提取,將提取后的特征波長(zhǎng)進(jìn)行PLSR與LS-SVM建模預(yù)測(cè)的結(jié)果如表3所示。
由表3可知,對(duì)經(jīng)過SPA算法進(jìn)行特征提取的光譜數(shù)據(jù)進(jìn)行建模,PLSR在訓(xùn)練集和測(cè)試集的表現(xiàn)均優(yōu)于LS-SVM,且PLSR模型訓(xùn)練集和測(cè)試集的精度差異更小,表明PLSR較LS-SVM有更好的精度和穩(wěn)定性。該SNV-SPA-PLSR預(yù)測(cè)模型的預(yù)測(cè)集決定系數(shù)為0.914 5,預(yù)測(cè)集均方根誤差RMSEP為0.503 0 g/100 g,波段數(shù)為61,光譜波段減少量為70%。
表3 基于SPA提取特征波長(zhǎng)的光譜建模效果
Table 3 Spectral modeling effect of extracting characteristic wavelength based on SPA
3.4.2 基于PCA載荷因子提取特征波長(zhǎng)的大曲還原糖預(yù)測(cè)模型
對(duì)SNV算法預(yù)處理后的204個(gè)波段的樣本光譜進(jìn)行PCA運(yùn)算,前3個(gè)主成分的貢獻(xiàn)率如圖4所示,其中還原糖的前3個(gè)主成分貢獻(xiàn)率之和達(dá)到99.96%,后續(xù)主成分的累計(jì)貢獻(xiàn)率提高幅度逐步變小,因此選擇前3個(gè)主成分的載荷因子提取特征波長(zhǎng)。
圖4 PCA中主成分的貢獻(xiàn)率
Fig.4 Contribution rate of principal components in PCA
利用PCA光譜數(shù)據(jù)主成分,根據(jù)前3個(gè)主成分對(duì)應(yīng)的載荷因子提取還原糖的特征波長(zhǎng),根據(jù)設(shè)置的載荷因子的閾值,可得到不同數(shù)目的特征波長(zhǎng),并進(jìn)行PLSR和LS-SVM建模,建模效果如表4所示。隨著載荷閾值的增加,提取的特征波長(zhǎng)數(shù)量會(huì)快速的減少,而后減少得較慢,最后不發(fā)生變化,這表明PCA載荷因子對(duì)變量的選擇是一個(gè)從粗略到精細(xì)的過程。當(dāng)載荷因子的閾值達(dá)到0.060時(shí),選擇的特征波長(zhǎng)數(shù)目變化趨于平緩,且此時(shí)建模效果較差,預(yù)測(cè)精度皆在0.86及以下,說(shuō)明閾值設(shè)置過高,在提取特征波長(zhǎng)的過程中刪去了一部分與還原糖相關(guān)的波段。說(shuō)明當(dāng)載荷因子的閾值小于0.060時(shí),算法濾除與大曲還原糖無(wú)關(guān)的光譜信息。
表4 基于PCA提取特征波長(zhǎng)的光譜PLSR建模效果
Table 4 Spectral PLSR modeling effect based on PCA extracting characteristic wavelength
由表4中不同載荷因子閾值提取的不同特征波長(zhǎng)建模效果來(lái)看,PLSR建模精度明顯優(yōu)于LS-SVM。在載荷因子閾值為0.045時(shí)PLSR建模預(yù)測(cè)集的最高,達(dá)到0.916 8 g/100 g,在該載荷閾值下提取出的特征波長(zhǎng)共114個(gè),光譜波段減少量為44%。
3.4.3 基于PCA-SPA提取特征波長(zhǎng)的大曲還原糖預(yù)測(cè)模型
在研究中,分別將大曲的光譜數(shù)據(jù)進(jìn)行了PCA和SPA算法的特征波長(zhǎng)提取。單獨(dú)使用SPA算法時(shí),盡管降低了特征波長(zhǎng)點(diǎn)建的共線性,但也會(huì)保留下一些無(wú)信息、甚至?xí)a(chǎn)生干擾的波長(zhǎng)點(diǎn)。同樣,當(dāng)在單獨(dú)使用PCA算法進(jìn)行特征波長(zhǎng)提取時(shí),也會(huì)留下一些信息量較少的波長(zhǎng)。因此,本實(shí)驗(yàn)中將PCA算法與SPA算法聯(lián)合,實(shí)現(xiàn)兩者之間的優(yōu)勢(shì)互補(bǔ),建立基于PCA-SPA特征波段選取的PLSR大曲還原糖含量預(yù)測(cè)模型。
使用PCA-SPA算法對(duì)光譜數(shù)據(jù)進(jìn)行特征波長(zhǎng)提取。設(shè)定PCA的載荷因子閾值為0.045,經(jīng)過2種算法提取特征,得到26個(gè)特征波長(zhǎng)點(diǎn),分布如圖5。圖中藍(lán)色光譜曲線為132個(gè)大曲樣本的平均光譜反射率曲線,橙色標(biāo)記點(diǎn)對(duì)應(yīng)選擇的波段位置。還原糖的特征波長(zhǎng)主要分布在短波近紅外區(qū),且基本分布在光譜曲線的波峰波谷附近。
圖5 PCA-SPA算法提取的特征波長(zhǎng)
Fig.5 Characteristic wavelength extracted by PCA-SPA algorithm
對(duì)基于SNV-PCA-SPA方法提取的特征波長(zhǎng)進(jìn)行PLSR與LS-SVM建模分析。LS-SVM預(yù)測(cè)模型的訓(xùn)練集和預(yù)測(cè)集的決定系數(shù)分別為0.863 4和0.802 1,訓(xùn)練集和預(yù)測(cè)集的均方根誤差分別為0.662 2和1.119 4 g/100 g。PLSR模型預(yù)測(cè)大曲還原糖的效果最好,訓(xùn)練集和預(yù)測(cè)集的決定系數(shù)分別為0.983 2和0.922 7,訓(xùn)練集和預(yù)測(cè)集的均方根誤差分別為0.057 3和0.455 6 g/100 g,光譜波段數(shù)減少了87%。PLSR模型預(yù)測(cè)集的擬合效果如圖6所示。
圖6 預(yù)測(cè)集的擬合效果圖
Fig.6 Fitting effect diagram of prediction set
3.4.4 最優(yōu)大曲還原糖預(yù)測(cè)模型
經(jīng)過上述實(shí)驗(yàn)分析,本研究確定了SNV-PCA-SPA-PLSR為最優(yōu)的大曲還原糖含量的預(yù)測(cè)模型。首先對(duì)基于原始光譜和3種預(yù)處理的204個(gè)波長(zhǎng),建立PLSR和LS-SVM預(yù)測(cè)模型,得出經(jīng)SNV預(yù)處理算法的PLSR建模效果最佳;為減少建模的復(fù)雜度以及提升建模精度,分別使用PCA載荷系數(shù)法以及SPA算法對(duì)光譜數(shù)據(jù)進(jìn)行特征提取,經(jīng)建模分析,得出最佳模型為PCA-PLSR以及SPA-PLSR,建模所用光譜數(shù)據(jù)分別減少70%和44%;為進(jìn)一步提高建模效果,提出PCA-SPA算法進(jìn)行特征提取,經(jīng)建模驗(yàn)證,PLSR模型精度及準(zhǔn)確度皆有一定的提高,建模所用光譜數(shù)據(jù)減少87%。綜上所述,本研究的最優(yōu)大曲還原糖含量的預(yù)測(cè)模型為SNV-PCA-SPA-PLSR模型。
3.5 大曲還原糖含量可視化
在確定了SNV-PCA-SPA-PLSR為最優(yōu)的大曲還原糖含量的預(yù)測(cè)模型后,使用最優(yōu)模型對(duì)大曲還原糖含量進(jìn)行可視化分析。不同發(fā)酵時(shí)期的大曲樣本的還原糖含量可視化如圖7所示,其中不同的顏色代表不同的還原糖含量值,深紅色區(qū)域表示還原糖含量值較高,深藍(lán)色區(qū)域表示還原糖含量值較低。隨著還原糖含量的增加,顏色逐漸由深藍(lán)色變?yōu)樯罴t色。ROI中分布不均還原糖的含量可以通過顏色清晰區(qū)分,與單點(diǎn)檢測(cè)技術(shù)相比,高光譜成像可以實(shí)現(xiàn)大曲任意局部區(qū)域的可視化。
a-第1天;b-第5天;c-第9天;d-第13天;e-第17天;f-第22天
圖7 大曲還原糖可視化分布
Fig.7 Visual distribution of reducing sugar in Daqu
由圖7可知,不同發(fā)酵階段的大曲還原糖含量明顯不同,隨著發(fā)酵時(shí)間的進(jìn)行,還原糖含量不斷降低,顏色逐漸由紅變藍(lán)。發(fā)酵前期有較多紅色區(qū)域,因?yàn)榘l(fā)酵剛開始時(shí),微生物大量繁殖,產(chǎn)出大量還原糖;隨著發(fā)酵進(jìn)行,還原糖含量逐漸下降,這是因?yàn)榻湍妇绕渌N的快速增殖消耗了部分還原糖[25]。高光譜成像可以直觀顯示大曲還原糖分布,為判定大曲發(fā)酵狀態(tài),調(diào)節(jié)曲房環(huán)境提供了依據(jù)。
4 結(jié)論
本實(shí)驗(yàn)用高光譜成像系統(tǒng)采集了大曲樣本的高光譜圖像,使用K-S算法將大曲樣本以3∶1的比例進(jìn)行劃分,訓(xùn)練集樣本個(gè)數(shù)為100個(gè),預(yù)測(cè)集樣本個(gè)數(shù)為32個(gè)。利用原始(無(wú)處理)和不同預(yù)處理方式(SNV、MSC、SG)處理后的光譜數(shù)據(jù)分布建立PLSR和LS-SVM模型大曲還原糖含量,發(fā)現(xiàn)SNV方法可以提高模型預(yù)測(cè)還原糖含量的精度,訓(xùn)練集和預(yù)測(cè)集的決定系數(shù)分別為0.954 0和0.905 2,均方根誤差RMSEC和RMSEP分別為0.159 2 g/100 g和0.544 1 g/100 g。
對(duì)SNV預(yù)處理過后的光譜數(shù)據(jù)分別使用SPA、PCA和PCA-SPA 3種方法進(jìn)行特征波長(zhǎng)提取?;诓煌椒ㄌ崛〉奶卣鞑ㄩL(zhǎng)建立的PLSR和LS-SVM模型預(yù)測(cè)還原糖含量,發(fā)現(xiàn)用PCA-SPA提取的特征波長(zhǎng)建立的PLSR模型最優(yōu),訓(xùn)練集和預(yù)測(cè)集的決定系數(shù)分別為0.983 2和0.922 7,均方根誤差RMSEC和RMSEP分別為0.057 3 g/100 g和0.455 6 g/100 g。利用最優(yōu)模型對(duì)大曲樣本ROI區(qū)域的還原糖含量進(jìn)行可視化,直觀反映了不同發(fā)酵時(shí)期的大曲還原糖含量的變化情況。研究結(jié)果表明,高光譜成像技術(shù)用于大曲還原糖含量快速檢測(cè)是可行的,為大曲發(fā)酵狀態(tài)判定和曲房環(huán)境調(diào)控提供了理論基礎(chǔ)。
在進(jìn)一步研究中,應(yīng)擴(kuò)大樣本獲取范圍,采集不同發(fā)酵批次的大曲樣本,擴(kuò)大樣本數(shù)量,增大樣本的還原糖范圍,使模型的預(yù)測(cè)性更高,應(yīng)用更加廣泛。
欄目分類
- 1網(wǎng)絡(luò)直播現(xiàn)狀及前景探究
- 2淺析電影《我的父親母親》視聽語(yǔ)言特色——影視文學(xué)
- 3中美貿(mào)易戰(zhàn)的發(fā)展和應(yīng)對(duì)
- 4論微信傳播的特點(diǎn)
- 5企業(yè)如何進(jìn)行危機(jī)公關(guān)——以三星Galaxy note7爆炸門事件為例
- 6淺析網(wǎng)絡(luò)暴力的社會(huì)危害及防治對(duì)策
- 7聚酮類化合物研究進(jìn)展
- 8淺析《極限挑戰(zhàn)》的節(jié)目特色及啟示
- 9《楚門的世界》的多重隱喻解讀
- 10體育產(chǎn)業(yè)發(fā)展中存在的問題及建議
- 游戲教學(xué)法在網(wǎng)球教學(xué)中的應(yīng)用
- 心理素質(zhì)在網(wǎng)球比賽中的作用
- 綠色科技視角下企業(yè)環(huán)境績(jī)效指標(biāo)體系構(gòu)建
- 節(jié)約型基礎(chǔ)上的綠色財(cái)政稅收政策研究
- 財(cái)政投資項(xiàng)目竣工決算存在的問題及對(duì)策
- 基于精細(xì)化管理視域探析公立醫(yī)院成本管控優(yōu)化策略
- 農(nóng)村信用社在金融市場(chǎng)中的營(yíng)銷技巧探究
- 實(shí)現(xiàn)我國(guó)糧食增產(chǎn)增收的財(cái)稅政策分析
- 離子色譜法同時(shí)測(cè)定卷煙紙中幾種金屬離子的含量
- IC厭氧反應(yīng)器處理造紙廢水效率的時(shí)間分布特征研究
- 官方認(rèn)定!CSSCI南大核心首批191家“青年學(xué)者友好期刊名單”
- 2023JCR影響因子正式公布!
- 國(guó)內(nèi)核心期刊分級(jí)情況概覽及說(shuō)明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學(xué)者
- 我用了一個(gè)很復(fù)雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- 重磅!CSSCI來(lái)源期刊(2023-2024版)最新期刊目錄看點(diǎn)分析!全網(wǎng)首發(fā)!
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應(yīng)該熟知的10個(gè)知識(shí)點(diǎn)。
- 注意,最新期刊論文格式標(biāo)準(zhǔn)已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學(xué)術(shù)論文編寫規(guī)則
- 盤點(diǎn)那些評(píng)職稱超管用的資源,1,3和5已經(jīng)“絕種”了
- 職稱話題| 為什么黨校更認(rèn)可省市級(jí)黨報(bào)?是否有什么說(shuō)據(jù)?還有哪些機(jī)構(gòu)認(rèn)可黨報(bào)?