基于深度學(xué)習(xí)的烤煙分級(jí)研究與應(yīng)用

作者：臧傳江，李更新，趙湘江，董玉雙，婁欣東，李強(qiáng)來源：《上海輕工業(yè)》日期：2024-07-31人氣：620

本研究以標(biāo)準(zhǔn)的烤煙收購為場景，應(yīng)用可見光譜技術(shù)結(jié)合深度學(xué)習(xí)算法構(gòu)建面向6種烤煙類型的烤煙分級(jí)算法，目標(biāo)為實(shí)現(xiàn)完全自動(dòng)化煙葉定級(jí)。通過對(duì)機(jī)器分級(jí)技術(shù)的應(yīng)用和推廣，給煙葉分級(jí)整個(gè)流程帶來了許多好處。其一，提高煙葉分級(jí)的工作效率。其二，減少煙葉收購活動(dòng)中出現(xiàn)的糾紛數(shù)量和概率。其三，可以促進(jìn)全社會(huì)煙葉分類過程的統(tǒng)一化，規(guī)范煙草收購市場，提升我國煙草行業(yè)的全球競爭力。

1 材料與方法

1.1 數(shù)據(jù)獲取與預(yù)處理

1.1.1 煙葉樣本選擇

該項(xiàng)研究面向?qū)嶋H煙農(nóng)與收購站交接的流水線，為提升落地實(shí)用的應(yīng)用價(jià)值以及降低標(biāo)定等級(jí)的繁瑣性，最終采用了收購量集中（貢獻(xiàn)率）最高的六個(gè)等級(jí)進(jìn)行訓(xùn)練，分別為：C2F、C3F、C3L、B2F、B3F及X2F，所有收購煙葉通過青雜檢測后，統(tǒng)一進(jìn)行六分類的判別。采集對(duì)象為2021年山東省濰坊市洛莊煙站收購季煙葉，共采集6種合格等級(jí)的煙葉樣本1.8TB左右的數(shù)據(jù)集。卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練應(yīng)提供足夠多的樣本，并且每種等級(jí)相當(dāng)?shù)臉颖炯?/span>

1.1.2 采集環(huán)境

數(shù)據(jù)采集中使用白板校正技術(shù)來降低客觀因素導(dǎo)致的誤差，將WhiteBoard的樣本數(shù)據(jù)值作為基準(zhǔn)項(xiàng)，對(duì)獲取的高維數(shù)據(jù)進(jìn)行基準(zhǔn)歸一化，由此降低由客觀因素導(dǎo)致誤差率提升的可能性。此外，本文提出的算法目標(biāo)正是面對(duì)實(shí)際生產(chǎn)過程的煙葉分級(jí)，所以從模型的實(shí)用性出發(fā)，采集的樣本以實(shí)際需求為目標(biāo)，原始數(shù)據(jù)可表示為。

1.1.3 煙葉樣本數(shù)據(jù)預(yù)處理

對(duì)于合格樣本，返回的256段波長的高光譜數(shù)據(jù)。通過對(duì)高光譜數(shù)據(jù)的采集和處理，最終得到樣本數(shù)據(jù)存儲(chǔ)在RAW文件中，由Hdr文件定義輸入數(shù)據(jù)的特性。且在該文件中具體列舉了256個(gè)波段的具體范圍，為385.60～1006.60均分的256段波段（含頭尾）。

1.2 分級(jí)算法

本文提出基于卷積神經(jīng)網(wǎng)絡(luò)算法的，通過采集的高光譜數(shù)據(jù)，分別學(xué)習(xí)面向煙葉部位、煙葉顏色、煙葉等級(jí)的訓(xùn)練模型，構(gòu)建高光譜數(shù)據(jù)與煙葉部位、煙葉顏色乃至煙葉等級(jí)的非線性映射關(guān)系。此處為預(yù)處理后得到的輸入高光譜數(shù)據(jù)，為面向訓(xùn)練模型的部位、顏色和等級(jí)類別。

3 實(shí)驗(yàn)評(píng)估

實(shí)驗(yàn)依托山東省濰坊市下屬煙葉收購站，利用高光譜顯像儀，在收購對(duì)算法進(jìn)行實(shí)際驗(yàn)證。經(jīng)過數(shù)據(jù)預(yù)處理的數(shù)據(jù)集總共包括六種級(jí)別煙葉（B2F、B3F、C2F、C3F、X2F、C3L），采集的全部煙葉樣本數(shù)據(jù)中80%數(shù)據(jù)進(jìn)行模型訓(xùn)練，20%數(shù)據(jù)進(jìn)行模型測試。

3.1 分級(jí)算法性能評(píng)估

對(duì)比同類型參考文獻(xiàn)，在同樣獲取全光譜信息的前提下，如表1所示，本文提出的模型在損失、準(zhǔn)確率上稍顯突出，比對(duì)類型主要有四類：一、基于傳統(tǒng)的模糊識(shí)別準(zhǔn)則；二、基于統(tǒng)計(jì)學(xué)的數(shù)據(jù)挖掘算法；三、BP神經(jīng)網(wǎng)絡(luò)；四、三通道輸入的卷積神經(jīng)網(wǎng)絡(luò)。通過以上實(shí)驗(yàn)結(jié)果來看，加權(quán)準(zhǔn)確率居于97.5%附近，煙葉分級(jí)要求經(jīng)過對(duì)上中下三個(gè)部位的煙葉驗(yàn)證，機(jī)器識(shí)別與專家識(shí)別的一致率大于80％，而本文研究結(jié)果遠(yuǎn)超于國家基準(zhǔn)，具有可觀的探究價(jià)值。同時(shí)，最重要的一點(diǎn)在于，本文的研究面向?qū)嶋H生產(chǎn)應(yīng)用，采集的煙葉圖像均為連串雜糅狀態(tài)，以投入煙葉收購生產(chǎn)使用為目的，相比于理想實(shí)驗(yàn)環(huán)境下對(duì)單煙葉探究的分級(jí)算法來說更有落地應(yīng)用的說服力。在實(shí)際煙葉收購過程中，算法模型分級(jí)預(yù)測平均執(zhí)行時(shí)間在7s以內(nèi)，滿足高效的煙葉收購需求。

表1 不同煙葉分級(jí)方案正確率比較

算法	平均正確率 /%
基于NIR技術(shù)和ELM的烤煙煙葉自動(dòng)分級(jí)^[⁷^]	93.51%
基于機(jī)器視覺的煙葉分級(jí)^[²^]	92.00%
基于智能識(shí)別技術(shù)的煙葉分級(jí)技術(shù)^[⁴^]	95.45%
基于聚類和加權(quán)K近鄰的煙葉分級(jí)研究^[⁸^]	93.69%
基于PCA-GA-SVM的煙葉分級(jí)方法^[¹³^]	95.56%
基于圖像特征的煙葉分級(jí)^[³^]	91.00%
基于ANN分類器的煙葉分級(jí)^[¹⁴^]	95.04%
基于BP算法的煙葉分級(jí)^[⁵^]	84.76%
基于機(jī)器視覺與深度學(xué)習(xí)的煙葉定級(jí)研究^[1⁵^]	93.05%
本文模型	97.54%

表1中算法準(zhǔn)確率是1000次的平均準(zhǔn)確率值，相比其他算法，準(zhǔn)確率提升比例依次為4.5%，6%，2.2%，4.1%，2.1%，7.2%，2.6%，15.1%，4.8%，性能提升均超過2%，證明本文提出算法是有效的、可行的?；?/span>1000次的統(tǒng)計(jì)結(jié)果，利用本文算法和次高算法進(jìn)行統(tǒng)計(jì)學(xué)顯著性分析，即t-Tests，p值小于0.005。以上結(jié)果驗(yàn)證了本文提出算法能夠有效地改進(jìn)算法分類結(jié)果的準(zhǔn)確率。

為驗(yàn)證部分類別預(yù)測準(zhǔn)確率，基于本文算法，對(duì)4種煙葉等級(jí)（C2F、C3F、X2F、C3L）的進(jìn)行煙葉顏色、煙葉部位和煙葉最終等級(jí)模型訓(xùn)練，訓(xùn)練準(zhǔn)確率和測試準(zhǔn)確率如表2所示：

表2 4種煙葉分級(jí)方案正確率比較

算法	訓(xùn)練準(zhǔn)確率 /%	測試準(zhǔn)確率 /%
煙葉部位模型	99.78%	97.11%
煙葉顏色模型	99.82%	97.94%
本文模型	99.71%	97.05%

其中測試樣本數(shù)1732個(gè)，訓(xùn)練樣本數(shù)6928個(gè)。煙葉模型在部位、顏色的訓(xùn)練和測試準(zhǔn)確率均都超過97%。因此，利用融合煙葉部位、煙葉顏色和煙葉初始等級(jí)的煙葉定級(jí)策略在提高煙葉部位、顏色的準(zhǔn)確率的同時(shí)，提高了煙葉整體定級(jí)準(zhǔn)確率。

基于提出的融合煙葉顏色和部位的煙葉定級(jí)算法，將采用全部6種煙葉等級(jí)（B2F、B3F、C2F、C3F、X2F、C3L）的所有數(shù)據(jù)集進(jìn)行煙葉顏色、煙葉部位和煙葉最終等級(jí)模型訓(xùn)練，訓(xùn)練準(zhǔn)確率和測試準(zhǔn)確率如表3所示：

表3 6種煙葉分級(jí)方案正確率比較

算法	訓(xùn)練準(zhǔn)確率 /%	測試準(zhǔn)確率 /%
煙葉部位模型	98.88%	98.08%
煙葉顏色模型	99.91%	98.63%
本文模型	98.77%	97.54%

其中測試樣本數(shù)2854個(gè)，訓(xùn)練樣本數(shù)11420個(gè)。煙葉模型在部位、顏色的訓(xùn)練準(zhǔn)確率均都超過98%，測試準(zhǔn)確率均超過97%。隨著數(shù)據(jù)集和煙葉類別的增加，煙葉部位和煙葉顏色模型訓(xùn)練準(zhǔn)確率在99%左右，且測試準(zhǔn)確率也都超過98%，和4種等級(jí)的煙葉顏色和部位預(yù)測基本持平。隨著數(shù)據(jù)集規(guī)模增加，本文模型相比4種煙葉等級(jí)預(yù)測準(zhǔn)確率有所提升，都超過了97%。因此，在全部數(shù)據(jù)集規(guī)模下，利用融合煙葉部位、煙葉顏色和煙葉初始等級(jí)的煙葉定級(jí)策略在提高煙葉定級(jí)準(zhǔn)確率的方案是切實(shí)可行的。

3 討論

基于圖像處理方法和卷積神經(jīng)網(wǎng)絡(luò)算法，借助煙葉的高光譜數(shù)據(jù)對(duì)煙葉進(jìn)行分級(jí)。同時(shí)仿效國家標(biāo)準(zhǔn)進(jìn)行部位、顏色、葉片質(zhì)量三層定級(jí)，葉片部位分別為下部（X）、中部（C）、上部（B），顏色分別為桔黃色（F），檸檬黃色（L）等等，質(zhì)量等級(jí)依據(jù)多大致維線索分為1到4級(jí)。分步分級(jí)的重要性非常大，拿部位來說，不同部位的煙葉由于生長條件不同，形狀特征從表面上看是有明顯區(qū)別的。總體變化規(guī)律為：下部煙葉較寬圓；中部煙葉寬至較寬，葉尖較鈍；上部煙葉較窄，葉尖較銳。但是若和顏色信息進(jìn)行組合，會(huì)得到不同部位不同顏色反饋相同結(jié)果，由此，總體分級(jí)方案為先分“類型”，后分“組”，最后根據(jù)每個(gè)組內(nèi)煙葉質(zhì)量的好壞劃分成幾個(gè)不同的“級(jí)”，每一級(jí)的劃分通過卷積神經(jīng)網(wǎng)絡(luò)算法實(shí)現(xiàn)。

根據(jù)分級(jí)員經(jīng)驗(yàn)和視覺檢測技術(shù)要求，采用多次分級(jí)的方式，先處理葉片圖像劃分葉片部位，其次通過相同高光譜圖像劃分顏色屬性，最后根據(jù)輸入的多維數(shù)據(jù)集判別煙葉的質(zhì)量等級(jí)，這三者共同構(gòu)成最終煙葉等級(jí)，如B2F，B為上部煙葉，F為桔黃色，2為質(zhì)量等級(jí)。該措施最直觀的作用在于分級(jí)的條理性，級(jí)與級(jí)之前無交集。根據(jù)參考文獻(xiàn)中關(guān)于煙葉分級(jí)的多數(shù)應(yīng)用實(shí)例來看，集所有屬性轉(zhuǎn)化為多維數(shù)據(jù)進(jìn)行一次性定級(jí)的方案占多數(shù)，這種做法導(dǎo)致最大的問題在于級(jí)與級(jí)之中存在大范圍的交界區(qū)域，更容易因技術(shù)錯(cuò)誤導(dǎo)致等級(jí)的誤判，同時(shí)若落地于工業(yè)流水線，將大大模糊化同等級(jí)情況下不同部位或顏色的煙葉差別，不利于煙農(nóng)與收購站定價(jià)。

針對(duì)單片煙葉或具有明顯可分割特征的多片煙葉，使用圖像處理技術(shù)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)的煙草分級(jí)算法，能夠達(dá)到較高的煙葉定級(jí)。Li等研究了基于深度學(xué)習(xí)方法的41種煙葉圖像分類算法，在樣本數(shù)量較少的情況下，將遷移學(xué)習(xí)應(yīng)用于經(jīng)典的VGG16網(wǎng)絡(luò)模型，并對(duì)VGG16網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行微調(diào)，模型的精度達(dá)到91.26%，比原模型高1.25%。Luo等提出了一個(gè)簡單的煙草圖像分類框架，融合了表觀特征和低維深度特征，使用改進(jìn)的AlexNet網(wǎng)絡(luò)傳遞較淺的卷積特征，通過主動(dòng)硬樣本挖掘?qū)W(wǎng)絡(luò)進(jìn)行微調(diào)，與單純的表觀特征或深度特征相比，融合表觀特征和深度特征可以提高煙草分級(jí)的準(zhǔn)確性。賴福長等公開了一種基于人工智能的煙葉等級(jí)快速識(shí)別裝置，能快速識(shí)別煙葉等級(jí)。以上研究針對(duì)的是單片煙葉的定級(jí)策略，無法滿足實(shí)際烤煙收購的批量檢測的需求。

同時(shí)，考慮到化學(xué)成分決定煙葉的品質(zhì)，光譜特性能夠很好地反映煙葉化學(xué)成分的含量。通過分析B2F、C3F、X2F 3個(gè)煙葉等級(jí)與其主要化學(xué)成分的關(guān)系，利用多類logistic回歸模型探討不同化學(xué)成分對(duì)煙葉品級(jí)影響的差異，發(fā)現(xiàn)總生物堿、總氮、還原糖、總糖、鉀和淀粉對(duì)煙葉等級(jí)有顯著影響，利用多通道高光譜相機(jī)，為煙葉定級(jí)提供了數(shù)據(jù)支撐。

為解決大樣本訓(xùn)練問題、實(shí)現(xiàn)參數(shù)簡易可調(diào)以及滿足實(shí)際收購需求等問題，利用卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)煙葉分級(jí)，本文研究樣本使用連串雜糅煙葉，面向工業(yè)流水線收購，直接采集不規(guī)則合并單層煙葉進(jìn)行煙葉的分部位、分顏色的煙葉定級(jí)策略。

4 總結(jié)

本文基于深度學(xué)習(xí)算法深入研究煙葉定級(jí)的智能化和數(shù)字化，摒棄了效率低且主觀因素強(qiáng)的人工分級(jí)技術(shù)，通過機(jī)器識(shí)別技術(shù)和深度學(xué)習(xí)算法進(jìn)行自動(dòng)化智能分級(jí)，最終達(dá)到提高煙葉分級(jí)工作效率，減少人工損耗，增強(qiáng)定級(jí)精度的效果。目前，煙葉分級(jí)的自動(dòng)化和智能化以及越來越成熟，并且已有少數(shù)煙葉收購站引入自動(dòng)分級(jí)技術(shù)進(jìn)行煙葉收購活動(dòng)。此項(xiàng)技術(shù)落地應(yīng)用之后將顯著性提高我國煙葉分級(jí)效率，節(jié)省人力及雇傭成本，對(duì)煙葉農(nóng)產(chǎn)品分級(jí)的標(biāo)準(zhǔn)化有重要的正向意義。

文章來源：《上海輕工業(yè)》 http://www.12-baidu.cn/w/kj/30978.html

關(guān)鍵字：論文篇論文發(fā)表咨詢社科論文

上一篇：飲食人類學(xué)視角下魯南煎餅研究 ——以滕州煎餅為例
下一篇：揚(yáng)州市主城區(qū)兒童課外閱讀和兒童公共閱讀服務(wù)現(xiàn)狀與需求調(diào)查

欄目分類

熱門排行

推薦信息

期刊知識(shí)