基于深度學習的烤煙分級研究與應用
本研究以標準的烤煙收購為場景,應用可見光譜技術結合深度學習算法構建面向6種烤煙類型的烤煙分級算法,目標為實現(xiàn)完全自動化煙葉定級。通過對機器分級技術的應用和推廣,給煙葉分級整個流程帶來了許多好處。其一,提高煙葉分級的工作效率。其二,減少煙葉收購活動中出現(xiàn)的糾紛數(shù)量和概率。其三,可以促進全社會煙葉分類過程的統(tǒng)一化,規(guī)范煙草收購市場,提升我國煙草行業(yè)的全球競爭力。
1 材料與方法
1.1 數(shù)據(jù)獲取與預處理
1.1.1 煙葉樣本選擇
該項研究面向實際煙農(nóng)與收購站交接的流水線,為提升落地實用的應用價值以及降低標定等級的繁瑣性,最終采用了收購量集中(貢獻率)最高的六個等級進行訓練,分別為:C2F、C3F、C3L、B2F、B3F及X2F,所有收購煙葉通過青雜檢測后,統(tǒng)一進行六分類的判別。采集對象為2021年山東省濰坊市洛莊煙站收購季煙葉,共采集6種合格等級的煙葉樣本1.8TB左右的數(shù)據(jù)集。卷積神經(jīng)網(wǎng)絡模型的訓練應提供足夠多的樣本,并且每種等級相當?shù)臉颖炯?/span>
1.1.2 采集環(huán)境
數(shù)據(jù)采集中使用白板校正技術來降低客觀因素導致的誤差,將WhiteBoard的樣本數(shù)據(jù)值作為基準項,對獲取的高維數(shù)據(jù)進行基準歸一化,由此降低由客觀因素導致誤差率提升的可能性。此外,本文提出的算法目標正是面對實際生產(chǎn)過程的煙葉分級,所以從模型的實用性出發(fā),采集的樣本以實際需求為目標,原始數(shù)據(jù)可表示為。
1.1.3 煙葉樣本數(shù)據(jù)預處理
對于合格樣本,返回的256段波長的高光譜數(shù)據(jù)。通過對高光譜數(shù)據(jù)的采集和處理,最終得到樣本數(shù)據(jù)存儲在RAW文件中,由Hdr文件定義輸入數(shù)據(jù)的特性。且在該文件中具體列舉了256個波段的具體范圍,為385.60~1006.60均分的256段波段(含頭尾)。
1.2 分級算法
本文提出基于卷積神經(jīng)網(wǎng)絡算法的,通過采集的高光譜數(shù)據(jù),分別學習面向煙葉部位、煙葉顏色、煙葉等級的訓練模型,構建高光譜數(shù)據(jù)與煙葉部位、煙葉顏色乃至煙葉等級的非線性映射關系。此處為預處理后得到的輸入高光譜數(shù)據(jù),為面向訓練模型的部位、顏色和等級類別。
3 實驗評估
實驗依托山東省濰坊市下屬煙葉收購站,利用高光譜顯像儀,在收購對算法進行實際驗證。經(jīng)過數(shù)據(jù)預處理的數(shù)據(jù)集總共包括六種級別煙葉(B2F、B3F、C2F、C3F、X2F、C3L),采集的全部煙葉樣本數(shù)據(jù)中80%數(shù)據(jù)進行模型訓練,20%數(shù)據(jù)進行模型測試。
3.1 分級算法性能評估
對比同類型參考文獻,在同樣獲取全光譜信息的前提下,如表1所示,本文提出的模型在損失、準確率上稍顯突出,比對類型主要有四類:一、基于傳統(tǒng)的模糊識別準則;二、基于統(tǒng)計學的數(shù)據(jù)挖掘算法;三、BP神經(jīng)網(wǎng)絡;四、三通道輸入的卷積神經(jīng)網(wǎng)絡。通過以上實驗結果來看,加權準確率居于97.5%附近,煙葉分級要求經(jīng)過對上中下三個部位的煙葉驗證,機器識別與專家識別的一致率大于80%,而本文研究結果遠超于國家基準,具有可觀的探究價值。同時,最重要的一點在于,本文的研究面向實際生產(chǎn)應用,采集的煙葉圖像均為連串雜糅狀態(tài),以投入煙葉收購生產(chǎn)使用為目的,相比于理想實驗環(huán)境下對單煙葉探究的分級算法來說更有落地應用的說服力。在實際煙葉收購過程中,算法模型分級預測平均執(zhí)行時間在7s以內(nèi),滿足高效的煙葉收購需求。
表1 不同煙葉分級方案正確率比較
算法
| 平均正確率 /% |
基于NIR技術和ELM的烤煙煙葉自動分級[7] | 93.51% |
基于機器視覺的煙葉分級[2] | 92.00% |
基于智能識別技術的煙葉分級技術[4] | 95.45% |
基于聚類和加權K近鄰的煙葉分級研究[8] | 93.69% |
基于PCA-GA-SVM的煙葉分級方法[13] | 95.56% |
基于圖像特征的煙葉分級[3] | 91.00% |
基于ANN分類器的煙葉分級[14] | 95.04% |
基于BP算法的煙葉分級[5] | 84.76% |
基于機器視覺與深度學習的煙葉定級研究[15] | 93.05% |
本文模型 | 97.54% |
表1中算法準確率是1000次的平均準確率值,相比其他算法,準確率提升比例依次為4.5%,6%,2.2%,4.1%,2.1%,7.2%,2.6%,15.1%,4.8%,性能提升均超過2%,證明本文提出算法是有效的、可行的?;?/span>1000次的統(tǒng)計結果,利用本文算法和次高算法進行統(tǒng)計學顯著性分析,即t-Tests,p值小于0.005。以上結果驗證了本文提出算法能夠有效地改進算法分類結果的準確率。
為驗證部分類別預測準確率,基于本文算法,對4種煙葉等級(C2F、C3F、X2F、C3L)的進行煙葉顏色、煙葉部位和煙葉最終等級模型訓練,訓練準確率和測試準確率如表2所示:
表2 4種煙葉分級方案正確率比較
算法
| 訓練準確率 /% | 測試準確率 /% |
煙葉部位模型 | 99.78% | 97.11% |
煙葉顏色模型 | 99.82% | 97.94% |
本文模型 | 99.71% | 97.05% |
其中測試樣本數(shù)1732個,訓練樣本數(shù)6928個。煙葉模型在部位、顏色的訓練和測試準確率均都超過97%。因此,利用融合煙葉部位、煙葉顏色和煙葉初始等級的煙葉定級策略在提高煙葉部位、顏色的準確率的同時,提高了煙葉整體定級準確率。
基于提出的融合煙葉顏色和部位的煙葉定級算法,將采用全部6種煙葉等級(B2F、B3F、C2F、C3F、X2F、C3L)的所有數(shù)據(jù)集進行煙葉顏色、煙葉部位和煙葉最終等級模型訓練,訓練準確率和測試準確率如表3所示:
表3 6種煙葉分級方案正確率比較
算法
| 訓練準確率 /% | 測試準確率 /% |
煙葉部位模型 | 98.88% | 98.08% |
煙葉顏色模型 | 99.91% | 98.63% |
本文模型 | 98.77% | 97.54% |
其中測試樣本數(shù)2854個,訓練樣本數(shù)11420個。煙葉模型在部位、顏色的訓練準確率均都超過98%,測試準確率均超過97%。隨著數(shù)據(jù)集和煙葉類別的增加,煙葉部位和煙葉顏色模型訓練準確率在99%左右,且測試準確率也都超過98%,和4種等級的煙葉顏色和部位預測基本持平。隨著數(shù)據(jù)集規(guī)模增加,本文模型相比4種煙葉等級預測準確率有所提升,都超過了97%。因此,在全部數(shù)據(jù)集規(guī)模下,利用融合煙葉部位、煙葉顏色和煙葉初始等級的煙葉定級策略在提高煙葉定級準確率的方案是切實可行的。
3 討論
基于圖像處理方法和卷積神經(jīng)網(wǎng)絡算法,借助煙葉的高光譜數(shù)據(jù)對煙葉進行分級。同時仿效國家標準進行部位、顏色、葉片質(zhì)量三層定級,葉片部位分別為下部(X)、中部(C)、上部(B),顏色分別為桔黃色(F),檸檬黃色(L)等等,質(zhì)量等級依據(jù)多大致維線索分為1到4級。分步分級的重要性非常大,拿部位來說,不同部位的煙葉由于生長條件不同,形狀特征從表面上看是有明顯區(qū)別的??傮w變化規(guī)律為:下部煙葉較寬圓;中部煙葉寬至較寬,葉尖較鈍;上部煙葉較窄,葉尖較銳。但是若和顏色信息進行組合,會得到不同部位不同顏色反饋相同結果,由此,總體分級方案為先分“類型”,后分“組”,最后根據(jù)每個組內(nèi)煙葉質(zhì)量的好壞劃分成幾個不同的“級”,每一級的劃分通過卷積神經(jīng)網(wǎng)絡算法實現(xiàn)。
根據(jù)分級員經(jīng)驗和視覺檢測技術要求,采用多次分級的方式,先處理葉片圖像劃分葉片部位,其次通過相同高光譜圖像劃分顏色屬性,最后根據(jù)輸入的多維數(shù)據(jù)集判別煙葉的質(zhì)量等級,這三者共同構成最終煙葉等級,如B2F,B為上部煙葉,F為桔黃色,2為質(zhì)量等級。該措施最直觀的作用在于分級的條理性,級與級之前無交集。根據(jù)參考文獻中關于煙葉分級的多數(shù)應用實例來看,集所有屬性轉化為多維數(shù)據(jù)進行一次性定級的方案占多數(shù),這種做法導致最大的問題在于級與級之中存在大范圍的交界區(qū)域,更容易因技術錯誤導致等級的誤判,同時若落地于工業(yè)流水線,將大大模糊化同等級情況下不同部位或顏色的煙葉差別,不利于煙農(nóng)與收購站定價。
針對單片煙葉或具有明顯可分割特征的多片煙葉,使用圖像處理技術和卷積神經(jīng)網(wǎng)絡(CNN)的煙草分級算法,能夠達到較高的煙葉定級。Li等研究了基于深度學習方法的41種煙葉圖像分類算法,在樣本數(shù)量較少的情況下,將遷移學習應用于經(jīng)典的VGG16網(wǎng)絡模型,并對VGG16網(wǎng)絡結構進行微調(diào),模型的精度達到91.26%,比原模型高1.25%。Luo等提出了一個簡單的煙草圖像分類框架,融合了表觀特征和低維深度特征,使用改進的AlexNet網(wǎng)絡傳遞較淺的卷積特征,通過主動硬樣本挖掘對網(wǎng)絡進行微調(diào),與單純的表觀特征或深度特征相比,融合表觀特征和深度特征可以提高煙草分級的準確性。賴福長等公開了一種基于人工智能的煙葉等級快速識別裝置,能快速識別煙葉等級。以上研究針對的是單片煙葉的定級策略,無法滿足實際烤煙收購的批量檢測的需求。
同時,考慮到化學成分決定煙葉的品質(zhì),光譜特性能夠很好地反映煙葉化學成分的含量。通過分析B2F、C3F、X2F 3個煙葉等級與其主要化學成分的關系,利用多類logistic回歸模型探討不同化學成分對煙葉品級影響的差異,發(fā)現(xiàn)總生物堿、總氮、還原糖、總糖、鉀和淀粉對煙葉等級有顯著影響,利用多通道高光譜相機,為煙葉定級提供了數(shù)據(jù)支撐。
為解決大樣本訓練問題、實現(xiàn)參數(shù)簡易可調(diào)以及滿足實際收購需求等問題,利用卷積神經(jīng)網(wǎng)絡實現(xiàn)煙葉分級,本文研究樣本使用連串雜糅煙葉,面向工業(yè)流水線收購,直接采集不規(guī)則合并單層煙葉進行煙葉的分部位、分顏色的煙葉定級策略。
4 總 結
本文基于深度學習算法深入研究煙葉定級的智能化和數(shù)字化,摒棄了效率低且主觀因素強的人工分級技術,通過機器識別技術和深度學習算法進行自動化智能分級,最終達到提高煙葉分級工作效率,減少人工損耗,增強定級精度的效果。目前,煙葉分級的自動化和智能化以及越來越成熟,并且已有少數(shù)煙葉收購站引入自動分級技術進行煙葉收購活動。此項技術落地應用之后將顯著性提高我國煙葉分級效率,節(jié)省人力及雇傭成本,對煙葉農(nóng)產(chǎn)品分級的標準化有重要的正向意義。
文章來源: 《上海輕工業(yè)》 http://www.12-baidu.cn/w/kj/30978.html
- 館藏《(增修)施南府志》的修復與保存
- 紙媒介在平面設計創(chuàng)作中的應用與教學方法探討
- 廣電媒資從紙質(zhì)向數(shù)字化轉型中的敘事重構研究
- 空間設計教學中紙藝技術的創(chuàng)意應用與學生創(chuàng)新能力培養(yǎng)
- 人工智能驅動下的紙質(zhì)出版智能化轉型:技術融合與創(chuàng)新路徑
- 非遺傳統(tǒng)手工藝中紙張應用的技術體系與活態(tài)傳承策略
- 紙藝術的跨文化符號:中西方剪紙的英譯對比研究
- 數(shù)智時代非物質(zhì)文化遺產(chǎn)的保護與傳承路徑——以河南剪紙為例
- 基于環(huán)保視角的紙制品企業(yè)廢物管理與再利用策略
- 圖書館紙質(zhì)文獻數(shù)字化存儲平臺的優(yōu)化設計與文件管理方法研究
- 2025年中科院分區(qū)表已公布!Scientific Reports降至三區(qū)
- 官方認定!CSSCI南大核心首批191家“青年學者友好期刊名單”
- 2023JCR影響因子正式公布!
- 國內(nèi)核心期刊分級情況概覽及說明!本篇適用人群:需要發(fā)南核、北核、CSCD、科核、AMI、SCD、RCCSE期刊的學者
- 我用了一個很復雜的圖,幫你們解釋下“23版最新北大核心目錄有效期問題”。
- 重磅!CSSCI來源期刊(2023-2024版)最新期刊目錄看點分析!全網(wǎng)首發(fā)!
- CSSCI官方早就公布了最新南核目錄,有心的人已經(jīng)拿到并且投入使用!附南核目錄新增期刊!
- 北大核心期刊目錄換屆,我們應該熟知的10個知識點。
- 注意,最新期刊論文格式標準已發(fā)布,論文寫作規(guī)則發(fā)生重大變化!文字版GB/T 7713.2—2022 學術論文編寫規(guī)則
- 盤點那些評職稱超管用的資源,1,3和5已經(jīng)“絕種”了