1 南京农业大学人工智能学院江苏省现代设施农业技术与装备工程实验室, 江苏 南京 210031
2 青海大学水利电力学院, 青海 西宁 810016
3 同济大学生命科学与技术学院, 上海 200092
黑枸杞具有较高的营养和医学价值, 不同等级的黑枸杞质量不同, 价格也具有显著差异, 但由于缺乏有效的检测分级手段, 造成黑枸杞市场鱼龙混杂、 以次充好, 影响黑枸杞市场质量监管。 为实现黑枸杞快速、 无损、 高精度分级检测, 提出基于高光谱和集成学习的黑枸杞快速无损分级方法。 首先, 选取诺木洪1级(NMH-grade1)、 诺木洪2级(NMH-grade2)、 诺木洪3级(NMH-grade3)、 诺木洪4级(NMH-grade4)黑枸杞各200颗, 在两种放置模式下(果柄朝上、 去柄后整体横放), 通过GaiaSorter-Dual宽波段高光谱分选仪得到光谱范围为391.6~2 528.1 nm的光谱图像立方体。 掩模处理后结合细胞计数算法实现单颗黑枸杞ROI高光谱信息的自动提取。 考虑噪声的影响, 截取500~2 400 nm范围内的黑枸杞光谱信息。 经过FD(first derivative), FFT(fast Fourier transform)、 HT(hilbert transform), SG(savitzky golay), Normalize, SNV(standard normal variate)预处理后, 再通过PCA(principal components analysis), SPA(successie projection algorithm), CARS(competitive adaptive reweighted sampling)提取特征波长的光谱信息。 然后分别建立LIBSVM, LDA(latent dirichlet allocation), KNN(k-nearest neighbor), RF(random forest), NB(naive Bayes)检测模型, 其中, 果肉-Normalize-SPA-LDA、 果肉-FD-CARS-RF和果肉-SNV-CARS-LIBSVM组合方式最优, 准确率分别为0.941 7, 0.941 7和0.937 5。 在预处理方法中, FD, HT, Normalize和SNV效果较好; 在降维方法中, SPA和CARS的模型效果较好; 在LIBSVM, LDA, KNN, RF和NB所建立的模型中, 测试集精度不低于0.9的个数分别为2, 7, 0, 4和1, 因此LDA, RF和LIBSVM三个分类器效果最好。 为进一步提高黑枸杞的分级精度, 以LDA, RF, LIBSVM三个最优分类器为元模型, 通过Stacking集成学习建立黑枸杞快速无损分级模型, 使用果肉-FD-SPA-Stacking组合, 精度可从0.941 7提升到0.983 3, 此时共提取17个特征波长, 分别为: 591.6, 609.1, 721.6, 989.1, 1 083.3, 1 111.3, 1 296.1, 1 564.9, 1 844.9, 1 934.5, 1 996.1, 2 046.5, 2 130.5, 2 292.9, 2 315.3, 2 320.9和2 348.9 nm, 其中721.6, 1 083.3, 1 111.3, 2 130.5, 2 292.9, 2 315.3, 2 320.9和2 348.9 nm附近有C—H的倍频峰和吸收峰, 721.6, 989.1, 1 934.5, 1 996.1和2 292.9 nm附近有O—H的倍频峰和吸收峰, 2 130.5和2 292.9 nm附近有C—O的吸收峰。 研究结果表明基于高光谱结合集成学习进行黑枸杞快速无损分级是可行的。
光谱学 黑枸杞 集成学习 花青素 无损检测 Spectroscopy Black goji berry Ensemble learning Anthocyanin Non-destructive testing