红提糖度和硬度的高光谱成像无损检测 下载: 1012次
1 引言
红提被誉为世界四大水果之首,因果肉质地坚实、香甜可口、富含多种维生素而受到人们的喜爱[1]。糖作为红提果实中最主要的营养物质,决定着果实的风味,是果实成熟度的衡量标准和重要指标。采后红提的果实质地会不断发生变化,内部组织变软,风味变差,特别是在长距离运输过程中,挤压易造成果粒发生损伤,严重影响红提的品质和价格[2]。而且,损伤的果粒更容易腐烂。水果的硬度是判断果蔬成熟度和贮运品质的一个重要指标,决定了水果的耐贮性和成熟度[3],因此检测红提的糖度和硬度具有重要意义。
红提糖度和硬度的常规检测方法是破坏性抽样检测,不仅繁琐费时,而且检测后的样品因组织遭到严重破坏而不能销售和食用,存在诸多弊端,因此迫切需要开发一种无损检测技术。高光谱成像技术被广泛应用于果实糖度和成熟度的无损检测研究中[4-9],目前,国内外研究人员大都是针对哈密瓜[10]、苹果[11]、蓝莓[12]等进行硬度检测。Li等[13]利用高光谱技术测定了不同成熟期樱桃的可溶性固形物含量(SSC)与pH,确定将遗传算法优化多元线性回归模型(GA-MLR)作为最终的建模方法,预测集中可溶性固形物的标准差与均方根误差的比值为2.7,pH的标准差与均方根误差的比值为2.4,证明了利用近红外高光谱成像技术检测樱桃果实品质的可行性。Mo等[14]使用可见/近红外高光谱成像技术建立了苹果内部可溶性固形物含量的偏最小二乘回归(PLSR)模型,结果表明,高光谱成像技术可用于预测苹果内部可溶性固形物的含量。目前,采用高光谱技术研究红提糖度和硬度的综合研究还未见报道。
本文基于高光谱成像系统探讨红提在不同放置模式下的光谱数据对模型的影响规律,分别提取红提果粒在三种放置模式下(横放、果柄侧朝下、果柄侧朝上)的光谱数据,并将三种放置模式下的光谱数据进行平均,得到了整个果粒的平均光谱,然后根据相应光谱数据与化学计量方法得到的数据建立糖度和硬度的预测模型,并进行验证,为红提糖度和硬度的无损检测提供了可靠的检测模型及方法。
2 材料与方法
2.1 材料
实验材料为新鲜红提,在每穗红提的穗外部、穗中部、穗顶部、穗尖分别挑选大小相近、颜色差异较大、完好无损的红提果粒作为实验样本,建模样本总数为213粒。将样本编号后放入恒温恒湿箱中保存12 h[15],温度设置为(22±1) ℃,相对湿度设置为65%。
2.2 仪器与设备
实验仪器包括TMS-PRO型高精度专业食品物性分析仪(质构仪)、恒温恒湿箱(上海新苗医疗器械制造有限公司)、申光WAY(2WAJ)阿贝尔折射仪、Zolix Hyper SIS-VNIR-CL高光谱成像系统。高光谱成像系统主要由高光谱成像光谱仪(芬兰Spectral Imaging Ltd.公司)、CCD相机(日本Hamamatsu公司)、4个50 W的卤素灯、1台丝杆式位移控制平台等主要部件组成。该系统采集的光谱波长范围为391~1043 nm(含有520个波长),分辨率为2.8 nm,整个采集系统置于暗箱内。
2.3 方法
2.3.1 高光谱图像信息的采集
高光谱成像系统预热30 min后进行实验。由于暗电流及CCD相机芯片不稳定的影响,图像会产生一定的噪声,因此在样本采集前需要对高光谱图像进行黑白校正。将标准白板(聚四氟乙烯长方形白板)放在采集平台上,获得白板数据
实验时,在平台上放置自制的带孔载物平板,并分别采集不同样本放置模式下的高光谱图像。设置高光谱成像系统的参数如下:相机曝光时间为0.15 s,平台移动速度为1.7 mm/s,平台移动范围为0~245 mm,样本平台与镜头的距离为420 mm。三种放置模式下的高光谱图像如
图 1. 三种放置模式下红提果粒的高光谱图像。(a)横放;(b)果柄侧朝下;(c)果柄侧朝上
Fig. 1. Hyperspectral images in three placement orientations. (a) Horizontal; (b) fruit stalk-side down; (c) fruit stalk-side up
2.3.2 红提糖度和硬度的测定方法
硬度的测定:采集完样本的高光谱图像后,利用TMS-PRO型质构仪先进行质地剖面TPA(Texture Profile Analysis)试验,采用P100/R探头,测前速率为2.0 mm/s,测试速率为1.0 mm/s,测后速率为2 mm/s,测试时间间隔为1 s,压缩百分比为30%[16]。横向压缩,压缩部位为红提的中部位置。
糖度测定:完成硬度测定后立即参照NY/T 2637—2014《水果、蔬菜制品可溶性固形物含量的测定——折射仪法》进行糖度测定。
2.3.3 感兴趣区域的提取及平均光谱数据的处理
高光谱图像中包含无用的背景图像,因此,对上述三种放置模式下的高光谱图像进行分割,分别将分割后的单粒图像作为感兴趣区域(RIOs)进行提取。在MATLAB R2014a软件上对高光谱图像进行处理,选择图像中整粒红提的图像作为感兴趣区域,提取感兴趣区域的平均光谱作为原始光谱。分析时去除两端噪声较大的波长,本文选取450~1000 nm(含有438个波长)范围的波长进行建模。在进行感兴趣区域的提取时,由
图 2. 高光谱图像中背景与红提区域的反射率
Fig. 2. Reflectivity of background and red globe grape area in hyperspectral images
图 3. 红提果粒的高光谱图像处理。(a) 726.6 nm处高光谱的图像;(b)掩模板图像;(c)掩模后红提区域的图像
Fig. 3. Hyperspectral image processing of red globe grapes. (a) Hyperspectral image at 726.6 nm; (b) mask template image; (c) masked image of red globe grape area
遗传算法(GA)[17]模仿自然界生物的进化机制,使用选择、交叉和变异进行编码,并通过不断的迭代来优胜劣汰,逼近最优解。
连续投影算法(SPA)[18]可以挑选出具有最少冗余信息的变量组,有效解决信息重叠和不共线的问题。
竞争性自适应重加权(CARS)[19]算法是一种基于蒙特卡罗采样法对模型进行变量选择的方法,利用PLS(Partial Least Squares)建模并去掉权重较小的变量,将RMSECV(Root Mean Square Error of Cross)最小的变量集作为最终选定的最优变量子集。
无信息变量消除法(UVE)[20]的原理为在光谱中加入一个随机矩阵,建立偏最小二乘回归交互验证模型,将回归系数均值与标准差的商作为衡量指标,挑选出需要的光谱变量。
2.3.4 模型的建立及评价方法
本文分别建立基于原始光谱和上述3种特征波长提取方法后的特征波长建立红提糖度和硬度的PLSR模型、LS-SVM模型和RF模型。
偏最小二乘回归(PLSR)是一种经典的结合多元线性回归、相关分析和主成分优点的算法,通过最小化偏差平方和对曲线进行线性拟合。
最小二乘支持向量机(LSSVM)通过求解一次线性方程组来代替传统支持向量机中复杂的二次优化问题,在简化模型的同时提高了模型的运算速度。
随机森林(RF)算法是基于统计学习理论建立的,具有较高的预测准确率,建模过程较简单且有效解决了模型的过拟合问题。
模型的准确性和稳定性采用校正集的相关系数(
3 结果与分析
3.1 光谱数据的采集及预处理
从
建模前先对光谱进行预处理,以有效消除仪器噪声、暗电流等因素的影响[22],因此本研究采用标准正态变量变换(SNV)、SavitZky-Golay卷积平滑处理法(S_G)、多元散射校正(MSC)、移动窗口平滑(MA)、中心化(MC)等方法进行预处理。
表 1. 采用不同预处理方法得到的全波长PLSR预测模型
Table 1. Full-band PLSR prediction model using different preprocessing methods
|
3.2 样本集的划分
光谱理化值共生距离(SPXY)法[23]的优点是能够有效地覆盖多维向量空间,且同时考虑样本的光谱数据与所测指标,使划分的样本集更合理,已被广泛应用于光谱定量模型的建立。本文共采集了213份红提样本。
从
表 2. 利用SPXY算法划分样本集的数据统计
Table 2. Datastatistics of partitioning sample sets by SPXY algorithm
|
3.3 放置模式对PLSR模型的影响
根据横放、果柄侧朝下、果柄侧朝上、整个果粒平均得到的高光谱数据建立偏最小二乘回归模型[24],以确定最优的光谱采集方式。
由
表 3. 不同放置位置下得到的全波长PLSR预测模型
Table 3. Full-band PLSR prediction model with different placementorientations
|
3.4 特征波长的提取
根据上文分析的结论,采用整个果粒的平均光谱作为原始光谱进行研究。因原始光谱得到的相关系数较低,均方根误差较大,模型精度和稳定性较低,故研究在不同特征波长提取方法下建立的不同的PLSR模型,以得到最好的红提糖度和硬度模型[25]。下文以糖度为例进行特征波长的提取。
3.4.1 GA提取特征波长
以采用GA提取特征波长为例,在GA运算过程中,设定初始群体为30,交叉率为50%,变异率为1%,迭代次数为100,以最小的RMSECV值为标准,筛选出在迭代过程中出现频次较多的波长点为最优波长点;经过20次随机搜索后,最终选定特征波长点为26个,如
3.4.2 SPA提取特征波长
以采用SPA提取特征波长为例,设定波长选择变量数范围为5~30,步长为1,根据均方根误差(RMSE)的变化确定选择特征变量的个数。如
图 5. 红提糖度的GA特征波长选取图。(a)GA筛选图;(b)RMSECV变化图
Fig. 5. GA characteristic wavelength extraction of sugar content of red globe grape. (a) GA-screened image; (b) change of RMSECV
图 6. 红提糖度的SPA特征波长选取图。(a)RMSE变化图;(b)SPA选取的变量
Fig. 6. SPA characteristic wavelength extraction of sugar content of red globe grape. (a) Change of RMSE; (b) selected variables of SPA
3.4.3 CARS提取特征波长
以采用CARS提取特征波长为例,本研究设定蒙特卡罗采样为50次,采用5折交叉验证法。由
图 7. 红提糖度的CARS特征波长选取图。(a)采样变量数;(b) RMSECV;(c)回归系数路径
Fig. 7. CARS characteristic wavelength extraction of sugar content of red globe grape. (a) Number of sampled variables; (b) RMSECV; (c) paths of regression coefficients
3.4.4 UVE提取特征波长
以采用UVE提取特征波长为例,采用UVE提取光谱数据中的有效信息,设定噪声矩阵处最大稳定性绝对值的99%作为剔除阈值,图中左侧曲线代表光谱变量的稳定性值,右侧曲线代表噪声变量的稳定性值,两水平虚线为变量的选择阈值(±28.74),虚线内部为无用信息,外部为有用信息,选取结果如
图 8. 红提糖度的UVE特征波长选取图
Fig. 8. UVE characteristic wavelength extraction of sugar content of red globe grape
3.5 模型的建立及结果
3.5.1 模型建立
将各算法提取的特征波长作为模型的输入量,以通过实验方法获得的红提糖度和硬度作为模型的结果,建立PLSR、LSSVM和RF模型,模型的结果如
由
表 4. 基于红提特征波长建立的糖度和硬度预测模型的结果
Table 4. Results of prediction model for sugar content and firmness based on characteristic wavelengths of red globe grape
|
表 5. 糖度和硬度最优模型的特征波点列表
Table 5. Characteristic wave points of optimal model for sugar content and firmness
|
3.5.2 最优模型的比较
分别利用最优特征波长组合建立红提糖度和硬度的RF模型,校正集和预测集样本的预测值和化学测量值之间的散点图如
图 9. 基于GA-RF的红提糖度的最优模型
Fig. 9. Optimal model for sugar content of red globe grape based on GA-RF
图 10. 基于MA-SPA-RF的红提硬度的最优模型
Fig. 10. Optimal model for firmness of red globe grape based on MA-SPA-RF
由
4 结论
利用果柄侧朝下建立的糖度模型比果粒侧朝上、横放建立的糖度模型的效果更好,利用果柄侧朝上建立的硬度模型效果比果粒侧朝上、横放建立的硬度模型的效果更好,利用整个果粒的平均光谱建立的糖度、硬度模型效果最好。采用GA、SPA、CARS和UVE算法对原始光谱提取特征波长,波点数量明显减少,波点提取后所建模型的相关系数与基于原始光谱所建模型相比明显增大,均方根误差明显减小,4种特征波长提取方法都有效地提高了预测模型的准确性和可靠性;基于RF建立的糖度、硬度模型的效果较优;预测糖度的最优模型为GA-RF,其
[1] 许锋, 付丹丹, 王巧华, 等. 基于MCCV-CARS-RF建立红提糖度和酸度的可见-近红外光谱无损检测方法[J]. 食品科学, 2018, 39(8): 149-154.
[2] 田海龙, 张平, 农绍庄, 等. 基于TPA测试法对1-MCP处理后葡萄果实质构性能的分析[J]. 食品与机械, 2011, 27(3): 104-107.
[3] 邓云, 吴颖, 李云飞. 温度和相对湿度对采后葡萄浆果硬度的影响[J]. 食品科学, 2007, 28(3): 46-49.
[4] 董金磊, 郭文川. 采后猕猴桃可溶性固形物含量的高光谱无损检测[J]. 食品科学, 2015, 36(16): 101-106.
[5] 管晓梅, 杜军, 张立人, 等. 基于高光谱技术的果糖检测优化算法和可视化方法[J]. 光电子·激光, 2018, 29(2): 173-180.
[6] 王转卫, 迟茜, 郭文川, 等. 基于近红外光谱技术的发育后期苹果内部品质检测[J]. 农业机械学报, 2018, 49(5): 348-354.
[9] 刘燕德, 陈兴苗, 欧阳爱国. 可见/近红外光谱法无损检测赣南脐橙可溶性固形物[J]. 光学学报, 2008, 28(3): 478-481.
[10] 孙静涛, 马本学, 董娟, 等. 高光谱技术结合特征波长筛选和支持向量机的哈密瓜成熟度判别研究[J]. 光谱学与光谱分析, 2017, 37(7): 2184-2191.
[11] 冯迪, 纪建伟, 张莉, 等. 基于高光谱成像提取苹果糖度与硬度最佳波长[J]. 发光学报, 2017, 38(6): 799-806.
[12] 李瑞, 傅隆生. 基于高光谱图像的蓝莓糖度和硬度无损测量[J]. 农业工程学报, 2017, 33(z1): 362-366.
[15] 樊书祥, 黄文倩, 郭志明, 等. 苹果产地差异对可溶性固形物近红外光谱检测模型影响的研究[J]. 分析化学, 2015, 43(2): 239-244.
[16] 朱丹实, 张巧曼, 曹雪慧, 等. 湿度条件对巨峰葡萄贮藏过程中水分及质构变化的影响[J]. 食品科学, 2014, 35(22): 340-345.
[17] 蒋雪松, 周宏平. 基于遗传算法的农产品品质无损检测研究进展[J]. 江苏农业科学, 2013, 41(12): 17-19, 20.
[19] 李江波, 彭彦昆, 陈立平, 等. 近红外高光谱图像结合CARS算法对鸭梨SSC含量定量测定[J]. 光谱学与光谱分析, 2014, 34(5): 1264-1269.
[20] 刘燕德, 肖怀春, 孙旭东, 等. 柑桔叶片黄龙病光谱特征选择及检测模型[J]. 农业工程学报, 2018, 34(3): 180-187.
[21] 刘燕德, 叶灵玉, 孙旭东, 等. 基于光谱指数的蜜橘成熟度评价模型研究[J]. 中国光学, 2018, 11(1): 83-91.
[22] 姜雪芹, 叶勤, 林怡, 等. 基于谐波分析和高光谱遥感的土壤含水量反演研究[J]. 光学学报, 2017, 37(10): 1028001.
[23] 毛博慧, 孙红, 刘豪杰, 等. 基于正交变换与SPXY样本划分的冬小麦叶绿素诊断[J]. 农业机械学报, 2017, 48(S1): 160-165.
[24] 彭滟, 施辰君, 朱亦鸣, 等. 太赫兹光谱技术在生物医学检测中的定性与定量分析算法[J]. 中国激光, 2019, 46(6): 0614002.
[25] 马世欣, 刘春桐, 李洪才, 等. 基于线性嵌入和张量流形的高光谱特征提取[J]. 光学学报, 2019, 39(4): 0412001.
Article Outline
高升, 王巧华, 付丹丹, 李庆旭. 红提糖度和硬度的高光谱成像无损检测[J]. 光学学报, 2019, 39(10): 1030004. Sheng Gao, Qiaohua Wang, Dandan Fu, Qingxu Li. Nondestructive Detection of Sugar Content and Firmness of Red Globe Grape by Hyperspectral Imaging[J]. Acta Optica Sinica, 2019, 39(10): 1030004.