光子学报
2020, 49(10): 1015002
浙江大学控制科学与工程学院, 工业控制技术国家重点实验室, 浙江 杭州 310027
快速、 有效地识别饮用水中污染物类别对于降低突发饮用水污染事件影响十分重要。 目前基于紫外-可见光光谱法的饮用水污染物判别模型大多使用主成分分析(PCA)进行特征提取, 然而, 对于光谱相似度较高的有机污染物, 仅从数据驱动的角度提取其方差最大的方向作为特征进行识别效果往往不佳。 针对有机污染物光谱数据多重共线性以及谱峰重叠干扰的问题, 开展了基于连续投影算法(SPA)和多分类支持向量机(M-SVM)的紫外-可见光光谱饮用水有机污染物判别方法研究。 首先, 使用紫外光谱仪测量苯酚、 对苯二酚、 间苯二酚和间苯二胺的原始光谱数据并进行预处理, 在对四种污染物进行了波长与浓度的相关关系对比分析后, 发现苯酚和间苯二酚、 对苯二酚和间苯二胺的谱峰重叠较为严重; 特征提取时, 引入SPA筛选有机污染物紫外-可见光光谱数据的特征波长组合, 并对不同波长个数时的光谱吸光度进行多元线性回归分析, 选取对应最小预测标准偏差的参数及波段组合作为最优参数组合; 基于最优特征波长组合, 构建基于多分类SVM的饮用水有机污染物分类识别模型; 最后, 对比分析了全光谱、 PCA及SPA特征提取后的光谱数据在不同分类方法及不同污染物浓度下的分类效果, 进一步说明了SPA的适用性和稳定性。 实验结果表明, SPA作为一种提取光谱数据原始特征波段的方法, 可以有效的对有机污染物的紫外-可见光光谱进行特征提取, 提升不同物质之间的差异, 在一定程度上消除多重共线性和谱峰重叠干扰, 从而提高分类模型的准确率。 该方法对于解决饮用水中谱峰重叠的污染物类型判别问题具有参考价值。
紫外-可见光光谱 有机污染物判别 连续投影算法 多分类支持向量机 UV-Vis spectroscopy Identification of organic contaminants Successive projections algorithm Multi-classification support vector machine 光谱学与光谱分析
2020, 40(7): 2267
1 北京邮电大学自动化学院, 北京 100876
2 桂林电子科技大学计算机与信息安全学院, 广西 桂林 541004
3 中国食品药品检定研究院, 北京 100050
近红外光谱(NIR)分析具有分析高效、 样品无损、 环境无污染以及可现场检测等优点, 特别适合药品的快速建模分析。 但NIR存在吸收强度弱以及谱带重叠等缺点, 需要建立稳健可靠的化学计量学模型对其进行分析。 深度卷积神经网络是深度学习方法中一个重要分支, 它通过逐层抽取数据特征并进行组合、 转换, 形成更高层的语义特征, 具有极强的建模能力, 广泛应用于计算机视觉、 语音识别等领域, 而在药品NIR分析方面尚未见报道。 基于深度卷积网络模型, 对药品NIR多分类建模进行研究。针对药品NIR数据的特点,设计若干个面向多品种、多厂商药品NIR分类的一维深度卷积网络模型。模型中卷积层和池化层交叠排列用于逐层抽取NIR数据特征,输出层连接softmax分类器,对药品NIR数据进行分类概率预测。在输出层之前采用全局最大池化层, 将特征图进行整体池化, 形成一个特征点, 用于解决全连接层存在的限制输入维度大小, 参数过多的问题。 同时, 在网络模型中引入批处理操作和dropout机制, 以防止梯度消失和减小网络过拟合的风险。 在网络模型的设计过程中, 通过设计不同的卷积网络层数以及不同的卷积核尺寸大小, 分析其对建模效果的影响, 同时分析五种经典数据预处理方法对NIR分析的影响。 以我国7个厂商生产的头孢克肟片和11个厂商生产的苯妥英钠片样本NIR为实验对象, 建立药品的多品种、 多厂商分类模型, 该模型在二分类、 多分类实验中取得了良好的分类效果。 在十八分类实验中, 当训练集与测试集比例为7∶3时, 分类准确率为99.37±0.45, 比SVM, BP, AE和ELM算法取得更优的分类性能。 同时, 深度卷积神经网络模型推理速度较快, 优于SVM和ELM算法, 但训练速度慢于二者。 大量实验结果表明, 深度卷积神经网络可对多品种、 多厂商药品NIR数据准确、 可靠地判别分类, 且模型具有良好的鲁棒性和可扩展性。 该方法也可推广到烟草、 石化等其他领域的NIR数据分类应用中。
深度卷积神经网络 近红外光谱 药品鉴别 多分类 Deep convolution neural network Near infrared spectroscopy Pharmaceutical discrimination Multi-classification 光谱学与光谱分析
2019, 39(11): 3606