1 北京化工大学信息科学与技术学院, 北京 100029
2 北京化工大学材料科学与工程学院, 北京 100029
食用油是日常生活中的必需品。 市场上食用油在成分、营养价值及价格上有很大的不同。 为避免欺诈行为, 亟需建立一套有效的市场销售的食用油品质分类方法。 常规的食用油检测方法速度慢而且需要复杂的实验室预处理过程。 分子光谱从分子水平上反映了物质的组成与结构信息, 分子光谱分析速度快而且是无损监测, 因此分子光谱分析结合化学计量学的方法正成为食用油分类方法的趋势。 SIMCA(Soft Independent Modeling of Class Analogy)是应用广泛的分子光谱分析方法, 然而在SIMCA中使用欧氏距离于对基于PCA和F检验提取的特征进行分类, 难以区分不规则的特征空间。 由于食用油样本分子光谱差别细微, 通常难以用SIMCA方法进行分类。 SVDD(Support Vector Domain Description)算法是一类基于支持域的非线性单类分类方法, SVDD利用求解凸二次规划得出一个尽可能包含所有目标样本的最小超球体进行分类。 本文提出了一种基于SIMCA-SVDD方法的分子光谱分析方法并用于食用油的快速分类。 为鉴别不同种类的食用油, 在ATR-FTIR光谱仪上扫描四种食用油的红外光谱。 应用SIMCA方法提取分类特T2和Q, 由于提取的特征T2和Q分布的不规则性, 不同于SIMCA中的欧氏距离, 本文采用SVDD用于对提取的不规则特征进行分类。 由于SVDD能通过映射函数将分类特征映射到高维空间, 因此可以通过求解凸二次规划来训练最优的分类超球面对分类特征进行分类。 采用本文所提的SIMCA-SVDD方法及传统的SIMCA方法, 对同样的样本进行了对比实验。 对比实验证实了本文所提的SIMCA-SVDD方法具有比传统的SIMCA方法更好的分类结果, 所提的方法为实现基于分子光谱进行食用油快速分类提供了一条新的途径。
食用油 分子光谱 欧氏距离 Edible oil Molecular spectrum SIMCA SIMCA Euclidean distance SVDD SVDD 光谱学与光谱分析
2020, 40(8): 2651
1 北京化工大学信息科学与技术学院, 北京 100029
2 北京化工大学材料科学与技术学院, 北京 100029
纯棉与丝光棉制品是日常生活中常用的两种纤维制品, 但是由于二者在物理结构和化学结构上非常相似, 以至于使用一些简单的方法难以准确识别一部分纯棉与丝光棉制品。 提出一种使用水含量作为扰动的二维相关光谱结合机器学习方法来对二者进行鉴别的新方法。 共使用从专业机构获得的200个标准样本来设计实验对新方法进行验证, 其中包括100个纯棉样本与100个丝光棉样本。 对每一个样本, 使用水含量作为扰动, 分4次改变样本水含量并采集该水含量下样本的一维光谱, 其中4次的水含量分别为20.20%, 14.52%, 7.77%与0%。 根据四条不同的一维构造每一个样本的动态光谱, 再通过二维相关算法来计算其同步二维相关光谱, 从该同步二维相关光谱中使用移动窗口技术提取三组不同的分类特征, 每组特征分别对应一个设计好的支持向量机(SVM)分类器。 之后本文提出一种基于信息熵的多分类器融合方法, 根据权值不同, 将三个分类器融合为一个具有更优效果的强分类器。 为了验证方法的准确性与有效性, 设计了严谨的实验对方法进行验证。 实验首先按照传统的从一维光谱中提取特征的方法对纯棉与丝光棉样本进行鉴别, 使用两种样本各50个来进行分类模型建立, 剩余的进行模型验证, 分类效果最高只有76%。 但是基于从二维相关光谱中提取的三组特征设计的三个支持向量机(SVM)分类器的准确率分别可以达到88%, 90%, 88%, 最后根据提出的基于信息熵的多分类器信息融合方法将三个分类器进行融合同一可以得到92%的分类准确率, 比三个基础分类器准确率都有提升。 与从一维光谱中提取特征并设计分类器进行分别鉴别相比, 从二维相关光谱中提取特征设计多个分类器并使用基于信息熵的多分类器信息融合方法进行分类鉴别具有更高的分类准确率。 二维相关光谱将光谱信息扩展到更高的维度, 将一维光谱中隐藏的折叠峰进行展开, 因此具有更高的分类准确率。 提出的方法是一种快速准确鉴别纯棉与丝光棉制品的新方法。
二维相关光谱 纯棉与丝光棉 支持向量机 信息熵 信息融合 Two-dimension correlation spectroscopy Cotton and mercerized cotton Support vector machine Information entropy Information fusion 光谱学与光谱分析
2019, 39(5): 1653
1 北京化工大学信息科学与技术学院, 北京 100029
2 北京化工大学材料科学与技术学院, 北京 100029
分子光谱分析技术结合化学计量学已成为一种非常活跃的食用油鉴别方法。 然而, 当不同类型的样本之间的光谱差异极其微小时, 利用传统的分类技术也很难将其分开。 为了完成相似品种食用油的快速识别和分类, 收集了包括芝麻油、 玉米油、 油菜籽油、 调和油、 葵花油、 花生油、 橄榄油七种食用油的衰减全反射红外光谱, 在此基础上, 采用图像识别的方法对七种食用油进行快速分类。 在所提出的图像识别方法中, 首先, 将通过多元散射校正预处理后的红外光谱吸光度矩阵进行自相关运算, 利用等高线原理根据吸光度强度值的不同生成光谱图像, 以扩大的光谱差异并提高光谱可视化。 然后, 根据图像膨胀的原理找到光谱图像的局部特征点, 将其作为图像特征。 最后, 使用BP神经网络对特征点进行训练和分类预测。 为了对比所提出的方法, PCA-BP和KL-BP的方法被用于与图像识别的方法进行比较, 实验结果表明, 图像识别方法的正确识别率为94.4%, 高于PCA-BP的66.7%和KL-BP的83.3%。 所提方法为实现食用油的快速识别和检测提供了一条新的有效途径。
食用油 分子光谱 光谱可视化 特征提取 图像识别 Edible oil Molecular spectrum Spectral visualization Feature extraction Image recognition
1 北京化工大学信息科学与技术学院, 北京 100029
2 北京化工大学材料科学与工程学院, 北京 100029
无论是近红外还是红外光谱, 多元校正模型的传递问题都尚未解决。 为了实现模型和光谱的传递, 提出了一种改进的PDS算法——SA-PDS算法, 论方法通过PDS算法进行模型传递, 使用光谱间的夹角大小作为判定准则来选择传递参数, 使得模型传递过程不受到样品性质参考值的影响, 也不再依赖于模型, 并且可以双向传递。 该方法分别通过在近红外数据和中红外数据中应用来证明模型传递的可行性, 实验收集烟叶样本测得其近红外光谱, 沥青样本测得其中红外光谱, 将烟叶总糖会计师和沥青蜡含量作为模型预测对象。 使用光谱夹角作为PDS参数选择标准与使用预测标准偏差作为判定准则相比, 实验表明: 对于近红外光谱的从机向主机的传递, 其验证集预测精密度RMSEP从5.257 4降低至1.337 1, 优于RMSEP(1.350 3)方法, 预测偏差也同样被改善。 对于中红外光谱从机向主机的传递, 新方法验证集预测精密度RMSEP从0.525 1降低至0.186 9, 优于RMSEP(0.219)方法。 主机向从机的传递也取得了满意的传递结果。
近红外光谱 中红外光谱 光谱传递 分段直接校正法 光谱夹角 NIR spectroscopy MIR spectroscopy Spectra transfer Piecewise direct standardization Spectral angle
1 北京化工大学信息科学与技术学院, 北京 100029
2 北京化工大学材料科学与工程学院, 北京 100029
3 碳纤维及功能高分子教育部重点实验室, 北京 100029
4 北京市毛麻丝织品质量监督检验站, 北京 100085
5 内蒙古自治区纤维检验局, 内蒙古 呼和浩特 010000
SIMCA采用PCA模型参数和F检验构造计算T2i/T2ucl和Si/Q统计量作为样本分类的新属性, 并计算待测样本到各类主成分空间的欧式距离作为判别类别的依据, 是一种最常用和优秀的光谱分类方法。 但是, 在Q对T2作图平面上, 以欧式距离确定的样本分布范围是一个圆, 多数情况下并不一定能符合实际样本分布规律。 本文在分析了SIMCA理论缺陷的基础上, 提出了一种新方法, 即用马氏距离代替欧氏距离作为判别依据来判断样本的类别。 并设计了采用红外光谱判别组分比例很接近的掺假食用油样本的实验, 以及用近红外光谱判别相近皮毛样本的实验。 用调和比5%~8%的食用油红外光谱PCA模型, 分别以马氏距离和欧式距离计算出其样本的分布范围, 结果表明马氏距离的分类与识别能力更强。 新方法和SIMCA对动物皮毛样本的正确识别率分别为87.5%和75%, 对比例相近的食用油调和油的正确识别率分别为65%和55%。 结果表明新方法对化学组成差异微小的样品分类精度明显优于SIMCA。
SIMCA方法 马氏距离 欧氏距离 光谱分析 SIMCA method Mahalanobis distance Euclidean distance Spectral analysis 光谱学与光谱分析
2017, 37(8): 2493
1 北京化工大学信息科学与技术学院, 北京 100029
2 北京化工大学材料科学与工程学院, 北京 100029
针对不同型号的近红外光谱仪器(主机: SupNIR-2700, 从机: Nicolet Antaris Ⅱ)间的模型传递和同一仪器(Nicolet Antaris Ⅱ)不同分辨率的光谱间的模型传递进行研究, 提出了一种改进的PDS算法-SP-SG1st-PDS算法, 该方法结合三次样条插值、 Savitaky-Golay一阶求导和PDS算法。 思路是通过三次样条插值拟在不破坏原始光谱固有的信息的前提下实现了主光谱与从光谱之间的匹配, 然后对光谱进行S-G一阶求导去除光谱的基线漂移, 再通过PDS算法进行模型传递, 有效消除主、 从光谱之间的差异, 提高多元校正模型的预测精度。 该方法用于醋酸乙烯酯在乙烯-乙酸乙烯酯共聚物中含量的研究, 并且与小波去噪方法和S-G平滑方法作比较。 实验表明: 对于不同型号的仪器间的模型传递, 新方法采用S-G一阶求导较其他方法有明显的优势, 其验证集预测精密度RMSEP从20.595 0降低至0.374 8, 明显优于S-G平滑(0.522 1)和小波去噪(0.516 7)方法, 预测偏差也同样地被改善。 对于同一仪器不同分辨率的光谱之间的模型传递, 在模型传递前后其模型预测精密度RMSEP从0.272 2减少至0.255 3。 通过提出的SP-SG1st-PDS算法, 模型传递能应用于不同类型仪器之间, 也能用于相同仪器不同分辨率的光谱之间, 并且取得了满意的传递结果。
近红外光谱 模型传递 分段直接标准化 Savitaky-Golay一阶求导 三次样条插值 NIR spectroscopy Calibration model transfer Piece-wise direct standardization Savitaky-Golay smoothing with first order derivati Cubic spline interpolation 光谱学与光谱分析
2017, 37(5): 1587
1 北京化工大学材料科学与工程学院, 北京 100029
2 石油化工科学研究院, 北京 100083
二甲醚(DME)掺入液化石油气(LPG)中能加速储气罐橡胶密封圈的老化, 存在严重安全隐患, 直接危害消费者安全和利益, 国家明令规定禁止向LPG中掺入二甲醚等化学品作为液化气商品出售, 因此实现LPG中DME含量的快速分析极其重要。 提出一种快速测定LPG中DME含量的新方法, 解决了液化气成分快速测量技术难题。 实验设计和制造了一套精确配制DME液化气溶液的装置和一套基于近红外光谱技术快速测定LPG的分析系统。 该分析系统耐压3.5 MPa, 可方便与高压钢瓶连接, 实现了液化气直接快速测量。 收集了市场上LPG-1(胺前液化气), LPG-2(焦化液化气), LPG-3(脱硫醇后液化气)LPG-4(沧炼催化液化气)共四种液化石油气, 采集其近红外光谱作为背景子空间, 采用称重法配制DME浓度范围1.0%~45.0%。 采用斜投影算法从LPG溶液近红外光谱中提取出不同浓度LPG溶液中DME纯信号, 使用DME纯信号强度I与浓度c建立标准曲线, 其线性相关系数为0.999 4。 外部验证结果表明, 方法相对误差小于2.0%。 该方法具有操作简单, 快速、 无需建模等优点。
二甲醚 液化石油气 斜投影算法 Near-infrared spectroscopy NIR Dimethyl ether Liquefied petroleum gas Oblique projection
1 北京化工大学材料科学与工程学院, 北京 100029
2 中石油燃料油有限责任公司研究院, 山东 青岛 266500
沥青质量的优劣直接影响路用性能和公路寿命。 其中蜡含量、 软化点和针入度是沥青三大重要指标, 其分析过程繁冗耗时。 提出了一种快速准确的沥青性质检测方法。 实验共收集了220个已依照标准方法JTJ052-2000获得蜡含量、 软化点和针入度标准值的沥青样品, 采用偏最小二乘法(PLS)建立其红外光谱定量模型, 交互验证标准偏差(SECV)分别为0.13, 0.88, 3.18, 预测标准偏差(SEP)分别为0.14, 1.06, 3.90, 小于标准方法的再现性偏差, 任意选取不同厂家所生产的3个样品进行重复性测试, 均满足标准方法的精密度要求。 该方法具有重复性好、 分析速度快, 操作简单, 可显著提高沥青的分析效率, 在沥青质量检测与评价领域有着光明的应用前景。
衰减全反射红外光谱 沥青 Attenuated total reflection infrared spectroscopy Bitumen PLS PLS
1 广西科技大学广西糖资源绿色加工重点实验室, 广西 柳州 545006
2 广西科技大学生物与化学工程学院, 广西 柳州 545006
3 北京化工大学材料科学与工程学院, 北京 100029
拉曼光谱强度与物质量存在的线性关系会受到许多复杂因素破坏, 包括激发光源、 聚焦、 散射、 折射等, 导致定量效果不佳。 各种因素的干扰效应, 总体上分成加性和乘性效应, 而消除乘性效应的难度会更大一些。 光谱序列信号可视为向量, 信号强度对应向量的模量, 而体现向量本质的方向属性不会受模量变化的影响。 根据这一原理, 利用向量的方向确定性, 将信号的强度度量转换成空间角度度量, 建立了一种消除乘性效应的方法。 首先, 选择一个与待定量组分相近而与背景空间近似正交的基准向量, 并定义移动窗口; 然后, 计算移动窗口内的光谱向量与基准向量的夹角, 所得值存储为矩阵, 完成角度描述转换。 角度矩阵消除了乘性效应的干扰, 而定量关系仍然近似线性, 只要将该矩阵的秩满足多元统计建模要求, 就可以用于多元校正, 并得到良好结果。 研究采用甲醇-乙醇-异丙醇混合体系, 验证了消除乘性效应后改进的定量效果, 对于积分时间波动的预测值与实际值, 直接PLS方法的相关系数r为0.911 9, 预测标准偏差(RMSEP)为0.110 2; 采用MSC预处理的r为0.906 0, RMSEP为0.100 8; 而本文提出的VAPLS的r为0.998 7, RMSEP为0.015 2。 结果表明向量角转换度量处理后, 光谱的乘性干扰得到了有效校正, 拉曼定量分析准确性得到了提高。
拉曼光谱 乘性效应 散射校正 向量角转换 Raman spectrum Multiplicative effects Scatter correction Vector angle transformation
1 北京化工大学有机无机复合材料国家重点实验室, 碳纤维与功能高分子教育部重点实验室, 北京 100029
2 北京东方石油化工有限公司有机化工厂, 北京 100022
采用漫反射近红外光谱方法测定聚乙烯醇(简称PVA)的醇解度与挥发分含量。 从PVA生产线选取120个样品, 分别用容量法与恒重法测量样品的醇解度与挥发分含量。 用光栅扫描近红外光谱仪采集样品光谱, 光谱范围1 000~1 800 nm。 样品光谱用卷积平滑、 卷积求导、 均值中心化与正交信号校正方法进行预处理后, 与样品的醇解度与挥发分含量, 采用PLS1定量校正方法建立近红外分析模型。 醇解度与挥发分含量模型的校正相关系数RC分别为0.976和0.981, 校正标准偏差SEC分别为0.176和0.197, 验证相关系数RP分别为0.967和0.969, 验证标准偏差SEP分别为0.202和0.193。 方法具有速度快, 操作方便的特点, 分析结果满足PVA生产过程醇解度与挥发分含量的检测要求。
近红外 醇解度 挥发分含量 NIR PVA PVA Alcoholysis degree Volatile matter