南京航空航天大学 电子信息工程学院,江苏 南京 211106
针对现有多阵列非圆(NC)信号直接定位方法(DPD)谱峰搜索计算复杂度高,对基站的位置比较敏感,没有考虑信号在空间中传播时的损耗差异,导致估计性能不稳定的问题,提出一种联合降维传播算子与泰勒补偿(JRT-PM)的非圆信号直接定位算法。首先根据非圆信号的椭圆协方差信息扩展阵列孔径,通过降维方法消除非圆相位搜索维度进行粗估计降低计算复杂度,然后联合所有基站的信息进行泰勒补偿提升算法估计性能。仿真实验表明,相比于传统到达角K 均值聚类(AOA-clustering)两步定位算法、最小均方无畸变响应(MVDR)直接定位算法、子空间数据融合(SDF)直接定位算法,所提算法在提升定位精确度的同时可以估计更多目标;与非圆传播算子(NC-PM)直接定位相比,所提算法在保证估计性能的同时显著降低了计算复杂度。
非圆信号 传播算子 降维 泰勒补偿 直接定位 Non-Circular signal propagator method dimension reduction Taylor Compensation Direct Position Determination 太赫兹科学与电子信息学报
2023, 21(6): 725
1 青岛科技大学信息科学技术学院, 山东 青岛 266061
2 江西中烟工业有限责任公司信息中心, 江西 南昌 330096
3 中国海洋大学信息科学与工程学部, 山东 青岛 266100
近红外光谱具有高维、 高冗余、 非线性的特性, 严重影响了样本之间的相似性度量的精准, 故而提出了一种基于Wasserstein散度的t分布随机近邻嵌入算法(Wt-SNE)。 基于流形学习算法思想, 利用高斯分布将高维数据的距离转换为概率分布, 使用更加偏重长尾分布的方式t分布表示低维空间中对应数据点的概率分布。 将高维数据的概率分布嵌入映射至低维度空间, 重构低维流形结构, 引入Wasserstein散度度量两个空间内概率分布的差异, 通过降低散度值来提高两个分布的相似度, 以此来实现高维数据降维处理。 为验证Wt-SNE算法的有效性, 首先对烟叶近红外光谱数据进行降维投影, 并与PCA、 LPP、 t-SNE算法比较, 结果表明Wt-SNE算法降维后的数据, 在低维空间内样本类别边界更加明显。 其次, 采用KNN、 SVM和PLS-DA分类器对降维后的数据进行烟叶产地预测, 准确率分别为93.8%、 91.5%、 92.7%, 表明降维后的数据不仅重构了原始光谱的空间结构而且保留了样本间的相似度关系。 最后, 选取某一卷烟叶组配方中的烟叶进行单料目标烟叶的替换, 根据备选样本与目标样本之间的马氏距离选取替换样本。 实验表明, Wt-SNE选取的替换烟叶与目标烟叶相似度最高, 烟碱、 总糖等化学成分含量与目标烟叶差异较小, 香气、 烟气、 口感得分表现出较高的一致性。 该方法能够有效度量烟叶近红外光谱之间的相似性, 为卷烟叶组配方的维护提供有力的依据。
近红外光谱 数据降维 t-SNE算法 Wasserstein散度 相似性度量 Near-infrared spectrum Data dimension reduction t-SNE algorithm Wasserstein divergence Similarity measurement 光谱学与光谱分析
2023, 43(12): 3806
上海出版印刷高等专科学校 印刷包装工程系, 上海 200093
基于主成分或者权重主成分的多光谱降维方法实现高维多光谱数据和低维空间数据之间相互转换,但低维空间数据含有大量负值,不能和色度空间如CIELAB等连接起来,给光谱颜色复制的后续研究带来困扰;建立XYZ三刺激到多光谱数据的转换,在多光谱数据降维到XYZ三刺激值过程中保留更多的颜色信息;通过二阶多项式回归建立XYZ三刺激值与多光谱通过权重主成分降维的得到的三维空间数据对应关系,实现XYZ三刺激值到多光谱数据转换;在不同的训练样本,不同的测试样本时,相对于主成分和权重主成分,推荐的方法在多种照明条件下色度重建精度得到提高,可以较好地应用到多光谱图像的高保真降维和压缩。
多光谱降维算法 二阶多项式回归 主成分分析法 权重主成分分析 光谱颜色复制 multispectral dimension reduction algorithm second order polynomial regression principal component analysis weighted principal component analysis spectral color reproduction
当今全球范围内有机食品行业发展迅速, 体现出消费者对食品质量安全的重视。 相比于普通鸡蛋, 有机鸡蛋因严格的生产条件以及更高的营养价值生产成本更高、 售价更贵。 市面上所销售的有机鸡蛋虽取得了严格有机食品认证标识, 但依旧不能阻止不法份子将普通鸡蛋冒充有机鸡蛋销售, 从而谋取利润。 这一行为不仅会损害有机鸡蛋生产商的利益, 也降低了人们对有机食品的信任度, 为此需要一种有效的对有机鸡蛋和普通鸡蛋无损鉴别方法。 使用高光谱技术透射成像的方式, 可以获取物质内部的信息, 以有机鸡蛋和普通鸡蛋为试验对象, 采集鸡蛋样本364~1 025 nm波长范围的高光谱图像数据, 从采集到的数据中提取出鸡蛋蛋清和蛋黄感兴趣区域(ROI)的平均透射光谱数据。 根据透射光谱曲线图筛选出有机鸡蛋与普通鸡蛋光谱响应差异明显的波段区间, 分别通过偏最小二乘判别分析(PLS-DA)和支持向量机(SVM)建立鸡蛋类别的鉴别模型, 结果表明模型分别根据蛋黄区域与蛋清区域数据进行建模的鉴别准确率相近, 进一步对蛋黄区域数据进行分析。 由于高光谱数据量大且存在大量冗余信息, 给数据采集、 存储、 传输和建模处理都带来不便, 因此分别通过连续投影算法(SPA)和竞争性自适应重加权算法(CARS)对蛋黄ROI数据进行降维处理, 剔除了大量冗余信息后再建模。 最终, 使用对蛋黄ROI区域运用SPA降维后得到的23个特征波长建立的SPA-SVM鉴别模型在测试集的准确率最高达到94.2%。 结果表明, 通过高光谱技术对有机鸡蛋和普通鸡蛋进行无损鉴别有一定效果。
鸡蛋 有机食品 高光谱技术 光谱降维 鉴别 Eggs Organic food Hyperspectral technology Spectral dimension reduction Identification 光谱学与光谱分析
2022, 42(4): 1222
1 塔里木大学农学院, 新疆 阿拉尔 843300
2 中国农业大学土地科学与技术学院, 北京 100083
3 浙江大学环境与资源学院, 浙江 杭州 310058
快速准确监测农田土壤全氮含量, 可显著提高土壤肥力诊断与评价工作的效率。 传统测定土壤全氮的方法存在耗时费力、 成本高、 环境污染等缺点, 而基于光谱学原理的土壤全氮定量方法克服了传统测量的劣势。 中红外(MIR)光谱相较于可见光-近红外(VNIR)光谱而言, 具有更多的波段数和信息量, 如何利用中红外光谱监测土壤全氮含量是具有重要应用前景的研究课题。 为了探索中红外光谱对土壤全氮监测的可行性, 以新疆南疆地区采集的246个农田土样为研究对象, 以室内测定的全氮含量和中红外光谱反射率数据为数据源, 分析了不同全氮含量土样的中红外光谱特征差异, 以主成分分析法(PCA)和连续投影算法(SPA)对光谱数据进行降维, 然后采用偏最小二乘回归(PLSR)、 支持向量机(SVM)、 随机森林(RF)和反向传播神经网络(BPNN)四种建模方法分别构建基于全波段和降维数据的土壤全氮含量定量反演模型。 研究结果表明: (1)土壤在中红外波段光谱反射率随全氮含量的增加而增加, 在3 620, 2 520, 1 620和1 420 cm-1附近存在明显的吸收谷; 将中红外光谱数据进行最大值归一化处理后, 可明显提高土壤光谱反射率与全氮含量的相关性。 (2)对比两种数据降维方法, PCA和SPA分别使模型变量数减少了99.8%和97.5%, 但以PCA提取的8个主成分为自变量建立的模型预测精度总体要高于SPA对应的模型, 因此以PCA提取的主成分建模更适于土壤全氮模型的构建。 (3)在建模集中, PLSR和SVM模型以全波段建模精度最高, 但建模变量数多, 建模效率较低, 而RF和BPNN模型分别以PCA和SPA降维后的数据建立的模型在保持精度相当的前提下, 可显著提高建模效率; 在预测集中, 基于PCA降维数据的BPNN模型预测能力最高, R2和RMSE分别为0.78和0.12 g·kg-1, RPD和RPIQ值分别为2.33和3.54, 模型具备较好的预测能力。 研究结果可为农田土壤全氮含量快速估测提供一定的参考价值。
中红外光谱 土壤全氮 反演模型 光谱数据降维 Mid-infrared spectrum Soil total nitrogen Inversion model Dimension reduction of spectral data 光谱学与光谱分析
2022, 42(9): 2768
1 武汉大学印刷与包装系颜色科学实验室, 湖北 武汉 430079
2 武汉大学测绘遥感信息工程国家重点实验室, 湖北 武汉 430079
针对多光谱激光雷达系统在实景三维立体图像的真实颜色的再现问题,提出了一种基于稀疏信号表示的多光谱颜色数据降维方法,该方法利用字典学习和稀疏编码交替更新,以迭代的方式对光谱误差进行修正。实验结果表明,所提出的方法均方根误差的平均值较主成分分析法降低了35.29%,光谱拟合系数的平均值达到了99.8% 以上,色度精度也较主成分分析法平均提高了70.23%,在不同光源观测条件下仍能保持颜色的稳定性,其重构精度优于主成分分析法。该方法利用稀疏表示可以通过低维观测向量复原高维稀疏信号的特性,从数量相对较少的训练样本中对大量测试样本进行精确复原,提高了数据处理中的成本效率,对真实反映遥感多光谱影像的地物信息有较大的帮助。
光谱学 稀疏表示 字典学习 光谱反射率 光谱降维 激光与光电子学进展
2021, 58(22): 2230003
中国工程物理研究院电子工程研究所, 四川绵阳 621999
针对无先验知识下, 混合二进制协议数据帧难以识别分离的问题, 提出了一种基于联合高斯混合模型 (GMM)和自编码器的聚类方法。对于捕获到的未知二进制数据帧, 首先通过栈式自编码器对其进行降维提取特征, 并根据相应判别准则获取最佳聚类个数, 最后使用改进了代价函数的自编码器对二进制数据帧进一步训练以提高聚类准确率。实验表明, 该方法对网络二进制协议数据帧识别的准确率达到 94%以上。
二进制协议 降维 自编码器 特征聚类 binary protocol dimension reduction auto -encoder feature clustering 太赫兹科学与电子信息学报
2021, 19(4): 712
为解决调制识别研究中较少考虑到不同信号的特征之间联系性的问题, 搭建了卷积神经网络(CNN)来提取信号的彩色时频图对应的特征, 并利用时频变换的分析方法, 将一维信号处理成彩色时频图, 通过卷积神经网络架构提取图像特征; 同时为了提升算法在低信噪比下的分类识别准确率, 对时频图像的纹理特征进行了特征提取, 将提取到的纹理特征与卷积神经网络中提取到的特征进行特征融合。仿真实验结果表明, 采用的时频卷积神经网络( TF–CNN)和TF–Resnet网络框架能够达到高精确度信号自动调制识别分类的目的。
调制识别 时频变换 卷积神经网络 特征提取及降维 特征融合 modulation recognition time -frequency transform Convolutional Neural Network feature extraction and dimension reduction feature fusion 太赫兹科学与电子信息学报
2021, 19(4): 562
1 湖北工程学院物理与电子信息工程学院, 湖北 孝感 432000
2 华中科技大学武汉光电国家研究中心, 湖北 武汉 430074
为了实现工业现场对特种钢材的快速检测与种类识别, 采用基于光纤传能的移动式激光诱导击穿光谱(LIBS)样机对14种特种钢材进行光谱数据的采集与分析, 采用预选谱线并遍历组合的降维方法与支持向量机(SVM)相结合的算法对特钢材料的光谱进行快速分类。 分别将原始光谱数据、 归一化处理后的光谱数据、 归一化处理+遍历组合优选谱线数据作为SVM分类模型的输入向量, 并对比了不同输入向量下模型对特钢识别的准确度。 结果表明: 在事先选出的51条特征谱线作为输入变量的基础上, 归一化光谱数据作为SVM分类模型的输入特征时, 识别准确度达到95.71%, 明显高于使用原始光谱数据作为输入向量时SVM分类模型的准确度11.43%。 进一步地, 使用MATLAB程序遍历谱线组合, 通过遍历各种谱线组合选出最优的输入谱线组合, 当优选6条特定的谱线时, 对特钢种类识别的准确度达到100%, 且建模速度也有相应提升。 可以看出, 当预选出大量常见特征数据时, 机器自动选取特征与人工挑选谱线相比, 具有明显优势, 基于此降维方法的SVM算法模型在LIBS快速分类技术中具有很好的工业应用前景。
激光诱导击穿光谱 谱线遍历组合 降维 钢铁分类 Laser induced Breakdown spectroscopy SVM Spectral line traversal combination Dimension reduction Classification of steel SVM 光谱学与光谱分析
2021, 41(8): 2638
1 华大学信息科学与技术学院, 上海 201620
2 人工智能教育部重点实验室, 上海 200240
在图像特征提取中, 样本标签并非完全真实有效, 可能导致图像归类框架的分类精度大幅下降, 而现有标签恢复算法面临含噪样本难以高效再利用的瓶颈问题。为此, 本文提出一种基于子集划分迭代投影集成的标签恢复算法。该算法首先随机多次地提取小规模子集信息, 然后综合主成分分析、邻域图正则化及 K-近邻算法等技术进行样本图像的可靠降维与迭代投影集成, 最后遵循多数投票原则实现标签复原。本文选取两大代表性的人脸数据库, 对多种标签恢复算法进行了不同指标下的大量对比分析。实验结果证明, 本文算法能够有效地校正样本的含噪标签, 在同一图像归类框架下针对 Yale B与 AR数据库分别使分类精度提升了 16. 9%与 8. 1%。相较于目前最好的标签恢复算法, 本文子集划分迭代投影集成算法可以提升 4. 3%~4. 7%的分类精度, 且在确保样本数据完整性的同时具备了一定的可扩展性。
图像归类 特征提取 含噪标签 标签恢复 可靠降维 image classification feature extraction noisy label label recovery reliable dimension reduction 光学 精密工程
2020, 28(12): 2719