作者单位
摘要
1 贵州大学 大数据与信息工程学院,贵州 贵阳 550025
2 贵阳铝镁设计研究院有限公司,贵州 贵阳 550009
传统的语义分割知识蒸馏方法仍然存在知识蒸馏不完全、特征信息传递不显著等问题,且教师网络传递的知识情况复杂,容易丢失特征的位置信息。针对以上问题,本文提出了一种基于知识蒸馏的特征提炼语义分割模型FRKDNet。首先根据前景特征与背景噪声的特点,设计了一种特征提炼方法来将蒸馏知识中的前景内容进行分离,过滤掉教师网络的伪知识后将更准确的特征内容传递给学生网络,从而提高特征的表现能力。同时,在特征空间的隐式编码中提取类间距离与类内距离从而得到相应的特征坐标掩码,学生网络通过模拟特征位置信息来最小化与教师网络特征位置的差距,并分别和学生网络进行蒸馏损失计算,从而提高学生网络的分割精度,辅助学生网络更快地收敛。最后在公开数据集Pascal VOC和Cityscapes上实现了优秀的分割性能,MIoU分别达到74.19%和76.53%,比原始学生网络分别提高了2.04%和4.48%。本文方法相比于主流方法具有更好的分割性能和鲁棒性,为语义分割知识蒸馏提供了一种新方法。
语义分割 神经网络 知识蒸馏 特征提炼 深度学习 semantic segmentation neural network knowledge distillation feature refine deep learning 
液晶与显示
2023, 38(11): 1590
吴昊 1,1徐杨 1,1,2,">*曹斌 1,1,2,2
作者单位
摘要
1 贵州大学大数据与信息工程学院,贵州 贵阳 550025
2 贵阳铝镁设计研究院有限公司,贵州 贵阳 550009
针对人为无法及时从医学图像发现病理特征,最终导致病情恶化的问题,提出一种二次特征提取方法(ω-net),用来对肺、肝脏、细胞及脑质瘤进行分割。首先,将全尺寸的Unet网络作为一次特征提取路径,再将上采样路径的第三层作为起始层,用来扩展二次特征提取路径,以加强特征提取能力。其次,为了建立长期的通道依赖关系以及增强特征的位置信息,在不同的阶段引入两种新型注意力机制进行针对性优化。最后,复现了10种经典网络,在医学图像领域与基准网络Unet对比,所提网络的常用指标平均交并比、敏感性、精确度和准确率最高分别提升了0.0787、0.1287、0.1216、0.0201。经过在4种数据集上的指标数值和可视化结果比较,ω-net的多项性能指标均优于其他网络,证明了该网络的有效性与优越性。
医学图像 语义分割 二次特征提取 注意力机制 
激光与光电子学进展
2023, 60(4): 0410015
陈加敏 1徐杨 1,2,*
作者单位
摘要
1 贵州大学大数据与信息工程学院,贵州 贵阳 550025
2 贵阳铝镁设计研究院有限公司,贵州 贵阳 550009
人脸表情识别是神经网络应用于模式识别上一项极具挑战性的任务,而表情识别过程中特征提取尤为重要。因此,提出了一种注意力拆分卷积残差网络来增强特征表现。该网络以ResNet18为骨干网络,用Coordinate Attention Split Convolution Block(CASCBlock)替换ResNet18中的basic block。CASCBlock首先使用两个拆分卷积将特征在通道维度先拆分后融合降低冗余特征表现;然后在第2个拆分卷积后融入坐标注意力机制;最后构建一个全连接分类器进行表情识别。将所提方法在FER2013和RAF-DB数据集上进行了实验,实验结果表明,所提方法在FER2013和RAF-DB数据集上识别准确率相较于ResNet18分别提高了2.897个百分点和2.575个百分点,且模型的参数量下降了60%左右。
机器视觉 拆分卷积 残差网络 特征融合 表情识别 注意力机制 
激光与光电子学进展
2022, 59(18): 1815009
作者单位
摘要
辽宁科技大学计算机与软件工程学院,辽宁 鞍山 114051
已有用蓝光发光二极管(LED)激发绿橙双色荧光粉的荧光粉涂覆型白光LED的中视觉发光效率最大化光谱优化问题,目标函数为最大化多个亮度水平下的平均中视觉发光效率,该优化模型是对相关色温(CCT)进行离散穷举,仅能获得固定色温下不同亮度水平的平均中视觉发光效率最大值。为了在不同亮度水平下获得最大中视觉发光效率,提出了一种目标函数简单的非线性约束优化模型,同时将CCT作为在一定范围内变化的优化参数。实验结果表明,该模型可以在满足显色指数、色彩保真度和给定中视觉亮度水平的要求下,获得最优的LED光谱,真正实现在指定亮度水平下中视觉发光效率最大化的目的。
视觉光学 发光二极管 显色指数 色彩保真度 中视觉 亮度可调 发光效率 
激光与光电子学进展
2022, 59(11): 1133001
作者单位
摘要
1 上海理工大学 生物医学工程研究所,上海 200093
2 浙江大学 杭州国际科创中心,浙江 杭州 311200
针对太赫兹被动成像系统前端功率探测器内部引入的低频噪声(1/f噪声)对成像精度的影响较为明显的问题,设计了一种高灵敏度调制解调系统来降低低频噪声对成像的干扰。通过控制外部信号源使功率探测器在正常工作与饱和状态之间快速切换,实现对目标信号的调制,从而将目标信号的频率调制到高于功率探测器引入的低频噪声频段以便将低频噪声滤除,进而降低该低频噪声对后续成像质量的影响。通过MATLAB软件仿真,可模拟出信噪比(SNR)为31.17 dB的功率探测器输出信号,同时通过对目标信号调制解调,目标信号的信噪比被提高到了268.13 dB。通过对所设计的高灵敏度调制解调系统实际测试,可得目标信号的信噪比由4.22 dB提高到了301.88 dB。研究结果表明,该高灵敏度调制解调系统能有效降低太赫兹探测器内引入的低频噪声对后续成像质量的影响。
太赫兹被动成像 调制解调 低频噪声 terahertz passive imaging modulation and demodulation low frequency noise 
光学仪器
2022, 44(2): 15
作者单位
摘要
辽宁科技大学计算机与软件工程学院, 辽宁 鞍山 114051
研究了基于视锥响应三刺激值L,M,S导出的不同色品坐标空间和不同比例因子对相关色温(CCT)计算的影响,并比较了计算得到的CCT与标准CCT的差异。在Houser等收集的包含401个光谱功率分布的数据集上进行了测试,测试结果表明,采用比例因子均为1时计算得到的L,M,S直接导出的uc-vc空间表现最好,均值CCT绝对差异,中值CCT绝对差异和最大值CCT绝对差异分别为48,31和851 K。若将L,M,S转换到由配色函数定义的三刺激值空间XFYFZF导出的uF-vF空间中计算CCT,计算得到的CCT与标准CCT差异的均值CCT差异,中值CCT差异和最大值CCT差异分别为42,21和540 K。
颜色 视锥响应三刺激值LMS空间 相关色温 色度坐标空间 比例因子 牛顿法 
光学学报
2022, 42(2): 0233001
作者单位
摘要
辽宁科技大学计算机与软件工程学院, 辽宁 鞍山 114051
颜色学的发展依赖于感知现象和实验数据。随着视觉色差实验数据的增加,人们试图探索研发与CIELAB颜色空间一样简单,但更加均匀的颜色空间。分析了CIELAB颜色空间的特性,并基于这些特性提出了包含4个参数的颜色空间,称之为MLAB颜色空间。新颜色空间参数的确定是非线性约束优化问题,可保证优化后的空间能很好地预测由国际照明委员会专家组收集的视觉色差数据集COM-corrected。基于COM-corrected数据集的比较表明,MLAB颜色空间显著优于CIELAB颜色空间。基于色调线性数据集和椭圆数据集的测试表明,MLAB颜色空间较CIELAB颜色空间也有一定程度的进步。
颜色 均匀颜色空间 色差度量 感知差异 色调 色度椭圆 
光学学报
2022, 42(1): 0133001
作者单位
摘要
辽宁科技大学计算机与软件工程学院, 辽宁 鞍山 114051
研究了相机JPG数据线性化对基于加权多项式回归算法的光谱反射重建精度的影响,论证了是否需要在加权多项式回归算法中对JPG数据进行线性化处理。实验采用加权多项式回归算法重建反射率,以X-Rite Digital ColorChecker Semi Gloss (SG)色卡(包括140个色块和灰色色块)进行训练,GretagMacbeth ColorChecker色卡(包括24个色块和灰色色块) 和自制的44个印刷样品及48个纺织品样品做测试。采用CIEDE2000色差和均方根误差将结果与真实数据进行对比,结果表明,在加权多项式回归算法中使用原始JPG数据的效果要优于使用线性化JPG数据。基于该研究结果,对JPG数据进行线性化处理并不能提高加权多项式回归算法重建反射率的重建精度。而不进行JPG数据线性化,同样可以得到较高的光谱重建精度。在三阶加权多项式回归算法中,使用原始JPG数据的重建效果最好。
色彩 光谱反射率重建 线性化 多项式回归 色差 重建精度 
激光与光电子学进展
2021, 58(14): 1433001
张政 1徐杨 1,2,*
作者单位
摘要
1 贵州大学大数据与信息工程学院, 贵州 贵阳 550025
2 贵阳铝镁设计研究院有限公司, 贵州 贵阳 550009
针对传统卷积神经网络(CNN)中仅有对单手手势语义进行识别的算法和深度学习手势识别算法中CNN的收敛性差和识别精度低的问题,提出了一种基于两个分类器的自适应单双手手势识别算法以对单手和双手进行识别。该算法的核心是联合两个分类器进行单双手手势识别。首先,采用手数分类器对手势进行分割分组预测,将手势识别转化成部分手势图像识别;其次,采用自适应增强卷积神经网络(AE-CNN)进行手势识别,利用自适应模块分析出现识别误差的原因和反馈模式;最后,在迭代次数和识别结果的基础上进行参数更新。实验结果表明,手数分类器进行手势预测分组的正确概率为98.82%,AE-CNN的收敛性优于CNN和CNN+Dropout,对单手手势的识别率高达97.87%,对基于LSP数据集自建的9类单手手势和10类双手手势的整体模型识别率为97.10%,对复杂背景和不同光照强度下手势的平均识别率为94.00%,并且具有一定的鲁棒性。
图像处理 特征自适应增强 双分类器 单双手势识别 卷积神经网络 
激光与光电子学进展
2021, 58(2): 0210005
张肖辉 1李雪萍 2高程 1,2王智峰 1,2[ ... ]李长军 1,2,*
作者单位
摘要
1 辽宁科技大学电子与信息工程学院, 辽宁 鞍山 114051
2 辽宁科技大学计算机与软件工程学院, 辽宁 鞍山 114051
显示器特征化是颜色管理的关键问题之一, 早期人们关注的是建立显示器驱动信号RGB和色度值XYZ之间的相互转换关系, 文献中讨论最多的是GOG和PLCC模型。 最近, 为了实现同色同谱再现, 显示器的光谱特征化成为研究的热点, 而且显示器的光谱特征化在多光谱图像的再现有着重要应用。 提出采用常用的GOG和PLCC模型进行光谱特征化。 虽然GOG和PLCC模型是常用的显示器特征化模型, 但文献还没有用这两个模型进行光谱特征化的讨论。 首先基于通道独立性和各通道色品坐标恒定性的假设证明了GOG和PLCC模型均可用于显示器光谱特征化。 然后基于目前常采用的专业显示器EIZO CG277和BENQ PG2401进行了比较研究, 同时也分别探讨了采用纯色和灰阶数据进行训练GOG和PLCC模型。 比较结果表明, 采用灰阶数据训练的GOG和PLCC模型分别好于采用纯色数据训练的GOG和PLCC模型; 不论从正向还是从逆向的角度考虑采用灰阶训练的PLCC模型的精度要比SRPPM和GOG模型高, 而且PLCC模型的逆向远比SRPPM的逆向简单。 因此建议采用灰阶数据训练的PLCC模型对液晶显示器进行光谱特征化。
色品恒定性 最大值光谱辐亮度 液晶显示器 灰阶数据 光谱特征化 Chromaticity constancy Maximum spectral radiance Liquid crystal display Neutral-point data Spectral characterization 
光谱学与光谱分析
2020, 40(8): 2392

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!