王悦 1,2,3范慧杰 1,2,*刘世本 1,2,3唐延东 1,2
作者单位
摘要
1 中国科学院沈阳自动化研究所机器人学国家重点实验室,辽宁 沈阳 110016
2 中国科学院机器人与智能制造创新研究院,辽宁 沈阳 110016
3 中国科学院大学,北京 100049
由于水体对光的吸收和散射作用,水下图像普遍存在颜色失真和细节模糊这两种退化问题。为了得到色彩鲜明、细节清晰的水下图像,提出了一个基于多尺度注意力和对比学习的水下图像增强算法模型。该模型采用编码-解码结构作为基础框架,为了提取到更细粒度的特征,在编码部分设计了一个多尺度通道像素注意力模块,利用3个并行支路提取图像中不同层次的特征,然后将3条支路提取的特征进行融合输入到下一层编码器以及对应的解码层,提高网络特征提取以及细节增强的能力。最后,为了进一步提高增强图像的质量,引入对比学习训练网络。大量实验证明,本文算法增强后的图像色彩鲜明且细节信息保留较好。峰值信噪比和结构相似性指标的平均值最高可达到25.46和0.8946,与其他方法相比至少提高了4.4%和2.8%;水下彩色图像质量指标和信息熵的平均值最高为0.5802和7.6668,与其他方法相比均至少提高了2%;特征点匹配平均比原始图像多24个。
图像增强 注意力 多尺度 对比学习 
激光与光电子学进展
2024, 61(4): 0437008
林森 1,2,3,*刘世本 1唐延东 2,3
作者单位
摘要
1 辽宁工程技术大学 电子与信息工程学院,辽宁 葫芦岛 125105
2 中国科学院沈阳自动化研究所 机器人学国家重点实验室,辽宁 沈阳 110016
3 中国科学院机器人与智能制造创新研究院,辽宁 沈阳 110016
针对水下图像出现对比度低、颜色偏差和细节模糊等问题,提出了多输入融合对抗网络进行水下图像增强。该方法主要特点是生成网络采用编码解码结构,通过卷积层滤除噪声,利用反卷积层恢复丢失的细节并逐像素进行细化图像。首先,对原始图像进行预处理,得到颜色校正和对比度增强两种类型图像。其次,利用生成网络学习两种增强图像与原始图像之间差异的置信度图。然后,为减少在生成网络学习过程中两种增强算法引入的伪影和细节模糊,添加了纹理提取单元对两种增强图像进行纹理特征提取,并将提取的纹理特征与对应的置信度图进行融合。最后,通过构建多个损失函数,反复训练对抗网络,得到增强的水下图像。实验结果表明,增强的水下图像色彩鲜明并且对比度提升,评价指标UCIQE均值为0.639 9,NIQE均值为3.727 3。相比于其他算法有显著优势,证明了该算法的良好效果。
深度学习 生成对抗网络 多输入融合 编码解码框架 水下图像增强 deep learning generative adversarial network multi-input fusion encoding and decoding structure underwater image enhancement 
红外与激光工程
2020, 49(5): 20200015
作者单位
摘要
1 辽宁石油化工大学 信息与控制工程学院,辽宁 抚顺 113001
2 中国科学院沈阳自动化研究所 机器人学国家重点实验室,辽宁 沈阳 110016
提出一种基于多通道时空融合网络的双人交互行为识别方法,对双人骨架序列行为进行识别。首先,采用视角不变性特征提取方法提取双人骨架特征,然后,设计两层级联的时空融合网络模型,第一层基于一维卷积神经网络(1DCNN)和双向长短时记忆网络(BiLSTM)学习空间特征,第二层基于长短时记忆网络(LSTM)学习时间特征,得到双人骨架的时空融合特征。最后,采用多通道时空融合网络分别学习多组双人骨架特征得到多通道融合特征,利用融合特征识别交互行为,各通道之间权值共享。将文中算法应用于NTU-RGBD人体交互行为骨架库,双人交叉对象实验准确率可达96.42%,交叉视角实验准确率可达97.46%。文中方法与该领域的典型方法相比,在双人交互行为识别中表现出更好的性能。
双人交互行为 卷积神经网络 长短时记忆网络 时空融合网络 多通道 two-person interaction CNN LSTM spatio-temporal fusion network multi-stream 
红外与激光工程
2020, 49(5): 20190552
作者单位
摘要
1 辽宁工程技术大学 电子与信息工程学院, 辽宁 葫芦岛 125105
2 中国科学院沈阳自动化研究所 机器人学国家重点实验室, 沈阳 110016
3 中国科学院机器人与智能制造创新研究院, 沈阳 110016
针对水下光学图像颜色失真、非均匀光照、对比度低的问题,提出基于优势特征图像融合的水下光学图像增强算法.首先,提出改进的暗通道先验算法去除退化图像中的不均匀浑浊并均衡色彩;其次,对颜色校正图像分别使用基于加权分布的自适应伽玛校正算法和限制对比度自适应直方图均衡-同态滤波算法,增强颜色校正图像对比度并使其亮度均衡;最后,定义三幅融合图像即颜色校正图像、亮度均衡图像、对比度增强图像的关联权重图,通过多尺度融合算法获得融合图像.与单一预处理算法只能解决对应的退化现象相比,该算法对单幅退化图像进行多算法处理,得到三幅优势特征图像,通过不同权重的组合最大程度地将各优势特征相结合,得到的综合效果远超各单一算法优化效果,不再局限于解决颜色失真等单一问题.将本文算法与现有算法在主观评价和客观评价两方面进行实验对比,结果表明,该算法可以有效平衡水下图像的色度、饱和度及清晰度,视觉效果接近自然场景下的图像.
数字图像处理 图像增强 图像融合 水下图像 海洋光学 水下成像系统 Digital image processing Image enhancement Image fusion Underwater image Oceanic optics Underwater imaging system 
光子学报
2020, 49(3): 0310003
作者单位
摘要
1 辽宁石油化工大学 信息与控制工程学院, 辽宁 抚顺 113001
2 中国科学院沈阳自动化研究所 机器人学国家重点实验室, 辽宁 沈阳 110016
基于自然场景图像的人体行为识别方法中遮挡、背景干扰、光照不均匀等因素影响识别结果, 利用人体三维骨架序列的行为识别方法可以克服上述缺点。首先, 考虑人体行为的时空特性, 提出一种时空特征融合深度学习网络人体骨架行为识别方法; 其次, 根据骨架几何特征建立视角不变性特征表示, CNN(Convolutional Neural Network)网络学习骨架的局部空域特征, 作用于空域的LSTM(Long Short Term Memory)网络学习骨架空域节点之间的相关性特征, 作用于时域的LSTM网络学习骨架序列时空关联性特征; 最后, 利用NTU RGB+D数据库验证文中算法。实验结果表明: 算法识别精度有所提高, 对于多视角骨架具有较强的鲁棒性。
时空特征 融合 骨架 视角不变 spatio-temporal feature fusion skeleton view invariant 
红外与激光工程
2018, 47(2): 0203007
作者单位
摘要
1 东北大学 信息科学与工程学院, 辽宁 沈阳 110000
2 中国科学院沈阳自动化研究所 机器人学国家重点实验室, 辽宁 沈阳 110000
纹理合成是计算机图形学、计算机视觉和图像处理领域的研究热点之一。传统的纹理合成方法往往通过提取有效的特征样式或统计量并在该特征信息的约束下生成随机图像来实现。对抗生成网络作为一种较新的深度网络形式, 通过生成器和判别器的对抗训练能够随机生成与观测数据具有相同分布的新数据。鉴于此, 提出了一种基于对抗生成网络的纹理合成方法。该算法的优点是不需要经过多次迭代就能够生成更真实纹理图像, 且生成图像在视觉上与观测纹理图像一致的同时具有一定随机性。一系列针对随机纹理和结构性纹理的合成实验验证了该算法的有效性。
纹理合成 深度学习 生成模型 对抗生成网络 texture synthesis deep learning generative model generative adversarial networks 
红外与激光工程
2018, 47(2): 0203005
作者单位
摘要
1 中国科学院沈阳自动化研究所机器人学国家重点实验室, 辽宁 沈阳 110016
2 中国科学院大学, 北京 100049
3 东北大学信息科学与工程学院, 辽宁 沈阳 110819
针对有阴影情况下的道路及导航线提取问题, 提出一种基于光照不变图像分割和投票函数的阴影道路图像道路及视觉导航线提取算法, 该算法利用正交分解法获取彩色光照不变图像, 并对其进行分割, 通过构造的投票函数及道路判别准则提取道路区域, 扫描道路定位点后对其进行最小二乘拟合提取导航线。该方法不需要大量样本进行学习。实验结果表明, 所提算法与现有两种算法相比, 在检测精度和速度上均具有明显优势, 并且算法复杂度较低。算法能够有效地解决阴影环境下道路及导航线的提取问题。
机器视觉 光照不变图像 阴影道路图像 道路提取 导航线提取 
光学学报
2016, 36(12): 1215004
作者单位
摘要
1 中国科学院沈阳自动化研究所机器人学国家重点实验室, 辽宁 沈阳 110016
2 中国科学院大学, 北京 100049
针对室外光照条件下阴影的快速高效检测问题,提出了基于正交分解的阴影检测算法。利用室外场景图像中阴影区域内外的线性模型建立线性方程组,对该线性方程组的解空间进行正交分解,得到一幅彩色光照不变图像和一幅光照变化图像。通过K-means算法将彩色光照不变图像分类为几个区域,每个区域具有一致的反照率。根据分类结果,对光照变化图像采用EM算法进行高斯混合建模,提取阴影区域。最后采用形态学算子对提取的阴影区域进行优化。该算法不需要复杂的特征算子学习过程,大大降低了计算的时间复杂度,而且不需要任何先验知识,可以直接应用到实时场景处理中。
机器视觉 阴影检测 正交分解 期望最大化算法 高斯混合模型 
光学学报
2016, 36(8): 0815002
作者单位
摘要
1 中国科学院沈阳自动化研究所机器人学国家重点实验室,辽宁 沈阳 110016
2 中国科学院大学,北京 100049
3 沈阳工程学院自动化学院,辽宁  沈阳 110136
相位标志牌是重要的电力设施,通常安装在输电线挂点附近的显著位置上,准确地检测和识别相位标志牌对输电线路巡检具有非常重要的实际意义。应用图像处理与模式识别技术,提出了一种相位标志牌的检测和识别方法。首先采用灰度化、中值滤波、膨胀和腐蚀的方法对相位标志牌图像进行预处理;然后采用基于区域一致性算子的显著性目标检测方法对预处理后的图像进行相位标志牌检测;最后采用基于仿射SIFT算子的匹配方法对检测到的相位标志牌进行识别。实验结果表明,所提出的方法能够有效地对相位标志牌进行检测和识别,具有较好的鲁棒性、准确性和有效性。
相位标志牌 区域一致性 仿射SIFT 目标检测 目标识别 power phase sign region conformance ASIFT object detection object recognition 
光学技术
2015, 41(6): 537
李小毛 1,2,*唐延东 1闵莉 1,2
作者单位
摘要
1 中国科学院沈阳自动化研究所机器人学国家重点实验室,沈阳 110016
2 中国科学院研究生院,北京 100039
本文通过形状约束方程(组)与一般主动轮廓模型结合,将目标形状与主动轮廓模型融合到统一能量泛函模型中,提出了一种形状保持主动轮廓模型即曲线在演化过程中保持为某一类特定形状。模型通过参数化水平集函数的零水平集控制演化曲线形状,不仅达到了分割即目标的目的,而且能够给出特定目标的定量描述。根据形状保持主动轮廓模型,建立了一个用于椭圆状目标检测的统一能量泛函模型,导出了相应的Euler-Lagrange常微分方程并用水平集方法实现了椭圆状目标检测。此模型可以应用于眼底乳头分割,虹膜检测及相机标定。实验结果表明,此模型不仅能够准确的检测出给定图像中的椭圆状目标,而且有很强的抗噪、抗变形及遮挡性能。
形状保持 椭圆状目标 主动轮廓 Chan-Vese模型 水平集 shape preserving elliptic object active contour Chan-Vese model level set 
光电工程
2008, 35(2): 97

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!