王悦 1,2,3范慧杰 1,2,*刘世本 1,2,3唐延东 1,2
作者单位
摘要
1 中国科学院沈阳自动化研究所机器人学国家重点实验室,辽宁 沈阳 110016
2 中国科学院机器人与智能制造创新研究院,辽宁 沈阳 110016
3 中国科学院大学,北京 100049
由于水体对光的吸收和散射作用,水下图像普遍存在颜色失真和细节模糊这两种退化问题。为了得到色彩鲜明、细节清晰的水下图像,提出了一个基于多尺度注意力和对比学习的水下图像增强算法模型。该模型采用编码-解码结构作为基础框架,为了提取到更细粒度的特征,在编码部分设计了一个多尺度通道像素注意力模块,利用3个并行支路提取图像中不同层次的特征,然后将3条支路提取的特征进行融合输入到下一层编码器以及对应的解码层,提高网络特征提取以及细节增强的能力。最后,为了进一步提高增强图像的质量,引入对比学习训练网络。大量实验证明,本文算法增强后的图像色彩鲜明且细节信息保留较好。峰值信噪比和结构相似性指标的平均值最高可达到25.46和0.8946,与其他方法相比至少提高了4.4%和2.8%;水下彩色图像质量指标和信息熵的平均值最高为0.5802和7.6668,与其他方法相比均至少提高了2%;特征点匹配平均比原始图像多24个。
图像增强 注意力 多尺度 对比学习 
激光与光电子学进展
2024, 61(4): 0437008
作者单位
摘要
1 沈阳航空航天大学 自动化学院,辽宁 沈阳 110135
2 中国科学院沈阳自动化研究所,辽宁 沈阳 110016
细胞及细胞核的准确分割是宫颈癌计算机辅助筛查中的关键技术,针对具有重叠现象的宫颈细胞分割及其细胞核的提取,提出了一种U-Net网络语义分割下的多主动轮廓细胞分割提取方法。首先,对采集到的样本图像进行标注,将其分为背景、细胞、细胞核三部分;然后,对U-Net网络进行训练,并利用训练得到的模型对图像进行分语义分割,得到其中的细胞及细胞核区域;接着在U-Net语义分割结果的基础上获得细胞团块信息,并通过像素点与细胞核之间的距离为每个细胞初始化一个水平集函数表示的细胞轮廓;最后,结合细胞的形状先验信息、图像的边缘信息和不同轮廓之间的相互信息建立水平集函数的能量泛函,通过最小化能量泛函得到细胞轮廓,最终完成每个细胞的分割。实验表明:文中提出的分割方法可以对复杂情况下的宫颈细胞进行分割,包括独立细胞和互相重叠的细胞及其细胞核,取得了良好的分割效果。
宫颈细胞 主动轮廓 水平集 语义分割 细胞重叠 cervical cells active contour level set semantic segmentation cell overlap 
红外与激光工程
2020, 49(S1): 20200121
作者单位
摘要
1 辽宁石油化工大学 信息与控制工程学院,辽宁 抚顺 113001
2 中国科学院沈阳自动化研究所 机器人学国家重点实验室,辽宁 沈阳 110016
提出一种基于多通道时空融合网络的双人交互行为识别方法,对双人骨架序列行为进行识别。首先,采用视角不变性特征提取方法提取双人骨架特征,然后,设计两层级联的时空融合网络模型,第一层基于一维卷积神经网络(1DCNN)和双向长短时记忆网络(BiLSTM)学习空间特征,第二层基于长短时记忆网络(LSTM)学习时间特征,得到双人骨架的时空融合特征。最后,采用多通道时空融合网络分别学习多组双人骨架特征得到多通道融合特征,利用融合特征识别交互行为,各通道之间权值共享。将文中算法应用于NTU-RGBD人体交互行为骨架库,双人交叉对象实验准确率可达96.42%,交叉视角实验准确率可达97.46%。文中方法与该领域的典型方法相比,在双人交互行为识别中表现出更好的性能。
双人交互行为 卷积神经网络 长短时记忆网络 时空融合网络 多通道 two-person interaction CNN LSTM spatio-temporal fusion network multi-stream 
红外与激光工程
2020, 49(5): 20190552
作者单位
摘要
1 辽宁石油化工大学 信息与控制工程学院, 辽宁 抚顺 113001
2 中国科学院沈阳自动化研究所 机器人学国家重点实验室, 辽宁 沈阳 110016
基于自然场景图像的人体行为识别方法中遮挡、背景干扰、光照不均匀等因素影响识别结果, 利用人体三维骨架序列的行为识别方法可以克服上述缺点。首先, 考虑人体行为的时空特性, 提出一种时空特征融合深度学习网络人体骨架行为识别方法; 其次, 根据骨架几何特征建立视角不变性特征表示, CNN(Convolutional Neural Network)网络学习骨架的局部空域特征, 作用于空域的LSTM(Long Short Term Memory)网络学习骨架空域节点之间的相关性特征, 作用于时域的LSTM网络学习骨架序列时空关联性特征; 最后, 利用NTU RGB+D数据库验证文中算法。实验结果表明: 算法识别精度有所提高, 对于多视角骨架具有较强的鲁棒性。
时空特征 融合 骨架 视角不变 spatio-temporal feature fusion skeleton view invariant 
红外与激光工程
2018, 47(2): 0203007
蔡铁峰 1,2,3,*朱枫 1,3郝颖明 1,3范慧杰 1,3
作者单位
摘要
1 中国科学院沈阳自动化研究所,辽宁 沈阳 110016
2 中国科学院大学,北京 100049
3 中国科学院光电信息处理重点实验室,辽宁 沈阳 110016
人眼能分辨的颜色数量远多于人眼能分辨的灰度级,把灰度图像用伪彩色显示出来,人眼可以更好地感知图像中的景物信息。区别于现有方法,明确以有利于人眼探测识别为目标,给出了灰度图像伪彩色化后人眼能感知到的景物信息量的两项评价指标,在评价指标指导下,提出了一种灰度图像伪彩色化方法。该方法在确保灰度图像中各灰度级映射成人眼可分辨的不同颜色前提下,使尽量多的景物信息被人眼感知到。实验结果表明,相较于现有方法,该方法能使更多景物被人眼看清。该方法满足实时处理图像的要求。
探测识别 图像对比度增强 伪彩色 detection and recognition image contrast enhancement pseudo-color 
红外与激光工程
2015, 44(S): 0213

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!