同名作者【唐延东】论文列表 -- 中国光学期刊网

作者单位

摘要

¹ 中国科学院沈阳自动化研究所机器人学国家重点实验室，辽宁沈阳 110016

² 中国科学院机器人与智能制造创新研究院，辽宁沈阳 110016

³ 中国科学院大学，北京 100049

由于水体对光的吸收和散射作用，水下图像普遍存在颜色失真和细节模糊这两种退化问题。为了得到色彩鲜明、细节清晰的水下图像，提出了一个基于多尺度注意力和对比学习的水下图像增强算法模型。该模型采用编码-解码结构作为基础框架，为了提取到更细粒度的特征，在编码部分设计了一个多尺度通道像素注意力模块，利用3个并行支路提取图像中不同层次的特征，然后将3条支路提取的特征进行融合输入到下一层编码器以及对应的解码层，提高网络特征提取以及细节增强的能力。最后，为了进一步提高增强图像的质量，引入对比学习训练网络。大量实验证明，本文算法增强后的图像色彩鲜明且细节信息保留较好。峰值信噪比和结构相似性指标的平均值最高可达到25.46和0.8946，与其他方法相比至少提高了4.4%和2.8%；水下彩色图像质量指标和信息熵的平均值最高为0.5802和7.6668，与其他方法相比均至少提高了2%；特征点匹配平均比原始图像多24个。

图像增强注意力多尺度对比学习

PDF全文 Full Text

激光与光电子学进展

2024, 61(4): 0437008

人工智能

多输入融合对抗网络的水下图像增强

下载：755次

林森 ^1,2,3,*刘世本 ¹唐延东 ^2,3

作者单位

摘要

¹ 辽宁工程技术大学电子与信息工程学院，辽宁葫芦岛 125105

² 中国科学院沈阳自动化研究所机器人学国家重点实验室，辽宁沈阳 110016

³ 中国科学院机器人与智能制造创新研究院，辽宁沈阳 110016

针对水下图像出现对比度低、颜色偏差和细节模糊等问题，提出了多输入融合对抗网络进行水下图像增强。该方法主要特点是生成网络采用编码解码结构，通过卷积层滤除噪声，利用反卷积层恢复丢失的细节并逐像素进行细化图像。首先，对原始图像进行预处理，得到颜色校正和对比度增强两种类型图像。其次，利用生成网络学习两种增强图像与原始图像之间差异的置信度图。然后，为减少在生成网络学习过程中两种增强算法引入的伪影和细节模糊，添加了纹理提取单元对两种增强图像进行纹理特征提取，并将提取的纹理特征与对应的置信度图进行融合。最后，通过构建多个损失函数，反复训练对抗网络，得到增强的水下图像。实验结果表明，增强的水下图像色彩鲜明并且对比度提升，评价指标UCIQE均值为0.639 9，NIQE均值为3.727 3。相比于其他算法有显著优势，证明了该算法的良好效果。

深度学习生成对抗网络多输入融合编码解码框架水下图像增强 deep learning generative adversarial network multi-input fusion encoding and decoding structure underwater image enhancement

PDF全文 Full Text

红外与激光工程

2020, 49(5): 20200015

人工智能

多通道时空融合网络双人交互行为识别

裴晓敏 ¹范慧杰 ²唐延东 ²

作者单位

摘要

¹ 辽宁石油化工大学信息与控制工程学院，辽宁抚顺 113001

² 中国科学院沈阳自动化研究所机器人学国家重点实验室，辽宁沈阳 110016

提出一种基于多通道时空融合网络的双人交互行为识别方法，对双人骨架序列行为进行识别。首先，采用视角不变性特征提取方法提取双人骨架特征，然后，设计两层级联的时空融合网络模型，第一层基于一维卷积神经网络（1DCNN）和双向长短时记忆网络（BiLSTM）学习空间特征，第二层基于长短时记忆网络(LSTM)学习时间特征，得到双人骨架的时空融合特征。最后，采用多通道时空融合网络分别学习多组双人骨架特征得到多通道融合特征，利用融合特征识别交互行为，各通道之间权值共享。将文中算法应用于NTU-RGBD人体交互行为骨架库，双人交叉对象实验准确率可达96.42%，交叉视角实验准确率可达97.46%。文中方法与该领域的典型方法相比，在双人交互行为识别中表现出更好的性能。

双人交互行为卷积神经网络长短时记忆网络时空融合网络多通道 two-person interaction CNN LSTM spatio-temporal fusion network multi-stream

PDF全文 Full Text

红外与激光工程

2020, 49(5): 20190552

图像处理

基于优势特征图像融合的水下光学图像增强

下载：664次

林森 ^1,2,3迟凯晨 ¹李文涛 ^2,3唐延东 ^2,3

作者单位

摘要

¹ 辽宁工程技术大学电子与信息工程学院, 辽宁葫芦岛 125105

² 中国科学院沈阳自动化研究所机器人学国家重点实验室, 沈阳 110016

³ 中国科学院机器人与智能制造创新研究院, 沈阳 110016

针对水下光学图像颜色失真、非均匀光照、对比度低的问题，提出基于优势特征图像融合的水下光学图像增强算法.首先，提出改进的暗通道先验算法去除退化图像中的不均匀浑浊并均衡色彩；其次，对颜色校正图像分别使用基于加权分布的自适应伽玛校正算法和限制对比度自适应直方图均衡-同态滤波算法，增强颜色校正图像对比度并使其亮度均衡；最后，定义三幅融合图像即颜色校正图像、亮度均衡图像、对比度增强图像的关联权重图，通过多尺度融合算法获得融合图像.与单一预处理算法只能解决对应的退化现象相比，该算法对单幅退化图像进行多算法处理，得到三幅优势特征图像，通过不同权重的组合最大程度地将各优势特征相结合，得到的综合效果远超各单一算法优化效果，不再局限于解决颜色失真等单一问题.将本文算法与现有算法在主观评价和客观评价两方面进行实验对比，结果表明，该算法可以有效平衡水下图像的色度、饱和度及清晰度，视觉效果接近自然场景下的图像.

数字图像处理图像增强图像融合水下图像海洋光学水下成像系统 Digital image processing Image enhancement Image fusion Underwater image Oceanic optics Underwater imaging system

PDF全文 Full Text

光子学报

2020, 49(3): 0310003

特约专栏—“深度学习及其应用”

时空特征融合深度学习网络人体行为识别方法

裴晓敏 ^1,2,*范慧杰 ²唐延东 ²

作者单位

摘要

¹ 辽宁石油化工大学信息与控制工程学院, 辽宁抚顺 113001

² 中国科学院沈阳自动化研究所机器人学国家重点实验室, 辽宁沈阳 110016

基于自然场景图像的人体行为识别方法中遮挡、背景干扰、光照不均匀等因素影响识别结果, 利用人体三维骨架序列的行为识别方法可以克服上述缺点。首先, 考虑人体行为的时空特性, 提出一种时空特征融合深度学习网络人体骨架行为识别方法; 其次, 根据骨架几何特征建立视角不变性特征表示, CNN(Convolutional Neural Network)网络学习骨架的局部空域特征, 作用于空域的LSTM(Long Short Term Memory)网络学习骨架空域节点之间的相关性特征, 作用于时域的LSTM网络学习骨架序列时空关联性特征; 最后, 利用NTU RGB+D数据库验证文中算法。实验结果表明: 算法识别精度有所提高, 对于多视角骨架具有较强的鲁棒性。

时空特征融合骨架视角不变 spatio-temporal feature fusion skeleton view invariant

PDF全文 Full Text

红外与激光工程

2018, 47(2): 0203007

特约专栏—“深度学习及其应用”

基于对抗生成网络的纹理合成方法

余思泉 ^1,2,*韩志 ²唐延东 ^1,2吴成东 ¹

作者单位

摘要

¹ 东北大学信息科学与工程学院, 辽宁沈阳 110000

² 中国科学院沈阳自动化研究所机器人学国家重点实验室, 辽宁沈阳 110000

纹理合成是计算机图形学、计算机视觉和图像处理领域的研究热点之一。传统的纹理合成方法往往通过提取有效的特征样式或统计量并在该特征信息的约束下生成随机图像来实现。对抗生成网络作为一种较新的深度网络形式, 通过生成器和判别器的对抗训练能够随机生成与观测数据具有相同分布的新数据。鉴于此, 提出了一种基于对抗生成网络的纹理合成方法。该算法的优点是不需要经过多次迭代就能够生成更真实纹理图像, 且生成图像在视觉上与观测纹理图像一致的同时具有一定随机性。一系列针对随机纹理和结构性纹理的合成实验验证了该算法的有效性。

纹理合成深度学习生成模型对抗生成网络 texture synthesis deep learning generative model generative adversarial networks

PDF全文 Full Text

红外与激光工程

2018, 47(2): 0203005

机器视觉

基于光照不变图像的阴影图像道路及导航线提取算法

段志刚 ^1,2,*李勇 ^1,3王恩德 ¹田建东 ¹唐延东 ¹

作者单位

摘要

¹ 中国科学院沈阳自动化研究所机器人学国家重点实验室, 辽宁沈阳 110016

² 中国科学院大学, 北京 100049

³ 东北大学信息科学与工程学院, 辽宁沈阳 110819

针对有阴影情况下的道路及导航线提取问题, 提出一种基于光照不变图像分割和投票函数的阴影道路图像道路及视觉导航线提取算法, 该算法利用正交分解法获取彩色光照不变图像, 并对其进行分割, 通过构造的投票函数及道路判别准则提取道路区域, 扫描道路定位点后对其进行最小二乘拟合提取导航线。该方法不需要大量样本进行学习。实验结果表明, 所提算法与现有两种算法相比, 在检测精度和速度上均具有明显优势, 并且算法复杂度较低。算法能够有效地解决阴影环境下道路及导航线的提取问题。

机器视觉光照不变图像阴影道路图像道路提取导航线提取

PDF全文 Full Text

光学学报

2016, 36(12): 1215004

机器视觉

基于正交分解的室外光照阴影检测

段志刚 ^1,2,*屈靓琼 ^1,2田建东 ¹唐延东 ¹

作者单位

摘要

¹ 中国科学院沈阳自动化研究所机器人学国家重点实验室, 辽宁沈阳 110016

² 中国科学院大学, 北京 100049

针对室外光照条件下阴影的快速高效检测问题，提出了基于正交分解的阴影检测算法。利用室外场景图像中阴影区域内外的线性模型建立线性方程组，对该线性方程组的解空间进行正交分解，得到一幅彩色光照不变图像和一幅光照变化图像。通过K-means算法将彩色光照不变图像分类为几个区域，每个区域具有一致的反照率。根据分类结果，对光照变化图像采用EM算法进行高斯混合建模，提取阴影区域。最后采用形态学算子对提取的阴影区域进行优化。该算法不需要复杂的特征算子学习过程，大大降低了计算的时间复杂度，而且不需要任何先验知识，可以直接应用到实时场景处理中。

机器视觉阴影检测正交分解期望最大化算法高斯混合模型

PDF全文 Full Text

光学学报

2016, 36(8): 0815002

信息光学与图像处理

电力线路相位标志牌的检测和识别

何思远 ^1,2,3,*蔺蘭 ^1,2李文涛 ¹唐延东 ¹

作者单位

摘要

¹ 中国科学院沈阳自动化研究所机器人学国家重点实验室,辽宁　沈阳 110016

² 中国科学院大学,北京 100049

³ 沈阳工程学院自动化学院,辽宁　　沈阳 110136

相位标志牌是重要的电力设施,通常安装在输电线挂点附近的显著位置上,准确地检测和识别相位标志牌对输电线路巡检具有非常重要的实际意义。应用图像处理与模式识别技术,提出了一种相位标志牌的检测和识别方法。首先采用灰度化、中值滤波、膨胀和腐蚀的方法对相位标志牌图像进行预处理；然后采用基于区域一致性算子的显著性目标检测方法对预处理后的图像进行相位标志牌检测；最后采用基于仿射SIFT算子的匹配方法对检测到的相位标志牌进行识别。实验结果表明,所提出的方法能够有效地对相位标志牌进行检测和识别,具有较好的鲁棒性、准确性和有效性。

相位标志牌区域一致性仿射SIFT 目标检测目标识别 power phase sign region conformance ASIFT object detection object recognition

PDF全文 Full Text

光学技术

2015, 41(6): 537

图像与信息处理

基于形状保持主动轮廓的椭圆状目标检测

李小毛 ^1,2,*唐延东 ¹闵莉 ^1,2

作者单位

摘要

¹ 中国科学院沈阳自动化研究所机器人学国家重点实验室,沈阳 110016

² 中国科学院研究生院,北京 100039

本文通过形状约束方程(组)与一般主动轮廓模型结合,将目标形状与主动轮廓模型融合到统一能量泛函模型中,提出了一种形状保持主动轮廓模型即曲线在演化过程中保持为某一类特定形状。模型通过参数化水平集函数的零水平集控制演化曲线形状,不仅达到了分割即目标的目的,而且能够给出特定目标的定量描述。根据形状保持主动轮廓模型,建立了一个用于椭圆状目标检测的统一能量泛函模型,导出了相应的Euler-Lagrange常微分方程并用水平集方法实现了椭圆状目标检测。此模型可以应用于眼底乳头分割,虹膜检测及相机标定。实验结果表明,此模型不仅能够准确的检测出给定图像中的椭圆状目标,而且有很强的抗噪、抗变形及遮挡性能。

形状保持椭圆状目标主动轮廓 Chan-Vese模型水平集 shape preserving elliptic object active contour Chan-Vese model level set

PDF全文 Full Text

光电工程

2008, 35(2): 97

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索