合肥工业大学计算机与信息学院,安徽 合肥 230009
目前行人重识别的研究只关注了可见光下跨摄像头提取图像不变的特征表示,忽视了红外条件下的成像特点,并结合两种模态的研究成果很少。此外,当前行人重识别在判别两个图像时,通常是计算单个卷积层特征图的相似性,这会导致弱特征学习现象。为了解决上述问题,本文提出了基于特征金字塔的随机融合网络,它可以同时计算多个特征层级的相似性,匹配图像时是基于多个语义层的判别因子。该模型关注到红外图像的特性,并且缩小了可见光和红外模态内部负作用的偏差,平衡了模态间的异质差距,综合了局部特征和全局特征学习的优势,有效地解决了跨模态行人重识别问题。实验在SYSU-MM01数据集上对平均精确度和收敛速度进行验证。结果表明,所提的模型优于现有的先进算法,特征金字塔随机融合网络实现了快速收敛且平均精确度达到了32.12%。
行人重识别 可见光 红外 特征金字塔 person re-identification visible infrared feature pyramid
1 中国科学院自适应光学重点实验室,四川 成都 610209
2 中国科学院光电技术研究所,四川 成都 610209
3 中国科学院大学,北京 100049
变形反射镜是自适应光学系统的核心部件,也是开展自适应光学技术研究的首要研究对象。本文首先介绍了中国科学院光电技术研究所从事自适应光学特别是变形反射镜技术研究的历史背景,简述了光电所变形反射镜技术早期的发展脉络。然后介绍了光电所研制的变形反射镜在我国历代惯性约束聚变系统中的应用情况,也介绍了在天文光学观测领域典型的多单元变形镜技术及应用成果,随后还介绍了应用于生物医学等领域的紧凑型变形反射镜的发展情况和研究现状。最后介绍了光电所在变形反射镜技术新方向的研究情况。
变形反射镜 自适应光学 波前 deformable mirror adaptive optics wavefront
合肥工业大学计算机与信息学院, 安徽合肥 230009
卷积神经网络在单帧图像超分辨率重建任务中取得了巨大成功, 但是其重建模型多是基于单链结构, 层间联系较弱且不能充分利用网络提取的分层特征。针对这些问题, 本文设计了一种多路径递归的网络结构 (MRCN)。通过使用多路径结构来加强层之间的联系, 实现特征的有效利用并且提取丰富的高频成分, 同时使用递归结构降低训练难度。此外, 通过引入特征融合的操作使得在重建的过程中可以充分利用各层提取的特征, 并且自适应的选择有效特征。在常用的基准测试集上进行了大量实验表明, MRCN比现有的方法在重建效果上具有明显提升。
卷积神经网络 超分辨 分层特征 多路径 特征融合 convolutional neural network super-resolution hierarchical features multi-path feature fusion
合肥工业大学计算机与信息学院,安徽 合肥 230009
卷积神经网络在单标签图像分类中表现出了良好的性能,但是,如何将其更好地应用到多标签图像分类仍然是一项重要的挑战。本文提出一种基于卷积神经网络并融合注意力机制和语义关联性的多标签图像分类方法。首先,利用卷积神经网络来提取特征;其次,利用注意力机制将数据集中的每个标签类别和输出特征图中的每个通道进行对应;最后,利用监督学习的方式学习通道之间的关联性,也就是学习标签之间的关联性。实验结果表明,本文方法可以有效地学习标签之间语义关联性,并提升多标签图像分类效果。
多标签图像分类 卷积神经网络 注意力机制 语义关联性 multi-label classification convolution neural network attention mechanism semantic dependencies
合肥工业大学计算机与信息学院,安徽 合肥 230601
现有的细粒度分类模型不仅利用图像的类别标签, 还使用大量人工标注的额外信息。为解决该问题, 本文提出一种深度迁移学习模型, 将大规模有标签细粒度数据集上学习到的图像特征有效地迁移至微型细粒度数据集中。首先, 通过衔接域定量计算域间任务的关联度。然后, 根据关联度选择适合目标域的迁移特征。最后, 使用细粒度数据集视图类标签进行辅助学习, 通过联合学习所有属性来获取更多的特征表示。实验表明, 本文方法不仅可以获得较高精度, 而且能够有效减少模型训练时间, 同时也验证了进行域间特征迁移可以加速网络学习与优化这一结论。
迁移学习 细粒度分类 深度学习 卷积神经网络 transfer learning fine-grained categorization deep learning convolutional neural network
合肥工业大学计算机与信息学院,安徽 合肥 230009
图像超分辨率重建是利用单幅或多幅降质的低分辨率图像重建得到高分辨率图像,以提高图像的视觉效果并获得更多可用的信息。本文提出结合图像特征聚类和协同表示的超分辨率重建方法。在训练阶段根据图像的特征信息对图像样本进行聚类并利用图像特征的差异性训练不同的字典,克服了传统训练单个字典方法对图像特征表示不足的缺点。而且利用协同表示方法求得不同聚类的高、低分辨率图像样本之间的映射矩阵,提高了图像重建速度。实验表明,本文方法与其他方法相比,不仅提高了重建图像的PSNR和SSIM指标,而且改善了视觉效果。
超分辨率重建 聚类 协同表示 映射矩阵 image super-resolution clustering collaborative representation projection matrices
合肥工业大学 计算机与信息学院,合肥 230009
针对现有镜头检测算法在处理运动信息时无法随着帧间差异不同而变化的问题,提出一种基于光流的镜头边界检测方法。依据光流算法对图像间熵计算进行校正,并提出一种光流量化方法。使用量化值与校正熵值判断图像连续性,保留存在镜头切换的候选边界;根据镜头构造的差异提取图像的光度信息与图像间互信息,并提出一种模型匹配的方式进行镜头类型识别。在互信息提取前对图像进行显著区域提取,来增加图像间的差异而保证模型匹配的准确性。实验表明,该检测算法能准确检测镜头边界且有效排除运动干扰。
镜头边界检测 光流 互信息 显著区域 shot boundary detection optical flow mutual information salient region