广东工业大学 信息工程学院, 广东 广州 510006
针对现有医学图像分割模型存在着计算复杂度较高、参数量大,难以部署到实时医疗辅助诊断系统中,而现有的轻量化模型存在参数减小后导致分割性能下降等问题,提出了一种基于改进的轻量化U-Net分割模型。该模型由编码器、解码器和跳连接三个主要部分组成。编码器使用了由标准卷积和深度可分离卷积组合形成的多尺度融合模块,在此基础上,为增强神经网络学习能力,引入了瓶颈层结构,使用聚合方法设计出轻量级的跨级部分网络模块作为特征提取器对输入的图像进行特征提取; 在解码器中继续使用了该轻量级模块来进一步优化模型,降低模型的计算复杂度以及减少参数量,同时能够产生更好分割效果; 通过跳连接的方式实现编码器与解码器之间不同分辨率的特征信息融合。在腹部器官CHAOS和胸腔Chest X-ray数据集上进行实验,结果表明,改进型U-Net分割模型的参数量以及计算复杂度都得到了不同程度的降低,在模型参数量仅为1.28M的情况下,DSC分别为87.53%和95.85%,IOU分别为85.25%和92.21%,取得了不弱于其他网络的分割性能。
深度学习 医学图像分割 U-Net模型 轻量化 deep learning medical image segmentation U-Net model lightweight
江苏商贸职业学院 电子与信息学院, 江苏 南通 226011
针对红外夜视遥感系统成像质量差的问题, 提出一种目标与背景分离的多模态图像融合方法来改善红外夜视的成像质量。一方面, 采用注意力U-Net对红外与可见光图像的目标区域进行分割与融合处理, 利用U-Net强大的学习能力充分保留原图像中的目标信息; 另一方面, 通过引导滤波器对红外与可见光图像的背景区域进行分解, 采取不同的融合策略处理基层信息与细节层信息, 增强背景中的显著区域。在TNO数据集上的对比实验结果表明, 该方法在主观视觉评价与客观量化评价两方面均优于其它对比方法。
红外夜视系统 图像融合 图像质量增强 深度神经网络 引导滤波器 infrared night vision system image fusion image quality enhancement deep neural networks guided filter
1 安徽工程大学 人工智能学院, 安徽 芜湖 241000
2 安徽工程大学 机械工程学院, 安徽 芜湖 241000
图像质量评价方法是为了符合主观视觉图像质量评分结果, 设计出的客观计算方法。在本研究中, 提出了一种基于CIELAB颜色空间局部色貌指标(clarity)的无参考彩色模糊图像评价(NR-IQA)方法。在所提方法中, 结合最大局部clarity和变异局部clarity评价图像模糊等级。最大局部clarity表征提取模糊图像最锐度信息, 即局部模糊特征; 变异局部clarity表示图像内部色貌整体变化情况, 即全局模糊特征。为了验证该方法的性能, 使用五个常用图像质量数据库中的失真图像进行对比测试, 从预测精度、计算复杂度和泛化性进行分析。结果表明, SROCC和PLCC加权平均值分别是0.9345和0.9379, SROCC和PLCC直接平均值分别是0.9331和0.9357, 综合性能优于其他典型和最新提出的NR-IQA方法。研究结果表明, 所提方法是有效的、可行的, 是一个综合性能优异的NR-IQA方法。
图像质量评价 无参考 局部色貌 彩色模糊图像 image quality assessment no reference local color appearance color blurred image
北京理工大学 集成电路与电子学院, 北京 100081
为了提升行人重识别算法的检索准确率, 提出了基于软掩膜前景分割和多信息融合重排序的行人重识别算法。通过基于U-Net的软掩膜前景分割算法去除图像背景信息, 同时减缓图像分割边界的突变, 以保留图像中行人的关键信息; 通过基于孪生深度网络的多信息融合重排序算法融合行人图像的多种信息, 提升检索结果质量。实验结果表明, 提出的两种方法是对行人重识别算法流程的有效补充, 可作为提升准确率的有效方法应用于多数现有行人重识别算法中。
行人重识别 视频监控 前景分割 重排序 person re-identification video surveillance foreground segmentation re-ranking
1 江西旅游商贸职业学院 艺术传媒与计算机学院, 南昌 330100
2 江西现代职业技术学院 信息工程学院, 南昌 330095
鉴于现有的红外图像增强方法存在欠增强、过增强和放大噪声等缺陷, 提出了自适应加权直方图均衡化的红外图像增强方法。该方法提出了直方图的自适应加权系数, 其反比于每个灰度级对应直方图频次的平方根, 适当地提升频次较小的直方图, 而适当压制频次较大的直方图。用自适应加权系数对各个灰度级的直方图频次进行加权后, 进行直方图均衡化处理, 最后经灰度级映射得到增强图像。实验结果显示, 相对于现有的方法, 本方法的增强图像对比度更高, 边缘细节信息更丰富, 信息熵、平均梯度和标准差分别比现有方法高出0.23、2.2和3.7以上。因此, 本文方法的红外图像增强效果优于最新提出的现有方法。
红外图像增强 直方图均衡化 自适应加权数 信息熵 infrared image enhancement histogram equalization adaptive weighting coefficient information entropy
1 合肥学院 先进制造工程学院, 安徽 合肥 230601
2 中科院合肥物质科学研究院智能机械研究所, 安徽 合肥 230031
针对普通卷积神经网络在遥感图像分割中林地边界区域识别不完整、小片林地分割精度低的问题,提出一种基于transformer与注意力机制的DeeplabV3+网络改进方法。在编码阶段引入transformer机制,将原池化金字塔部分中的空洞卷积操作替换为可获取更多上下文信息的transformer操作,从而提高网络对林地边界信息的提取能力; 将注意力机制引入到网络的解码部分,提升模型对小片林地的检测能力。实验表明,采用改进后的方法平均交并比(MIou)可达到81.83%,对比原DeepLabV3+网络模型提升了1.25%。该方法充分考虑了卫星遥感图像分割中林地边缘信息的提取以及对小目标的关注度,提出的改进方法可提升遥感图像中对林地提取的精度。
遥感图像 注意力机制 语义分割 remote sensing image DeepLabV3+ DeepLabV3+ Transformer transformer attention mechanism semantic segmentation
1 北京理工大学 光电学院 精密光电测试仪器及技术北京市重点实验室, 北京 100081
2 长春理工大学 光电工程学院, 长春 130022
3 湖南师范大学 工程与设计学院, 长沙 410082
基于互信息的视觉伺服使用图像全局信息来实现伺服控制, 避免了对传统几何特征的提取、匹配和跟踪, 并且对光照变化、部分遮挡具有鲁棒性, 但由于其任务函数的高非线性, 该方法具有收敛域较小的缺点。提出了基于主成分分析(PCA)重建图像的互信息视觉伺服方法, 有效降低了任务函数的非线性。通过实验比较了基于PCA重建图像的互信息视觉伺服和基于原始图像的互信息视觉伺服收敛域大小及收敛速度, 并考虑了PCA中主成分个数的影响, 结果表明基于PCA重建图像的互信息视觉伺服有效地扩大了互信息视觉伺服的收敛域, 且具有更快的收敛速度。
主成分分析 互信息 视觉伺服 收敛域 principal component analysis mutual information visual servo convergence region
1 广东技术师范大学天河学院 计算机科学与工程学院, 广东 广州 510540
2 华南农业大学 电子工程学院, 广东 广州 510642
3 暨南大学 管理学院, 广东 广州 510000
为了有效降低计算的复杂度并保证压缩质量, 提出了一种基于可分二维马尔可夫过程全局模型的单模低复杂度图像压缩方法。在假定的全局图像模型上寻求最优的空间预测, 其模型构建主要采用了可分二维马尔可夫过程; 对预测残差块进行变换编码进一步消除空间冗余。方法与视频编码中的帧内编码类似, 但仅使用一种空间预测模式(单模)以便有效降低算法的复杂度。实验结果表明, 与相似的低复杂度单模图像编码器相比, 单模方法在平均编码/解码时间不变的情况下, 平均比特率(BD-BR)有所改善(约12%), 且在低比特率下没有产生明显的方块效应, 证明了方法的有效性。
图像压缩 马尔可夫过程 离散余弦变换 全局图像模型 空间预测 image compression Markov process discrete cosine transform global image model spatial prediction
1 河北公安警察职业学院 警务科研处, 河北 石家庄 050091
2 河北师范大学 计算机与网络空间安全学院, 河北 石家庄 050024)
3 河北师范大学 河北省网络与信息安全重点实验室, 河北 石家庄 050024)
4 河北师范大学 河北省供应链大数据分析与数据安全工程研究中心, 河北 石家庄 050024
传统表情识别技术采用单一类型的特征表示方法, 由于每个特征类型对不同数据集的表示效果存在差异, 导致传统技术对不同数据集的表情识别效果也存在较大的差异。设计一种多类型混合特征的选择方案,用以提高不同数据集的表情识别准确率。将面部不同区域、不同类型的特征集作为基础特征集, 利用重引力搜索算法从基础特征集中选择优化的特征子集。将优化的特征子集输入深度信念网络进行训练和半监督学习, 采用训练的网络模型对表情进行识别。实验结果表明,在不同数据集条件下, 采用该方法均能够保持较高的识别准确率。
深度学习 深度神经网络 重引力搜索算法 表情识别 特征选择 表达式目录树 deep learning deep neural networks gravity search algorithm expression recognition feature selection expression tree
1 武汉学院 信息工程学院, 湖北 武汉 430212
2 中南财经政法大学 工商管理学院, 湖北 武汉 430212
当前较多图像篡改检测算法主要是依靠测量图像间的距离来匹配像素特征, 以此来实现图像的篡改检测, 但其没有考虑图像特征间显著特征的关联性, 导致检测结果存在误检等弊端。为此, 设计了灰度差异耦合显著特征的图像复制-粘贴篡改检测算法。首先, 借助Harris算子, 从待检测图像中提取初始特征, 并利用像素点间的灰度差异信息, 删除伪特征, 以得到准确度较高的图像特征。然后, 将Haar小波作为求取图像特征方向信息的依据, 利用图像锐度信息, 获取特征向量。采用傅里叶变换来计算图像特征的显著信息, 利用其对图像特征实施匹配。最后, 对匹配图像特征进行聚类计算, 以辨别出图像中的篡改内容。实验数据表明, 较当前伪造检测算法而言, 所提算法不仅具有更少的错误检测内容, 而且拥有更强的健壮性, 能抵御多种仿射变换对篡改检测的干扰。
图像篡改检测 Harris算子 图像特征 锐度信息 显著特征 灰度差异信息 image copy-paste tampering detection harris operator image feature sharpness information salient feature gray difference information