光学 精密工程
2022, 30(20): 2501
为减少暴恐图像对社会发展和青少年成长造成的不利影响,本文提出一种基于集成分类的暴恐图像自动标注方法,辅助筛除网页中的暴恐信息。该方法将暴恐图像的标注视作多标签分类问题,利用迁移 学习训练多个子网络,然后通过集成学习对子网络的输出进行融合,同时在融合过程中针对各个标签在不同网络上的准确率进行权重分配,最后经过一系列矩阵运算得到图像的标注结果。实验结果表明,与传统机器 学习算法相比,本文方法在准确率和召回率上都有较大提升,并改善了样本不均衡所造成的不同标签类别上模型标注精确度差异较大的问题。
图像标注 多标签分类 集成学习 权重分配 样本不均衡 image annotation multi-label classification ensemble learning weight allocation label category imbalance 太赫兹科学与电子信息学报
2020, 18(2): 306
1 北京邮电大学 计算机学院, 北京 100876
2 北京邮电大学 数字媒体与设计艺术学院, 北京 100876
3 北京邮电大学 网络技术研究院, 北京100876
4 北京邮电大学 世纪学院, 北京 102101
针对当前图像多标签分类方法只关注图像本体类别信息(本体), 而忽略图像深层次语义信息(隐义)的问题, 本文提出了一种“本体-隐义”融合学习的图像多标签分类模型。该模型首先利用CNN中间层和较高层分别学习图像的本体信息和隐义信息, 然后利用本体信息与隐义信息之间的依赖关系设计了融合学习模型, 同时对提出模型的不同中间层特征和模型的不同结构进行了深入研究, 最终实现了对图像中多类别以及各类别蕴含的隐义信息分类。在传统民族服饰纹样图像数据集上进行实验, 得到图像本体多标签分类和隐义多标签分类的mAP分别为0.88和0.82; 在Scene数据集上进行对比实验, 本文模型在Hamming loss, One-error以及Average precision指标上分别优于其他最好方法0.103, 0091和0.083, 实验结果证明了本文方法的有效性和优越性。
多标签分类 融合学习 传统民族服饰 语义理解 multi-label classification fusion learning traditional national costumes semantic understanding
江南大学物联网工程学院, 无锡 江苏 214122
为降低图像文本数据的稀疏性和传统图像特征的局限性,提出一种融合卷积神经网络(CNN)和主题模型的图像标注算法。利用狄利克雷主题模型对图像训练集的文本数据进行建模,生成文本主题分布和文本主题标注词分布,以降低图像文本数据的维度和稀疏性。考虑到图像文本主题的稀疏分布,利用CNN提取图像的高层视觉特征,同时改进损失函数以重构CNN。利用图像的高层视觉特征和对应的多个文本主题构建多分类器,进行图像文本主题多标签分类学习,并获得图像的文本主题分布。最后,将该文本主题分布和主题模型生成的文本主题标注词分布融合计算出图像的标注词概率。由Corel5K和IAPR TC-12图像标注数据集的对比实验可知,本文方法有效提高了图像的标注性能。
图像处理 卷积神经网络 主题模型 图像标注 损失函数 多标签分类学习 激光与光电子学进展
2019, 56(20): 201004