首页 > 论文 > 激光与光电子学进展 > 56卷 > 20期(pp:201004)

融合卷积神经网络与主题模型的图像标注

张蕾   蔡明  
  • 摘要
  • 论文信息
  • 参考文献
  • 被引情况
分享:

摘要

为了降低图像文本数据的稀疏性和传统图像特征的局限性,提出了融合卷积神经网络和主题模型的图像标注。利用LDA主题模型对图像训练集的文本数据进行建模,生成文本主题分布和文本主题标注词分布,以此降低图像文本数据的维度和稀疏性。考虑到图像文本主题的稀疏分布,利用卷积神经网络提取图像的高层视觉特征,同时改进损失函数以重构卷积神经网络。利用图像的高层视觉特征和对应的多个文本主题构建多分类器,进行图像文本主题多标签分类学习。最后由改进的卷积神经网络计算出的文本主题分布与主题模型得到主题标注词分布共同计算图像的标注词概率。由Corel5K和IAPR TC-12图像标注数据集上的对比实验可知,文中方法有效提高了图像的标注性能。

Newport宣传-MKS新实验室计划
补充资料

DOI:10.3788/lop56.201004

作者单位:

    江南大学
    江南大学

引用该论文

张蕾,蔡. 融合卷积神经网络与主题模型的图像标注[J].激光与光电子学进展,2019,56(20):201004.