网络首发

激光与光电子学进展
ESCI,SCOPUS,CJCR,CSCD,北图
2021年第58卷第04期12页
一种结合场景描述的文本生成图像方法
录用时间:2020-08-07
论文栏目
10
作者单位
1 江西理工大学
论文摘要
本文研究基于场景描述文本生成对应图像的方法,针对生成图像常常出现的对象重叠和缺失问题,提出了一种结合场景描述的生成对抗网络模型。首先,利用掩模生成网络对数据集进行预处理,为数据集中的对象提供分割掩模向量。然后,将生成的对象分割掩模向量作为约束,通过描述文本训练布局预测网络,得到各个对象在场景布局中的具体位置和大小,送入级联细化网络模型,完成图像的生成;最后,将场景布局与图像共同引入到布局鉴别器中,弥合场景布局与图像之间的差距,得到更加真实的场景布局。实验结果表明,本文设计的模型能够生成与文本描述更匹配的图像,图像更加自然,同时有效地提高了生成图像的真实性和多样性。
引用本文
黄友文, 周斌, 唐欣. 一种结合场景描述的文本生成图像方法[J]. 激光与光电子学进展, 2021, 58(04): 12. 
DOI:10.3788/lop58.041012
PDF 全文:点击此处查看 

关于本站 Cookie 的使用提示

中国光学期刊网使用基于 cookie 的技术来更好地为您提供各项服务,点击此处了解我们的隐私策略。 如您需继续使用本网站,请您授权我们使用本地 cookie 来保存部分信息。
全站搜索
您最值得信赖的光电行业旗舰网络服务平台!