首页 | 官方网站   微博 | 高级检索  
     

基于Transformer实现文本导向的图像编辑
引用本文:兰红,陈子怡,刘秦邑.基于Transformer实现文本导向的图像编辑[J].计算机应用研究,2022,39(5):1563-1568.
作者姓名:兰红  陈子怡  刘秦邑
作者单位:江西理工大学信息工程学院,江西赣州341000
基金项目:江西省研究生创新专项资金资助项目
摘    要:为方便非专业用户修图,提出一种基于Transformer的图像编辑模型TMGAN,使用户可通过自然语言描述自动修改图像属性。TMGAN整体框架采用生成对抗网络,生成器采用Transformer编码器结构提取全局上下文信息,解决生成图像不够真实的问题;判别器包含基于Transformer的多尺度判别器和词级判别器两部分,给生成器细粒度的反馈,生成符合文本描述的目标图像且保留原始图像中与文本描述无关的内容。实验表明,此模型在CUB Bird数据集上,IS(inception score)、FID(Fréchet inception distance)以及MP(manipulation precision)度量指标分别达到了9.07、8.64和0.081。提出的TMGAN模型对比现有模型效果更好,生成图像既满足了给定文本的属性要求又具有高语义性。

关 键 词:Transformer  图像编辑  自然语言  生成对抗网络
收稿时间:2021/10/13 0:00:00
修稿时间:2022/4/19 0:00:00

Text-guided image manipulation with transformer
Lan Hong,Chen Ziyi and Liu Qinyi.Text-guided image manipulation with transformer[J].Application Research of Computers,2022,39(5):1563-1568.
Authors:Lan Hong  Chen Ziyi and Liu Qinyi
Affiliation:Jiangxi University of Science and Technology,,
Abstract:
Keywords:Transformer  image manipulation  natural language  generative adversarial network
本文献已被 万方数据 等数据库收录!
点击此处可从《计算机应用研究》浏览原始摘要信息
点击此处可从《计算机应用研究》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号