基于Transformer实现文本导向的图像编辑 Text-guided image manipulation with transformer期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于Transformer实现文本导向的图像编辑

引用本文：	兰红,陈子怡,刘秦邑.基于Transformer实现文本导向的图像编辑[J].计算机应用研究,2022,39(5):1563-1568.

作者姓名：	兰红陈子怡刘秦邑

作者单位：	江西理工大学信息工程学院,江西赣州341000

基金项目：	江西省研究生创新专项资金资助项目

摘要：	为方便非专业用户修图，提出一种基于Transformer的图像编辑模型TMGAN，使用户可通过自然语言描述自动修改图像属性。TMGAN整体框架采用生成对抗网络，生成器采用Transformer编码器结构提取全局上下文信息，解决生成图像不够真实的问题；判别器包含基于Transformer的多尺度判别器和词级判别器两部分，给生成器细粒度的反馈，生成符合文本描述的目标图像且保留原始图像中与文本描述无关的内容。实验表明，此模型在CUB Bird数据集上，IS（inception score）、FID（Fréchet inception distance）以及MP（manipulation precision）度量指标分别达到了9.07、8.64和0.081。提出的TMGAN模型对比现有模型效果更好，生成图像既满足了给定文本的属性要求又具有高语义性。
关键词：	Transformer 图像编辑自然语言生成对抗网络
收稿时间：	2021/10/13 0:00:00
修稿时间：	2022/4/19 0:00:00
Text-guided image manipulation with transformer

Lan Hong,Chen Ziyi and Liu Qinyi.Text-guided image manipulation with transformer[J].Application Research of Computers,2022,39(5):1563-1568.

Authors:	Lan Hong Chen Ziyi and Liu Qinyi

Affiliation:	Jiangxi University of Science and Technology,,

Abstract:

Keywords:	Transformer image manipulation natural language generative adversarial network
本文献已被万方数据等数据库收录！
	点击此处可从《计算机应用研究》浏览原始摘要信息
	点击此处可从《计算机应用研究》下载全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏