基于CNN-RNN深度学习的图片描述方法与优化期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于CNN-RNN深度学习的图片描述方法与优化

作者姓名：	陈虹君罗福强赵力衡张杰李瑶

作者单位：	四川大学锦城学院电子信息学院;四川大学图像研究所

摘要：	为了提高模型的泛化能力,将机器翻译的编-解码模型引入图片描述中.首先,提出了CNN-RNN模型:CNN负责编码,RNN负责解码,RNN模型采用LSTM网络.接着,考虑到该模型一定程度上忽略了图片的局部区域特征和图片语义信息,因此又提出改进的CNN-MIL-DRN模型.该模型考虑了属性概率向量,并将多个时刻状态堆叠在一个时刻的计算中,加深了非线性变换的复杂深度.最后,采用MS COCO C5进行模型测试,以AP及5个不用的阈值测试不同指标,同时选取一些目前较新的模型作对比,从而得到CNN-MIL-DRN模型的最优效果.
关键词：	神经网络 CNN RNN MIL LSTM DRN
本文献已被 CNKI 等数据库收录！
	点击此处可从《湘潭大学自然科学学报》浏览原始摘要信息
	点击此处可从《湘潭大学自然科学学报》下载全文