首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
三角形约束下的词袋模型图像分类方法   总被引:1,自引:0,他引:1  
汪荣贵  丁凯  杨娟  薛丽霞  张清杨 《软件学报》2017,28(7):1847-1861
视觉词袋模型广泛地应用于图像分类与图像检索等领域.在传统词袋模型中,视觉单词统计方法忽略了视觉词之间的空间信息以及分类对象形状信息,导致图像特征表示区分能力不足.本文提出了一种改进的视觉词袋方法,结合显著区域提取和视觉单词拓扑结构,不仅能够产生更具代表性的视觉单词,而且能够在一定程度上避免复杂背景信息和位置变化带来的干扰.首先,通过对训练图像进行显著区域提取,在得到的显著区域上构建视觉词袋模型.其次,为了更精确的描述图像的特征,抵抗多变的位置和背景信息的影响,该方法采用视觉单词拓扑结构策略和三角剖分方法,融入全局信息和局部信息.通过仿真实验,并与传统的词袋模型及其他模型进行比较,结果表明本文提出的方法获得了更高的分类准确率.  相似文献   

2.
针对传统视觉词袋(Bag Of Visual Words,BOVW)模型缺少空间信息,且不能充分表达图像所属类别共有特征的问题,提出一种基于最大频繁项集的视觉词袋表示方法。该方法在排除孤立特征点的基础上,引入环形区域划分的思想,嵌入更多的空间信息。通过对不同环的视觉单词进行频繁项挖掘得到新的视觉单词表示,能有效提高同类别图像视觉单词的相似程度,而使不同类别视觉单词的差异更为显著。通过在图像数据集COREL及Caltech-256上进行分类实验,验证了该方法的有效性和可行性。  相似文献   

3.
词包模型中视觉单词歧义性分析   总被引:4,自引:0,他引:4       下载免费PDF全文
刘扬闻  霍宏  方涛 《计算机工程》2011,37(19):204-206,209
传统词包(BOW)模型中的视觉单词是通过无监督聚类图像块的特征向量得到的,没有考虑视觉单词的语义信息和语义性质。为解决该问题,提出一种基于文本分类的视觉单词歧义性分析方法。利用传统BOW模型生成初始视觉单词词汇表,使用文档频率、χ2分布和信息增益这3种文本分类方法分析单词语义性质,剔除具有低类别信息的歧义性单词,并采用支持向量机分类器实现图像分类。实验结果表明,该方法具有较高的分类精度。  相似文献   

4.
以概率图模型为基础,提出一种基于作者主题模型ATM(Author Topic Model)的多光谱遥感图像类别标注方法。该方法采用了一种新的基于颜色和形状特征的描述符,并结合ATM对遥感图像进行类别标注。首先采用一组定义了语义鸿沟的图像作为训练图像,然后采用基于颜色和形状特征的视觉单词描绘训练图像,最后结合ATM对遥感图像进行类别标注。通过对实际的遥感图像进行类别标注验证,可以看出,所提出的基于ATM的遥感图像标注方法在区域类别较少的情况下具有较高的分类准确率。  相似文献   

5.
一种用于图像分类的多视觉短语学习方法   总被引:2,自引:0,他引:2  
针对词袋图像表示模型的语义区分性和描述能力有限的问题,以及由于传统的基于词袋模型的分类方法性能容易受到图像中背景、遮挡等因素影响的问题,本文提出了一种用于图像分类的多视觉短语学习方法.通过构建具有语义区分性和空间相关性的视觉短语取代视觉单词,以改善图像的词袋模型表示的准确性.在此基础上,结合多示例学习思想,提出一种多视觉短语学习方法,使最终的分类模型能反映图像类别的区域特性.在一些标准测试集合如Calrech-101[1]和Scene-15[2]上的实验结果验证了本文所提方法的有效性,分类性能分别相对提高了约9%和7%.  相似文献   

6.
张永  杨浩 《计算机应用》2017,37(8):2244-2247
针对视觉词袋(BOV)模型中过大的视觉词典会导致图像分类时间代价过大的问题,提出一种加权最大相关最小相似(W-MR-MS)视觉词典优化准则。首先,提取图像的尺度不变特征转换(SIFT)特征,并用K-Means算法对特征聚类生成原始视觉词典;然后,分别计算视觉单词与图像类别间的相关性,以及各视觉单词间的语义相似性,引入一个加权系数权衡两者对图像分类的重要程度;最后,基于权衡结果,删除视觉词典中与图像类别相关性弱、与视觉单词间语义相似性大的视觉单词,从而达到优化视觉词典的目的。实验结果表明,在视觉词典规模相同的情况下,所提方法的图像分类精度比传统基于K-Means算法的图像分类精度提高了5.30%;当图像分类精度相同的情况下,所提方法的时间代价比传统K-Means算法下的时间代价降低了32.18%,因此,所提方法具有较高的分类效率,适用于图像分类。  相似文献   

7.
图像标题生成利用机器自动产生描述图像的句子,属于计算机视觉与自然语言处理的交叉领域.传统基于注意力机制的算法侧重特征图不同区域,忽略特征图通道,易造成注意偏差.该模型通过当前嵌入单词与隐藏层状态的耦合度来赋予特征图不同通道相应权重,并将其与传统方法结合为融合注意力机制,准确定位注意位置.实验结果均在指定的评估方法上有一定的提升,表明该模型可以生成更加流利准确的自然语句.  相似文献   

8.
近年来,基于bag-of-words模型的图像表示方法由于丢弃了视觉词汇之间的空间位置关系,且存在冗余信息,从而不能有效地表示该类图像。针对传统词袋模型视觉词汇之间相对位置关系利用不足,以及语义信息不明确的问题,提出采用基于支持区域的视觉短语来表示图像。通过支持区域探测得到图像中对分类起重要作用的支持区域,然后对支持区域上的视觉词进行空间建模得到视觉短语用于分类。最后在标准数据集UIUC-Sports8图像库和Scene-15图像库上进行对比实验,实验结果表明该算法具有良好的图像分类性能。  相似文献   

9.
基于视觉显著性检测的图像分类方法   总被引:1,自引:0,他引:1  
针对传统的图像分类方法对整个图像不分等级处理以及缺乏高层认知的问题,提出了一种基于显著性检测的图像分类方法。首先,利用视觉注意模型进行显著性检测,得到图像的显著区域;然后,利用Gabor滤波方法和脉冲耦合神经网络模型,分别提取该显著区域的纹理特征和时间签名特征;最后,根据提取的纹理特征和时间签名特征,利用支持向量机实现图像分类。实验结果表明,所提方法在SIMPLIcity图像数据集上平均分类正确率达到94.26%,在Caltech数据集上平均分类正确率为95.43%,从而证明,显著性检测与有效的特征提取对图像分类有重要影响。  相似文献   

10.
针对先前的立体图像显著性检测模型未充分考虑立体视觉舒适度和视差图分布特征对显著区域检测的影响,提出了一种结合立体视觉舒适度因子的显著性计算模型.该模型在彩色图像显著性提取中,首先利用SLIC算法对输入图像进行超像素分割,随后进行颜色相似区域合并后再进行二维图像显著性计算;在深度显著性计算中,首先对视差图进行预处理;然后基于区域对比度进行显著性计算;最后,结合立体视觉舒适度因子对二维显著图和深度显著图进行融合,得到立体图像显著图.在不同类型立体图像上的实验结果表明,该模型获得了85%的准确率和78%的召回率,优于现有常用的显著性检测模型,并与人眼立体视觉注意力机制保持良好的一致性.  相似文献   

11.
利用分块相似系数构造感知图像Hash   总被引:1,自引:0,他引:1  
提出一种基于图像分块相似系数的感知稳健图像Hash.先对图像预处理,再进行重叠分块,在密钥控制下,利用高斯低通滤波器生成伪随机参考图像块,分别计算每个分块与参考图像块的相关系数得到图像特征序列.依此将相邻两个分块特征值合并以缩短Hash长度,同时对压缩后的特征序列进行重排,进一步提高图像Hash的安全性.最后对归一化特征值进行量化,并运用Huffman方法对其编码,进一步压缩Hash长度.理论分析和实验结果表明,该图像Hash方法对JPEG压缩、适度的噪声干扰、水印嵌入、图像缩放以及高斯低通滤波等常见图像处理有较好的鲁棒性,能有效区分不同图像,冲突概率低,可用于图像篡改检测.  相似文献   

12.
针对现有X线图像拼接方法中分别存在的需要固定标志物、鲁棒性差及全景图像存在伪影等问题,提出一种旋转不变的图像自动拼接方法.基于特征点配准,结合改进的、旋转不变的相关度法进行特征匹配,对图像重合度要求较低.在图像融合中则采用2维动态权值和平衡曝光度等策略.经实验验证,本文配准算法在保证结果准确性的同时提高了鲁棒性;本文融合算法可有效地平衡曝光度差异,并避免拼接伪影,极大地提高了全景图像质量.  相似文献   

13.
图像拼接技术综述*   总被引:10,自引:2,他引:8  
给出了图像拼接的一般流程,在此基础上将图像拼接技术分为两个关键技术——图像配准技术和图像融合技术,并分别对图像配准技术和图像融合技术的经典算法及最新算法作一概述和比较。  相似文献   

14.
提出一种对鱼眼图像进行校正和配准的算法。首先把鱼眼图像从相等距离投影模型映射到参数化球面投影模型,使得合成球面全景图成为一个平移求解问题。然后使用非线性优化算法进行图像的配准。在合成场景的球面全景图以后,通过重投影球面全景图到视平面来完成虚拟场景的实时漫游。  相似文献   

15.
汉字从创始至今走过了漫长的历史,它是目前世界上仅存的表意形文字。汉字在造字思维上注重形意结合——以意造形、以形表意,这种思维贯穿了我们的历史和文化。文章以汉字的造字思维为切入点,重点分析了汉字中的意象思维及其在插画中的应用,这种意象思维为我们提供了极为广阔的创作空间。  相似文献   

16.
图像拼接方法探讨   总被引:12,自引:2,他引:12  
本文系统的阐述了图像拼接技术的由来、现状,应用领域以及拼接方法,对图像拼接的两个主要过程:图像配准和图像融合分别进行了详细介绍.图像配准是图像拼接的核心技术,本文还对现有的图像配准方法进行归类总结,对每个配准算法进行优缺点描述。对目前现有以及常用的图像融合方法也进行了详细的介绍。最后提出了图像拼接技术的不足.  相似文献   

17.
图像镶嵌技术是近年来发展迅速的图像处理技术之一,是计算机视觉领域和计算机图形学领域都十分关注的研究热点之一。通过对现有遥感图像镶嵌方法的研究,时其进行了归纳和总结,并介绍了几种常见的图像镶嵌关键技术。  相似文献   

18.
本文简述了红外与可见光图像融合的意义及其应用,介绍了多种红外与可见光序列图像融合方法。在对这些融合方法进行比较分析的基础上,总结了红外与可见光序列图像融合的研究现状、当前研究热点及未来的发展趋势。  相似文献   

19.
车辆运动模糊图像的快速恢复   总被引:2,自引:0,他引:2  
论文针对运动造成的模糊图像,根据运动造成的图像模糊的特点,建立了原始图像与模糊图像间的关系,在此基础上提出了一种运动模糊图像的快速恢复算法,并用于车辆运动模糊车牌图像恢复中。实验结果验证了该方法的有效性。  相似文献   

20.
探讨数字化图像监视和记录系统的构建与程序设计技术,通过详细的程序设计实例, 讲述用图像摄取控件高效设计硬盘录像系统的程序设计技巧.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号