首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
近年来,基于bag-of-words模型的图像表示方法由于丢弃了视觉词汇之间的空间位置关系,且存在冗余信息,从而不能有效地表示该类图像。针对传统词袋模型视觉词汇之间相对位置关系利用不足,以及语义信息不明确的问题,提出采用基于支持区域的视觉短语来表示图像。通过支持区域探测得到图像中对分类起重要作用的支持区域,然后对支持区域上的视觉词进行空间建模得到视觉短语用于分类。最后在标准数据集UIUC-Sports8图像库和Scene-15图像库上进行对比实验,实验结果表明该算法具有良好的图像分类性能。  相似文献   

2.
针对词袋模型易受到无关的背景视觉噪音干扰的问题,提出了一种结合显著性检测与词袋模型的目标识别方法。首先,联合基于图论的视觉显著性算法与一种全分辨率视觉显著性算法,自适应地从原始图像中获取感兴趣区域。两种视觉显著性算法的联合可以提高获取的前景目标的完整性。然后,使用尺度不变特征变换描述子从感兴趣区域中提取特征向量,并通过密度峰值聚类算法对特征向量进行聚类,生成视觉字典直方图。最后,利用支持向量机对目标进行识别。在PASCAL VOC 2007和MSRC-21数据库上的实验结果表明,该方法相比同类方法可以有效地提高目标识别性能。  相似文献   

3.
传统词袋模型仅仅是将图像表示成视觉单词的直方图,并没有考虑到物体的形状信息,也没有考虑到视觉特征的空间信息.因此将金字塔模型引入到词袋模型中,建立金字塔词袋模型,将金字塔词袋模型与金字塔直方图模型相结合,两种信息相互补充,共同来表征图像;在分类器设计方面采用SVM进行分类.通过在Caltech 101数据库进行实验,验证了论文方法的有效性,实验结果表明,该方法能够大幅度提高图像分类的性能.  相似文献   

4.
陈鹏  邹涛 《计算机系统应用》2015,24(12):243-248
针对被动毫米波(PMMW)图像成像质量差,边界模糊,不易识别的特点,在传统词袋模型图像分类的基础上,提出了利用减法聚类改进FCM聚类算法并将其运用到词袋模型上去,提取视觉单词,利用局部不变量SIFT方法对手枪、匕首和炸药进行了粗分类.实验结果证明,改进的词袋模型能够准确的对违禁品进行分类,识别率平均能达到90%以上,性能优于传统的K均值聚类和原始的FCM聚类算法.  相似文献   

5.
视觉词袋(Visual Bag-of-Words)模型在图像分类、检索和识别等计算机视觉领域有了广泛的应用,但是视觉词袋模型中词汇数目往往是根据经验确定或者采用有监督的交叉学习选取。提出一种确定视觉词袋模型中词汇数目的无监督方法,利用模型选择的思想来解决问题。使用高斯混合模型描述具有不同词汇数目的视觉词袋,计算各模型贝叶斯信息准则的值,选取贝叶斯信息准则最小值对应的词汇数目。与交叉验证的监督学习在图像分类实验的对比结果说明该方法准确有效。  相似文献   

6.
三角形约束下的词袋模型图像分类方法   总被引:1,自引:0,他引:1  
汪荣贵  丁凯  杨娟  薛丽霞  张清杨 《软件学报》2017,28(7):1847-1861
视觉词袋模型广泛地应用于图像分类与图像检索等领域.在传统词袋模型中,视觉单词统计方法忽略了视觉词之间的空间信息以及分类对象形状信息,导致图像特征表示区分能力不足.本文提出了一种改进的视觉词袋方法,结合显著区域提取和视觉单词拓扑结构,不仅能够产生更具代表性的视觉单词,而且能够在一定程度上避免复杂背景信息和位置变化带来的干扰.首先,通过对训练图像进行显著区域提取,在得到的显著区域上构建视觉词袋模型.其次,为了更精确的描述图像的特征,抵抗多变的位置和背景信息的影响,该方法采用视觉单词拓扑结构策略和三角剖分方法,融入全局信息和局部信息.通过仿真实验,并与传统的词袋模型及其他模型进行比较,结果表明本文提出的方法获得了更高的分类准确率.  相似文献   

7.
文本的表示与文本的特征提取是文本分类需要解决的核心问题,基于此,提出了基于改进的连续词袋模型(CBOW)与ABiGRU的文本分类模型。该分类模型把改进的CBOW模型所训练的词向量作为词嵌入层,然后经过卷积神经网络的卷积层和池化层,以及结合了注意力(Attention)机制的双向门限循环单元(BiGRU)神经网络充分提取了文本的特征。将文本特征向量输入到softmax分类器进行分类。在三个语料集中进行的文本分类实验结果表明,相较于其他文本分类算法,提出的方法有更优越的性能。  相似文献   

8.
针对传统的人体动作识别分类器忽略时空特征存在的固有噪声和动作类的异常值而导致严重类失衡和类内差异的问题,提出一种基于能量的最小二乘双分界面支持向量机(ELS-TSVM)的人体动作识别算法。首先对于输入的视频使用梯度方向直方图特征和光流直方图特征识别人体动作;然后,检测可能的兴趣点,生成时空特征后提取时空视觉词袋特征,通过构建一组视觉词袋来完成特征提取;最后,利用ELS-TSVM完成分类。解决了SVM的类失衡和计算量高的问题。在Weizmann和Hollywood数据库上的实验验证了本文算法的有效性及可靠性,实验结果表明,相比其他几种较新的方法,本文算法更加高效精确,且大大减少了算法执行时间。  相似文献   

9.
用于图像场景分类的空间视觉词袋模型   总被引:3,自引:2,他引:1  
以传统的词袋模型为基础,根据同类场景图像具有空间相似性的特点,提出了一种用于图像场景分类的空间视觉词袋模型.首先将图像进行不同等级的空间划分,针对对应空问子区域进行特征提取和k均值聚类,形成该区域的视觉关键词,进而构建整个训练图像集的空间视觉词典.进行场景识别时,将所有空间子区域的视觉关键词连接成一个全局特征向量进行相...  相似文献   

10.
葛轶洲  姚泽  张歆  周青 《计算机仿真》2024,(2):13-16+33
水声目标识别技术在水下信息处理中起着非常重要的作用,从辐射噪声中提取水声目标的有效特征一直都是水声目标识别技术的难点所在。提出了一种利用水声目标辐射噪声的梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients, MFCC)作为目标特征提取的方法。通过对辐射噪声信号进行梅尔频率滤波得到目标噪声信号的MFCC特征,它模拟了人耳对不同频率的声音具有不同感知能力的听觉非线性效应,因此具有良好的识别效果。通过对实际水声目标的辐射噪声进行测试实验,提取目标噪声信号的MFCC特征向量,并运用K近邻算法对其进行分类识别,实验结果显示MFCC特征提取与分类识别算法对水声目标的识别率达到85%以上。  相似文献   

11.
海洋声场环境的时变空变特性、水声目标发声机理的多源性以及其他噪声源的干扰,给水声目标的检测和识别带来很多困难.常规的目标识别手段主要是基于音频时频域特征分析,在复杂海洋环境下的难以获取有效的表征特征及鲁棒的识别效果.为了解决这些问题,本文提出了基于迁移学习的水声目标识别,分别利用预训练网络VGG和VGGish提取深层声学特征及模型微调,实现水声目标的分类识别.实验表明,本文提出的识别算法有效提升了识别准确率,减少了训练时间,基于微调的迁移学习算法在水声目标识别上平均准确率为92.48%,取得了当前最好的识别结果.  相似文献   

12.
针对以传统的谱图和模型参教等方法提取得到的水下目标特征高维数据,文章提出了LPP的非线性降维方法,有效的去除特征向量各分量间的相关性,增大了特征向量的可分性,降低了后期识别的计算复杂度。同时设计了DS-SVM融合决策分类器对获得的低堆特征向量进行分类识别。与传统的SVM算法的分类识别效果进行比较分析,所得结果表明该方法有效的提高了水下目标识别的准确性,是一种行之有效的方法。  相似文献   

13.
针对现有词包模型对目标识别性能的不足,对特征提取、图像表示等方面进行改进以提高目标识别的准确率。首先,以密集提取关键点的方式取代SIFT关键点提取,减少了计算时间并最大程度地描述了图像底层信息。然后采用尺度不变特征变换(Scale-invariant feature transform, SIFT)描述符和统一模式的局部二值模式(Local binary pattern,LBP)描述符描述关键点周围的形状特征和纹理特征,引入K-Means聚类算法分别生成视觉词典,然后将局部描述符进行近似局部约束线性编码,并进行最大值特征汇聚。分别采用空间金字塔匹配生成具有空间信息的直方图,最后将金字塔直方图相串联,形成特征的图像级融合,并送入SVM进行分类识别。在公共数据库中进行实验,实验结果表明,本文所提方法能取得较高的目标识别准确率。  相似文献   

14.
船舶辐射噪声是非常复杂的,寻找新的特征是目前水下目标识别中的一项非常迫切而艰巨的任务。基于线性预测编码(LPC)原理提出了一种加权交叠平均的LPC谱估计算法,同时给出了支持向量机解决多类分类问题的一对多方法。利用得到的LPC谱特征矢量用支持向量机分类器和BP神经网络分类器对海上实测的三类目标噪声数据进行了分类识别,并与一般的LPC谱特征进行了对比。结果表明,加权交叠平均的LPC谱特征对三类目标的总体正确识别概率在95.02%以上,并且比一般的LPC谱特征具有更好的分类性能,支持向量机的分类性能也优于BP神经网络的分类性能。  相似文献   

15.
准确的模式识别要求提取出的特征尽可能反映分类本质的特征.本文利用同态分析理论对水下声信号进行预处理,从最终接收到经过噪声干扰的目标信号中复原出能反映目标传输特性的原始信号,并在此基础上对信号进行离散小波变换,提取小波变换系数在不同区间上的尺度—过零密度、尺度—平均幅度特征,最终利用组合核函数支持向量机对提取出的特征进行分类识别.实验表明,提取出的特征能反映目标类别特点,该方法能对水下目标进行有效的识别.  相似文献   

16.
为了有效地解决多示例图像自动分类问题,提出一种将多示例图像转化为包空间的单示例描述方法.该方法将图像视为包,图像中的区域视为包中的示例,根据具有相同视觉区域的样本都会聚集成一簇,用聚类算法为每类图像确定其特有的“视觉词汇”,并利用负包示例标注确定的这一信息指导典型“视觉词汇”的选择;然后根据得到的“视觉词汇”构造一个新的空间—包空间,利用基于视觉词汇定义的非线性函数将多个示例描述的图像映射到包空间的一个点,变为单示例描述;最后利用标准的支持向量机进行监督学习,实现图像自动分类.在Corel图像库的图像数据集上进行对比实验,实验结果表明该算法具有良好的图像分类性能.  相似文献   

17.
水声目标检测就是从水声取目标信息并进行识别,而有效的水声标检测在现代化的海洋开发中有着十分重要的作用;首先,介绍了水声目标检测所采用的设备,以及该设备的工作方式,并搭建试验场景进行水声回波的采集;其次,对水声标检测算法进行了研究,比对不同的滤波算法可知,中值滤波方法的去噪效果更佳;进行了灰度直方图分析,对目标的灰度范围进行了增强处理;对图像分割算法进行了研究,设计了一种自适应迭代分割算法,对比其他方法有着更好的处理效果;对分割后的图像进行连通域查找,目标筛选,从而识别出待检测目标;试验结果验证了该水声目标检测算法在对水下目标的检测识别上的有效性。  相似文献   

18.
水声信号识别近年来备受关注,由于海洋信道具有时变空变性、信号传播的衰落特性和水下目标声源具有复杂多变性,水声信号识别任务面临巨大挑战.传统的水声信号识别方法难以充分获取目标的表征信息且不具备良好的抗噪声能力,识别效果有待提升.针对上述问题,本文提出一种基于多分支外部注意力网络(multi-branch external attention network, MEANet)的水声信号识别方法,可以在复杂海洋环境下充分获取水声信号的特征并进行识别. MEANet由多分支主干网络,通道、空间注意力模块和外部注意力模块组成.首先,输入数据通过多个并行的主干网络分支,提取水声信号不同层级的特征信息;其次,辅以通道、空间注意力模块对水声信号的通道和空间维度分别进行加权,调节不同通道和空间位置对特征表示的重要性;最后,整合外部注意力模块,以外部记忆单元和附加计算来引导网络的特征提取和预测,从而显著提高模型的识别率和鲁棒性.实验结果表明,本文提出的MEANet在ShipsEar数据集上的水声信号识别率达到98.84%,显著优于其他对比算法,证实了其有效性.  相似文献   

19.
基于ICA和SVM的SAR图像特征提取与目标识别   总被引:6,自引:1,他引:5       下载免费PDF全文
宦若虹  杨汝良 《计算机工程》2008,34(13):24-25,2
提出一种利用独立分量分析和支持向量机的合成孔径雷达图像特征提取与目标识别方法。对图像小波分解后提取低频子带图像,对低频子带图像进行独立分量分析提取特征向量,利用支持向量机对特征向量分类完成目标识别。将该方法用于MSTAR数据中的3类目标识别,识别率最高可达96.92%。实验结果表明,该方法是一种有效的合成孔径雷达图像特征提取与目标识别方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号