首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 872 毫秒
1.
卷积神经网络(CNN)是当前图像识别领域的研究热点,利用预训练的CNN网络提取的图像特征展示出了较强的图像识别能力.主要对比分析了传统视觉特征和CNN视觉特征在基于内容图像检索任务中的性能表现,并指出了一些可以值得深入研究的方向.在两个公开数据库(Pascal Sentence和Pascal VOC 2007)的实验尝试表明CNN视觉特征比传统的视觉特征更适用于图像检索.  相似文献   

2.
针对基于内容的图像检索(CBIR)中图像底层视觉特征与高层语义特征之间存在的"语义鸿沟"问题,提出了一种基于卷积神经网络(CNN)特征和标签信息融合的图像检索算法。首先使用CNN模型提取图像的CNN特征以及标签信息,然后使用余弦距离分别计算这两个特征的相似度,最后将这两个相似度进行加权融合,用作图像检索排序准则。在caltech101和caltech256数据集上分别进行实验,实验结果表明,所提算法加强了图像特征与高层语义的结合,大大提高了图像检索的查准率。  相似文献   

3.
欧拉数是二值图像最重要的特征之一,在模式识别中常被用来作为一种重要的特征矢量.现实的计算机图像处理在计算复杂图像的欧拉数时遇到了一定的困难.因此介绍利用CNN处理器进行CNN通用编程,进行图像欧拉数的提取,既能利用CNN处理器的并行图像处理能力,又兼顾了传统计算机通用编程的灵活性.首先介绍CNN图像处理的原理,以及不同图像识别功能的各种算法元素,然后以图像的欧拉数计算为例说明CNN通用编程在图像识别中的应用.  相似文献   

4.
足迹图像作为犯罪现场的重要痕迹物证之一,在破解串并案上有着不可忽视的作用.传统的足迹图像检索与匹配,需要耗费大量的时间与人力,极大地影响了破案进展.卷积神经网络(CNN)在图像识别与检索上表现出很好的效果.面向公安足迹图像比对实战需求,提出了一种基于卷积神经网络的足迹图像检索与匹配方法,对检索结果设置不同检索区,可以满足不同业务需求.初步实验表明该方法的有效性和实用性.  相似文献   

5.
面向食品领域的图像检索和分类等方面的研究成为多媒体分析和应用领域越来越受关注的研究课题之一.当前的主要研究方法基于全图提取视觉特征,但由于食品图像背景噪音的存在使得提取的视觉特征不够鲁棒,进而影响食品图像检索和分类的性能.为此,本文提出了一种基于Faster R-CNN网络的食品图像检索和分类方法.首先通过Faster R-CNN检测图像中的候选食品区域,然后通过卷积神经网络(CNN)方法提取候选区域的视觉特征,避免了噪音的干扰使得提取的视觉特征更具有判别力.此外,选取来自视觉基因库中标注好的食品图像集微调Faster R-CNN网络,以保证Faster R-CNN食品区域检测的准确度.在包括233类菜品和49 168张食品图像的Dish-233数据集上进行实验.全面的实验评估表明:基于Faster R-CNN食品区域检测的视觉特征提取方法可以有效地提高食品图像检索和分类的性能.  相似文献   

6.
为了改善有限的现勘图像数据量在训练卷积神经网络(convolutional neural network,CNN)时易产生过拟合现象的情况,以及更精准地描述图像内容,提出了基于迁移学习的两种CNN特征级联以及与图像低层特征融合的现勘图像检索算法。首先利用目标图像集对两个预训练CNN模型进行微调,分别提取其fc7层的特征并级联作为图像的高层特征,再与适合本目标图像集的低层特征进行融合,以此作为特征进行图像检索。在现勘图像数据库上的测试结果验证了算法的有效性,并在GHIM-10K数据库进行测试,结果证明了算法的普适性。  相似文献   

7.
最新研究表明,互联网上存在的海量近似重复图像可以为解决一些传统上很困难的计算机视觉任务提供新的解决方案。介绍了4个主流的用来进行近似重复图像检索的方法:Hash码,Mean SSIM,SIFT视觉词袋模型(Bo VW)和属性关系图(ARG)。构建了一个包含24 762幅图像的与人物有关的图像数据集,观察数据确定了4种近似重复图像类型。利用该数据集通过实验定量评估了4种近似重复图像检索方法的运行效率和检索精度,最后推荐使用基于SIFT特征的视觉词袋方法来进行面向人物图像的近似重复Web图像检索。  相似文献   

8.
近年来,细粒度图像识别逐渐成为计算机视觉领域的研究热点.由于不同类别图像间的视觉差异小、语义鸿沟问题严重,传统的基于视觉特征的细粒度图像识别性能往往不尽人意.针对这些挑战,目前许多学者都在研究基于用户点击数据的图像识别.本文围绕点击数据在图像识别中数据预处理、特征提取和模型构建3大模块中的应用,总结了已有的基于点击数据的识别算法及最新的研究进展.  相似文献   

9.
针对真实场景下采集的人脸图像受环境、设备影响导致分辨率低且图像识别率较低的问题,应用深度学习技术,提出一种基于卷积神经网络(CNN)和主成分分析(PCA)的低分辨率人脸识别算法.首先利用图像超分辨率重构将低分辨率图像重建为高分辨率图像;其次利用CNN提取重建后人脸图像特征,对损失函数进行优化;再利用PCA对特征进行降维,得到更优的分类特征;最后利用支持向量机(SVM)、向量间距离等算法筛选出最优人脸分类并计算准确率.实验表明,该算法在LFW和FERET上均取得更好的识别效果,当人脸图像分辨率下降到8×8时,准确率仍能到达94.5%,优于其他算法并且降低了运算时间.  相似文献   

10.
针对基于目标的图像检索(OBIR)领域中,传统的视觉关键词方法忽略了局部特征之间的空间关系信息,导致检索准确度不高的问题,提出一种基于多重分割捆绑特征的目标图像检索方法.通过对图像进行多重分割,各分割区块用它所包含的尺度不变特征变换(SIFT)特征集合来描述,生成包含空间关系信息的捆绑特征;根据视觉关键词词库匹配捆绑特征,并提出一种改进的相似性度量方法计算捆绑特征相似度,再将该相似度作为权重融入到视觉关键词方法的向量空间模型中,计算图像相似度并进行排序.结果表明,该方法能够有效利用局部特征之间的空间关系信息,在保证检索效率的同时,显著提高检索准确度.  相似文献   

11.
基于支持向量机(SVM)的卷积神经网络(CNN)模型结合了大间隔原理,在图像识别中表现出了优异的泛化性能。然而,该方法忽视了一个关键:SVM的泛化性能不仅取决于不同类之间的间隔,还与所有样本的最小包含球(MEB)的半径有关。针对这一事实,文章提出一种基于半径间隔界(RMB)驱动的CNN模型的图像特征提取和识别的方法。与传统CNN模型相比,该模型采用基于SVM泛化误差界的策略来指导CNN深度模型学习和相应分类器构建,不仅考虑了不同类别之间的间隔,还考虑了MEB的半径。该模型能提高深度卷积模型的泛化能力而不会额外增加网络的复杂度,还能够应用于不同的深度模型中而不受限于某一特定的网络结构。在多个数据集上的实验结果表明,相比于基于Sofmax损失的CNN模型、基于中心损失的CNN模型以及基于 SVM 的 CNN 模型,该模型能够提取到鉴别性更强的图像特征,取得更高的识别率。  相似文献   

12.
为了检测输气管道阀门泄漏,对改进AlexNet网络结构进行了研究,提出了基于改进卷积神经网络(CNN)的阀门泄漏超声信号识别方法.针对泄漏信号短时稳定的窄带线谱特征,从图像邻域信息密度角度出发,将卷积核形状由图像识别领域通常使用的"正方形"改进为"扁横状".同时,对AlexNet层数进行优化,重新确定卷积核和全连接层神经元数目,并选择小尺寸卷积核,在减少参数量的同时增加网络容量和模型复杂度,防止模型出现过拟合.分别建立二分类和不同泄漏量下的多分类模型,通过输气管道实验平台采集阀门泄漏数据集,生成对应时频图样本,包括不同阀门开度、不同管道压力下的泄漏及背景声信号.结果表明,对比传统的CNN分类模型,改进CNN分类模型在测试集上取得了更高的识别性能.  相似文献   

13.
针对典型卷积神经网络卷积核由经验设置且网络结构固定不变难以后期再学习的问题,基于稀疏自编码器(Sparse Autoencoder, SAE)和卷积神经网络(Convoutional Neural Network, CNN),提出新的CNN模型。该模型通过SAE预训练CNN网络的卷积核,提取有效特征;并在典型CNN结构基础上增加一条网络支路,使得后续再学习时只更新支路权值,记忆已有特征并增加新特征。文中模型在MNIST数据集上迭代更新10次网络权值可以使测试识别率达到97.65%;在手写汉字数据集HCL2000中的简单字,中等字,复杂字及相似字上的测试正确率能达93%以上;50个训练样本,250个测试样本时,相似字识别率可达80.36%;比典型CNN及传统手写汉字识别方法更具泛化性。实验表明所提出方法可有效应用于手写字等图像识别应用中。  相似文献   

14.
为了改善作为低级表示的尺度不变特征变换(scale invariant feature transform, SIFT)匹配常出现的没有足够特征来防止假匹配的问题,提出在传统方法“词袋”(bag of features, BOF)算法中融合具有较好语义分割能力的卷积神经网络(convolution neural network, CNN)特征来提高识别率的方法。利用ImageCLEF网站的LifeCLEF鱼类视频,制作目标图像数据库。在caffe平台的Alexnet模型进行卷积神经网络的训练,提取图像库和查询图像的特征。利用训练好的CNN特征在Matlab软件进行识别试验验证,计算汉明距离来验证匹配效果。改变参数值来观察不同汉明距离阈值对水下目标识别结果的影响。自制图像库的试验表明,融合深度学习的特征可以有效提高BOF算法的水下目标识别率,对汉明距离阈值的选择需要根据实际情况选择合适的参数。  相似文献   

15.
针对传统卷积神经网络(CNN)模型构建过度依赖经验知识、参数多、训练难度大等缺点,同时鉴于复杂多类问题的CNN模型构建策略的重要价值,提出一种自适应深度CNN模型构建方法.首先,将初始网络模型的卷积层和池化层设置为仅含一幅特征图;然后,以网络收敛速度为评价指标,对网络进行全局扩展,全局扩展后,根据交叉验证样本识别率控制网络展开局部扩展,直到识别率达到预设期望值后停止局部网络学习;最后,针对新增训练样本,通过拓展新支路实现网络结构的自适应增量学习.通过图像识别实验验证了所提算法在网络训练时间和识别效果上的优越性.  相似文献   

16.
In order to accomplish the task of object recognition in natural scenes, a new object recognition algorithm based on an improved convolutional neural network (CNN) is proposed. First, candidate object windows are extracted from the original image. Then, candidate object windows are input into the improved CNN model to obtain deep features. Finally, the deep features are input into the Softmax and the confidence scores of classes are obtained. The candidate object window with the highest confidence score is selected as the object recognition result. Based on AlexNet, Inception V1 is introduced into the improved CNN and the fully connected layer is replaced by the average pooling layer, which widens the network and deepens the network at the same time. Experimental results show that the improved object recognition algorithm can obtain better recognition results in multiple natural scene images, and has a higher degree of accuracy than the classical algorithms in the field of object recognition.  相似文献   

17.
为了解决水下图像的雾模糊和偏色问题,针对水下图像成像模型提出基于生成式对抗网络(GAN)和改进卷积神经网络(CNN)的水下图像增强算法. 利用生成式对抗网络合成水下图像,以对配对式水下图像数据集进行有效扩充. 利用多级小波变换,以不丢失特征分辨率的方式对水下图像进行多尺度分解,然后结合卷积神经网络利用紧凑式学习方式对多尺度图像进行特征提取,并利用跳跃连接以防止梯度弥散,克服水下图像的雾模糊效应. 利用风格代价函数学习彩色图像各通道间的相关性,提高模型的色彩校正能力,克服水下图像色彩失真的问题. 实验结果表明,相较对比算法,在主观视觉和客观指标上,本研究所提算法拥有更优秀的综合性能及鲁棒性.  相似文献   

18.
为了探究图像底层视觉特征与高层语义概念存在的差异,提出可以确定图像关注重点、挖掘更高层语义信息以及完善描述句子的细节信息的图像语义描述算法. 在图像视觉特征提取时提取输入图像的全局-局部特征作为视觉信息输入,确定不同时刻对图像的关注点,对图像细节的描述更加完善;在解码时加入注意力机制对图像特征加权输入,可以自适应选择当前时刻输出的文本单词对视觉信息与语义信息的依赖权重,有效地提高对图像语义描述的性能. 实验结果表明,该方法相对于其他语义描述算法效果更有竞争力,可以更准确、更细致地识别图片中的物体,对输入图像进行更全面地描述;对于微小的物体的识别准确率更高.  相似文献   

19.
基于PReLUs-Softplus非线性激励函数的卷积神经网络   总被引:1,自引:0,他引:1  
针对卷积神经网络表达能力和识别效果受卷积层激励函数影响的问题,提出了一种新型非线性激励函数PRe LUs-Softplus,并将其应用于神经网络卷积层.对新型神经网络和采用传统激励函数的神经网络在MNIST和CIFAR-10标准数据库上进行了图像识别对比实验,结果表明,相比于采用传统激励函数的神经网络,使用PRe LUs-Softplus激励函数的卷积神经网络在不同的池化方式下图像识别计算收敛速度更快,显著降低了识别的错误率.  相似文献   

20.
为了提升交通标志自动识别的精度,提出一种基于多尺度CNN的交通标志识别方法(TSR -MSCNN算法).该方法采用三阶段卷积神经网络,融合了低阶、中阶和高阶3种不同尺度的特征,并串联了多个小卷积层用以代替单个较大卷积层.通过对全连接层的神经元个数、Dropout参数、卷积核尺寸等网络超参数进行选比实验,获得了最佳的网络超参数.利用德国交通标志基准数据库(GTSRB)对不同算法进行测试表明,本文提出的算法在较小的网络参数量下能够有效提取交通标志特征,获取的识别准确率达到99.76%,且显著优于传统卷积神经网络方法和多尺度特征方法的识别准确率,因此本文算法在图像识别领域有良好的应用价值.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号