首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
莫宏伟  田朋 《控制与决策》2021,36(12):2881-2890
视觉场景理解包括检测和识别物体、推理被检测物体之间的视觉关系以及使用语句描述图像区域.为了实现对场景图像更全面、更准确的理解,将物体检测、视觉关系检测和图像描述视为场景理解中3种不同语义层次的视觉任务,提出一种基于多层语义特征的图像理解模型,并将这3种不同语义层进行相互连接以共同解决场景理解任务.该模型通过一个信息传递图将物体、关系短语和图像描述的语义特征同时进行迭代和更新,更新后的语义特征被用于分类物体和视觉关系、生成场景图和描述,并引入融合注意力机制以提升描述的准确性.在视觉基因组和COCO数据集上的实验结果表明,所提出的方法在场景图生成和图像描述任务上拥有比现有方法更好的性能.  相似文献   

2.
一种基于遗传算法的图像FCM分割方法   总被引:4,自引:0,他引:4  
图像分割对于图像分析和图像理解有着极为重要的意义。提出一个基于遗传算法的图像分割算法,在充分利用遗传算法优异的全局搜索能力的基础上,该算法根据图像的灰度分布按照模糊聚类的分割策略实现图像的分割,并且根据预应力的隶属度阈值自动地确定聚类数目。理论分析和实验表明,所提出的算法能产生很好的分割效果,并能自动确定分割类数。  相似文献   

3.
一种新的基于区域的图像检索方法   总被引:2,自引:0,他引:2  
论文提出了一种新的基于区域的图像检索方法。与传统的基于区域的检索方法相比,论文从组成目标对象的基本结构角度出发分割图像,利用少量色彩等级更易描述对象主要构成的特性提取一组能够描述对象基本组成的区域序列。采用这些区域列的面积作为图像特征,用于图像检索。实验表明,该算法简单但非常有效,而且对图像的旋转、尺度变化具有良好的鲁棒性。  相似文献   

4.
提出了一种基于显著区域的图像分割方法.该方法首先根据自底向上的人类视觉注意模型计算出图像的综合显著图.以便反映出图像中各区域的重要程度;然后在此基础上,设计了两种分割算法,分别是基于1-D直方图最大熵法的区域分割和基于注意焦点的区域增长,其中注意焦点从显著图中得到;并结合显著图和分割图,以区域的平均显著度为依据提取显著...  相似文献   

5.
一种彩色纹理图像的分割方法   总被引:7,自引:0,他引:7  
纹理分析一直是图像理解和计算机视觉等领域研究的重点和难点,现有的纹理分割方法大多集中于研究灰度纹理图像,文中提出一种基于分形理论的BP神经网络原彩色纹理图像分割方法,该方法将彩色图像由RGB色彩空间转换为HSI色彩空间,根据亮度计算分数维、多重分形广义维数谱q-D(q)和“空隙”等纹理特征,同时加入归一化的色度和饱和度作为另外两个分类特征,采用经过有监督训练的BP神经网络作为分类器,通过对纹理图像的分割实验,结果证实该方法行之有效。  相似文献   

6.
对图像资源的有效使用和管理迫切需要建立图像分类的标准或规范,本文通过采集网络图像样本,考察它们的视觉特征差异情况,提出了基于内容的图像分类体系,并且就每类图像的特点予以介绍,指出了图像中用于分类的鲜明的视觉特征。  相似文献   

7.
场景图为描述图像内容的结构图(Graph),其在生成过程中存在两个问题:1)二步式场景图生成方法造成有益信息流失,使得任务难度提高;2)视觉关系长尾分布使得模型发生过拟合、关系推理错误率上升。针对这两个问题,文中提出结合多尺度特征图和环型关系推理的场景图生成模型SGiF(Scene Graph in Features)。首先,计算多尺度特征图上的每一特征点存在视觉关系的可能性,并将存在可能性高的特征点特征提取出来;然后,从被提取出的特征中解码得到主宾组合,根据解码结果的类别差异,对结果进行去重,以此得到场景图结构;最后,根据场景图结构检测包含目标关系边在内的环路,将环路上的其他边作为计算调整因子的输入,以该因子调整原关系推理结果,并最终完成场景图的生成。实验设置SGGen和PredCls作为验证项,在大型场景图生成数据集VG(Visual Genome)子集上的实验结果表明,通过使用多尺度特征图,相比二步式基线,SGiF的视觉关系检测命中率提升了7.1%,且通过使用环型关系推理,相比非环型关系推理基线,SGiF的关系推理命中率提升了2.18%,从而证明了SGiF的有效性。  相似文献   

8.
李林  练金  吴跃  叶茂 《计算机应用》2014,34(10):2913-2921
近年来,计算机图像理解技术在智能交通、卫星遥感、机器视觉、医疗图像分析、网络图像搜索等多个领域得到广泛应用。图像整体场景理解作为其延伸,其复杂性和综合性远高于基本图像理解任务。针对这一特点,从图像理解基本框架、图像整体场景理解研究价值和意义、典型模型等多方面进行了归纳与分析,重点介绍了四种代表性的整体场景理解模型,并详细比较了模型架构。最后指出了目前图像整体场景理解研究不足以及未来发展方向,为该领域的进一步研究提供参考。  相似文献   

9.
一种新的基于易得图像建筑建模方法研究   总被引:1,自引:0,他引:1  
为突破单纯运用立体视觉求解算法的诸多限制条件,实现建筑物三维造型的快速便利的建模,该文提出一种新的基于实体特征库的三维真实感建筑造型算法,在以易获得的单幅建筑场景图像作为输入的基础上,系统综合运用建筑场景中各组成实体的造型特征及参考库匹配技术,实现场景的三维造型以及真实感编辑与优化。该文建立实体特征造型库辅助识别二维图像中各个实体部件,并以该实体为造型的构造单元,通过匹配与编辑二维投影图,快速造型复杂和不规则的建筑场景。为解决常见的纹理贴图造型失真问题,优化三维造型的真实感属性,该文设计并实现了三维造型纹理与材质属性的编辑计算方法及实用工具。实验已证明该算法与系统综合体系设计的实用有效性,所研制的系统与优化工具可作为同类型的真实感造型与编辑软件的组件。这项研究成果对于建筑工程CAD与数字城市造型工作,具有重要的实用价值和广阔的应用前景。  相似文献   

10.
规则网格是视觉词袋模型中常用的图像检测方法,该方法抽取图像所有区块,获得背景区块和目标区块完整的图像信息。事实上,抽取的背景区块信息对类别的判定往往会有一定的混淆作用。以“摩托车”类和“小汽车”类的图像为例,这两类图像背景特征相似,大多都是道路,一般的分类方法很可能将它们分为相同类别。可见,背景信息会干扰图像分类结果。因此,提出一种提取目标区域词袋特征的图像分类方法。利用图像分割去除背景信息提取目标区域;对目标区域构建视觉词袋模型;使用SVM分类器对图像进行分类。PASCAL VOC2006及PASCAL VOC2010数据集上的实验结果表明,提取目标区域词袋特征的图像分类方法具有较好的分类性能。  相似文献   

11.
铁路检测、监测领域产生海量的图像数据,基于图像场景进行分类对图像后续分析、管理具有重要价值.本文提出一种结合深度卷积神经神经网络DCNN (Deep Convolutional Neural Networks)与梯度类激活映射Grad-CAM (Grad Class Activation Mapping)的可视化场景分类模型,DCNN在铁路场景分类图像数据集进行迁移学习,实现特征提取,Grad-CAM根据梯度全局平均计算权重实现对类别的加权热力图及激活分数计算,提升分类模型可解释性.实验中对比了不同的DCNN网络结构对铁路图像场景分类任务性能影响,对场景分类模型实现可视化解释,基于可视化模型提出了通过降低数据集内部偏差提升模型分类能力的优化流程,验证了深度学习技术对于图像场景分类任务的有效性.  相似文献   

12.
深度学习能够提高光学遥感图像场景分类的准确率和效率,但光学遥感图像语义丰富,部分场景仍存在易误分类的情况,同时由网络模型规模扩大带来的硬件要求过高、时间成本消耗过大等问题制约着深度学习网络模型的推广应用.为此,提出一种基于轻量化网络模型的光学遥感图像场景分类方法.通过EfficientNet网络提取图像特征,对图像特征...  相似文献   

13.
基于一类不仅含有连续函数,还含有间断函数的正交完备函数系——V-系统,提 出相应的V-矩函数,并将之应用到图像分类中。V-系统中基函数的间断特性,使得V-矩函数 在描述含有多个闭合边界的形状时有特别的优势,这种优势表现为对这类复杂形状的特征提取 更加准确。因此用V-矩可以得到一种图像分类的有效算法。在几个通用数据库中的图像分类 实验表明,本文算法较Zernike 矩、不变矩和几何中心矩有更高的准确率,对噪声不敏感,特 别在含有多个闭合边界的复杂形状分类问题中,本文方法优势更为显著。  相似文献   

14.
从深度图RGB-D域中联合学习RGB图像特征与3D几何信息有利于室内场景语义分割,然而传统分割方法通常需要精确的深度图作为输入,严重限制了其应用范围.提出一种新的室内场景理解网络框架,建立基于语义特征与深度特征提取网络的联合学习网络模型提取深度感知特征,通过几何信息指导的深度特征传输模块与金字塔特征融合模块将学习到的深...  相似文献   

15.
该文针对中文网络评论情感分类任务,提出了一种集成学习框架。首先针对中文网络评论复杂多样的特点,采用词性组合模式、频繁词序列模式和保序子矩阵模式作为输入特征。然后采用基于信息增益的随机子空间算法解决文本特征繁多的问题,同时提高基分类器的分类性能。最后基于产品属性构造基分类器算法综合评论文本中每个属性的情感信息,进而判别评论的句子级情感倾向。实验结果表明了该框架在中文网络评论情感分类任务上的有效性,特别是在Logistic Regression分类算法上准确率达到90.3%。  相似文献   

16.
在雾天情况下,雾对光线的散射使得室外场景的光照发生很大变化,太阳光和天空光的参数估计变得更为复杂.结合雾天情况下的大气散射模型,提出了室外场景的雾天基图像模型,并基于该模型提出了雾天室外场景图像光照参数估计算法.在已知场景基图像的条件下,利用迭代散射系数方法,优化求解雾浓度与场景深度图像,然后通过对去雾图像进行分解,获得最佳的去雾图像以及正确的光照分解系数.算法能够得到较为精确的雾浓度与场景深度图像.实验结果表明了算法的有效性.  相似文献   

17.
Object bank (OB) representation is a novel image representation for high-level visual tasks, which encodes semantic and spatial information of the objects within an image. However, the poor precision of the object detectors in OB method influences the extraction effect of high-level image feature. In order to solve this problem, a new OB method improved by Graph-Based Visual Saliency (GBVS) is proposed. Firstly, GBVS saliency model is utilized to process the image and detect the saliency regions and extract better high-level feature. The experiments results show that the proposed method performs better in classification and increases the classification accuracy of 4%.  相似文献   

18.
基于集成聚类的流量分类架构   总被引:1,自引:0,他引:1  
鲁刚  余翔湛  张宏莉  郭荣华 《软件学报》2016,27(11):2870-2883
流量分类是优化网络服务质量的基础与关键.机器学习算法利用数据流统计特征分类流量,对于识别加密私有协议流量具有重要意义.然而,特征偏置和类别不平衡是基于机器学习的流量分类研究所面临的两大挑战.特征偏置是指一些数据流统计特征在提高部分应用识别准确率的同时也降低了另外一部分应用识别的准确率.类别不平衡是指机器学习流量分类器对样本数较少的应用识别的准确率较低.为解决上述问题,提出了基于集成聚类的流量分类架构(traffic classification framework based on ensemble clustering,简称TCFEC).TCFEC由多个基于不同特征子空间聚类的基分类器和一个最优决策部件构成,能够提高流量分类的准确率.具体而言,与传统的机器学习流量分类器相比,TCFEC的平均流准确率最高提升5%,字节准确率最高提升6%.  相似文献   

19.
程刚  王春恒 《计算机工程》2011,37(5):227-229
利用整体结构特征和局部纹理特征的优势,采用两级分类器对场景图像进行分类。第1级分类器利用全局结构信息得到候选类别,并通过分类结果判定相似类别对;第2级分类器则利用局部纹理信息区分相似类别,采用分类器的级联综合利用场景图像的整体结构信息和局部纹理信息。实验结果表明,该方法能够做到不同场景类别鲁棒分类,有效区分相似场景类别,提高场景图像的分类准确率。  相似文献   

20.
针对基于频繁子图的图分类算法不能有效解决高效和分类正确率并存的矛盾,提出G-Bagging图分类算法。该算法利用传统图分类算法训练出多个基图分类器,集成学习加权构造集成分类器,余度管理实时更新权值。通过实验,表明G-Bagging算法降低了对最小支持度和训练样本空间大小的要求,即在算法效率提高的同时,保证了分类正确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号