期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

钟玉琢乔秉新《计算机学报》1992,15(11):809-814

视觉信息处理可以看作是从三维环境的图象中抽取、描述和解释信息的过程.根据该过程所涉及的方法和技术的复杂性,可将它们分成三个处理层次:低层视觉,中层视觉和高层视觉.作者根据各个层次视觉处理的要求和特点,提出分别采用基于DSP的低层视觉处理模块,中层视觉处理模块——PIPE以及高层视觉处理模块——并行图归约机(PGR).它们共用一个工作平台IBMPC,组成混合型视觉计算机.这可能是解决视觉信息处理复杂、数据量大以及实时要求高等问题的有效方法. 相似文献

2.

图像—文本多模态指代表达理解研究综述

下载免费PDF全文

王丽安缪佩翰苏伟李玺吉娜烨姜燕冰《中国图象图形学报》2023,28(5):1308-1325

指代表达理解（referring expression comprehension,REC）作为视觉—语言相结合的多模态任务,旨在理解输入指代表达式的内容并在图像中定位其所描述的目标对象,受到计算机视觉和自然语言处理两个领域的关注。REC任务建立了人类语言与物理世界的视觉内容之间的桥梁,可以广泛应用于视觉理解系统和对话系统等人工智能设备中。解决该任务的关键在于对复杂的指代表达式进行充分的语义理解;然后利用语义信息对包含多个对象的图像进行关系推理以及对象筛选,最终在图像中唯一地定位目标对象。本文从计算机视觉的视角出发对REC任务进行了综述,首先介绍该任务的通用处理流程。然后,重点对REC领域现有方法进行分类总结,根据视觉数据表征粒度的不同,划分为基于区域卷积粒度视觉表征、基于网格卷积粒度视觉表征以及基于图像块粒度视觉表征的方法;并进一步按照视觉—文本特征融合模块的建模方式进行了更细粒度的归类。此外,本文还介绍了该任务的主流数据集和评估指标。最后,从模型的推理速度、模型的可解释性以及模型对表达式的推理能力3个方面揭示了现有方法面临的挑战,并对REC的发展进行了全面展望。本文希望通过对REC... 相似文献

3.

一种基于多层语义特征的图像理解方法

莫宏伟田朋《控制与决策》2021,36(12):2881-2890

视觉场景理解包括检测和识别物体、推理被检测物体之间的视觉关系以及使用语句描述图像区域.为了实现对场景图像更全面、更准确的理解,将物体检测、视觉关系检测和图像描述视为场景理解中3种不同语义层次的视觉任务,提出一种基于多层语义特征的图像理解模型,并将这3种不同语义层进行相互连接以共同解决场景理解任务.该模型通过一个信息传递图将物体、关系短语和图像描述的语义特征同时进行迭代和更新,更新后的语义特征被用于分类物体和视觉关系、生成场景图和描述,并引入融合注意力机制以提升描述的准确性.在视觉基因组和COCO数据集上的实验结果表明,所提出的方法在场景图生成和图像描述任务上拥有比现有方法更好的性能. 相似文献

4.

面向视觉语言理解与生成的多模态预训练方法

刘天义吴祖煊陈静静姜育刚《软件学报》2023,34(5):2024-2034

大多数现有的视觉语言预训练方法侧重于理解任务,并在训练时使用类似于BERT的损失函数(掩码语言建模和图像文本匹配).尽管它们在许多理解类型的下游任务中表现良好,例如视觉问答、图像文本检索和视觉蕴涵,但它们不具备生成信息的能力.为了解决这个问题,提出了视觉语言理解和生成的统一多模态预训练(unified multimodal pre-training for vision-language understanding and generation, UniVL). UniVL能够处理理解任务和生成任务,并扩展了现有的预训练范式,同时使用随机掩码和因果掩码,因果掩码即掩盖未来标记的三角形掩码,这样预训练的模型可以具有自回归生成的能力.将几种视觉语言理解任务规范为文本生成任务,并使用基于模版提示的方法对不同的下游任务进行微调.实验表明,在使用同一个模型时,理解任务和生成任务之间存在权衡,而提升这两个任务的可行方法是使用更多的数据. UniVL框架在理解任务和生成任务方面的性能与最近的视觉语言预训练方法相当.此外,实验还证明了基于模版提示的生成方法更有效,甚至在少数场景中它优于判别方法. 相似文献

5.

基于感知视觉重要性的立体图像质量评价

姜峰郭美思刘绍辉赵德斌《智能系统学报》2012,7(5):414-422

视觉心理、生理因素是有效、准确评价图像质量的重要依据.尽管在计算层面已有众多视觉心理、生理计算模型及方法为其提供支持,但在图像质量评价任务中如何分析各种孤立方法之间的内在关系进而使之有效协同,是使得评价结果更符合人主观评测的关键.从图像质量评价的角度出发,功能上将人眼的视觉注意区域定义并数学形式化为视觉初期注意区域与视觉转移期的劣质区域;同时考虑人眼的感知冗余特性,结合JND感知冗余模型,进而提出了图像质量评价范畴下的视觉感知模型PVSSIM.以此为依据,将感知视觉的方法在二维图像数据库中验证其可行性,并将其引入到立体图像质量评价中.实验结果表明,提出的客观评价方法与传统方法相比,充分考虑到了图像质量评价任务中各种视觉心理、生理因素的协同,与人主观的图像质量评价相比具有更高的相关度,评价方法在立体图像库中能很好地与主观评价相吻合,达到了预期的效果. 相似文献

6.

基于视觉的手势界面关键技术研究 总被引：1，自引：0，他引：1

武汇岳张凤军刘玉进戴国忠《计算机学报》2009,32(10)

针对视觉手势界面存在的问题,提出了一套行之有效的解决方案.首先,为了解决视觉手势交互中的MidasTouch问题,以人类注意的信息加工模型为理论依据提出了一个可扩展的视觉手势交互模型,该模型将手势交互过程分为选择性处理、分配性处理和集中处理3个不同阶段;然后,基于该模型提出了一个视觉手势识别框架,并结合认知心理学从手势检测、跟踪和识别3个方面对该框架的各个组成模块的关键技术进行了阐述,其中手势检测模块和识别管理模块能够辅助系统在复杂的背景中滤除掉不相关信息而选择性地搜索人手并根据上下文信息对手势识别任务重定向,从而避免了系统时刻都处于激活状态并对所有的手势动作都进行识别分析,有效解决了Midas Touch问题.文中介绍了使用该方法实现的IEToolkit手势界面工具平台,并基于一个视觉手势交互系统进行了实验测试与评估,结果验证了文中方法的可用性. 相似文献

7.

光电混合处理系统在机器人视觉目标识别中的应用研究 总被引：2，自引：1，他引：1

余杨黄惟一《机器人》2001,23(5):471-475

分析了光电混合处理系统应用于机器人视觉识别的可行性和研究意义,评述了光电混合处理系统在光学模式识别和机器人视觉识别领域中的研究现状．提出将JTC系统在机器人视觉识别中的应用划分为五个研究层次,分析综述了与各类研究层次相关的形态学JTC和三维JTC的代表性算法及JTC硬件结构,以此作为机器人视觉识别光电混合处理系统的研究基础．相似文献

8.

深度学习时代下的RGB-D显著性目标检测研究进展

丛润民张晨徐迈刘鸿羽赵耀《软件学报》2023,34(4):1711-1731

受人类的视觉注意力机制启发, 显著性目标检测任务旨在定位给定场景中最吸引人注意的目标或区域. 近年来, 随着深度相机的发展和普及, 深度图像已经被成功应用于各类计算机视觉任务, 这也为显著性目标检测技术提供了新思路. 通过引入深度图像, 不仅能使计算机更加全面地模拟人类视觉系统, 而且深度图像所提供的结构、位置等补充信息也可以为低对比度、复杂背景等困难场景的检测提供新的解决方案. 鉴于深度学习时代下RGB-D显著目标检测任务发展迅速, 旨在从该任务关键问题的解决方案出发, 对现有相关研究成果进行归纳、总结和梳理, 并在常用RGB-D SOD数据集上进行不同方法的定量分析和定性比较. 最后, 对该领域面临的挑战及未来的发展趋势进行总结与展望. 相似文献

9.

计算机视觉中不确定性的处理

李凡高雅卿《机器人》1988,(4)

在计算机视觉系统中,不确定性可能出现在不同的层次。它可能出现在低层——原始传感器输入,并可以扩展到中层和高层。一个高性能的计算机视觉系统,应能恰当地处理这些不确定性。本文用实例分析了利用模糊集处理不确定性的各种方法,给出了运算结果,并对各种方法进行了比较。最后,我们给出了模糊分割的形式定义。相似文献

10.

引入视觉注意机制的目标跟踪方法综述 总被引：2，自引：0，他引：2

黎万义王鹏乔红《自动化学报》2014,40(4):561-576

视觉跟踪在无人飞行器、移动机器人、智能监控等领域有着广泛的应用,但由于目标外观和环境的变化,以及背景干扰等因素的存在,使得复杂场景下的鲁棒实时的目标跟踪成为一项极具挑战性的任务. 视觉注意是人类视觉信息处理过程中的一项重要的心理调节机制,在视觉注意的引导下,人类能够从众多的视觉信息中快速地选择那些最重要、最有用、与当前行为最相关的感兴趣的视觉信息,特别地,人类能够快速指向感兴趣的目标,从而可以轻松地实现对目标的稳定跟踪.因此,将视觉注意机制引入到复杂场景下的目标跟踪中,有利于实现更为稳定和接近于人类认知机制的视觉跟踪算法.本文旨在对引入了视觉注意机制的目标跟踪方法进行综述. 首先,介绍了视觉注意的基本概念及其代表性的计算模型;其次,对视觉注意与跟踪的内在关系进行了阐述;然后,对引入视觉注意机制的目标跟踪方法进行归纳、总结和分类,对代表性的方法进行介绍和分析;最后,对该类方法的特点和优势进行了讨论,并对未来的研究趋势进行了展望. 相似文献

11.

显著性物体检测研究综述：方法、应用和趋势

李婉蓉徐丹史金龙黄树成《计算机应用研究》2022,39(7)

显著性物体检测旨在快速定位图像中的显著性目标,可用于目标检测和识别、关键点定位、视觉跟踪、语义分割等计算机视觉任务中。为梳理显著性检测研究的发展脉络,从方法、应用领域和研究方向等方面分析显著性检测的研究现状和发展趋势。首先,阐述了显著性检测与相关研究的区别和联系;然后,分析了目前主流的显著性物体检测算法的流程、创新点、性能和适用性;接下来,介绍了显著性检测领域数据集的发展和演化;最后,展望了显著性检测研究的发展趋势并总结了显著性检测的主要应用领域。相似文献

12.

视觉Transformer识别任务研究综述

下载免费PDF全文

周丽娟毛嘉宁《中国图象图形学报》2023,28(10):2969-3003

Transformer模型在自然语言处理领域取得了很好的效果,同时因其能够更好地连接视觉和语言,也激发了计算机视觉界的极大兴趣。本文总结了视觉Transformer处理多种识别任务的百余种代表性方法,并对比分析了不同任务内的模型表现,在此基础上总结了每类任务模型的优点、不足以及面临的挑战。根据识别粒度的不同,分别着眼于诸如图像分类、视频分类的基于全局识别的方法,以及目标检测、视觉分割的基于局部识别的方法。考虑到现有方法在3种具体识别任务的广泛流行,总结了在人脸识别、动作识别和姿态估计中的方法。同时,也总结了可用于多种视觉任务或领域无关的通用方法的研究现状。基于Transformer的模型实现了许多端到端的方法,并不断追求准确率与计算成本的平衡。全局识别任务下的Transformer模型对补丁序列切分和标记特征表示进行了探索,局部识别任务下的Transformer模型因能够更好地捕获全局信息而取得了较好的表现。在人脸识别和动作识别方面,注意力机制减少了特征表示的误差,可以处理丰富多样的特征。Transformer可以解决姿态估计中特征错位的问题,有利于改善基于回归的方法性能,还减少了三维估计时深度映射所产生的歧义。大量探索表明视觉Transformer在识别任务中的有效性,并且在特征表示或网络结构等方面的改进有利于提升性能。相似文献

13.

视觉注意力检测综述 总被引：1，自引：0，他引：1

王文冠沈建冰贾云得《软件学报》2019,30(2):416-439

人类能够迅速地选取视野中的关键部分,选择性地将视觉处理资源分配给这些视觉显著的区域.在计算机视觉领域,理解和模拟人类视觉系统的这种注意力机制,得到了学界的大力关注,并显示出了广阔的应用前景.近年来,随着计算能力的增强以及大规模显著性检测数据集的建立,深度学习技术逐渐成为视觉注意力机制计算和建模的主要手段.综述了视觉注意力检测的最新研究进展,包括人眼关注点检测和显著物体检测,并讨论了当前流行的视觉显著性检测数据集和常用的评估指标.对基于深度学习的工作进行了综述,也对之前代表性的非深度学习模型进行了讨论,同时,对这些模型在不同的数据集上的性能进行了详细评估.最后探讨了该领域的研究趋势和未来的发展方向. 相似文献

14.

基于深度学习的显著性目标检测综述

史彩娟张卫明陈厚儒葛录录《计算机科学与探索》2021,15(2):219-232

随着深度学习的不断发展,基于深度学习的显著性目标检测已经成为计算机视觉领域的一个研究热点。首先对现有的基于深度学习的显著性目标检测算法分别从边界/语义增强、全局/局部结合和辅助网络三个角度进行了分类介绍并给出了显著性图,同时对三种类型方法进行了定性分析比较;然后简单介绍了基于深度学习的显著性目标检测常用的数据集和评估准则;接着对所提基于深度学习的显著性目标检测方法在多个数据集上进行了性能比较,包括定量比较、P-R曲线和视觉比较;最后指出现有基于深度学习的显著性目标检测方法在复杂背景、小目标、实时性检测等方面的不足,并对基于深度学习的显著性目标检测的未来发展方向,如复杂背景、实时、小目标、弱监督等显著性目标检测进行了探讨。相似文献

15.

深度聚类注意力机制下的显著对象检测

下载免费PDF全文

陈庆文谢宏文查浩奚瑜张雪《中国图象图形学报》2021,26(5):1017-1029

目的为了得到精确的显著对象分割结果,基于深度学习的方法大多引入注意力机制进行特征加权,以抑制噪声和冗余信息,但是对注意力机制的建模过程粗糙,并将所有特征均等处理,无法显式学习不同通道以及不同空间区域的全局重要性。为此,本文提出一种基于深度聚类注意力机制（deep cluster attention,DCA）的显著对象检测算法DCANet （DCA network）,以更好地建模特征级别的像素上下文关联。方法 DCA显式地将特征图分别在通道和空间上进行区域划分,即将特征聚类分为前景敏感区和背景敏感区。然后在类内执行一般性的逐像素注意力加权,并在类间进一步执行语义级注意力加权。DCA的思想清晰易懂,参数量少,可以便捷地部署到任意显著性检测网络中。结果在6个数据集上与19种方法的对比实验验证了DCA对得到精细显著对象分割掩码的有效性。在各项评价指标上,部署DCA之后的模型效果都得到了提升。在ECSSD （extended cornplex scene saliency dataset）数据集上,DCANet的性能比第2名在F值上提升了0.9%;在DUT-OMRON （Dalian University of Technology and OMRON Corporation）数据集中,DCANet的性能比第2名在F值上提升了0.5%,平均绝对误差（mean absolute error,MAE）降低了3.2%;在HKU-IS数据集上,DCANet的性能比第2名在F值上提升了0.3%, MAE降低了2.8%;在PASCAL （pattern analysis,statistical modeling and computational learning）-S （subset）数据集上,DCANet的性能则比第2名在F值上提升了0.8%,MAE降低了4.2%。结论本文提出的深度聚类注意力机制通过细粒度的通道划分和空间区域划分,有效地增强了前景敏感类的全局显著得分。与现有的注意力机制相比,DCA思想清晰、效果明显、部署简单,同时也为一般性的注意力机制研究提供了新的可行的研究方向。相似文献

16.

基于蚁群优化算法的弱光图像显著性目标检测

汪虹余张彧杨恒穆楠《计算机应用》2021,41(10):2970-2978

近年来,显著性目标检测受到工业界和学术界的大量关注,成为了计算机视觉领域中一项重要的基础研究,该问题的解决有助于各类视觉任务取得突破性进展。尽管针对可见光场景的显著性检测工作已经取得了有效成果,但如何在信噪比偏低、可用有效信息匮乏的弱光图像中提取边界清晰、内部结构准确的显著性目标,仍然是具有挑战性的难题。针对弱光场景下显著性目标检测存在边界模糊、结构不完整等造成准确率较低的问题,提出基于蚁群优化（ACO）算法的显著性检测模型。首先,通过多尺度超像素分割将输入图像转换为具有不同节点的无向图;其次,基于最优特征选择策略来更充分地获取低对比度弱光图像中所包含的更多显著目标的特征信息,并摒弃冗余的噪声信息;然后,引入空间对比度策略用于探索弱光图像中具有相对较高对比度的全局显著性线索。而为了在低信噪比情况下也能获取准确的显著性估计,利用ACO算法对显著图进行优化。通过在3个公共数据集（MSRA、CSSD和PASCAL-S）以及夜间弱光图像（NI）数据集上进行实验,可以看出,所提模型在3个公共数据集上的曲线下面积（AUC）值分别达到了87.47%、84.27%和81.58%,在NI数据集上的AUC值比排名第2的低秩矩阵恢复（LR）模型提高了2.17个百分点。实验结果表明,相较于11种主流的显著性检测模型,所提模型具有结构更准确且边界更清晰的检测效果,有效抑制了弱光场景对显著性目标检测性能的干扰。相似文献

17.

Hierarchical salient object detection model using contrast-based saliency and color spatial distribution

Xin?Xu Email author Nan?Mu Li?Chen Xiaolong?Zhang 《Multimedia Tools and Applications》2016,75(5):2667-2679

Visual saliency is an important cue in human visual system to detect salient objects in natural scenes. It has attracted a lot of research focus in computer vision, and has been widely used in many applications including image retrieval, object recognition, image segmentation, and etc. However, the accuracy of salient object detection model remains a challenge. Accordingly, a hierarchical salient object detection model is presented in this paper. In order to accurately interpret object saliency in image, we propose to investigate distinctive features from a global perspective. Image contrast and color distribution are calculated to generate saliency maps respectively, which are then fused using the principal component analysis. Compared with state-of-the-art models, the proposed model can accurately detect the salient object which conform with the human visual principle. The experimental results from the MSRA database validate the effectiveness of our proposed model. 相似文献

18.

基于踪片Tracklet关联的视觉目标跟踪:现状与展望

刘雅婷王坤峰王飞跃《自动化学报》2017,43(11):1869-1885

近年来，由于计算机视觉技术的发展和计算机硬件性能的提高，基于视觉的目标跟踪方法得到了飞速的发展.其中，基于踪片（Tracklet）关联的目标跟踪方法因为具有对目标遮挡的强鲁棒性、算法运行的快速性等优点得到了广泛关注，本文对这类方法的最新研究进展进行了综述.首先，简明地介绍了视觉目标跟踪的基本知识、研究意义和研究现状.然后，通过感兴趣目标检测、跟踪特征提取、踪片生成、踪片关联与补全四个步骤，系统详尽地介绍了基于踪片关联的目标跟踪方法，分析了近年来提出的一些踪片关联方法的优缺点.最后，本文指出了该研究问题的发展方向，一方面要提出更先进的目标跟踪模型，另一方面要采用平行视觉方法进行虚实互动的模型学习与评估. 相似文献

19.

基于渐进式嵌套特征的融合网络

孙君顶王金凯唐朝生毋小省《模式识别与人工智能》2023,36(1):70-80

显著目标检测是指通过引入人类视觉注意力机制,使计算机能检测视觉场景中人们最感兴趣的区域或对象.针对显著性目标检测中存在检测边缘不清晰、检测目标不完整及小目标漏检的问题,文中提出基于渐进式嵌套特征的融合网络.网络采用渐进式压缩模块,将较深层特征不断向下传递融合,在降低模型参数量的同时也充分利用高级语义信息.先设计加权特征融合模块,将编码器的多尺度特征聚合成可访问高级信息和低级信息的特征图.再将聚合的特征分配到其它层,充分获取图像上下文信息及关注图像中的小目标对象.同时引入非对称卷积模块,进一步提高检测准确性.在6个公开数据集上的实验表明文中网络取得较优的检测效果. 相似文献