首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
随着计算机视觉不断发展,人体行为识别在视频监控、视频检索和人机交互等诸多领域中展现出其广泛的应用前景和研究价值。人体行为识别涉及到对图像内容的理解,由于人体姿势复杂多样和背景遮挡的因素导致实际应用的进展缓慢。全面回顾了人体行为识别的发展历程,深入探究了该领域的研究方法,包括传统手工提取特征的方法和基于深度学习的方法,以及最近十分热门的基于图卷积网络(GCN)的方法,并按照所使用的数据类型对这些方法进行了系统的梳理;此外,针对不同的数据类型,分别介绍了一些热门的行为识别数据集,对比分析了各类方法在这些数据集上的性能。最后进行了概括总结,并对未来人体行为识别的研究方向进行了展望。  相似文献   

2.
深度神经网络图像语义分割方法综述   总被引:1,自引:0,他引:1  
图像语义分割是计算机视觉领域近年来的热点研究课题,随着深度学习技术的兴起,图像语义分割与深度学习技术进行融合发展,取得了显著的进步,在无人驾驶、智能安防、智能机器人、人机交互等真实场景中应用广泛。首先对应用于图像语义分割的几种深度神经网络模型进行简单介绍,接着详细阐述了现有主流的基于深度神经网络的图像语义分割方法,依据实现技术的区别对图像语义分割方法进行分类,并对每类方法中代表性算法的技术特点、优势和不足进行分析与总结。之后归纳了图像语义分割常用的大规模公共数据集和性能评价指标,并在此基础上对经典的语义分割方法的实验结果进行了对比,最后对语义分割领域未来可行的研究方向进行展望。  相似文献   

3.
随着信息交互的日益频繁,大量的文档经数字化处理,以图像的格式保存和传播。实际生活工作中,票据识别理解、卡证识别、自动阅卷和文档匹配等诸多应用场景,都需要从文档图像中获取某一特定类别的文本内容,这一过程即为视觉信息抽取,旨在对视觉富文档图像中蕴含的指定类别的信息进行挖掘、分析和提取。随着深度学习技术的快速发展,基于该技术提出了诸多性能优异、流程高效的视觉信息抽取算法,在实际业务中得到了大规模应用,有效解决了以往人工操作速度慢、精度低的问题,极大提高了生产效率。本文调研了近年来提出的基于深度学习的信息抽取方法和公开数据集,并进行了整理、分类和总结。首先,介绍视觉信息抽取的研究背景,阐述了该领域的研究难点。其次,根据算法的主要特征,分别介绍隶属于不同类别的主要模型的算法流程和技术发展路线,同时总结它们各自的优缺点和适用场景。随后,介绍了主流公开数据集的内容、特点和一些常用的评价指标,对比了代表性模型方法在常用数据集上的性能。最后,总结了各类方法的特点和局限性,并对视觉信息抽取领域未来面临的挑战和发展趋势进行了探讨。  相似文献   

4.
孪生网络是由2个或多个人工神经网络建立的耦合框架,因其将回归问题转换为相似度匹配问题,备受计算机视觉领域的研究人员关注。随着深度学习理论的快速发展,目标跟踪技术在生活中得到了广泛的应用。基于孪生网络的目标跟踪算法以其相对优越的准确率和实时性逐渐代替了传统的目标跟踪算法,成为目标跟踪的主流算法。首先,介绍了目标跟踪任务面对的挑战和传统方法;然后,介绍了孪生网络的基础结构及其发展,汇总了近年来基于孪生网络的目标跟踪算法与相应设计原理;另外,介绍多个用于目标跟踪测试的主流数据集,并基于这些数据集对比了基于孪生网络的目标跟踪算法的性能;最后,提出基于孪生网络目标跟踪算法目前存在的问题及对未来的展望。  相似文献   

5.
视觉问答(visual question answering,VQA)是融合自然语言处理与计算机视觉技术的图-文跨模态热门任务。该任务以计算机智能识别与检索图像内容并给出准确答案为主要目标,融合应用了目标识别与检测、智能问答、图像属性分类、场景分析等多项技术,能够支撑许多前沿交互式人工智能高层任务,如视觉对话、视觉导航等,具有广泛的应用前景和极高的应用价值。近几年,计算机视觉、自然语言处理及图-文跨模态领域人工智能模型的发展为视觉问答任务的实现提供了许多新的技术和方法。主要对2019—2022年视觉问答领域的主流模型及专业数据集进行总结。首先,依据视觉问答任务实现的模块框架,对关键步骤中的主流技术方法进行综述讨论。其次,按照主流模型采用的技术方法,将该领域内各类模型进行细分,并简要介绍改进重点和局限性。随后,综述视觉问答常用数据集与评价指标,对几类典型模型性能进行对比阐述。最后,对现阶段视觉问答领域内亟待解决的问题进行重点阐述,并对视觉问答领域未来应用及技术发展进行预测和展望。  相似文献   

6.
深度学习理论在计算机视觉中的应用日趋广泛,在目标分类、检测领域取得了令人瞩目的成果,但是深度学习理论在目标跟踪领域的早期应用中,由于存在跟踪时只有目标为正样本,缺乏数据支持,对位置信息依赖程度高等问题,因而应用效果并不理想,传统方法仍占据主流地位.近年来,随着技术的不断发展,深度学习在目标跟踪方向取得了长足的进步.本文首先介绍了目标跟踪技术的基本概念和主要方法,然后针对深度学习在目标跟踪领域的发展现状,从基于深度特征的目标跟踪和基于深度网络的目标跟踪两方面重点阐述了深度学习在该领域的应用方法,并对近期较为流行的基于孪生网络的目标跟踪进行了详细介绍.最后对近年来深度学习在目标跟踪领域取得的成果,以及未来的发展方向作了总结和展望.  相似文献   

7.
行为识别是当前计算机视觉方向中视频理解领域的重要研究课题。从视频中准确提取人体动作的特征并识别动作,能为医疗、安防等领域提供重要的信息,是一个十分具有前景的方向。本文从数据驱动的角度出发,全面介绍了行为识别技术的研究发展,对具有代表性的行为识别方法或模型进行了系统阐述。行为识别的数据分为RGB模态数据、深度模态数据、骨骼模态数据以及融合模态数据。首先介绍了行为识别的主要过程和人类行为识别领域不同数据模态的公开数据集;然后根据数据模态分类,回顾了RGB模态、深度模态和骨骼模态下基于传统手工特征和深度学习的行为识别方法,以及多模态融合分类下RGB模态与深度模态融合的方法和其他模态融合的方法。传统手工特征法包括基于时空体积和时空兴趣点的方法(RGB模态)、基于运动变化和外观的方法(深度模态)以及基于骨骼特征的方法(骨骼模态)等;深度学习方法主要涉及卷积网络、图卷积网络和混合网络,重点介绍了其改进点、特点以及模型的创新点。基于不同模态的数据集分类进行不同行为识别技术的对比分析。通过类别内部和类别之间两个角度对比分析后,得出不同模态的优缺点与适用场景、手工特征法与深度学习法的区别和融合多模态的优势。最后,总结了行为识别技术当前面临的问题和挑战,并基于数据模态的角度提出了未来可行的研究方向和研究重点。  相似文献   

8.
随着计算机视觉和自动驾驶技术的快速发展,自动感知、理解和预测人类行为的能力变得越来越重要。各类传感器的普及使得社会中产生了大量运动物体的位置数据。基于这些数据预测行人的运动轨迹在社交预测等多个领域都有着极大的价值。为了深入了解这方面的发展,对基于图神经网络的行人轨迹预测方法进行了综述,从多个角度比较、分析和总结了行人轨迹预测的图神经网络算法,讨论了不同算法在该领域的研究与发展;在目前的公共数据集上进行了对比和分析,介绍了相应性能指标,给出了不同算法的性能比较结果,提出了目前研究仍存在的问题,拓展研究思路和方法;展望了未来可能出现的研究方向。  相似文献   

9.
基于卷积神经网络的单图像超分网络性能已经远超传统算法,为进一步提升网络表征能力及网络性能,许多研究在网络架构中使用了注意力机制。该文首先回顾注意力机制在单图像超分中的研究,并将其划分为基于一阶注意力机制和基于高阶注意力机制两类方法;然后,对比基于注意力机制的超分网络在网络规模、内存占用、计算量、网络损失类型和注意力机制架构差异,验证了不同注意力机制模块的性能差异,并使用最新的超分可视化分析工具为实验提供侧面证明;最后,分析和讨论基于注意力机制的算法研究在处理真实退化图像方面存在的挑战,指出超分技术发展的关键瓶颈及未来发展方向。  相似文献   

10.
双目立体匹配是计算机视觉领域的经典问题,在自动驾驶、遥感、机器人感知等诸多任务中得到广泛应用。双目立体匹配的主要目标是寻找双目图像对中同名点的对应关系,并利用三角测量原理恢复图像深度信息。近年来,基于深度学习的立体匹配方法在匹配精度和匹配效率上均取得了远超传统方法的性能表现。将现有基于深度学习的立体匹配方法分为非端到端方法和端到端方法。基于深度学习的非端到端方法利用深度神经网络取代传统立体匹配方法中的某一步骤,根据被取代步骤的不同,该类方法被分为基于代价计算网络、基于代价聚合网络和基于视差优化网络的3类方法。基于深度学习的端到端方法根据代价体维度的不同可分为基于3D代价体和基于4D代价体的方法。从匹配精度、时间复杂度、应用场景等多个角度对非端到端和端到端方法中的代表性成果进行分析,并归纳各类方法的优点以及存在的局限性。在此基础上,总结基于深度学习的立体匹配方法当前面临的主要挑战并展望该领域未来的研究方向。  相似文献   

11.
视觉里程计通过分析相机所获取的图像流信息估计移动机器人的位姿。为了深入分析视觉里程计算法的发展现状,结合一些先进的视觉里程计系统,综述了视觉里程计的相关技术以及最新的研究成果。首先简述了视觉里程计的概念和发展历程,介绍了视觉里程计问题的数学描述和分类方法;然后,详细阐述了视觉里程计的关键技术,包括特征模块、帧间位姿估计和减少漂移;此外,还介绍了基于深度学习的视觉里程计的发展动态。最后,总结了视觉里程计目前存在的问题,展望了未来的发展趋势。  相似文献   

12.
随着国际上天文项目的发展与推进,天文数据呈爆炸式增长。如何从浩瀚如海的大数据集中快速检索所需信息,已成为各国科研人员共同面对的问题。虚拟天文台(Virtual Observatory,VO)为满足对大规模天文数据进行处理分析、检索访问和共享发布等需求,提供了一系列 VO 标准协议和集成化服务。开发符合 VO 标准协议的天文数据发布与检索系统、集成数据访问发布和可视化分析服务,符合当前的发展趋势。本文在回顾 VO发展历程的基础上,对 VO 体系结构、VO 标准协议等若干关键技术进行概括阐述。同时,基于 VO的技术框架,提出硬 X 射线调制望远镜(Hard X-ray ModulationTelescope,HXMT)卫星数据发布与检索系统的初步设想,设计符合卫星任务需求的体系结构,并选取相关的 VO 标准协议加以实现。  相似文献   

13.
读写分离技术在很多大型企业的信息系统中得到了广泛的应用。结合传统电信运营商核心交易系统的架构现状,通过增加读库、数据缓存、搜索引擎三种读写分离技术,设计了一种高性能、高可用、可扩展的数据层架构方案。实验结果表明,读写分离可以极大地提升数据的读取性能以及整个系统的业务承载能力。  相似文献   

14.
Virtual organization (VO) is a main organizational paradigm for enterprises to collaborate in the rapidly changing environment. Advances in information and communication technologies are accelerating collaboration among enterprises in different domains as well as unknown enterprises. In this environment, an enterprise faces more chances to cooperate with other enterprises through the internet. Trust is a key concept in many kinds of interactions, allowing an enterprise to act under uncertainty and with the risk of negative consequences. To minimize the operating risk and guarantee the success of a VO, trust evaluation of potential partners should be considered during the partner selection process. However, trust evaluation methods in the literature have limitations in applying them to small and medium enterprises because they are based on evaluation of human experts. In this paper, a goal-oriented trust model is proposed to evaluate the trust values of enterprises. In the context, trust is the probability that a trustee satisfies the goals when it completes assigned tasks. This paper introduces the concept of a goal-oriented trust model with the core constructs of a goal, a project, a task, and a capability. It further addresses an example of applying the proposed model to the partner selection process of a project-based VO creation.  相似文献   

15.
图像修复是计算机视觉领域中极具挑战性的研究课题。近年来,深度学习技术的发展推动了图像修复性能的显著提升,使得图像修复这一传统课题再次引起了学者们的广泛关注。文章致力于综述图像修复研究的关键技术。由于深度学习技术在解决“大面积缺失图像修复”问题时具有重要作用并带来了深远影响,文中在简要介绍传统图像修复方法的基础上,重点介绍了基于深度学习的修复模型,主要包括模型分类、优缺点对比、适用范围和在常用数据集上的性能对比等,最后对图像修复潜在的研究方向和发展动态进行了分析和展望。  相似文献   

16.
将虚拟仪器技术应用于电力系统谐波测试,利用美国NI公司功能强大的LabVIEW虚拟仪器开发平台研制了基于虚拟仪器技术的电力谐波测试仪,其总体性能优于传统测试仪。本文论述了谐波测试仪的工作原理、系统组成以及硬软件设计中的技术要点。  相似文献   

17.
随着科技工作者对网络的日渐依赖,论文的在线撰写、发表与管理对促进学术思想交流、加快研究成果共享发挥了举足轻重的作用。为设计功能完善、可扩展性强、易于维护的大型在线论文撰写与管理系统,传统的Web开发技术已不能满足需要。传统的Web开发技术将页面显示、业务逻辑和数据处理等集中在页面代码中,耦合度过高,大型系统的开发、维护和扩展比较困难,不利于开发人员分工协作。本文研究基于Struts的Web系统开发技术,采用MVC(模型-视图-控制器)设计模式,并基于Struts框架体系结构实现一套提供在线论文服务的大型Web信息系统。实践工作表明,基于Struts框架的设计技术有效提高了系统的开发效率及系统的可维护性和可扩展性。  相似文献   

18.
Web服务测试的研究   总被引:1,自引:0,他引:1  
李乔  郑啸  秦锋 《微机发展》2006,16(9):93-96
Web服务是一种全新的分布式计算技术,它具有真正意义上的系统平台异构性和语言的独立性。随着Web服务技术的不断发展和广泛应用,需要运用测试技术来保障Web服务的正确有效运行。然而由于Web服务采用了新的体系结构和核心协议,其测试方法有别于以往的传统软件测试或网络协议测试,所以有必要对其测试方法和技术进行研究。文中对Web服务的测试进行了分析,针对不同的测试目的提出了对Web服务进行测试的方法,并给出了一种Web服务的测试执行框架。  相似文献   

19.
改进的动态图水印实现方案   总被引:1,自引:0,他引:1  
白雪梅 《现代计算机》2006,(8):16-18,48
在研究动态图水印技术的基础上,针对不同的性能指标提出两种改进方案并作了简单的性能分析,最后指出软件水印技术的发展方向.  相似文献   

20.
基于对象的视频图象分割技术   总被引:4,自引:0,他引:4       下载免费PDF全文
随着“流媒体”技术应用的发展和 MPEG- 4基于内容的功能的提出 ,视频图象处理领域中 ,基于对象的分割技术已成为该领域的研究热点 .如今视频分割研究已由基于镜头的分割发展到了通过提取视频对象面 ,来分割出视频对象的阶段 ,但目前基于对象的分割研究仍处于起步阶段 ,技术还很不成熟 .为了推动该技术进一步发展 ,在深入分析分割问题本质的基础上 ,首先提出从分割所利用的信息角度出发来进行分割的技术 ;然后针对分割技术的发展趋势 ,深入介绍了该研究领域国内外的最新研究算法 ,并分析了各方法技术的贡献和不足 ;最后提出了一些分割技术值得进一步深入探讨的问题和研究方向  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号