首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
针对复杂环境下的运动目标跟踪问题,提出了一种基于视觉显著性特征的粒子滤波跟踪算法.该算法利用显著性检测算法对序列图片进行检测,生成视觉显著图,然后利用二阶自回归模型对目标状态进行预测,再根据中心强化-四周弱化的机制,生成最终显著图.利用视觉显著图中目标区域像素值较大的特点,提取视觉显著性特征,与颜色特征进行自适应融合,从而完成跟踪.实验结果表明,该算法能够有效应对跟踪过程中出现的场景光照变化和目标姿态变化等问题,具有较强的鲁棒性.  相似文献   

2.
语音信号和面部表情是人们表达情感的主要途径,也被认为是情感表达的两个主要模态,即听觉模态和视觉模态.目前情感识别的研究方法大多依赖单模态信息,但是单模态情感识别存在信息不全面、容易受噪声干扰等缺点.针对这些问题,提出一种融合听觉模态和视觉模态信息的两模态情感识别方法 .首先利用卷积神经网络和预先训练好的面部表情模型,分别从语音信号和视觉信号中提取相应的声音特征和视觉特征;然后将提取的两类特征进行信息融合和压缩,充分挖掘模态间的相关信息;最后,利用长短期记忆循环神经网络对融合后的听觉视觉双模态特征进行情感识别.该方法能够有效地捕捉听觉模态和视觉模态间的内在关联信息,提高情感识别性能.利用RECOLA数据集对提出的方法进行验证,实验结果证明基于双模态的模型识别的效果比单个的图像或声音识别模型更好.  相似文献   

3.
在非重叠视野摄像机网络中, 因视觉盲区等因素的存在, 难以对人体目标进行准确可靠的持续跟踪, 为此, 提出一种融合主颜色特征、 纹理特征和时空拓扑特征的目标跟踪算法。该算法将人体区域分割成上、 中、 下3个目标子块, 分别利用最近邻聚类算法提取每个目标子块的主颜色信息, 并计算主颜色匹配率; 通过提取目标的空间纹理特征获得纹理匹配率; 最后通过融合计算人体外观匹配模型。同时, 根据目标关联信息的累计统计信息, 采用增量学习思路建立和更新摄像机网络的时空拓扑关系。实际场景的实验表明, 该算法能有效地对非重叠视野多摄像机网络中出现的人体目标进行连续跟踪, 并随系统的持续运行和监控区域中新目标的不断出现, 其跟踪准确度也随之提高。  相似文献   

4.
针对目标跟踪过程存在的动态不确定性的问题,传统跟踪方法容易产生目标漂移甚至跟踪失败,而基于深度学习的跟踪算法随着网络结构的加深容易导致深层特征过于稀疏抽象,不利于克服上述问题.为此,本文提出SiamMask三分支网络融合注意力机制的孪生网络目标跟踪新方法,旨在加强网络对特征选取的学习能力,加强目标有效特征的抽取,并减少冗余信息对网络负担的影响.特征提取主干网络选用改进的Resnet-50,通过融合深层和浅层特征,实现跟踪目标特征的有效表达.利用4个数据集(COCO、ImageNet-DET 2015、ImageNet-VID 2015、YouTube-VOS)对提出的特征融合孪生网络框架进行训练,并使用VOT数据集进行在线测试.实验表明:与文中其他跟踪方法相比,该算法在面对动态目标尺度变化、环境光照、运动模糊等场景表现更优异.  相似文献   

5.
针对视觉跟踪中运动目标鲁棒性跟踪问题,结合高斯核函数和卷积神经网络(CNN),提出一种无需训练的卷积神经网络提取深度特征的视觉跟踪算法.首先,对初始图像进行归一化处理并聚类提取目标信息,结合跟踪过程中目标信息共同作为卷积网络结构中的各阶滤波器;其次,通过高斯核函数来提高卷积运算速度,提取目标简单抽象特征;最后,通过叠加简单层的卷积结果得到目标的深层次表达,并结合粒子滤波跟踪框架实现跟踪.结果表明:简化后的卷积网络结构能够有效地应对低分辨率、目标遮挡与形变等场景,提高复杂背景下的跟踪效率.  相似文献   

6.
为了解决单一固定目标模型在复杂的场景中易产生跟踪漂移问题,提出一种基于DSPCA的自适应粒子滤波跟踪方法,通过稀疏主成分分解(DSPCA)在线获取互补图像集,同时将其按照新的相似度BRS进行自适应融合作为新目标模型。与经典的粒子滤波跟踪算法、视觉分解跟踪算法和多特征自适应融合跟踪算法,与有挑战性较高的场景视频相比,提出的算法在形态、运动快速及严重遮挡的运动场景中,都能鲁棒地跟踪到目标。  相似文献   

7.
为了提高视觉跟踪系统在空间环境对外界变化的适应能力,提出一种模糊化多视觉信息融合的视觉跟踪策略.该策略综合了多个反映目标特征的视觉信息,通过对选择的每一项子特征集进行模糊化处理,提高了识别的智能化程度.针对运动物体分割阈值受噪声干扰的问题,提出一种结合人口统计与区域生长的区域分割方法,实现了运动区域特征的稳定聚类.相对于传统的局部特征识别方法,这种多特征融合技术适合应用于复杂的动态环境,冗余信息间的互相补充可确保特征在不确定环境中的识别.试验结果表明,该策略能够实现鲁棒的特征提取和跟踪,尤其当出现被跟踪物体部分遮挡以及外界发生光线变化时,视觉跟踪系统仍能够实现稳定、快速的识别.  相似文献   

8.
运动目标检测是计算机视觉中目标识别、目标跟踪和场景理解的前提.文中提出一种基于块的混合高斯背景建模方法,采用图像块的均值和块内方差作为块的特征对场景进行建模,并对前景块根据它的邻域块处理以得到更精确的目标区.新方法不仅考虑了像素在时间域上的分布信息,还利用了像素邻域间的信息消除虚警数,改善了传统混合高斯背景建模方法处理...  相似文献   

9.
针对低光照、雨雾等恶劣场景对智能驾驶视觉系统检测能力的影响,提出了一种雷达与相机特征融合的网络模型. 基于毫米波雷达信息和注意力模型构建了雷达注意力机制特征模块,该模块可以为特征融合网络提供一个先验信息和增加算法在目标候选区域权重. 测试结果表明,引入雷达注意力机制模块后,特征融合网络的目标检测性能要比仅依赖计算机视觉的检测性能有了明显的提升,并且在复杂场景下的目标检测鲁棒性更强.   相似文献   

10.
综合颜色和纹理特征的粒子滤波人脸跟踪算法   总被引:3,自引:1,他引:2  
提出了一种综合颜色和纹理特征的粒子滤波人脸跟踪算法.该方法利用粒子滤波能有效处理非线性非高斯过程和融合目标人脸多种测量信息的特性,针对人脸特征对环境变化的不同鲁棒性,综合加权颜色直方图和旋转复合小波进行人脸特征描述,将颜色和纹理特征融合到粒子滤波跟踪框架中.实验结果表明了该算法的鲁棒性、精确性和灵活性,与基于单一特征的粒子滤波跟踪方法相比,该算法稳健而有效,且对现实场景下人脸的跟踪效果准确.  相似文献   

11.
文章介绍了基于MPEG-4 BIFS的交互场景的实现机制,与VRML交互场景进行了比较,分析了基于BIFS的场景构成,并具体构造了一个动态文本显示的场景描述。由于基于MPEG-4标准的视频、音频信息编码效率高,并提供了丰富的交互功能,使其特别适合于视频聊天、网络会议、视频监控和视频交互游戏等领域。  相似文献   

12.
本文根据电化教学的特点和规律,探讨电化教学的目标、内容、媒体以及信息反馈等方面的设计.  相似文献   

13.
随着人们对于场景音频研究的逐渐深入,现有的分析方式由于存在不能完整反映音频的声学特性等弊端,已经无法满足人们的需求。基于时频域特征的分析方式可以很好地解决这一问题,即通过提取场景音频的语谱图,使待分析信号中包含的声学事件得到完整保留,使其表现得更加直观。语谱图中包含着丰富的纹理信息,选取不同窗长,可分别得到场景音频的宽带语谱图和窄带语谱图。对比实验表明,窄带语谱图可以更好的反映出待分析信号中所包含声学事件的趋势、连续性及分布特征。因此对场景音频进行时频域特征分析更适合使用窄带语谱图。  相似文献   

14.
图像匹配特征的一种融合表示   总被引:1,自引:0,他引:1  
提出图像匹配特征的一种信息融合表示方法,对由不同传感器所获得的对同一场景进行描述的灰度信息、边缘轮廓特征信息和图像熵信息,进行综合分析,利用不同有效信息之间的互补性,导出更为丰富的图像特征信息,进行图像匹配.实验表明该方法能够提高图像匹配的正确率.  相似文献   

15.
DRA多声道数字音频信号容易受到异质信号的干扰,导致音频信号中的无用信息增多,音频质量下降。提出一种新的异质信号干扰下DRA多声道数字音频信号加权融合方法,设计了一种采集系统同时采集DRA多声道数字音频信号,将获取的信号在DSP中进行加权融合处理,利用A/D转换芯片进行转换。介绍了DRA多声道数字音频信号加权融合原理,在将采集信号传输至融合中心前对其进行量化处理,结合量化过程的统计特性对加权系数进行推导,依据加权系数设计融合函数,使融合函数和有用DRA多声道数字音频信号在统计意义上最大程度的吻合,从而实现音频信号的加权融合。实验结果表明,所提方法能够有效实现DRA多声道数字音频信号的加权融合,在不同信噪比下均能保持较低的均方根误差,加权融合精度较高。  相似文献   

16.
在信息化和网络化时代, 音频已成为网络信息传输的主要媒体之一.如何从大量的音频信息流中进行快速高效的内容检索以获得所需要的内容已经成为现代社会急需解决的问题,并已发展成为学术界的一个重要研究方向.该文就音频信息检索研究现状及发展趋势对音频检索的概念和方法进行了阐述,并重点对基于内容的音频信息检索的关键技术和方法进行了讨论.  相似文献   

17.
高分辨率遥感图像场景分类广泛应用于土地监测、环境保护及城市规划等诸多领域.现有场景分类方法不能很好地结合局部纹理信息和全局语义信息,同时各通道特征之间的关系没有得到有效挖掘.因此,本文提出了一种基于多通道自注意力网络的遥感图像场景分类模型.通过卷积网络提取遥感图像的多尺度特征;随后采用特征融合单元建立多尺度特征间的局部-全局关系,基于多头自注意力机制的Inter-Channel Transformer在通道维度对融合后的特征建模,并推导特征在通道间的关系,进一步扩大全局感受野,以捕捉其语义结构信息,有效提高了网络的分类精度.在数据集AISC和SIRI-WHU上,本文所提算法的整体分类准确率(OA)分别为95.70%和94.00%,超过了当前最新的研究算法,证明了所提模型在高分辨率遥感图像场景分类任务中的有效性.  相似文献   

18.
特定类型音频流泛化识别方法   总被引:2,自引:2,他引:0  
提出一种基于Mel频率倒谱系数(MFCC)和AdaBoost算法的特定类型音频流泛化识别方法,通过分析特定类型音频流的子类别间的共性和差异性,利用共性特征进行泛化识别,能够准确地检测并定位音频流中特定类型的音频.文中将枪声作为特定类型音频进行研究,通过提取各种枪声子类别的共性,弱化子类间的差异得到一个泛化的枪声模板,利用一个模板就可以支持多子类的准确识别.实验结果表明,算法的识别准确率为87.6%,查全率达到91.8%.  相似文献   

19.
按照MEPG-7的音频特征规范,设计了帧层次和段层次上的音频特征提取算法.在深入分析足球比赛中各类音频信息的不同特点的基础上,通过有针对性地选取特征,构造特征向量,设计并实现了一种基于决策树的层次化分类算法.该算法可以自动将足球比赛中的音频信息分为噪音、解说员语音、哨音、欢呼声和带背景音的解说员语音等5个类别.实验表明:该算法提取的特征有效,分类效果良好.  相似文献   

20.
为了提升变电站巡检机器人对自身所处环境的理解能力,将深度学习技术应用于变电站巡检机器人对道路场景的识别中,提出了一种全卷积道路场景识别网络(road scene recognition net,RSRNet)。该网络主要由相对浅层的编码网络和镜像结构与跳层融合结构相结合的解码网络组成,通过编码网络提取图像特征后由解码网络识别出图像目标信息。通过实验表明,本文提出的网络在同类型网络中识别精度及效率更高,同时在实际变电站场景中也表现出了优良的场景识别性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号