排序方式: 共有60条查询结果,搜索用时 8 毫秒
31.
基于视频的人体运动捕捉综述 总被引:11,自引:0,他引:11
系统地总结和介绍了基于视频的人体运动捕捉研究的技术方法和最新进展.将基于视频的人体运动捕捉方法分为自顶向下的方法和自底向上的方法2大类,阐述了每一类中各种方法的原理、技术特点和研究现状,最后分析了该领域的难点问题和发展趋势. 相似文献
32.
一种有效的体育视频目标跟踪算法 总被引:1,自引:0,他引:1
论文研究了面向体育视频的运动目标跟踪技术,提出了一种最优化的混合跟踪方法。首先,采用粒子滤波算法来预测运动目标的初略位置,通过比较预测位置上的目标同目标模型之间的相似度,当相似度小于一定的阀值时,认为目标运动模型发生了根本变化,需要启用新的运动模型;当相似度大于一定的阀值时则认为目标运动模型没有发生大的变化,不需要启用新的运动模型,通过这种方式找到目标的最优化运动模型。最后将最优化的运动模型用于基于核的均值转移算法中,从而获得运动目标的精确位置。 相似文献
33.
台标识别是典型的细微目标识别问题,针对台标区域小、信息量低,且镂空、半透明台标极易受到画面背景影响的难题,提出一个基于端到端全卷积网络的像素级台标识别网络——PNET.首先构建一个像素级标注的台标数据集,通过视频抽帧和图像预处理获得台标图像集,并提出一种逐图像的像素级半自动标注方法获得二值标签图像集;然后提出一个像素级台标识别网络,在典型分类网络AlexNet,VGG的基础上,通过微调,将分类网络在分类任务中学习到的网络参数转换为像素级台标识别网络在台标分割任务中的所需的网络参数;最后引入跨层架构,融合来自网络深层的全局信息和浅层的局部信息.实验结果表明PNET实现了准确的像素级分割,准确率高达98.3%,在NVIDIA Tesla K80上单幅图像识别时间不超过1.5 s. 相似文献
34.
动态场景视频序列中的前景区域自动提取 总被引:4,自引:0,他引:4
首先提出一种具有自适应外点过滤功能的全局运动估计算法,通过交替地进行参数估计和外点过滤,能够有效地抑制噪声的影响,实现准确的背景对准;然后,通过直方图拟合获得准确的背景噪声方差值,克服了以往只能依据经验设定背景噪声方差的缺点,并使用显著性测试技术有效地对帧差图进行二值化,最终消除帧间的重叠背景,提取出前景区域.实验结果表明,该算法能够有效地实现动态场景视频序列中的背景对准,并准确地提取出前景区域. 相似文献
35.
大数据环境下,如何对高并发的视频数据进行实时地分析处理,是一个亟待解决的科学问题。本文介绍了面向互联网视频内容监管的高通量视频内容分析技术,着重对其中的四个主要关键技术(基于众核的视频高速解码和视频特征提取、基于分布式系统的高维索引和语义识别)的研究现状和发展趋势进行了综述和总结,并介绍了作者在这四个主要关键技术研究的最新成果,主要包括面向众核处理器的并行环路滤波、高鲁棒性和高并行度的局部特征提取与挖掘、分布式高维索引、面向大数据的集成学习方法,以充分发挥多粒度并行硬件平台的高并行计算能力,为互联网视频内容监管、视频搜索等重要应用提供关键技术支撑。 相似文献
36.
37.
改进了一种DCT快速算法,使之可用于降低H.264中整数4×4 DCT的复杂度.考虑到Laplacian模型不能准确地描述实际的H.264 DCT系数的分布,定义了3类简化块,并用统计分析的方法分别建立了这3类块的系数分布模型,进而提出了一种基于新模型的快速DCT算法.设计了简化块的蝶形算法,并分析、比较了所提出的2种快速DCT算法的复杂度.以后者为基础,设计了一种DCT复杂度可分级机制,以调节不同计算能力平台上的4×4DCT的复杂度.实验结果表明,该算法能够准确地按照设定目标控制DCT复杂度,且保证编码性能. 相似文献
38.
视频码流转换是支持在异质网络环境中进行视频通信的关键技术之一。提出了一种充分利用人类视觉系统特性的MPEG视频码流码率转换方法。与原有方法相比,该方法在转换过程中巧妙地使用Foveation视觉模型,有效地提高转换效率,产生视觉质量更好的低码率码流,并减少了计算量。 相似文献
39.
利用仿射变换的快速空间关系验证 总被引:1,自引:0,他引:1
为了合理利用视觉关键词之间的空间关系,以提高基于视觉关键词的对象检索方法的准确度,提出一种利用仿射变换进行空间关系验证的算法.首先通过视觉关键词仿射协变的空间邻近特征集进行初步空间关系一致性匹配;然后计算对应仿射协变区块的多组可能的仿射变换矩阵,并选择满足区块匹配最多的变换矩阵作为对象与图像之间最终仿射变换矩阵,其中,仅利用一对协变区块来计算自由度为6的仿射变换的算法有效地提高了计算速度和鲁棒性;最后通过计算出的仿射变换矩阵来精确验证对象与图像之间的空间位置关系是否一致.实验结果表明,与现有方法相比,文中算法更鲁棒,能以较低的计算开销显著地提高基于对象的实时图像检索的准确度. 相似文献
40.
GPU加速的基于增量式聚类的视频拷贝检测方法 总被引:1,自引:1,他引:0
为有效地保护版权,提高大规模视频集的拷贝检测速度,提出一种完全实现在GPU上的基于增量式聚类的拷贝检测方法.对数据库中新增加的视频,首先调用GPU上的硬件解码单元对视频流解码,以实时的速度提取高维SIFT特征点;然后对特征点进行增量K-means聚类,以动态地反映数据库的变化,并根据聚类结果更新视觉关键词词典;再将每帧表示成归一化的词频向量;最后使用基于帧级别词频向量的时空顺序匹配法来判定查询视频是否为数据库中视频的拷贝.实验结果表明,该方法比原有的CPU实现方法整体提速最高达63倍. 相似文献