排序方式: 共有19条查询结果,搜索用时 0 毫秒
1.
篮球视频冗余数据分析与检测 总被引:1,自引:0,他引:1
体育视频因收视群体稳定,结构规则明确,商业潜力巨大而备受关注.文章在重点分析体育视频内容特征的基础上,提出体育视频冗余数据(Sports Redundancy Data简称SRD)这一概念,结合基于内容的视频分析方法和体育视频特有的时间、结构、规则等特征,采用主区域颜色(MRC)和多重区域分割算法,实现了对篮球视频"冗余"数据的分析与检测.实验结果表明,算法在查全率、查准率方面都达到了较好的效果. 相似文献
2.
基于内容的体育视频分类是高效管理大量体育视频数据的关键步骤之一,为提高体育视频分类方法的正确率及泛化能力,提出一种基于类型标志镜头与视觉词袋模型相结合的体育视频分类方法.首先给出类型标志镜头的定义,并通过类型标志镜头构建该镜头视频帧训练库;然后构建基于视频帧训练库的金字塔视觉词袋模型,将视频帧标志为归一化的词频向量,使用SVM对视频帧进行分类;再通过分析视频帧分类错误的原因及表现形式提出基于时序连续性孤立帧去除算法,以消除视频帧的错误归类.由于体育视频按组合类型可分为单一体育视频与混合体育视频,因此分别提出了单一体育视频及混合体育视频2种分类算法.实验结果表明,文中算法具有实现简单、处理速度快和准确度高的优点. 相似文献
3.
目的 视觉检索需要准确、高效地从大型图像或者视频数据集中检索出最相关的视觉内容,但是由于数据集中图像数据量大、特征维度高的特点,现有方法很难同时保证快速的检索速度和较好的检索效果。方法 对于面向图像视频数据的高维数据视觉检索任务,提出加权语义局部敏感哈希算法(weighted semantic locality-sensitive hashing, WSLSH)。该算法利用两层视觉词典对参考特征空间进行二次空间划分,在每个子空间里使用加权语义局部敏感哈希对特征进行精确索引。其次,设计动态变长哈希码,在保证检索性能的基础上减少哈希表数量。此外,针对局部敏感哈希(locality sensitive hashing, LSH)的随机不稳定性,在LSH函数中加入反映参考特征空间语义的统计性数据,设计了一个简单投影语义哈希函数以确保算法检索性能的稳定性。结果 在Holidays、Oxford5k和DataSetB数据集上的实验表明,WSLSH在DataSetB上取得最短平均检索时间0.034 25 s;在编码长度为64位的情况下,WSLSH算法在3个数据集上的平均精确度均值(mean average precision,mAP)分别提高了1.2%32.6%、1.7%19.1%和2.6%28.6%,与几种较新的无监督哈希方法相比有一定的优势。结论 通过进行二次空间划分、对参考特征的哈希索引次数进行加权、动态使用变长哈希码以及提出简单投影语义哈希函数来对LSH算法进行改进。由此提出的加权语义局部敏感哈希(WSLSH)算法相比现有工作有更快的检索速度,同时,在长编码的情况下,取得了更为优异的性能。 相似文献
4.
随着多客户端交互多媒体应用的快速发展,屏幕内容图像(Screen content image,SCI)的分发和处理与日俱增.图像质量评价课题的研究是其它许多应用的基础,至今图像质量评价课题研究的重点是传统自然图像,因此针对屏幕图像质量评价的研究就变的非常迫切和必要.客观图像质量评价算法的提出的基础建立在标准图像质量评价数据库上.本文首先构建了一个大规模的屏幕内容图像质量评价数据库(Immersive Media Laboratory screen content image quality database,IML-SCIQD).IML-SCIQD数据库包含参考图像25张以及经过10种失真处理的1250张失真图像.以建立的IML-SCIQD数据库为基础,考虑到屏幕内容图像图像区域和文本区域的视觉感知差异,在基于自然场景统计的无参考方法的启发下,本文提出了针对屏幕内容图像的无参考评价算法(Natural Scene Statistics based No Reference Screen Content Image Quality Assessment metric,NSNRS).NSNRS算法首先分别计算图像区域和文本区域的质量分数,再将这两个区域的质量分数结合起来得到整幅失真图像的质量分数.该算法与其它12种经典的客观评价算法,包括全参考算法,部分参考算法与无参考算法,在IML-SCIQD数据库和SIQAD数据库上进行了性能测试和对比,结果表明本文提出的算法优于经典的的无参考评价算法;就整个数据库而言,本文提出的算法可以达到与全参考方法相当的性能. 相似文献
5.
为了对被篡改过的视频进行准确快速的篡改检测与定位,引入人类视觉可计算模型,提出一种多层次、多粒度的视频篡改快速检测与定位算法.采用随机分块采样技术,提取视频结构感知特征及视频图像时域感知特征,利用哈希理论的单向摘要特性量化感知特征,获取视频摘要哈希.通过应用相似度矩阵进行多粒度、多层次篡改部位检测与定位.实验结果表明,相似度拟合图能够体现视频篡改攻击强度和攻击部位,算法表现出更好的篡改检测准确率与定位精确度. 相似文献
6.
基于DC系数和运动矢量的快速场景分割算法 总被引:1,自引:0,他引:1
场景分割技术是动态视频分析和基于内容的视频检索的基础,以检测出来的场景作为基本单元,可以进一步对视频内容进行分析和建立索引.本文旨在提出一种基于MPEG压缩视频流的场景分割算法,利用MPEG数据流中已有的DCT DC系数和运动矢量,来检测场景的变换,从而实现场景分割,针对实际视频流中场景突变和渐变两类变换.本文提出两种方法分别处理不同情况,对于突变检测,该算法可以定位到帧,由于该算法进行最小程度的解码,降低了计算复杂度,因而大大提高了检测速度. 相似文献
7.
基于直线抽取的数字视频全局文字提取的研究 总被引:1,自引:0,他引:1
提出一种基于相位编组提取数字视频文字区域的算法.本算法首先基于相位编组抽取视频帧中的直线,然后过滤掉弱边缘直线;对边缘进行尺寸限制过滤掉了不符合文字尺寸的边缘.进一步提出了像素密度α的概念,并指出文字区域的像素密度α应在某一阈值范围之内(αmin≤α≤αmax),通过像素密度α滤去了非文字区域,最后应用投影法最终确定文字区域.以上方法的结合保证了本算法的正确率和鲁棒性.最后选用不同类型的视频素材对本算法进行了实验,表明本算法具有较好的正确率和较快的计算速度. 相似文献
8.
根据使用的压缩域上的信息将当前国内外的视频分段技术划分为5种类型,介绍了各种研究方法的特点及其不足之处,分析了当前视频分段技术的研究现状和存在问题,并对其研究前景进行了探讨。 相似文献
9.
视频数据中的音频流包含了丰富的语义信息.在基于内容的视频检索中,对音频信息的分析是不可分割的一部分.本文主要讨论基于内容的音频场景分割,分析各种音频特征及提取方法,并在此基础上提出一种新的音频流分割方法,根据六种音频类型(语音、音乐、静音、环境音、纯语音、音乐背景下的语音和环境音背景下的语音)的音频特征对视频数据中的音频流分割音频场景.实验证明该方法是有效的,在保证一定的分割精度的同时,准确率和查全率都得到了较大的提高. 相似文献
10.
一种基于视频聚类的关键帧提取方法 总被引:9,自引:0,他引:9
关键帧提取技术是视频分析和基于内容的视频检索的基础。关键帧的使用大大减少了视频索引的数据量,同时也为视频摘要和检索提供了一个组织框架。该文简单介绍了目前的关键帧提取技术,提出了一种基于聚类利用颜色直方图提取关键帧的方法来克服其它方法的不足。实验证明该方法计算量小,可以较好地代表视频内容。 相似文献