共查询到19条相似文献,搜索用时 100 毫秒
1.
2.
3.
视频检索中的边界检测算法 总被引:1,自引:0,他引:1
从视频检索技术的发展背景出发,重点介绍了视频检索技术中镜头的边界检测技术。分别介绍了基于解压的全图像序列的算法,基于压缩视频的算法以及基于确定变换模型的算法三类算法。最后,对基于内容的视频检索提出一些值得进一步研究的问题。 相似文献
4.
关键帧的提取是视频数据结构化的一部分,在获得关键帧之后就可以进入基于内容的图像检索阶段,实现基于内容的视频检索。本文提出了一种在镜头边界检测之后再进行视频帧聚类的方法来提取关键帧。聚类形成了数据更小的子镜头,最后从子镜头中选择与聚类中心距离最小的一帧作为关键帧。最后,通过仿真实验表明该方法能够快速有效地提取出视频关键帧。 相似文献
5.
文章先对压缩视频直接进行镜头分割,然后选取熵值最大的镜头进行检索,通过对视频运动进行统计,把镜头运动量化到二维概率分布空间,选择距离与样本最较近的目标,大幅缩小检测范围,然后再进行关键帧比对,实现对视频的快速准确检索。 相似文献
6.
一种压缩域中基于镜头的视频检索方法 总被引:1,自引:0,他引:1
镜头是视频的基本单元。文章提出了一个计算镜头纹理直方图和在压缩域中基于镜头的视频检索方法。对镜头中所有Ⅰ帧的DC图分别提取颜色和纹理直方图,然后分别形成镜头的可变阿尔法颜色和纹理直方图.并用镜头的这些特征在镜头层次上用不同的距离度量方法进行视频检索。实验结果表明,基于镜头的检索用L1度量距离比用L2和Χ^2度量距离有更好的检索性能,而且避免了基于关键帧检索中由于镜头运动等原因可能导致镜头关键帧选择不当对检索性能的影响,因而比基于关键帧检索具有更好的检索性能。 相似文献
7.
8.
9.
新闻视频字幕是新闻视频数据中所包含的固有信息,是实现自动化视频检索的重要信息源,运用X^2直方图匹配法检测突变镜头,再通过C-均值聚类算法标识出新闻字幕,可以准确提取出新闻字幕,利用新闻视频字幕进行新闻视频检索,可以克服现有硬件设备的局限性,提高检索的速度和准确性,进而提高数字电视的人机交互性。 相似文献
10.
用非监督式聚类进行视频镜头分割 总被引:2,自引:1,他引:2
镜头边界检测是基于内容的视频检索首先要解决的问题。研究人员通常将镜头转换分为突变和渐变,并根据各种转换的特点采用不同的检测算法。在研究中发现,视频镜头的抽象程度与对其进行边界划分的精度相关。为此,提出采用非监督式聚类算法,按照给定的相似尺度对视频数据进行自组织和动态分析,完成层次化的镜头分割。该算法侧重于揭示视频的层次结构,能实现不同精度的视频抽象要求。 相似文献
11.
Focusing on the problem of goal event detection in soccer videos, a novel method based on Hidden Markov Model (HMM) and the semantic rule is proposed. Firstly, a HMM for a goal event is constructed. Then a Normalized Semantic Weighted Sum (NSWS) rule is established by defining a new feature of shots, semantic observation weight. The test video is detected based on the HMM and the NSWS rule, respectively. Finally, a fusion scheme based on logic distance is proposed and the detection results of the HMM and the NSWS rule are fused by optimal weights in the decision level, obtaining the final result. Experimental results indicate that the proposed method achieves 96.43% precision and 100% recall, which shows the effectiveness of this letter. 相似文献
12.
13.
It is significant to detect and track soccer players in broadcast sports video, which is helpful to analysis player activity and team tactics. However, it is challenging to efficiently detect and track soccer players with shots switched and noise caused by auditorium and billboards. And for multi-player tracking how to treat the increase or decrease of player are also difficult. In this paper, a robust player detection algorithm based on salient region detection and tracking based on enhanced particle filtering are proposed. Salient region detection is used to segment sports fields, and then soccer players are detected by edge detection combined with Otsu algorithm. For soccer players tracking, we use an enhanced particle filter which we improve the algorithm in sample and the likelihood function combing the color feature and edge feature. Experimental results show the proposed algorithm can quickly and accurately detect and track soccer players in broadcast video. 相似文献
14.
15.
本文提出了一种基于音视模板匹配的新闻视频识别方法。在模板建立过程中,从新闻视频片头中的主题音乐提取音频模板,从主持人镜头中的扩展人脸区域提取视觉模板,这两者共同构成音视模板;在识别过程中,对电视视频流先进行音频模板匹配,然后由匹配通过的候选时间点定位到相应的视频镜头,接着通过视觉模板对镜头中的扩展人脸区域进行匹配,进而确定主持人镜头,最后完成新闻视频识别。实验结果表明,该方法计算效率高、简单易操作,具有较好的实用价值。 相似文献
16.
Efficient Automatic Text Location Method and Content-Based Indexing and Structuring of Video Database 总被引:2,自引:0,他引:2
Hae-Kwang Kim 《Journal of Visual Communication and Image Representation》1996,7(4):336-344
An efficient automatic text detection and location method for video documents is proposed and its application for the content-based retrieval of video is presented and discussed. Target frames are selected at fixed time intervals from shots detected by a scene-change detection method. For each selected frame, segmentation by color clustering is performed around color peaks using a color histogram. For each color plane, text-lines are detected using heuristics, and the temporal and spatial position and the text-image of each text-line are stored in a database. Experimental results for text detection in video images and the performance of the method are reported for various video documents. A user interface for text-image based browsing is designed for direct content-based access to video documents, and other applications are discussed. 相似文献
17.
镜头边界检测是实现基于内容的视频检索的一个重要步骤.为了将视频分割成镜头,现有的方法大都是首先提取大量的特征然后构造相异性测度函数.然而,太多的特征就会降低算法的效率.因此,有必要对镜头边界检测的规则进行特征约简.本文将粗糙集中的属性重要性和模糊粗糙集中的分类精度相结合定义了模糊粗糙算子,并构造了相异度检测函数.最后给出了镜头边界检测的一般性规则.由于本文检测方案的自适应性,因此适合于各种类型的新闻视频.用来自中央电视台的3个多小时的新闻视频所做的镜头边界检测实验获得了95.4%的查全率和96.1%的准确率. 相似文献
18.
随着视频等多媒体数据呈指数式迅猛增长,高效快速的视频检索算法引起越来越多的重视。传统的图像特征如颜色直方图以及尺度不变特征变换等对视频拷贝检测中检索速度以及检测精度等问题无法达到很好的效果,因此文中提出一种多特征融合的视频检索方法。该方法利用前后两帧的时空特征进行基于滑动窗口的时间对齐算法,以达到减少检索的范围和提高检索速度的目的。该算法对关键帧进行灰度序列特征、颜色相关图特征以及SIFT局部特征提取,然后融合全局特征和局部特征两者的优势,从而提高检测精度。实验结果表明,该方法可达到较好的视频检索精度。 相似文献
19.
现有的大多数视频事件检测方法首先从视频帧或视频快照中提取特征,然后对特征进行量化和汇集,进而为整个视频生成一个向量表示.最后的汇集步骤虽然简单高效,但是可能丢失时间局部信息,而这些信息对于确定长视频中事件发生的位置具有重要作用,从而削弱了事件检测的准确性.为此,本文首先将每个视频表示为多个“实例”,并将其定义为不同时间间隔的视频段.然后,针对每个视频的正实例比例已知和未知两种情况,提出基于多尺度实例学习的检测算法,在将实例标签看成隐藏潜在变量的同时推断出实例标签以及实例尺度的事件检测模型.最后,利用大规模视频事件数据集进行了全面的仿真实验,结果证明了本文算法具有显著的性能提升.此外,算法还可以确定视频中导致正检测的时间段的位置,进而对检测结果做出解释. 相似文献