首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
视频字幕提取是建立视频信息索引的有效手段,字幕区的检测和定位是新闻视频字幕提取过程中影响识别效率的关键问题。利用新闻视频字幕区在视频帧序列中的变化规律,通过计算视频字幕帧之间的时间相关性能够实现新闻视频字幕场景的快速分割。对经过场景分割同主题新闻视频帧序列中的字幕,以像素的帧序列方差描述其字幕区时间不变性,提出了一种基于帧序列颜色分析的视频字幕区定位提取方法,并通过实验验证了方法的有效性。  相似文献   

2.
针对视频检索过程中存在的视频亮度整体漂移、突变干扰以及视频再编辑等问题,提出了一种融合视频指纹特征和关键帧密度的检索算法.该算法首先对视频帧进行区域分割提取视频指纹特征;其次,采用改进的直接时序算法消除亮度漂移等干扰;最后,引入关键帧密度的概念消除了视频再编辑引起的时间跨度问题,同时采用了一种综合的搜索策略.实验结果表明:改进的算法不仅可有效地应对上述问题,而且算法运算量小、查全率与查准率高,具有很好的鲁棒性.  相似文献   

3.
为了建立一种通用、鲁棒的镜头边界检测算法,根据镜头转换的特性和多种视频特征融合的思想,选取了YUV直方图特征、纹理特征和边缘特征进行特征融合并计算帧间差值,采用全局阈值与自适应阈值相结合的方法,对镜头边界检测加以控制,提高阈值选取的准确性。实验结果表明,该算法能够有效地实现视频镜头边界检测,并对闪光、字幕有着较强的鲁棒性。  相似文献   

4.
针对基于内容的视频检索中的镜头聚类问题,采用了一种基于模拟退火思想改进的K均值聚类算法.该方法提取视频帧的时间信息、均值、方差、偏度和信息熵等颜色直方信息作为特征,利用模拟退火算法全局寻优的能力来改善K均值聚类易陷入局部极值的缺点,从而提高视频镜头聚类的准确性.理论分析和实验结果表明该方法是一种有效的视频镜头聚类算法.  相似文献   

5.
文章提出了一种利用线性回归分析方法的无参考视频序列质量评估算法。该算法主要利用帧间编码帧的比特数和该帧与其参考帧的差异两个参数进行线性回归分析来评估视频质量。该方法不需要原始参考视频,算法简单。通过对标准视频序列的仿真实验,该算法可有效评价不同视频的编码质量,使用该质量评估方法测得的失真视频客观质量评分与其主观质量评分有很好的一致性。  相似文献   

6.
插帧和删帧是常见的视频帧间篡改方式,针对此研究问题,提出一种基于结构相似度均值( MSSIM)商的一致性检测算法。对于一段连续拍摄的视频,由于视频内容的连续性,相邻帧之间的MSSIM商具有连续现象。而对于经过插帧或删帧篡改的视频,其篡改点位置的MSSIM商会发生突变,从而破坏其一致性。为此,该算法首先计算每相邻两帧间的MSSIM值,之后对相邻MSSIM求商并以此作为特征,而后两次利用切比雪夫不等式及阈值法对提取特征进行异常点检测,从而实现对视频插帧和删帧的篡改检测及定位。实验结果表明,该算法对视频插帧和删帧篡改具有较高的检测率。  相似文献   

7.
提出了一种新的基于DWT的视频水印算法,选取视频的奇偶帧进行分帧,利用奇偶帧的二次DWT分解后的低频分量完成动态水印帧的嵌入,提取时通过选择取整系数扩大水印信息的选取范围恢复水印。仿真结果表明,该算法能使嵌入后的视频在抵抗有损压缩、滤波等攻击的同时很好地恢复出动态水印,在维持视频的稳健性的同时提高了视频的隐蔽性。  相似文献   

8.
针对MPEG-2的视频特征,提出了一种视频水印算法。该算法利用GOP中的I帧和P帧实现定位,并在多个B帧嵌入水印信息。在确定嵌入强度时,利用人类视觉特性自适应的方法嵌入阈值。通过仿真测试,该算法具有较好的透明性和鲁棒性。  相似文献   

9.
提出了一种基于时空上下文特征和相关向量机的视频滚动字幕检测算法.可检测视频关键帧中的角点,并估计出角点上的稀疏光流;在对光流场优化的基础上,提出一种新的融合静态和动态特性的滚动字幕统计描述方法,进而结合多个关键帧特征建立起滚动字幕的时空上下文联系;引入相关向量机进行决策.实验结果表明,该算法优于现有4种典型方法,综合性能也略好于基于支持向量机的方法.  相似文献   

10.
提出了一种新的基于一维DFT和Radon变换的视频水印算法,对视频帧进行一维DFT变换,选择频率最高的帧作为嵌入水印的帧,并对该帧进行Radon变换后进行水印的嵌入和抽取。本算法通过三种不同比特率进行了H.264压缩攻击,进行了旋转、平移、缩放的几何变换攻击,同时进行了帧丢失、帧变换、滤波和加噪攻击实验,结果本文算法对上述攻击具有很好的鲁棒性。本算法最重要的优点是具有简单性和实用性。  相似文献   

11.
为了克服现有数字视频取证算法识别准确率低、定位能力差等缺点,提出一种具有高识别率且定位准确的基于Inception-V3网络的二级分类取证算法.在第一级分类器中提出简单的阈值判断方法来区分原始和篡改视频,第二级分类器将采用Inception-V3网络的稠密卷积核结构来自动提取篡改视频帧的高维多尺度特征.高维多尺度特征有助于提升篡改视频帧的识别率.实验结果表明,本文提出的算法不仅能准确地检测出篡改视频,还能从篡改视频中精确定位出篡改帧.  相似文献   

12.
提出了基于语义的视频分析方法及其在武术视频检索中的两个步骤:基于双边滤波的边缘检测算子对时空切片做边缘检测;基于SVM的方法对关键帧进行语义提取并训练分类.利用这两个步骤中的相关算法完成的系统实现了对武术视频的分割与检索.实验证明利用本系统能更好的利用武术视频的特点进行检索.  相似文献   

13.
一种有效的抗闪光灯新闻视频镜头检测方法   总被引:1,自引:0,他引:1       下载免费PDF全文
新闻视频中存在着大量闪光灯事件,对镜头检测带来很大干扰。根据闪光灯事件在视频流时序上的特点,文章提出了一种稳健的抗闪光灯镜头边界检测方法。首先,计算基于直方图分布的帧间差异图;其次,定位出帧间差异图中峰值异常区域;再次,通过对该区域前后视频内容进行检测来滤除闪光灯;最后,利用因果的镜头边界检测方法进行新闻镜头检测。实验结果和性能比较表明,新方法是有效的,避免了多闪光灯造成的影响,提高了检测正确率。  相似文献   

14.
Biography videos based on life performances of prominent figures in history aim to describe great men''s life. In this paper, a novel interactive video summarization for biography video based on multimodal fusion is proposed, which is a novel approach of visualizing the specific features for biography video and interacting with video content by taking advantage of the ability of multimodality. In general, a story of movie progresses by dialogues of characters and the subtitles are produced with the basis on the dialogues which contains all the information related to the movie. In this paper, JGibbsLDA is applied to extract key words from subtitles because the biography video consists of different aspects to depict the character''s whole life. In terms of fusing keywords and key-frames, affinity propagation is adopted to calculate the similarity between each key-frame cluster and key-words. Through the method mentioned above, a video summarization is presented based on multimodal fusion which describes video content more completely. In order to reduce the time spent on searching the interest video content and get the relationship between main characters, a kind of map is adopted to visualize video content and interact with video summarization. An experiment is conducted to evaluate video summarization and the results demonstrate that this system can formally facilitate the exploration of video content while improving interaction and finding events of interest efficiently.  相似文献   

15.
基于DM642的H.264编码实现与优化   总被引:1,自引:0,他引:1  
为优化H.264编码技术在数字信号处理中的实际应用,在对H.264标准中帧内及帧间预测模式深入研究的基础上,提出了2种改进算法:帧内预测时,采用直方图的自相关特性进行快速模式判别;帧间预测时,采用运动估计块匹配过程中得到的绝对值误差和作为中途停止条件,结合运动搜索预处理及残差纹理分析进行模式判别.这2种算法均大幅提高了编码速度.在此基础上合理利用DM642芯片及H.264编码器的自身特点,充分挖掘处理器的并行特性和计算资源等以优化编码器.实验结果表明,在图像质量不变的前提下,编码速度提高到15帧/s,部分序列达到18帧/s,码率上升8%.  相似文献   

16.
提出了一种新的抗摄像机频繁抖动的视频分割算法.采用分层马尔可夫随机场(MRF)模型对视频各帧图像进行多分辨率建模,利用视频序列中帧图像的空间关系来提高分割的准确性,通过Gibbs采样算法求得最大后验概率(MAP),从而实现在摄像机抖动情况下对视频目标的准确分割.在强光、多目标以及复杂背景等情况下对视频序列的车辆目标进行分割.经过实验对比,新算法的分割效果明显优于背景累积相减分割算法以及高斯混合模型方法.  相似文献   

17.
新闻视频中播音员镜头的检测与跟踪是视频故事单元分割的重要基础工作,也是内容信息安全研究的基础。本文提出了一种基于PCA特征提取的新闻视频播音员镜头的检测与跟踪方法。首先将新闻视频进行镜头分割并提取关键帧;其次,通过对关键帧图像进行人脸检测与分析,找到新闻视频中所有候选播音员图像;最后,通过学习方法,实现播音员图像的分类检测,并对播音员镜头进行跟踪。通过对来自CCTV的视频实验结果表明,该方法可有效地实现新闻视频播音员镜头的检测和跟踪.  相似文献   

18.
基于置信度传播(BP:Belief Propagation)的立体匹配算法与局部算法相比,视差准确度高,但需要耗费大量的计算时间。为此,提出一个基于运动估计的置信度传播立体视频匹配算法。该算法首先通过传统的BP算法获得I帧的匹配视差图,并保存每个像素获得最佳视差值的传递信息;然后,通过参考I帧的运动估计信息,得到重新排列的I帧视差值的传递信息,将其作为P帧置信度传播算法的初值进行迭代运算,从而大大减少了P帧置信度传播算法的迭代次数。实验结果表明,该算法能大大提高置信度传播立体视频的匹配效率。  相似文献   

19.
设计了一个用于铁路编组站的驼峰溜放视频系统.通过对实时视频信号的检测自动获取驼峰机车溜放的速度,并随时将机车速度信息反馈给信号员,信号员根据反馈速度信息来调整溜放作业,以达到提高调车效率与安全性的目的.系统的软件架构采用调试运行两用框架,在此基础上设计系统功能和系统配置,并对该软件的测量车速和车长部分的算法进行了探讨.  相似文献   

20.
速率控制与容错联合编码方案   总被引:1,自引:0,他引:1  
针对移动网络中低时延视频应用的诸多约束,提出了一种速率控制和容错编码相结合的H.264视频通信新方案.采用预编码阶段估计出的视频帧及其内部宏块对传输差错的敏感度,设计了自适应的帧级和宏块级目标比特分配方法.根据视频片(slice)中对差错敏感的宏块所占的百分比为其设置了重要性等级,采用Turbo码对不同重要性的片进行不均等差错保护(UEP).实验结果显示,此方案与传统的H.264速率控制与容错算法相比,在解码端可以获得超过1dB的亮度PSNR增益.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号