首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 218 毫秒
1.
提出了一种基于过零率和音频指纹的两步固定音频检索算法.在基于过零率直方图的初步检索中,采用直方图的迭代计算和动态的观测窗滑动步长来减少计算量并加快搜索速度,快速筛选出相似度较高的候选音频片段;接着基于降维Philips音频指纹对候选音频进行精检索,进一步提高检索精度.实验结果表明,该音频检索算法在保证较好的检索准确性基础上,大幅度提高了检索速度,且具有较好的鲁棒性.  相似文献   

2.
针对基于内容的音频检索中由于噪声造成的查找失败问题,本文提出了一种对噪声鲁棒的基于音频指纹因子的音频特征提取算法和一种半监督的音频字典训练算法,以提高噪声下音频检索的精度。本文方法从Mel谱中提取音频指纹,利用非负矩阵分解算法将指纹分解为对噪声鲁棒的频率因子和时间因子作为特征。同时通过提出的半监督音频字典训练算法进行音频字典训练,本文方法使用音效集计算基本音效的分布空间作为初始字典,在量化数据的同时动态更新字典以实现对数据的准确描述。实验结果表明,在低信噪比条件下本文提出的算法的平均查询精度明显高于其他算法。  相似文献   

3.
《计算机工程》2018,(1):280-284
在Philips音频指纹检索算法中,构造一个查询表作为索引,由于内存消耗过大限制其广泛应用。为此,基于Philips音频指纹检索原型,提出一种改进算法。结合斐波那契数列和右移运算,构造新的哈希函数,通过斐波那契优化哈希值分布,并执行右移运算调整哈希表的长度。实验结果表明,改进算法能减少内存消耗,提高系统的实用性。  相似文献   

4.
针对现有音频检索中样本音频特征库数据量较大且检索速率慢问题, 本文提出一种基于压缩感知和音频指纹降维的固定音频检索方法. 在音频检索的训练阶段, 首先, 对样本音频信号进行稀疏化处理, 并通过压缩感知算法对稀疏化后的音频数据进行压缩; 其次, 提取压缩信号的音频指纹; 再次, 引入音频指纹离散基尼系数通过计算音频指纹各维度的离散基尼系数对指纹实施降维, 最终得到检索特征库. 在音频检索阶段用和训练阶段相同的算法提取待检音频的特征与音频特征库数据匹配得出检索结论. 实验结果表明, 所提音频检索方法在确保较好的检索准确率的基础上, 大幅度减小了样本音频数据库的存储量, 提高了音频的检索速率.  相似文献   

5.
针对音频检索应用,提出一种使用提升小波变换和非负矩阵分解的稳健音频指纹方案。原始音频按固定长度分帧,对每帧进行小波提升变换得到低频近似分量和高频细节分量;对细节分量作非负矩阵分解得到可近似表示音频子帧的基矩阵和系数矩阵;将系数矩阵各列元素累加,对各列累加和进行量化得到表示分帧音频指纹序列的1 bit信息。实验结果表明该方案对常见音频处理操作具有良好的稳健性,对音频的局部变化不敏感,能较好地区分不同音频,可用于面向对象的音频检索。  相似文献   

6.
李坚  毛先领  文贵华 《计算机工程》2008,34(11):211-213
提出利用分形几何抽取音频特征的全局化音频检索,将其学习阶段计算音频数据库中每个音频的分维作为特征向量,保存在音频特征数据库中,并建立索引。其检索阶段则首先计算查询音频的分维,然后从音频数据库中快速找出分维最相似的若干音频对象。分维刻画了音频的内在属性如自相似性,使其具有片段检索对匹配的起点不敏感、抗噪音、检索速度快等优点。用FRACTAL, MFCC和SOLAR 3种方法对数据集分别检索,实验结果表明基于分维的音频检索在性能和时间复杂度上有显著优势。  相似文献   

7.
提出一种基于离散小波变换的有效抵抗随机剪切的鲁棒性音频水印算法。该方法首先把音频信号划分为若干个包含相同采样点的帧;然后对每帧进行小波变换,提取小波低频系数并计算相应的绝对平均值;最后根据每帧绝对平均值与低频系数比较的结果,将经过Arnold变换后的二值图像嵌入到小波低频系数中。该算法在对水印进行提取和检测时不需要原始音频。实验结果表明,提出的方法在抵抗各种音频处理(如高斯噪声、MP3压缩、重采样、去噪处理、随机剪切、抖动攻击等)性能良好,尤其是抵抗音频信号的恶意剪切攻击鲁棒性更强。  相似文献   

8.
为提高视频内容检索方法的鲁棒性,提出一种基于AdaBoost的多特征融合指纹检索方法。通过对样本数据的训练,自适应地获得尺度不变特征变换特征、运动特征以及音频特征的权重,利用得到的权重融合音视频特征,以产生视频指纹。实验结果表明,该方法的准确性较高,在尺度变化、亮度变化、音频噪音攻击下具有较好的鲁棒性。  相似文献   

9.
《微型机与应用》2017,(5):38-41
解决大规模音频数据库快速检索的有效手段之一是建立合适的音频索引,其中音频分割和标注是建立音频索引的基础。文中采用了一种基于短时能量和改进度量距离的两步音频分割算法,使得分割后的音频片段具有段间特征差异大、段内特征方差小的特点。在音频分割的基础上进行了音频数据库中音频流的标注;分别基于BP神经网络算法和Philips音频指纹算法对音频进行了音频类别和音频内容的标注,为后续建立音频索引表做准备。实验结果表明,两步分割算法能较好地分割任意音频流,音频标注算法能有效进行基于音频类别和音频内容的标注,算法同时具有良好的鲁棒性。  相似文献   

10.
王伟  陈志高  孟宪凯  李伟 《计算机科学》2017,44(Z6):551-556
介绍了一种基于熵的音频指纹检索技术,该技术采用音频的熵特征作为音频的指纹特征(AFP),在检索中,该指纹特征可以用多种串匹配算法进行信息比对。实验采用最大公共字串(LCS)、编辑距离(Levenshtein Distance)和动态时间规整(DTW)算法实现指纹特征匹配,并采用一定数量的歌曲文件作为实验的测试集。每首歌曲都有一个带有不同的较大失真的音频文件或由不同歌唱家演唱的不同版本,这些带有不同的较大失真的音频文件由原曲经过不同的严重音频处理得到,比如添加噪声、加快速度、剪辑等。实验结果显示,使用的3种匹配算法均可以将训练集中所有的歌曲正确地识别出来,从而证明了基于熵的音频指纹检索技术具有准确性、鲁棒性、区分性等优良性质。  相似文献   

11.
12.
传统的机载录音设备存在记录时间短、录音质量差、查询困难等缺点,提出了一种新的数字录音机设计方案;介绍了MP3编码原理,对混合滤波器组进行了重点分析,包括子带滤波器组、MDCT及窗口选择,介绍了系统设计方案,给出了在S3C2440A上移植开源的MP3编码器shine的过程,提出了一种简单有效的检索信息产生算法,以便于在回放时迅速找到播放点;实验结果表明达到了预期设计目标,在2G的电子盘上可连续记录23h的高质量音频信号,体积小,功耗低,是传统机载录音设备的理想替代品。  相似文献   

13.
针对非法音频拷贝的检索跟踪性能问题进行研究,提出了一种基于新哈希的并行双音频指纹方法。为了提高检测片段的完整性,应用了并行的特性,通过沃尔什—哈达玛转换生成两组实时并行的指纹;通过新哈希方法对两组指纹进行相似性计算;最后检索时让并行的两组指纹进行匹配,合并得到最终结果。实验结果表明,该方法不仅对采用不同方法处理的音频具有良好的鲁棒性,能稳定地表征音频整体特性,与所考虑的其他方法相比,所提出的方法在匹配段完整性方面有所提高。  相似文献   

14.
视频数据中的音频流包含了丰富的语义信息.在基于内容的视频检索中,对音频信息的分析是不可分割的一部分.本文主要讨论基于内容的音频场景分割,分析各种音频特征及提取方法,并在此基础上提出一种新的音频流分割方法,根据六种音频类型(语音、音乐、静音、环境音、纯语音、音乐背景下的语音和环境音背景下的语音)的音频特征对视频数据中的音频流分割音频场景.实验证明该方法是有效的,在保证一定的分割精度的同时,准确率和查全率都得到了较大的提高.  相似文献   

15.
基于混沌和系数均值统计特性的音频指纹方案   总被引:1,自引:1,他引:0       下载免费PDF全文
周鸿飞  杨晓元 《计算机工程》2008,34(13):142-143
提出基于混沌和小波系数统计特性的数字指纹方案。通过用户信息生成混沌映射的初值,由该初值应用混沌方法生成用户指纹,并对其重复编码。对音频信号分帧并对每帧进行加汉明窗处理,对音频帧进行离散小波变换,根据小波系数统计恒定特性将指纹嵌入到每帧中。对音频帧进行逆变换,合并所有帧得到含指纹的音频信号。实验表明,该方案有较强的鲁棒性,能抵御常见音频攻击和处理方法,且对同步攻击不敏感,可用作版权保护,也可利用指纹的抗合谋攻击特性,确定叛逆者。  相似文献   

16.
冯永  李志国  钟将  叶春晓  邓伟 《计算机工程》2008,34(13):87-88,9
动态复制技术对于提高数据网格的性能非常重要。鉴于目前效果较好的动态复制策略均为单选址算法,对于延迟较大、分布较广的网格存在很大局限性,提出3种多选址的动态复制策略,将其转化为经典的数学问题求解。并给出了多选址动态复制策略在远程教育资源管理中的应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号