共查询到16条相似文献,搜索用时 218 毫秒
1.
2.
针对基于内容的音频检索中由于噪声造成的查找失败问题,本文提出了一种对噪声鲁棒的基于音频指纹因子的音频特征提取算法和一种半监督的音频字典训练算法,以提高噪声下音频检索的精度。本文方法从Mel谱中提取音频指纹,利用非负矩阵分解算法将指纹分解为对噪声鲁棒的频率因子和时间因子作为特征。同时通过提出的半监督音频字典训练算法进行音频字典训练,本文方法使用音效集计算基本音效的分布空间作为初始字典,在量化数据的同时动态更新字典以实现对数据的准确描述。实验结果表明,在低信噪比条件下本文提出的算法的平均查询精度明显高于其他算法。 相似文献
3.
4.
针对现有音频检索中样本音频特征库数据量较大且检索速率慢问题, 本文提出一种基于压缩感知和音频指纹降维的固定音频检索方法. 在音频检索的训练阶段, 首先, 对样本音频信号进行稀疏化处理, 并通过压缩感知算法对稀疏化后的音频数据进行压缩; 其次, 提取压缩信号的音频指纹; 再次, 引入音频指纹离散基尼系数通过计算音频指纹各维度的离散基尼系数对指纹实施降维, 最终得到检索特征库. 在音频检索阶段用和训练阶段相同的算法提取待检音频的特征与音频特征库数据匹配得出检索结论. 实验结果表明, 所提音频检索方法在确保较好的检索准确率的基础上, 大幅度减小了样本音频数据库的存储量, 提高了音频的检索速率. 相似文献
5.
龙小保 《计算机工程与应用》2013,49(9):197-199
针对音频检索应用,提出一种使用提升小波变换和非负矩阵分解的稳健音频指纹方案。原始音频按固定长度分帧,对每帧进行小波提升变换得到低频近似分量和高频细节分量;对细节分量作非负矩阵分解得到可近似表示音频子帧的基矩阵和系数矩阵;将系数矩阵各列元素累加,对各列累加和进行量化得到表示分帧音频指纹序列的1 bit信息。实验结果表明该方案对常见音频处理操作具有良好的稳健性,对音频的局部变化不敏感,能较好地区分不同音频,可用于面向对象的音频检索。 相似文献
6.
7.
提出一种基于离散小波变换的有效抵抗随机剪切的鲁棒性音频水印算法。该方法首先把音频信号划分为若干个包含相同采样点的帧;然后对每帧进行小波变换,提取小波低频系数并计算相应的绝对平均值;最后根据每帧绝对平均值与低频系数比较的结果,将经过Arnold变换后的二值图像嵌入到小波低频系数中。该算法在对水印进行提取和检测时不需要原始音频。实验结果表明,提出的方法在抵抗各种音频处理(如高斯噪声、MP3压缩、重采样、去噪处理、随机剪切、抖动攻击等)性能良好,尤其是抵抗音频信号的恶意剪切攻击鲁棒性更强。 相似文献
8.
9.
10.
介绍了一种基于熵的音频指纹检索技术,该技术采用音频的熵特征作为音频的指纹特征(AFP),在检索中,该指纹特征可以用多种串匹配算法进行信息比对。实验采用最大公共字串(LCS)、编辑距离(Levenshtein Distance)和动态时间规整(DTW)算法实现指纹特征匹配,并采用一定数量的歌曲文件作为实验的测试集。每首歌曲都有一个带有不同的较大失真的音频文件或由不同歌唱家演唱的不同版本,这些带有不同的较大失真的音频文件由原曲经过不同的严重音频处理得到,比如添加噪声、加快速度、剪辑等。实验结果显示,使用的3种匹配算法均可以将训练集中所有的歌曲正确地识别出来,从而证明了基于熵的音频指纹检索技术具有准确性、鲁棒性、区分性等优良性质。 相似文献
11.
12.
传统的机载录音设备存在记录时间短、录音质量差、查询困难等缺点,提出了一种新的数字录音机设计方案;介绍了MP3编码原理,对混合滤波器组进行了重点分析,包括子带滤波器组、MDCT及窗口选择,介绍了系统设计方案,给出了在S3C2440A上移植开源的MP3编码器shine的过程,提出了一种简单有效的检索信息产生算法,以便于在回放时迅速找到播放点;实验结果表明达到了预期设计目标,在2G的电子盘上可连续记录23h的高质量音频信号,体积小,功耗低,是传统机载录音设备的理想替代品。 相似文献
13.
针对非法音频拷贝的检索跟踪性能问题进行研究,提出了一种基于新哈希的并行双音频指纹方法。为了提高检测片段的完整性,应用了并行的特性,通过沃尔什—哈达玛转换生成两组实时并行的指纹;通过新哈希方法对两组指纹进行相似性计算;最后检索时让并行的两组指纹进行匹配,合并得到最终结果。实验结果表明,该方法不仅对采用不同方法处理的音频具有良好的鲁棒性,能稳定地表征音频整体特性,与所考虑的其他方法相比,所提出的方法在匹配段完整性方面有所提高。 相似文献
14.
视频数据中的音频流包含了丰富的语义信息.在基于内容的视频检索中,对音频信息的分析是不可分割的一部分.本文主要讨论基于内容的音频场景分割,分析各种音频特征及提取方法,并在此基础上提出一种新的音频流分割方法,根据六种音频类型(语音、音乐、静音、环境音、纯语音、音乐背景下的语音和环境音背景下的语音)的音频特征对视频数据中的音频流分割音频场景.实验证明该方法是有效的,在保证一定的分割精度的同时,准确率和查全率都得到了较大的提高. 相似文献
15.
提出基于混沌和小波系数统计特性的数字指纹方案。通过用户信息生成混沌映射的初值,由该初值应用混沌方法生成用户指纹,并对其重复编码。对音频信号分帧并对每帧进行加汉明窗处理,对音频帧进行离散小波变换,根据小波系数统计恒定特性将指纹嵌入到每帧中。对音频帧进行逆变换,合并所有帧得到含指纹的音频信号。实验表明,该方案有较强的鲁棒性,能抵御常见音频攻击和处理方法,且对同步攻击不敏感,可用作版权保护,也可利用指纹的抗合谋攻击特性,确定叛逆者。 相似文献