共查询到15条相似文献,搜索用时 734 毫秒
1.
2.
不同的音频指纹提取算法需要不同的音频指纹搜索。针对某些特定(例如:foosic算法)的音频指纹提取算法,在数据预处理方面提出并实现了两种新的音频指纹搜索算法:PCA(Principle Component Analysis)主成分分析算法、不同帧之间相应的数据求和算法。实验结果表明:应用PCA算法,在搜索正确率为94.98%的情况下,搜索时间缩短为8.42%;应用求和算法,在搜索正确率为95.92%的情况下,搜索时间缩短为3.72%。 相似文献
3.
龙小保 《计算机工程与应用》2013,49(9):197-199
针对音频检索应用,提出一种使用提升小波变换和非负矩阵分解的稳健音频指纹方案。原始音频按固定长度分帧,对每帧进行小波提升变换得到低频近似分量和高频细节分量;对细节分量作非负矩阵分解得到可近似表示音频子帧的基矩阵和系数矩阵;将系数矩阵各列元素累加,对各列累加和进行量化得到表示分帧音频指纹序列的1 bit信息。实验结果表明该方案对常见音频处理操作具有良好的稳健性,对音频的局部变化不敏感,能较好地区分不同音频,可用于面向对象的音频检索。 相似文献
4.
5.
6.
提出基于混沌和小波系数统计特性的数字指纹方案。通过用户信息生成混沌映射的初值,由该初值应用混沌方法生成用户指纹,并对其重复编码。对音频信号分帧并对每帧进行加汉明窗处理,对音频帧进行离散小波变换,根据小波系数统计恒定特性将指纹嵌入到每帧中。对音频帧进行逆变换,合并所有帧得到含指纹的音频信号。实验表明,该方案有较强的鲁棒性,能抵御常见音频攻击和处理方法,且对同步攻击不敏感,可用作版权保护,也可利用指纹的抗合谋攻击特性,确定叛逆者。 相似文献
7.
针对现有音频检索中样本音频特征库数据量较大且检索速率慢问题, 本文提出一种基于压缩感知和音频指纹降维的固定音频检索方法. 在音频检索的训练阶段, 首先, 对样本音频信号进行稀疏化处理, 并通过压缩感知算法对稀疏化后的音频数据进行压缩; 其次, 提取压缩信号的音频指纹; 再次, 引入音频指纹离散基尼系数通过计算音频指纹各维度的离散基尼系数对指纹实施降维, 最终得到检索特征库. 在音频检索阶段用和训练阶段相同的算法提取待检音频的特征与音频特征库数据匹配得出检索结论. 实验结果表明, 所提音频检索方法在确保较好的检索准确率的基础上, 大幅度减小了样本音频数据库的存储量, 提高了音频的检索速率. 相似文献
8.
理想的音频检索方法可以准确、高效地从大规模音频数据库中识别所有音频。但是,目前还没有一种方法可以对所有噪声干扰鲁棒。基于Philips指纹的采样计数音频检索方法是目前最高效的方法之一,如果能解决其无法抵抗线性变换(时间缩放、频率变换)的缺点,则整个采样计数音频检索方法将进一步趋于理想。针对其中的频率变换问题,提出抗频率变换的采样计数音频检索方法,包括变频带间隔的查询指纹生成方法、多频率尺度的查询匹配方法,以及分步骤指纹提取和变过滤阈值两种加速策略。该方法可以抵抗70%到130%的频率变换,效果与目前最好的QUAD方法相当,并且可以扩展到任意使用Philips类的指纹的检索方法以增强其抵抗频率变换干扰的能力。 相似文献
9.
提出一种基于离散小波变换的有效抵抗随机剪切的鲁棒性音频水印算法。该方法首先把音频信号划分为若干个包含相同采样点的帧;然后对每帧进行小波变换,提取小波低频系数并计算相应的绝对平均值;最后根据每帧绝对平均值与低频系数比较的结果,将经过Arnold变换后的二值图像嵌入到小波低频系数中。该算法在对水印进行提取和检测时不需要原始音频。实验结果表明,提出的方法在抵抗各种音频处理(如高斯噪声、MP3压缩、重采样、去噪处理、随机剪切、抖动攻击等)性能良好,尤其是抵抗音频信号的恶意剪切攻击鲁棒性更强。 相似文献
10.
针对基于内容的音频检索中由于噪声造成的查找失败问题,本文提出了一种对噪声鲁棒的基于音频指纹因子的音频特征提取算法和一种半监督的音频字典训练算法,以提高噪声下音频检索的精度。本文方法从Mel谱中提取音频指纹,利用非负矩阵分解算法将指纹分解为对噪声鲁棒的频率因子和时间因子作为特征。同时通过提出的半监督音频字典训练算法进行音频字典训练,本文方法使用音效集计算基本音效的分布空间作为初始字典,在量化数据的同时动态更新字典以实现对数据的准确描述。实验结果表明,在低信噪比条件下本文提出的算法的平均查询精度明显高于其他算法。 相似文献
11.
12.
针对语音识别中固定帧率特征提取方法没有充分考虑语音频谱变化特性、噪声鲁棒性差的问题,提出了一种基于自适应加权和的变帧率方法用于特征提取,并在固定音频检索系统中进行实验,在信噪比为20 dB的情况下,与固定帧率的特征提取方法相比,系统检出率提高了近4%。实验表明,该方法在降低噪声影响,提高固定音频检索性能方面是有效的。 相似文献
13.
数字音频来源被动取证研究旨在不依赖主动嵌入的数字水印或数字签名等冗余信息,通过原始数字音频数据的内在设备信息提取出表征设备源机器指纹的特征,进而对数字音频证据来源做出判断,在司法取证、军事信息、新闻传播等领域有着广泛的应用前景。目前,数字音频来源被动取证的研究综述面临时效性不足、针对性不够的问题。据此,给出了数字音频来源被动取证的研究框架和基本思路。对该领域常用的数据集做了简要的分析。根据数字音频来源被动取证的研究对象,将领域内的研究分为特征表达和表征建模两大模块,对频域信息特征、倒谱特征、基于高斯超矢量信息的特征、融合特征、深度特征五类特征,高斯混合取证模型、支持向量机决策模型、稀疏表达分类器决策模型、其他机器学习决策模型、深度学习决策模型五类模型的性能进行了比较分析。总结分析了数字音频来源被动取证领域的研究现状和存在的问题,并对未来的研究方向进行了展望。 相似文献
14.
Jian-quan Ouyang Hua Nie Min Zhang Zezhou li Yongzhou LiAuthor vitae 《Computers & Electrical Engineering》2011,37(6):991-1008
Sixty-four percent of consumers believe television advertising still has the greatest impact on them. Therefore, there is a great application to provide accurate and real-time TV advertising identification for government and advertisement providers. As the integration of multi-modal method takes full account of video and audio information, this paper aims to handle composite fingerprinting in a unified framework for advertising identification. The Improved Harris Combining Motion feature which is based on the differences between the adjacent video frames can produce video fingerprint. Meanwhile the proposed FIR filter based Fast Audio Fingerprint is focused on extracting the differences between the equivalent bands from adjacent frames. Moreover, this multi-model framework combines the audio and video fingerprint by weighted manner. Experimental results show that compared with the current methods, both audio and video fingerprint has the advantage of higher discrimination, stronger robustness and lower time complexity. Moreover, multi model fingerprint can enhances the performance of the unique fingerprint. 相似文献
15.
音频信息检索的研究及实现 总被引:9,自引:0,他引:9
介绍了常见的基于内容的音频检索的关键技术和音频特征提取的一般方法,讨论了其中基于隐马尔科夫(HMM)模型识别音频例子的关键问题,并在此基础上给出了一个基于内容的音频信息检索系统的框架和实例。 相似文献