首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
李坚  毛先领  文贵华 《计算机工程》2008,34(11):211-213
提出利用分形几何抽取音频特征的全局化音频检索,将其学习阶段计算音频数据库中每个音频的分维作为特征向量,保存在音频特征数据库中,并建立索引。其检索阶段则首先计算查询音频的分维,然后从音频数据库中快速找出分维最相似的若干音频对象。分维刻画了音频的内在属性如自相似性,使其具有片段检索对匹配的起点不敏感、抗噪音、检索速度快等优点。用FRACTAL, MFCC和SOLAR 3种方法对数据集分别检索,实验结果表明基于分维的音频检索在性能和时间复杂度上有显著优势。  相似文献   

2.
音频自动分类中的特征分析和抽取   总被引:8,自引:1,他引:8  
音频特征分析和抽取是音频自动分类的基础,本文将音频对象分为静音,噪音,纯语音,带背景音语音,音乐等5类,从帧层次和段层次上深入分析了不同类音频之间的区别性特征,包括帧层次上的MFCC,频域能量,子带能量,过零率,频谱中心等特征,在此基础上计算了段层次上的基本音频特征,包括静音比率,子带能量比均值等,提出了3个音频”流”特征-High-ZCR比率,Low-Frequency-Energy比率,频谱流量.设计并实现了一种基于支持向量机(support vector machine)的自动分类器,考察了上述特征组成的特征集合在该分类器中的分类性能.实验表明,本文提出的特征有效,分类性能良好.  相似文献   

3.
音频数据的一种空间特征模型   总被引:3,自引:0,他引:3  
程凯  李应  黄樟钦 《计算机应用》2004,24(1):143-146
音频是多媒体中一种典型的媒体,音频检索也自然成为多媒体检索的重要内容。本文针对波形声音,提出一种用于产生音频数据索引的空间特征模型,并给出该模型中各个元素的获取算法,举例说明了该空间特征模型的应用。  相似文献   

4.
模糊粗糙集在音频检索中的应用   总被引:1,自引:1,他引:0       下载免费PDF全文
音频具有数据量大、维数高等特点,直接进行音频检索会造成“特征维数灾难”,因此有必要从音频提取最能表现音频特征的音频帧。提出一种基于模糊粗糙集模型(Fuzzy Rough Set Model,FRSM)的音频数据约简算法,根据隶属度对音频数据进行模糊离散,基于知识表达能力约简属性,以等价划分计算具有等同分类能力的知识核。实验结果表明,该算法能够得到最小约简,并且最大程度地保持音频特征,提高检索效率。  相似文献   

5.
利用小波分解和分形维数进行声纳图像识别   总被引:6,自引:0,他引:6  
以分形维数和多重分形的概念为基础,通过计算原图像和灰度差分图像的分形维数和多重分形维数,形成了纹理特征集的第一部分;然后对声纳图像采用树式结构小波变换,将小波变换各个频带输出的熵作为纹理分类的特征,并根据特征本身的离散程度对其进行规范化处理,构成了纹理特征集的第二部分;最后将这两部分组合,对不同信噪比的声纳图像进行分类识别.识别结果表明,文中方法的识别率可达到90%以上.  相似文献   

6.
音频内容分割与聚类的研究   总被引:1,自引:0,他引:1  
分析了采用音频特征检测音频边缘来分割音频的过程,给出了采用高斯混合模型GMM描述音频段的方法;介绍了音频段聚类的实现;并给出了实验结果,实验结果说明分割和聚类的效果较好。  相似文献   

7.
根据地震资料和少量标定井预测油气储层横向变化是油气勘探开发的重要课题,基于分形理论和地质变量具有分形特征,提出了分形模式识别地震储层分析思想,为实现该思想,提出了基于二维分形布朗运动的油气识别方法并将其成功地应用于某油田的油气储层横向预测。  相似文献   

8.
基于COM规范的实时音频特征提取技术及实现   总被引:2,自引:0,他引:2  
蔡波  于俊清  周洞汝 《计算机工程》2003,29(11):116-118
数字视频中含有大量的音频信息,通过声音分类建立基于内容的视频索引是一个有效的途径。该文提出了基于COM规范的实时音频特征提取的系统框架,并按此框架使用DirectShow样本捕捉器进行了音频帧和音频特征实时提取的试验,取得了满意的结果。  相似文献   

9.
基于分形的水声图像目标探测   总被引:4,自引:0,他引:4       下载免费PDF全文
针对水声图像中人造物体的探测问题,给出了一种基于分形分析的方法,由于分形模型可以较好地模拟自然物体,而与人工物体存在较大差距,所以以其为主要特征可以准确地将人造物体从自然背景中探测出来。本文讨论了分维的提取方法,根据分形特征将水声图像标记为人造目标区域和非人造目标区域,并对一定噪声干扰下该方法的应用进行了研究,给出了相应的实验结果。实验结果表明,分形特征可以实现人造目标和自然物体的分类,并具有一定的抗噪声性,适宜对水声图像中的目标进行探测和识别。  相似文献   

10.
基于分形纹理的遥感图像岩性识别方法   总被引:9,自引:0,他引:9  
根据分形理论和遥感影像的特征,本提出一种图像分形纹理计算方法。分形纹理能够准确刻画图像的空间特征信息,在遥感图像分类中作为空间特征信息的补充。利用该方法在河西走廊酒泉盆地的红柳峡地区进行了TM图像的岩性分类实验,当只采用原始TM六个波段图像分类时,精度仅为71.62%,而采用分类纹理信息时分类精度则提高到79.54%。说明分形纹理对岩性空间特征信息有较好的描述,将分形纹理信息配合原始波段进行岩性识别时,总体识别精度达到87.93%.提高了16.3个百分点。因此,该分形纹理对于图像空间特征信息的描述具有重要意义。  相似文献   

11.
基于AdaBoost特征约减的入侵检测分类方法   总被引:1,自引:0,他引:1       下载免费PDF全文
陶晓玲  王勇  罗鹏 《计算机工程》2008,34(18):199-201
提出一种基于AdaBoost的入侵特征约减算法,利用该算法约减入侵特征中的冗余特征,构造Ada-加权和Ada-域值分类器,并与支持向量机分类器进行对比。设计并实现Linux实时入侵检测实验平台,并将特征约减算法和3种分类方法应用于该平台。实验结果表明,由特征约减算法挑选出来的入侵特征集较优,Ada-加权和Ada-域值分类器的分类效果优于支持向量机分类器,且Ada-域值分类器在测试集上的检测性能最佳。  相似文献   

12.
文章处理的是中国民族乐器的识别分类问题.提出了一种基于合适的音频特征值选择方法,该方法在基于MPEG_7标准的声学特征,在特征值的时间特性上进行改造,并加入改进后的特征值.从提取的音频特征值数据集选择K-最近邻算法.特别是对没有加入新特征值和加入新特征值后生成分类器模型的性能进行了比较.实验结果证明新特征值的加入提高了分类器的F1度量值.  相似文献   

13.
This paper addresses a model-based audio content analysis for classification of speech-music mixed audio signals into speech and music. A set of new features is presented and evaluated based on sinusoidal modeling of audio signals. The new feature set, including variance of the birth frequencies and duration of the longest frequency track in sinusoidal model, as a measure of the harmony and signal continuity, is introduced and discussed in detail. These features are used and compared to typical features as inputs to an audio classifier. Performance of these sinusoidal model features is evaluated through classification of audio into speech and music using both the GMM (Gaussian Mixture Model) and the SVM (Support Vector Machine) classifiers. Experimental results show that the proposed features are quite successful in speech/music discrimination. By using only a set of two sinusoidal model features, extracted from 1-s segments of the signal, we achieved 96.84% accuracy in the audio classification. Experimental comparisons also confirm superiority of the sinusoidal model features to the popular time domain and frequency domain features in audio classification.  相似文献   

14.
针对现行异常声音识别算法复杂度高和特征识别率低的问题,将梅尔频率倒谱系数(MFCC)与短时能量混合特征应用到异常声音识别系统中。该混合特征使得高斯混合模型(GMM)分类器可获得比使用MFCC特征及其差分MFCC更好的分类性能。给出了系统实现的具体步骤,并通过仿真实验证明了该算法的有效性,分类器的平均识别率可达到90%以上,并且计算复杂度小。  相似文献   

15.
音频分类是提取音频结构和内容语义的重要手段,是基于内容的音频检索和分析的基础.本文对几种常用的音频分类算法作了综述,介绍了最小距离法、神经网络、支持向量机、决策树方法、隐马尔可夫模型等典型算法的特征,并对它们的优缺点进行了比较.  相似文献   

16.
Content-based audio classification and segmentation is a basis for further audio/video analysis. In this paper, we present our work on audio segmentation and classification which employs support vector machines (SVMs). Five audio classes are considered in this paper: silence, music, background sound, pure speech, and non- pure speech which includes speech over music and speech over noise. A sound stream is segmented by classifying each sub-segment into one of these five classes. We have evaluated the performance of SVM on different audio type-pairs classification with testing unit of different- length and compared the performance of SVM, K-Nearest Neighbor (KNN), and Gaussian Mixture Model (GMM). We also evaluated the effectiveness of some new proposed features. Experiments on a database composed of about 4- hour audio data show that the proposed classifier is very efficient on audio classification and segmentation. It also shows the accuracy of the SVM-based method is much better than the method based on KNN and GMM.  相似文献   

17.
We present an algorithm that predicts musical genre and artist from an audio waveform. Our method uses the ensemble learner ADABOOST to select from a set of audio features that have been extracted from segmented audio and then aggregated. Our classifier proved to be the most effective method for genre classification at the recent MIREX 2005 international contests in music information extraction, and the second-best method for recognizing artists. This paper describes our method in detail, from feature extraction to song classification, and presents an evaluation of our method on three genre databases and two artist-recognition databases. Furthermore, we present evidence collected from a variety of popular features and classifiers that the technique of classifying features aggregated over segments of audio is better than classifying either entire songs or individual short-timescale features. Editor: Gerhard Widmer  相似文献   

18.
论文使用音频分析技术和模式识别技术相结合的方法对传统京剧中的3种典型角色(生、旦、净)的唱腔和2种典型的纯伴奏形式(文场和武场)进行了基于内容的自动分类研究。实验测试数据包括266个片段,来自于许多著名京剧演员如梅兰芳、袁世海、于魁智等人的演出。实验结果表明,对于5类分类问题可以达到88.7%的平均分类正确率,对于有伴奏下的唱腔和纯伴奏之间的2类分类问题可以取得高达96.6%的平均分类正确率。这一结果对京剧的进一步研究有着重要意义。  相似文献   

19.
王晓峰  蒋先涛 《微机发展》2012,(10):59-61,65
音频分类在多媒体应用中十分广泛,主要有时域分析和频域分析方法。文中提出了一种基于自适应间距比(APR)算法和支持向量机(svrd)算法的音频分类方法,先用APR算法区分语音与非语音;对于非语音,再通过SVM进行音频分类。APR算法是比较PR参数和阈值来区分语音和非语音,它和信噪比密切相关;而将非语音分成四组:音乐,汽车,会议,雨声,提取特征因子。实验结果表明:文中设计的分类器的精度达到93.75%以上,能很好地把各类型音频分开。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号