期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

罗森林李金玉潘丽敏《北京理工大学学报》2011,31(10):1231-1235

提出一种基于Mel频率倒谱系数(MFCC)和AdaBoost算法的特定类型音频流泛化识别方法,通过分析特定类型音频流的子类别间的共性和差异性,利用共性特征进行泛化识别,能够准确地检测并定位音频流中特定类型的音频.文中将枪声作为特定类型音频进行研究,通过提取各种枪声子类别的共性,弱化子类间的差异得到一个泛化的枪声模板,利用一个模板就可以支持多子类的准确识别.实验结果表明,算法的识别准确率为87.6%,查全率达到91.8%. 相似文献

2.

2D-Haar声学特征超向量快速生成方法

谢尔曼罗森林潘丽敏《北京理工大学学报》2016,36(3):295-301

针对大数据量音频的高速处理,提出一种快速的声学特征超向量生成方法,有效提高音频识别系统的识别速度和精度.所提方法首先将多个连续音频帧的常用声学特征构成声学特征图,进而使用低复杂度的运算方法在其中快速提取维数达数十万的Haar-like声学特征;然后使用AdaBoost.MH算法,筛选出具有较高代表性的Haar-like声学特征模式组合,用以构成声学特征超向量;进而提出Random AdaBoost特征筛选方法,进一步提高特征筛选速度.实验结果表明,在音频事件识别、说话人识别、说话人性别识别3种场合下,使用Haar-like声学特征可以使SVM、C5.0、AdaBoost等识别算法获得比MFCC、PLP、LPCC等常用声学特征更高的识别准确率,同时可以获得7~20倍的训练速度提升和5~10倍的识别速度提升. 相似文献

3.

基于遗传算法优化匹配追踪的自然环境声音分类

下载免费PDF全文

李明李应《福州大学学报(自然科学版)》2012,40(6):719-725

针对自然环境中各种背景噪声下的声音事件识别问题,提出一种基于遗传匹配追踪算法将自然环境音频信号稀疏表示进行分类的方法.首先,利用匹配追踪(MP)算法稀疏表示信号的主体结构,以消除噪声影响,其中利用采用精英策略的遗传算法(GA)优化MP的分解重构速度;接着,提取MFCCs作为音频信号的特征参数;最后,使用分类器支持向量机(SVM)和高斯混合模型(GMM)对4大类19种声音进行分类与比较,分类效果明显优于未进行稀疏表示的声音信号.实验表明,SVM模型分类效果优于GMM,提出的方法对实地采集的自然环境音频信号能有效识别. 相似文献

4.

基于特征融合方法的车型识别研究

赵宏旭《科学技术与工程》2018,18(18)

车辆音频信号具有复杂的特征,单一特征提取方法不能全面反应该特点。为了使提取的音频信号特征能更好地反映车辆原始信号,本文提出了将已有的短时能量(ENERGY)、短时傅里叶变换（STFT）及梅尔倒谱系数（MFCC）特征提取方法进行融合的方法,依据支持向量机（SVM）的分类识别算法,达到车辆识别的目的。实验表明,提出的组合方法优于单一提取方法,实现了提高识别率的目标,其中,ENERGY+MFCC组合方式效果最好。相似文献

5.

基于支持向量机和遗传算法融合的入侵检测 总被引：2，自引：0，他引：2

张飞张得生《青岛化工学院学报(自然科学版)》2013,(5):532-535,541

为了研究网络异常入侵检测问题,将支持向量机（SVM）和遗传（GA）算法融合并应用于入侵检测领域,区分正常和异常的用户行为,实现对网络系统的入侵检测.传统SVM算法易产生训练参数选择不当,难以获得较高的检测效率和分类精度等问题.针对此问题,提出了一种优化的基于SVM-GA融合的入侵检测方法,首先对网络入侵数据进行归一化处理简化输入,然后通过遗传算法对SVM训练参数进行同步优化,最后采用SVM算法对网络数据进行检测,分类识别得到网络入侵结果.仿真实验结果表明,该融合算法训练时间短、检测精度高、误报率和漏报率低,是一种有效可行的入侵检测方法. 相似文献

6.

说话人辨认中基于进化策略的最大互信息训练方法

茅晓泉胡光锐唐斌《上海交通大学学报》2003,37(3):335-337

针对最大似然训练分辨能力的不足，把最大互信息训练方法引入到高斯混合模型（GMM）的训练中，并直接采用进化策略实现模型参数的全局训练，以模型与训练数据之间的互信息作为进化过程中个体的适应度。该系统不仅分辨能力强，而且摆脱了局部搜索的缺陷。实验结果表明，这种方法生成的说话人辨认系统的识别性能要优于传统的期望最大化算法（EM）生成的系统。相似文献

7.

基于改进MGR融合算法的视频信息融合框架

李梅王晶樊刘娟《太原理工大学学报》2013,44(1):9-13

针对视频信息具有的多模态性质,提出了融合视音频多种模态特征信息的视频融合分析框架,用以提高视频检索的正确率和效率.该框架根据从视频底层提取出的多种图像特征、音频特征,采用基于图嵌入框架的降维算法MFA降维,根据降维后得到的各种特征向量,训练SVM分类器进行分类,并用改进后的MGR融合算法对SVM分类器输出的序号矩阵进行融合分析.实验结果表明该融合框架融合多种特征提高了分类识别的效率,采用了改进的融合算法降低了计算复杂度,提高了系统的整体性能. 相似文献

8.

一种基于网格的最近邻SVM新算法

吴渝向浩宇刘群《重庆邮电大学学报(自然科学版)》2008,20(6):706-709

支持向量机(SVM)算法往往由于分类面过分复杂或过学习而导致其泛化能力降低,现有的最近邻（NNSVM)或K近邻（KNNSVM）方法解决了这类样本问题,但算法时间复杂度高,处理海量样本的能力有限。在NNSVM算法的基础上引入了网格概念,提出了GNNSVM算法,该算法先对空间进行分块,然后在空间块内计算样本距离,找出最近邻,并结合分块序列最小优化算法(SMO)进行了算法实现。实验表明,该方法降低了计算复杂度,它在保持分类精度的同时,提高了训练和分类的速度,并具有较强的泛化能力,从而提高了原NNSVM算法的海量数据处理能力。相似文献

9.

基于GMM统计参数和SVM的说话人辨认研究

贺志阳张玲华《南京邮电大学学报(自然科学版)》2006,26(3):78-82

支持向量机(SVM)是以统计学习理论为基础,解决模式识别问题的有力工具,但是它训练算法复杂,难以处理大量样本,限制了其在说话人识别方面的使用。针对这个问题,提出了一种基于GMM(高斯混合模型)统计参数和SVM的说话人辨认系统,以GMM模型的统计参数来训练SVM说话人辨认模型,有效解决了大样本数据下SVM模型的训练问题。实验表明,该方法有良好的效果,并且与倒谱加权方法结合后,可以增强系统的健壮性,进一步提高系统的识别率。相似文献

10.

采用复倒谱和子串匹配的音频指纹算法研究

周亦敏牟同鑫《上海理工大学学报》2010,32(3)

提出了一种基于复倒谱变换和子串匹配的数字音频指纹算法.该算法通过应用混沌方法生成用户指纹,并将原始音频信号分帧并实施复倒谱变换后,进行指纹嵌入.指纹的识别采用子串匹配的方法,计算出待检测的指纹与原始指纹之间的匹配结果,最终确定待检测的未知音频.实验结果表明:该算法具有良好的鲁棒性,能抵御常见的音频攻击,可应用于音乐版权保护、音频识别等领域. 相似文献

11.

基于改进支持向量机的冷轧带钢表面缺陷分类识别

王成明颜云辉陈世礼韩英莉《东北大学学报(自然科学版)》2007,28(3):410-413

针对冷轧带钢表面缺陷图像模式识别中存在的问题,提出了基于改进支持向量机的冷轧带钢典型表面缺陷分类识别方法.根据带钢表面缺陷图像识别的特点,对渐进直推式支持向量机在其基本原理基础上加以改进,设计了一种冷轧带钢表面缺陷图像模式识别的分类器.通过实验确定了分类器的结构,给出了相关参数选择的方法.对几种生产现场出现频率较高的典型缺陷图像进行了计算机实验研究.研究结果显示,这种分类器很好地克服了传统支持向量机中存在的推广性能差以及当类别距离过近时准确率下降的问题,具有更好的适应性和准确性. 相似文献

12.

驾驶员不良情绪状态检测系统的方法研究

马兴民孙文财徐艺郑鹏宇《吉林大学学报(信息科学版)》2015,33(6):680-684

针对驾驶员因处于非常状态下驾车而频繁导致交通事故问题, 设计了驾驶员不良情绪状态检测系统。该系统采用LBP(Local Binary Patterns)和SVM(Support Vector Machine)决策树相结合的算法分析、识别人脸表情。经实验验证, 该方法有较高的准确率, 系统运行速度快。相似文献

13.

基于特征的音频比对技术

郭兴吉范秉琪《河南师范大学学报(自然科学版)》2006,34(2):35-38

音频比对有别于语音识别,音频比对不存在音频重构.在保证音频主要信息不丢失的前提下,采用二阶Haar小波变换压缩原始音频,以音频帧的方式提取出能代表音频主要信息特征的质心、均方根和前12个Mel倒谱系数,并分别计算这3类参数的欧氏距离,根据欧氏距离的值与阀值ε之间的关系,完成音频间的比对任务.经实践证明,这套方案对于音频比对具有较高的准确性和较好的实时性. 相似文献

14.

基于BP神经网络的录音地点识别方法

王学强吉建梅包永强《南京工程学院学报(自然科学版)》2014,(3):19-24

现有的数字音频取证技术很难做到录音地点的识别,因此司法机关就不易对音频证据的有效性做出判断.针对现状,本文设计了一种基于BP神经网络的录音地点识别方法.该方法是将电网频率(ENF)作为识别根据.进行地点识别操作时,首先将电网ENF作为训练样本训练BP神经网络,然后从待取证的音频文件中提取电网频率数据并作为输入样本,用训练好的BP神经网络对输入样本进行识别,最后用模拟退火算法从识别结果中搜索出最佳识别结果,从而识别出录音的地点.实验结果表明,该方法的识别准确率最低达到90.6%,可靠性满足一定的要求. 相似文献

15.

基于SVM和CRF的双层模型中文机构名识别

黄德根李泽中万如《大连理工大学学报》2010,(5):782-787

提出了一种基于支持向量机(SVM)和条件随机场(CRF)的双层模型进行中文机构名识别的方法．第一层模型采用CRF识别简单机构名,并将识别结果传至第二层辅助下一步的识别;第二层采用基于驱动的方法,将SVM和CRF结合进行复杂机构名的识别;最后将两层的识别结果合并,并通过一个后续处理对置信度较低的识别结果进行修正．大规模真实语料的开放测试表明,精确率达到94.83 %,召回率达到95.02%,证明了该方法的有效性．相似文献

16.

基于HMMs和SVM的人体日常动作序列分割识别研究

武东辉王哲龙陈野《大连理工大学学报》2015,55(4):411-416

随着微机电系统(MEMS)研究的精细化,人体传感器网络(简称体感网)技术在医疗监护领域有了长足发展,而人体动作分析与识别是体感网中富有挑战性的研究课题.采用动态隐马尔可夫模型(HMMs)方法对基于用体感网技术的人体动作序列进行了分割,并且对分割精准度进行了度量分析.从实验结果可以看到,动态HMMs方法优于LIR和Top-Down方法,其分割精准度达到了80%以上.对分割后的数据提取均值、方差等特征,采用支持向量机(SVM)方法分类识别的结果表明所提分割方法具有良好的稳健性,平均识别准确率在89%左右,与手动分割接近. 相似文献

17.

一种RBFN和FLD融合的说话人识别方法

连翰汪峥王建军《复旦学报(自然科学版)》2005,44(1):118-121,127

提出一种新的可用于说话人识别的径向基函数网络(RBFN)阵列．RBFN网设计思想是在确定网络中心点之后采用最小线性方差作为目标函数解得最优权重,该方法并不能得到最优分类效果．使用Fisher目标函数,替代RBF中的误差目标函数来求取最优权重,用与文本无关的闭集说话人识别系统对该算法进行了验证,实验结果表明,该方法提高了RBF分类能力,比传统的RBF、算法以及ROLS算法具有更高的识别率,并在识别效果接近GMM方法的情况下计算量大幅度减少。相似文献