期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

朱晓丽李吉祥陈明钱盛友《电脑与信息技术》2023,(2):24-26+30

对鸣笛声的准确识别是机动车鸣笛抓拍系统得以运用的关键。为了克服单一特征对鸣笛声表征不足的缺陷,提高识别的准确性,文章将Mel频率倒谱系数（Mel Frequency Cepstrum Coefficient,MFCC）与Gama频率倒谱系数（Gammatone Frequency Cepstrum Coefficient,GFCC）融合得到M-GFCC特征,并分别使用支持向量机（Support Vector Machines,SVM）和BP(Back Propagation,BP)神经网络算法进行分类。实验结果表明,与使用单一的MFCC特征相比,BP神经网络对鸣笛声识别的有效率提高了10.4%,SVM的有效率提高了4.4%;相较于单一的GFCC特征,BP神经网络的有效率提高了6.6%,SVM的有效率提高了4.2%,证明了该融合特征能提高鸣笛声识别准确性。相似文献

2.

基于卷积神经网络的反无人机系统声音识别方法

下载免费PDF全文

薛珊李广青吕琼莹毛逸维《工程科学学报》2020,42(11):1516-1524

针对如何识别无人机的问题,提出了一种基于卷积神经网络的声音识别无人机的方法。首先,对100 m范围内的无人机、鸟和人的声音进行采集、预处理和提取MFCC+GFCC特征值,将其特征参数作为卷积神经网络学习和识别的数据集;然后分别设计了支持向量机和卷积神经网络两种模型对无人机等声音进行识别实验。实验结果表明,运用支持向量机识别无人机的准确率为91.9%,卷积神经网络识别无人机的准确率为96.5%。为了进一步验证设计的卷积神经网络的识别能力,在部分UrbanSound8K数据集上进行测试,准确率达到90%。实验结果表明运用卷积神经网络识别无人机具有可行性,且识别性能优于支持向量机。相似文献

3.

基于深度自编码网络语音识别噪声鲁棒性研究

黄丽霞王亚楠张雪英王洪翠《计算机工程与应用》2017,53(13):49-54

为了解决传统径向基（Radial basis function,RBF）神经网络在语音识别任务中基函数中心值和半径随机初始化的问题,从人脑对语音感知的分层处理机理出发,提出利用大量无标签数据初始化网络参数的无监督预训练方式代替传统随机初始化方法,使用深度自编码网络作为语音识别的声学模型,分析梅尔频率倒谱系数（Mel Frequency Cepstrum Coefficient,MFCC）和基于Gammatone听觉滤波器频率倒谱系数（Gammatone Frequency Cepstrum Coefficient,GFCC）下非特定人小词汇量孤立词的抗噪性能。实验结果表明,深度自编码网络在MFCC特征下较径向基神经网络表现出更优越的抗噪性能;而与经典的MFCC特征相比,GFCC特征在深度自编码网络下平均识别率相对提升1.87%。相似文献

4.

噪声环境下法庭语音证据量化评价方法

《计算机应用与软件》2019,(7)

针对说话人自动识别系统的性能与稳定性在高噪声环境下会严重下降,人耳却能捕捉高噪声环境中的目标语音的问题。提出使用能模拟耳蜗听觉特性的GFCC(Gammatone Frequency Cepstral Coefficient)特征与主成分分析(Principal Component Analysis,PCA)相结合的方法,以提高识别系统的鲁棒性。在不同程度信噪比的真实语音案件噪声条件下,对国际上最认可的基于似然比证据评估体系的法庭自动说话人识别系统的准确性和稳定性进行测试。实验结果显示:GFCC特征在多个程度的信噪比条件下,甚至信噪比为-20 dB的条件下,依然能保持较高的识别准确度和良好的稳定性,并能够提供可量化、可重复的证据强度值。相似文献

5.

多类型语音特征进化选择算法

下载免费PDF全文

张小恒谢文宾李勇明《计算机工程与应用》2016,52(14):150-155

基于特征选择的语音特征获取用于说话人识别是目前较为有效的方式。但是,最优语音特征随着具体应用环境的变化而不同。因此,提出了基于四类型语音特征封装式遗传特征选择算法（FSF-WrGAF）,该算法提取了四种类型的语音特征参数,通过链式智能体遗传算法和GMM-UBM进行封装式动态特征选择,获取高精度的识别准确率。采用了多种指标完成该算法的性能测试。实验结果表明,该算法具体实现过程简便,改进效果明显,较同类算法在多项指标（识别率,EER,DET曲线）上都有显著提高。相似文献

6.

基于MFCC和GFCC混合特征的语音情感识别研究

郭卉姜囡任杰《光电技术应用》2019,34(6)

相似文献

7.

基于GFCC与RLS的说话人识别抗噪系统研究

茅正冲王正创黄芳《计算机工程与应用》2015,51(10):215-218

为了提高说话人识别抗噪系统的性能,提出了将RLS自适应滤波器作为语音信号去噪的预处理器,进一步提高语音信号的信噪比,再通过Gammatone滤波器组,对去噪后的说话人语音信号进行处理,提取说话人语音信号的特征参数GFCC,进而将特征参数GFCC用于说话人识别系统中。仿真实验在高斯混合模型识别系统中进行。实验结果表明,采用这种方法应用于说话人识别抗噪系统,系统的识别率及鲁棒性都有明显的提高。相似文献

8.

基于改进压缩感知的说话人识别抗噪算法

《计算机应用与软件》2016,(6)

压缩感知CS(compressive sensing)是一种基于信号稀疏性,有效提取信号中有用信息的方法。根据语音信号和干扰噪声在离散余弦变换域DCT(discrete cosine transform)稀疏性的不同,提出一种基于改进压缩感知的说话人识别抗噪算法。在用正交匹配追踪OMP(orthogonal matching pursuit)算法重构语音信号时设定相关度阈值和语音恢复阈值,不仅有效恢复了语音信号,而且实现了语音增强。然后通过Gammatone滤波器组,对恢复语音信号进行处理,提取特征参数GFCC。仿真实验在高斯混合模型识别系统中进行,实验结果表明,将这种方法应用于说话人识别抗噪系统,系统的识别率及鲁棒性都有明显提高。相似文献

9.

法庭语音比对中话者自身变化性建模方法研究

下载免费PDF全文

王华朋姜囡刘恩晁亚东《计算机工程与应用》2019,55(8):110-115

针对法庭说话人识别中待鉴定人员语音样本不足的问题,提出了一种新的对说话人自身变化性建模的替代性方法以及相应的方差控制算法。使用同条件下的参考数据库构建识别系统的多个相同说话人得分模型,代替检验需要的多个非同期的带检验人员语音样本比较时的得分模型,以获得能反映说话人自身变化性的统计模型。基于目前最新的法庭证据评估的似然比证据强度评估体系,使用MFCC（Mel Frequency Cepstral Coefficients）和GFCC（Gammatone Frequency Cepstral Coefficients）特征对该方法的有效性进行了验证,并对上述特征进行了特征级和决策级融合。实验结果表明：该方法在纯净语音环境和噪声环境下都具有很高的识别率和稳定性,并且特征级融合能进一步提高识别系统的性能。相似文献

10.

结合差分演化和逻辑回归的构音障碍自动识别方法

黎雨星梁正友孙宇《计算机与现代化》2019,(8):1

针对传统的构音障碍诊断方法存在耗时高、成本高等问题，提出一种构音障碍语音的计算机自动识别方法。结合Gammatone频率倒谱系数(Gammatone Frequency Cepstrum Coefficients, GFCC)与常用声学特征形成组合声学特征，应用差分演化算法进行特征选择，并使用逻辑回归分类器对构音障碍语音进行识别。将Torgo构音障碍语音数据库分成3个语音子集，分别是非词、短词语、限制句子集，提取24维GFCC和37维常用的声学特征构成组合声学特征，最后使用差分演化算法和逻辑回归分类器进行分类识别。实验表明：使用差分演化算法可以有效选择出具有更佳识别能力的特征，从而显著提高构音障碍识别率。在非词子集上的实验准确率达到98.18%，召回率为98.3%，精确率为98.3%。相似文献