期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王民李弼程屈丹《信息工程大学学报》2008,9(3):国家863计划资助项目

对最小方差无失真响应谱进行了研究,并将其应用到语音特征参数的提取中,对传统的美尔频率倒谱系数提取方法进行了有效的改进。该方法首先计算短时语音信号的最小方差无失真响应谱,在该谱的基础上提取美尔频率倒谱系数。基于最小方差无失真响应谱的美尔频率倒谱系数在保留语义信息的同时有效抑制了说话人信息,更加适合于关键词检出。相似文献

2.

语音信息查询虚拟仪器的设计

朱立忠华宇宁范长青《沈阳理工大学学报》2009,28(4):6-10

在虚拟仪器开发软件LABVIEW平台上,利用LABVIEW和MATLAB混合编程,通过声卡获得原始语音信号,经过小波消噪处理、预加重处理和端点检测处理得到干净的语音信号,提取语音信号的美尔频率倒谱系数及其一阶、二阶差分系数作为语音识别的特征参数,通过矢量量化（VQ）与隐马尔可夫模型（HMM）实现非特定人连续语音的训练与识别,构建了基于LabVIEW平台的连续语音识别系统．实验表明,系统的识别速度较快,识别率达到90％左右,而且成本比较低廉,具有一定的应用价值．相似文献

3.

基于Mel频率倒谱参数相似度的语音端点检测算法

王宏志徐玉超李美静《吉林大学学报(工学版)》2012,42(5):1331-1335

为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似度距离曲线进行端点检测。实验结果表明,该方法在白噪声和粉噪声环境下均可得到理想的端点检测效果,并且在低信噪比时仍然有效。相似文献

4.

融合非线性幂函数和谱减法的CFCC特征提取

白静史燕燕薛珮芸郭倩岩《西安电子科技大学学报(自然科学版)》2019,46(1):86-92

为提高噪声环境下的语音识别准确率,提出一种改进的语音特征提取算法。该算法采用模拟人耳听觉特性的非线性幂函数提取一种新的耳蜗滤波倒谱系数,并在特征提取前端引入谱减法对信号进行增强,将提取到的新的特征及其一阶差分组成一种混合特征参数;再联合主成分分析对该混合特征进行降维,将最终得到的特征用于一个非特定人、孤立词、小词汇量的语音识别系统。实验结果表明:采用非线性幂函数提取的耳蜗滤波倒谱系数特征与传统的耳蜗滤波倒谱系数特征相比,明显提高了语音识别准确率;混合特征参数相比单一特征能达到更佳的语音识别性能;结合主成分分析后的特征集在信噪比为0dB时的识别正确率可达到88.10%。相似文献

5.

基于MFCC相关系数的语音感知哈希认证算法

李金凤吴涛王宏霞《北京邮电大学学报》2015,38(2):89-93

提出了一种基于梅尔频率倒谱系数相关性的语音感知哈希内容认证算法. 该算法提取分段语音的声纹梅尔频率倒谱系数作为感知特征. 为提高算法的安全性,算法利用伪随机序列作为密钥,计算得到梅尔频率倒谱系数与伪随机之间的相关度,最后量化相关值并加密生成感知哈希序列. 语音认证过程中,采用相似性度量函数用来衡量哈希序列之间的距离,同时与汉明距离方法进行了比较. 仿真结果表明,该算法对语音内容保持操作,如重采样、MP3压缩等具有较好的鲁棒性,相似性度量函数也对语音篡改检测定位具有较高的灵敏性. 相似文献

6.

基于自适应心理声学模型的智能语音识别系统

熊笑颜陈栩黄灿英陈艳《沈阳工业大学学报》2017,39(6):675-679

针对包含环境噪声和信道失真等噪声的语音处理问题,提出了一种基于自适应心理声学模型的智能语音识别系统,并建立了听觉模型.该模型将心理声学和耳声发射(OAE)合并到了自动语音识别(ASR)系统中,利用AURORA2数据库分别在清洁训练条件和多训练条件下进行试验.结果表明,所提出的特征提取方法可以显著提高词识别率,优于梅尔频率倒谱系数(MFCC)、前向掩蔽(FM)、侧向抑制(LI)和倒谱平均值及方差归一化(CMVN)算法,能够有效地提高智能语音识别系统的性能. 相似文献

7.

多位朝鲜语数字语音识别方法的研究

朴明姬芦世丹崔荣一《延边大学学报(自然科学版)》2011,(4):337-341

针对朝鲜语数字串语音识别中单位符号容易被误判为数字的问题,提出了基于朝鲜语数字串结构特点的识别方法．首先,对事先采集好的语音样本提取特征并存储成数字模板和单位符模板;其次,将数字串测试样本切分成孤立的数字或单位符并提取特征参数;最后,根据朝鲜语数字串发音特点,即若前1个孤立词已被识别为数字,那么后1个被默认为单位符并且只与存储单位符号的模板进行匹配．实验结果表明,该方法不仅可以获得较高的正确识别率,同时提高了识别效率．相似文献

8.

基于矢量量化方法的说话人识别技术 总被引：1，自引：0，他引：1

张一清李轶《杭州电子科技大学学报》2005,25(4):58-61

说话人识别是一项通过语音来识别说话人身份的技术，它在保安、司法、军事、财经和信息服务等领域都具有广泛的应用前景。该文采用线性预测倒谱系数和美尔倒谱系数特征相结合，基于矢量量化聚类方法建立了一个与文本无关的、连续语音发音的说话人识别系统。只要矢量量化聚类法码本大小选择合适，该说话人识别系统就可以获得较好的识别效果。当阈值恰当选取时，该系统具备拒绝识别集外人的功能。相似文献

9.

两种倒谱特征提取技术在水声目标识别中的应用 总被引：5，自引：0，他引：5

柳革命孙超杨益新《西北工业大学学报》2008,26(3)

按照声纳员的感受,被动声纳目标被看作为一个发声体,目标噪声信号表示为激励噪声源与发声体冲激响应的卷积,在这一模型下,使用倒谱分析水声目标噪声的时域特征.提出利用线性预测倒谱和考虑人耳听觉特点的美尔倒谱分析发声体的冲激响应在倒谱域中的表示,据此对水声噪声信号提取这两种倒谱的特征,进行分类识别.设计了神经网络分类器,利用实测数据对三类目标进行分类.分析比较两种方法的分类结果,验证了基于倒谱的水声目标特征提取方法的可行性. 相似文献

10.

基于Gammatone频率离散小波系数的水下目标鲁棒识别

吴姚振杨益新田丰杨龙陶灿《西北工业大学学报》2014,(6):906-911

针对水下目标辐射噪声的复杂性和研究样本的局限性,提出了一种基于Gammatone频率离散小波系数的特征提取方法,结合人耳听觉感知机理,提取出了有效吻合人耳听觉特性的识别特征。该方法在2个方面改进了目前广泛采用的美尔倒谱系数:1用Gammatone滤波器代替三角滤波器,更好地模拟了人耳基底膜的滤波特性;2用离散小波变换替换离散余弦变换,使得识别特征具有优良的局部化特性。针对实录的水下动物叫声和舰船辐射噪声进行分类实验,表明所提出的特征提取方法在识别率和稳健性方面都有明显提高。相似文献

11.

基于修正MFCC的耳语说话人识别方法

丁国梁《苏州大学学报(工科版)》2009,29(4)

在说话人识别中,美尔倒谱系数MFCC(Mel-Frequency Cepstral Coefficients)是一种常用的特征.但是这种通用的特征在耳语音的说话人识别上并不太理想.MFCC的三角滤波器组在Mel尺度上是均匀分布的,但是耳语音不同于正常音的发声,通过改变这种均匀分布的格局来改善耳语音说话人识别率,将全频域分成不同频段,分别调整各频段内滤波器的疏密程度,再将各频段的滤波器组合成新的滤波器组.修正后的滤波器模型在文本无关的耳语音说话人识别中相比原模型识别效果有所提高. 相似文献

12.

说话人识别算法的研究 总被引：2，自引：0，他引：2

郭春霞《西安邮电学院学报》2010,15(5):104-106,119

针对说话人识别问题,基于概率神经网络PNN,实验比较MFCC,ΔMFCC+MFCC分别与PNN相结合时的识别率。仿真结果表明,在文本有关情况下,当说话人说话内容为0～9的发音时,ΔMFCC+MFCC优于MFCC,使用PNN算法的识别率能够满足说话人识别的实际要求。相似文献

13.

矢量量化的音频信号类型确认算法的研究

陈宝远姜海鹏史玲玲王正王晓亮《哈尔滨理工大学学报》2010,15(1):108-111

语音识别和控制环境中,非语音信号(噪音)很容易与语音信号相混淆,一部分噪音被机器误认为语音,导致系统性能恶化.针对这一问题,以说话人识别理论为基础,提出了一种采用矢量量化来对音频信号类型(噪音或语音)进行确认的方法,以便于后期对非语音信号的噪音进行鉴别并且予以消除,提高语音信号处理系统的工作效率.在此基础之上,在MATLAB平台上设计了一个基于此方法的语音与非语音识别的仿真系统.测试结果表明,系统实现了语音与非语音识别的基本功能,达到较好的工作效果. 相似文献

14.

基于MFCC和HMM的气固流型辨识

胡红利闫洁冰邢文奇张炜《沈阳工业大学学报》2013,35(5):555-560

针对气力输送管道中测控装置后常见的三种过渡流型,即中心流、环状流和层状流,采用静电传感器作为测量装置获得静电流动噪声信号,借鉴语音信号处理方法,提取静电流动噪声信号的梅尔频率倒谱系数（MFCC）及其一阶差分作为特征参数,用特征参数训练连续高斯混合密度隐马尔科夫模型（CGHMM）,建立不同流型的模型库,再用训练好的CGHMM模型对提取的特征参数进行分类,进而实现流型识别.实验结果表明,该方法识别率达到98%,为气固流流型识别及气力输送测控装置提供了新的研究方法. 相似文献

15.

基于对数Gammatone滤波器能量谱图的语种识别

张昊阁邵玉斌龙华彭艺周大春《北京邮电大学学报》2023,46(1):38-43

针对语种识别在噪声环境下识别率低的问题，提出了一种基于对数Gammatone滤波器能量特征谱图的语种识别方法。依据Gammatone滤波器组的听觉特征提取出对数Gammatone滤波器能量特征，并将特征转化为图像获得特征谱图，然后运用暗通道先验算法对特征图进行增强去噪，最后使用残差神经网络模型进行训练识别。实验表明，在信噪比为0 dB,噪声源分别为白噪声、车内噪声和粉红噪声时，该方法相对于线性灰度语谱图识别率分别提升了32.7%、10.1%和29.1%,且在其他信噪比下的识别率也有一定的提升。相似文献

16.

基于小波包分析和支持向量机的说话人识别

王志兰《佳木斯工学院学报》2010,(6):873-875,890

在说话人识别系统中,语音特征参选是系统的关键问题之一.本文研究了MFCC参数、小波包分析.从听觉特性出发,提出基于小波包分析代替傅立叶变换的一种新的特征参数,给出了衡量各种特征参数识别能力的Fisher准则,结合Fisher准则构造一种新的混合特征参数,最后采用支持向量机实现说话人的分类识别.实验数据表明：有效地提高了说话人辨认系统的识别率. 相似文献

17.

基于非线性取值DTW算法的鲁棒性语音识别系统

张宇昕丁岩《长春光学精密机械学院学报》2013,(6):144-148,107

提出了一个在噪声环境下高效的语音识别系统。针对端点检测,提出了基于平滑函数的检测方法,从而提高了利用短时能量算法的检测精度。运行频谱滤波器方法在能量频谱和对数频谱用了两次带通滤波器减少噪声,在对数频谱内用倒谱均值相减的方法去除卷积噪声,从而减少了计算量。对于普：i~DTW（DynamicTimeWarpin）算法得到某个测试语音与该语音所有的参考语音相似值,应用一个非线性中值滤波器取中间某个值的方法来进行识别,从而提高了DTW算法的识别精度。利用少量参考语音,实现了高于HMM的识别精度同时又减少了训练的花费时间。相似文献

18.

基于MFCC和CHMM技术的语音情感分析及其在教育中的应用研究 总被引：1，自引：0，他引：1

张永皋马青玉孙青《南京师范大学学报》2009,9(2):89-92

语音情感识别作为一个新的研究热点,因其能解决教育中情感缺失的问题,而越来越受到研究者的重视.选取符合人类听觉系统感知的M el频率倒谱系数（MFCC）与各态历经型的连续隐马尔可夫模型（CHMM）进行语音情感特征的分析,并对大量的语音信号进行情感识别实验,识别正确率达到86.7%,为教育中的情感补偿提供了切实可行的依据. 相似文献