共查询到18条相似文献,搜索用时 421 毫秒
1.
2.
3.
提出了一种基于Bark小波变换参数的语音寂声/语声段检测方法。利用Bark小波的频率分级和能量聚焦能力,提取语音信号在不同子带上的统计参数;引入基于模糊熵的参数有效性分析,获得所有子带参数中分辨能力和稳定性最大的参数作为识别参数。仿真试验证明,该方法在不同噪声条件下稳定有效;比照传统参数,该方法在准确率和鲁棒性上都有较大幅度的提升。 相似文献
4.
跨数据库语音情感识别中,将不同尺度上提取的情感特征进行融合是目前的技术难点。本文利用深度学习领域的深度信念模型,提出了基于深度信念网络的特征层融合方法。将语音频谱图中隐含的情感信息作为图像特征,与传统情感特征融合。研究解决了跨数据库语音情感识别中,将不同尺度上提取的情感特征进行融合的技术难点。利用STB/Itti模型对语谱图进行分析,从颜色、亮度、方向三个角度出发,提取了新的语谱图特征;然后研究改进的DBN网络模型并对传统声学特征与新提取的语谱图特征进行了特征层融合,增强了特征子集的尺度,提升了情感表征能力。通过在ABC数据库和多个中文数据库上的实验验证,特征融合后的新特征子集相比传统的语音情感特征,其跨数据库识别结果获得了明显提升。 相似文献
5.
6.
7.
数据融合应用于通信信号调制样式识别 总被引:1,自引:0,他引:1
对通信信号的频域、时域特征进行了提取,介绍了利用决策树识别其调制样式的方法。针对决策树缺点,提出了基于模糊理论和D-S证据理论对不同参数的可信度进行融合的方法,并给出了利用数据融合算法进行调制样式识别的仿真结果。 相似文献
8.
以多聚焦图像为研究对象,提出一种新的基于多目标优化与熵成分分析的融合方法。源图像经小波分解后分为低频和高频两部分。针对低频信息采用权重系数法融合。将灰色关联分析运用于VEQPSO迭代优化中,用来确定最佳融合系数。源图像分窗体,每个窗体提取特征向量,利用模糊C-均值聚类算法(FCM)在特征空间上分割图像。将窗体进行熵成分变换,构建区域的熵主成分向量,该向量即反映了区域的灰度信息又体现了熵信息。基于熵成分向量设计融合策略更为合理可靠。最后,利用小波逆变换得到融合图像。研究表明,提出的方法具有良好的融合特性。 相似文献
9.
多分类器协同合作克服了单个分类器识别效果不理想,适用范围较窄或对使用环境要求较高的不足。本文提出了一种基于SVM分类器融合的语种识别系统,该系统采用了SVM作为子分类器,参数选取包括美尔频率倒谱系数、线性预测倒谱系数,基音频率和第一共振峰频率,采用投票法,加权平均法和决策模板法等三种不同的融合方法对汉语,英语,日语,德语和西班牙语进行识别研究,达到了预期的识别效果。 相似文献
10.
11.
为解决雷达辐射源信号分选识别特征评价不够客观和缺乏评价依据等问题,提出了一种基于区间模糊原理、模糊交叉熵和多准则折衷法的特征评价方法. 首先通过区间模糊原理建立信噪比分级评价模型,并基于汉明距离进行寻优得出信噪比权重;其次结合信噪比权重和区间直觉模糊加权平均算子将分级模型整合成群决策矩阵,使用熵最大化法计算属性权重;最后基于多准则折衷法框架,采取模糊交叉熵实现特征方案排序. 仿真实验结果表明,所提方法能够给出与实际仿真实验相一致的分选识别特征评价排序结果,并优于逼近理想点方法,验证了所提方法的可行性和有效性. 相似文献
12.
A new method was proposed to identify speech-segment endpoints based on the empirical mode decomposition (EMD) and a new wavelet entropy ratio with improving the accuracy of voice activity detection. With the EMD, the noise signals can be decomposed into several intrinsic mode functions (IMFs). Then the proposed wavelet energy entropy ratio can be used to extract the desired feature for each IMFs component. In view of the question that the method of voice endpoint detection based on the original wavelet entropy ratio cannot adapt to the low signal-to-noise ratio (SNR) condition, an appropriate positive constant was introduced to the basic wavelet energy entropy ratio with effectively improved discriminability between the speech and noise. After comparing the traditional wavelet energy entropy ratio with the proposed wavelet energy entropy ratio, the experiment results show that the proposed method is simple and fast. The speech endpoints can be accurately detected in low SNR environments. 相似文献
13.
14.
针对复杂电磁环境下识别雷达信号脉内调制样式困难以及受噪声影响识别准确率受限的问题,提出了一种将变分模态分解(Variational Mode Decomposition, VMD)与熵特征提取相结合的识别方法。首先,通过基于峭度加权的改进VMD算法对雷达信号进行分解,得到由三个本征模态函数组成的最优分量集合;其次,对各分量分别计算其模糊熵、排列熵和符号熵值,从而实现对熵特征信息提取;最后,将特征向量输入到支持向量机完成识别。相较于其他方法,该方法有着较高的识别准确率和抗噪性能,在2 dB信噪比以上平均识别准确率为94.63%。 相似文献
15.
为了进一步提高基于传统的GMM模型的说话人辨识的识别率,引入了GMM-UBM模型,并且在特征提取方面采用多种特征参数组合来代替单一特征参数,以提高有效特征维数来弥补特征样本的不足,同时在说话人辨识的端点检测部分,用基于MFCC相似度和谱熵的端点检测方法来代替传统的基于短时能量和过零点的方法,以解决其对含噪语音检测不准确而影响说话人辨识的问题。实验表明,与传统的GMM模型相比,GMM-UBM模型能够有效地提高说话人辨识的性能,并且使用组合特征参数和利用基于MFCC相似度和谱熵的端点检测方法都可以进一步提高说话人辨识的性能。 相似文献
16.
为了提高低信噪比下语音端点检测的准确性,提出一种基于经验模态分解与功率谱熵的语音端点检测方法。对带噪语音信号进行经验模态分解获得一系列语音本征模函数,选取功率谱熵作为语音端点检测的特征,并计算特定阶本征模函数的功率谱熵实现语音的端点检测。通过EMD分解可以有效地消除白噪声的影响,仿真结果表明,在低噪比情况下结合经验模态分解和功率谱熵的方法能够有效实现语音端点检测。 相似文献
17.
18.
Robust speech features based on wavelet transform with application to speaker identification 总被引:2,自引:0,他引:2
Hsieh C.-T. Lai E. Wang Y.-C. 《Vision, Image and Signal Processing, IEE Proceedings -》2002,149(2):108-114
An effective and robust speech feature extraction method is presented. Based on the time-frequency multiresolution property of the wavelet transform, the input speech signal is decomposed into various frequency channels. For capturing the characteristics of an individual speaker, the linear predictive cepstral coefficients of the approximation channel and entropy value of the detail channel for each decomposition process are calculated. In addition, an adaptive thresholding technique for each lower resolution is also applied to remove the influence of noise interference. Experimental results show that using this mechanism not only effectively reduces the influence of noise interference but also improves the recognition performance. Finally, the proposed method is evaluated on the MAT telephone speech database for text-independent speaker identification using the group vector quantisation identifier. Some popular existing methods are also evaluated for comparison, and the results show that the proposed feature extraction algorithm is more effective and robust than the other existing methods. In addition, the performance of the proposed method is very satisfactory even in a low SNR environment corrupted by Gaussian white noise. 相似文献