共查询到18条相似文献,搜索用时 31 毫秒
1.
2.
呼吸音信号的包络特征提取方法 总被引:1,自引:0,他引:1
李圣君 《计算机工程与应用》2008,44(32):151-154
针对时变宽带的呼吸音信号,在分析传统Hilbert变换方法提取包络的缺点基础上,提出基于复小波变换的呼吸音信号包络特征提取方法。选取Morlet复小波,以适当的尺度对预处理后的呼吸音数据进行变换得到包络,提取包络的统计量和能量作为特征,构造BP分类神经网络的输入矢量,经训练识别取得较好分类效果。研究表明该文的特征提取方法是行之有效的。 相似文献
3.
4.
对时变性强的非平稳汉语语音信号,建议采用变时-频复子波分析方法提取汉语语音信号的幅度谱、相位谱、基音周期及共振峰信息。选择有n阶消失矩及良好的时频局域化特性的复高斯子波提取汉语语音信号的幅度谱和相位谱,实验结果表明,该方法提取的语音信号的幅度谱、相位谱和子波变换谱表征了汉语语音的音节包络、细节包络及声调,区分了清、浊音,并准确提取了语音信号的动态基音周期、估计出共振峰。这对汉语语音特征提取和识别提供了一种新的思路。 相似文献
5.
湖底回波的包络特征提取 总被引:4,自引:0,他引:4
湖底回波包络包含了湖底沉积物的结构和物理性质的信息,可以作为沉积物分类的特征.用传统的Hilbert变换提取宽带回波包络存在一些固有的缺点.该文中,采用线性相位的双正交小波,对湖底回波解析信号的实部和虚部分别进行离散正交小波变换,提取合适尺度上的小波系数的模值作为包络特征矢量.它可以采用Mallat快速算法,运算量少,提取的包络特征矢量维数少,能简化目标识别的算法.对实测的湖底回波数据进行特征提取和分类的仿真实验也表明,采用这种方法得到的包络特征是一种稳健、有效的特征,能获得较高的正确识别率. 相似文献
6.
为克服传统算法采用离散小波变换(Discrete Wavelet Transform,DWT)最终引起的加性噪声隐写图像检测正确率较低而虚惊率较高的问题,提出了一种新的盲隐写分析算法。综合应用主成分分析(Principal Component Analysis,PCA)和希伯特包络分析的优点,提取隐写图像高频子带希伯特包络解析信息号的主成分特征统计量,计算主成分信息熵,构建信息熵敏感特征向量。采用非线性支持向量机(Support Vector Machine,SVM)分类器,基于Matlab7.1平台进行仿真研究,结果表明:该算法对于空域和DWT域隐写检测具有较高的检测正确率和较低的虚惊率。 相似文献
7.
一种新颖的基频包络聚类方法 总被引:1,自引:0,他引:1
主要研究音节基频包络的聚类问题.在聚类的基础上,通过合理的样本选择,可以实现对大语料库的裁减,再结合现有的语音编码技术,就能够构建出一个小存储容量多样本的带调音节语音库,来满足嵌入式TTS系统对合成语音清晰度和自然度的要求.针对音节基频包络长度的不同,给出了一种非定长包络的聚类方法,这种方法将DP(dynamic programming)的概念融入了聚类.首先利用DP的思想,在两个基频包络之间寻找一条最佳路径,然后再沿这一路径进行两包络的相似度计算,若两包络形状类似,距离测度的值会很小.实验表明,与传统的方法相比,使用新方法可以获得更好的聚类结果.合成实验也验证了这种方法的有效性. 相似文献
8.
对汉语TTS系统的大规模语料库做了基本的韵律参数统计,分析了音节的韵律特征与其所在的韵律结构位置以及韵律结构边界的关系。进一步,对有调音节样本集基于基频包络采用k中心点算法进行聚类,通过听辩实验检验了聚类结果。并分析了音节聚类与其所在韵律结构之间的对应关系。 相似文献
9.
10.
11.
提出了一种基于听觉与小波变换处理的汉语语音基音的方法,在对听觉系统描述的基础上,给出了人的听觉与小波变换的关系,选取适合汉语事音基频提取的小波函数,给出了基频提取的应用实例和基于FCM模糊聚类分析的汉语四声调值识别结果。 相似文献
12.
提出一种基于仿生小波变换以及自适应阈值的语音增强方法.含噪语音通过仿生小波变换后,针对不同的尺度采用不同的阈值函数进行去噪.由于在小波变换过程中考虑了人耳的听觉特性,所提出方法优于基本的小波语音增强方法.实验表明,该方法在多种噪声条件下均具有较好的语音增强效果. 相似文献
13.
提出一种基于人类听觉特性的自适应小波滤波算法。该方法用听觉感知小波变换对含噪语音信号进行小波分解,这样可以保证对信号频率和幅值的听觉特性,将经听觉感知小波变换所分离出来的噪声成分作为自适应滤波器的输入。通过采用递推最小二乘算法从而实现信噪分离的最佳滤波,以保证去除信号中的相关噪声。结果表明,该方法能实现非平稳信号在同频段对噪声成分和有用信号的最佳估计,提高了语音的清晰度和可懂度。 相似文献
14.
基于前置滤波和小波变换的带噪语音基音周期检测方法 总被引:10,自引:0,他引:10
根据语音信号的基音周期范围有限和在声门闭合时刻语音信号出现锐变的特点,提出一种基于前置滤波和小波变换的基音周期检测方法。带噪语音信号经过3阶椭圆低通滤波器滤波后,采用以二次样条小波作为小波函数,进行一级小波变换检测语音信号的锐变点,再计算基音周期。实验表明,本文提出的基音周期检测方法,与平均幅度差函数(AMDF)和自相关函数(ACF)方法相比,提高了提取基音周期的准确率;与多尺度小波变换的基音周期检测方法相比,减小了计算量,削弱了噪声信号和语音的共振峰对基音周期检测的影响。 相似文献
15.
16.
17.
语音可懂度增强是一种在嘈杂环境中再现清晰语音的感知增强技术. 许多研究通过说话风格转换(SSC)来增强语音可懂度, 这种方法仅依靠伦巴第效应, 因此在强噪声干扰下效果不佳. SSC还利用简单的线性变换对基频(F0)的转换进行建模, 并且只映射很少维的梅尔倒谱系数(MCEPs). 因为F0和MCEPs是语音的两个重要特征, 对这些特征进行充分的建模是非常必要的. 因此本文进行了一个创新性研究即通过连续小波变换(CWT)将F0分解为10维来描述不同时间尺度的语音, 以实现F0的有效转换, 而且使用20维表示MCEPs实现MCEPs的转换. 除此之外, 还利用iMetricGAN网络来优化强噪声中的语音可懂度指标. 实验结果表明, 提出的基于CycleGAN使用CWT和iMetricGAN的非平行语音风格转换方法(NS-CiC)在客观和主观评价上均显著提高了强噪声环境下的语音可懂度. 相似文献