期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

覃爱娜高晓红桂卫华《电路与系统学报》2012,(5):6-12

目前语音信号的分析与预测都是采用线性理论和线性预测技术,而语音信号的产生系统是一个复杂的非线性时变系统,而且具有混沌性,所以采用线性方法是不够的.深入研究了汉语语音信号的非线性特性,包括相空间重构理论及延迟时间、嵌入维数等相空间重构参数的确定方法,并求解出汉语语音音素的李雅普诺夫指数、延迟时间、嵌入维数和关联维数,所得结果表明汉语语音信号既非确定性的信号,又非随机信号,而是具有混沌特性的信号;根据汉语语音音素的延迟时间及嵌入维数的均值确定RBF神经网络(Radical Basis Function Network)模型中三层网络的神经元个数,结合 RBF 神经网络分析方法构造了一个非线性预测模型.仿真结果表明:基于 RBF 神经网络构造的非线性预测模型与线性预测模型相比,预测误差明显减小,预测性能上有所提高. 相似文献

2.

基于一种改进的监督流形学习算法的语音情感识别 总被引：2，自引：0，他引：2

张石清李乐民赵知劲《电子与信息学报》2010,32(11):2724-2729

为了有效提高语音情感识别的性能,需要对嵌入在高维声学特征空间的非线性流形上的语音特征数据作非线性降维处理。监督局部线性嵌入(SLLE)是一种典型的用于非线性降维的监督流形学习算法。该文针对SLLE存在的缺陷,提出一种能够增强低维嵌入数据的判别力,具备最优泛化能力的改进SLLE算法。利用该算法对包含韵律和音质特征的48维语音情感特征数据进行非线性降维,提取低维嵌入判别特征用于生气、高兴、悲伤和中性4类情感的识别。在自然情感语音数据库的实验结果表明,该算法仅利用较少的9维嵌入特征就取得了90.78%的最高正确识别率,比SLLE提高了15.65%。可见,该算法用于语音情感特征数据的非线性降维,可以较好地改善语音情感识别结果。相似文献

3.

基于混沌编码的容错性语音识别

顾明亮张毅锋王太君何振亚《信号处理》1998,(Z1)

根据混沌编码具有联想记忆的特点，本文提出了一种基于混沌编码的语音识别新方法，该方法首先解决了语音特征矢量维数不固定难于进行混沌编码的难题，其次提出了多样本下语音信号特征的选取原则。实验结果表明，新方法对语音的缺损和噪声干扰具有较好的容错能力。相似文献

4.

语音信号相空间重构中嵌入维数的选择 总被引：4，自引：0，他引：4

林嘉宇黄芝平《电子科学学刊》1999,21(6):735-742

嵌入维是时间序列相空赣色中的基本参数。本语文基于“增大重构维反减少虚邻点”的思想,构造了一种求合适最小嵌入维的方法。文章详细讨论了本的原理,给出了具体的算法构造,分析了算法性能,比较了本与已有同类方法的不同,用本方法,除可得到适合的最小嵌入维外,还可评估重构数据中所含的噪声强弱,并以重构质量评价,将本方法应用于语音信号相空间重构,得到了语音信号一般情况下的嵌入维数。相似文献

5.

混沌在语音保密中的应用

肖琳君谷爱昱张小红《电光与控制》2007,14(5):110-112

为了加强语音传输的安全性,利用混沌的特性,把混沌作为加密钥加入到语音信号中形成密文,并从此密文中剔除混沌信号将语音信号还原,从而实现了对实时语音的加密解密处理.通过计算机仿真,实现了语音信号的加密工作,对密文用两种解密钥进行解密.分析所得的结果表明,把混沌加入语音信号中形成的密文保密特性较好,不易被破解,混沌是一种有效的保障信息安全的工具. 相似文献

6.

基于广义维数距离的语音端点检测方法

武薇范影乐庞全《电子与信息学报》2007,29(2):465-468

为能够准确有效地对含噪声语音信号进行起止位置的端点检测,该文提出了一种基于广义维数距离的端点检测方法。首先利用覆盖法求取广义维数得到该语音信号的三维特征向量,包括容量维数、信息维数、关联维数;然后计算信号的维数特征距离;最后根据特征距离对语音信号类别进行决策分类。实验结果表明,与仅使用单一维数特征检测语音起止端点相比,该文所提出的方法具有较好的鲁棒性,对混杂有不同噪声、不同信噪比的语音信号都能有较好的检测结果,尤其适用于低信噪比的语音端点检测。相似文献

7.

语音信号相空间重构中嵌人维数的选择

林嘉宇黄芝平王跃科沈振康《电子与信息学报》1999,21(6):735-742

嵌入维是时间序列相空间重构中的基本参数。本文基于增大重构维以减少虚邻点的思想,构造了一种求合适最小嵌入维的方法。文章详细讨论了本方法的原理,给出了具体的算法构造,分析了算法性能,比较了本方法与已有同类方法的不同。用本方法,除可得到适合的最小嵌入维外,还可评估重构数据中所含的噪声强弱。并得到重构质量评价。将本方法应用于语音信号相空间重构,得到了语音信号一般情况下的嵌入维数。相似文献

8.

基于Lyapunov指数的非线性模拟电路故障诊断方法 总被引：3，自引：0，他引：3

马红光韩崇昭孔祥玉王国华许剑锋朱小菲《电路与系统学报》2004,9(4):71-75,124

本文介绍一种基于计算最大Lyapunov指数的非线性模拟电路故障诊断方法，它应用混沌方法对一个变周期的多谐振荡器的输出信号进行处理，利用数据替代法生成电路故障数据，借助于小数据量法计算相应的最大Lyapunov指数，将这种混沌特性分析应用于强非线性模拟电路的故障诊断，并对混沌时间序列相空间重构中的延迟时间间隔和嵌入维数的选取方法进行了讨论；结合实例对该方法进行了计算验证。相似文献

9.

语音信号的混沌遮掩及其正定盲提取算法

王尔馥郑远硕陈新武刘晓珍《通信学报》2016,37(8):191-198

利用小波变换提取语音信号的能量聚集带,将其隐藏在混沌载体信号中进行传输,设计一种盲提取算法实现不同混沌动力学系统下语音信号的有效提取。以3种不同维数的混沌动力学系统为背景,仿真实验定性和定量地分析了所提出算法的性能,验证了噪声环境下算法的可靠性,证明盲提取算法可作为对混沌保密通信系统保密性验证的有效方法。相似文献

10.

低信噪比条件下的语音端点检测与增强

章勇勤《电声技术》2008,32(1):63-66,69

针对在低信噪比条件下难以实现语音端点检测,提出了基于混沌理论的解决方法,采用Duffing方程的间歇混沌特性对语音信号进行检测,同时对谱减法作了改进,根据入耳听觉掩蔽效应的语音增强算法,动态修正谱减系数,有针对性地进行谱减,有效克服了音乐噪声.在信噪比较低的情况下,按照该方案处理后的语音不仅信噪比显著提高,主观听觉失真有效减小,且语音清晰度、可懂度和舒适度极大改善. 相似文献

11.

混沌,分形理论与语音信号处理 总被引：17，自引：0，他引：17

韦岗陆以勤《电子学报》1996,24(1):34-39

本文旨在将新兴的混沌、分形理论引入语音信号处理。本文提出了一种新的语音信号相空间重构方法，分析、统计了语音信号最大Ｌｙａｐｕｎｏｖ指数及分维度的分布，并提出了基于分形码本的语音信号码激励线性预测编码瓣算法。本文的研究表明，混沌、分形理论在语音信号处理中有良好的应用前景。相似文献

12.

基于庞加莱截面的语音基音检测

马勇顾明亮《电声技术》2006,(8):39-42

提出了利用庞加莱截面检测语音信号基音的方法,通过延时重构语音信号的相空间,在相空间内计算通过某点的庞加莱截面,根据相轨迹穿过截面上初始点邻域交点进行基音检测;实验表明,基于庞加莱截面的语音信号的方法,描述语音信号的非线性特性具有较高的准确性和时间分辨率。相似文献

13.

A nonlinear adaptive estimation method based on local approximation 总被引：1，自引：0，他引：1

Iiguni Y. Kawamoto I. Adachi N. 《Signal Processing, IEEE Transactions on》1997,45(7):1831-1841

One of the most important problems in signal processing is to estimate the output for a query from the input/output (I/O) data seen so far. This paper presents a nonlinear adaptive estimation method based on the n-nearest neighbor approach. In this method, observed I/O data are stored in a database in the form of a X-dimensional binary digital search trie (k-D trie), and a nonlinear local model to answer each query is derived based on regularization theory. The database contents are efficiently time updated to follow nonstationary data. A storage procedure allowing a simple and efficient update is developed for reduction in processing time and storage requirement. The effectiveness of the proposed method is demonstrated with both simulation data and real speech signals 相似文献

14.

用于语音信号非线性建模的RBF神经网络的训练方法及其性能 总被引：4，自引：0，他引：4

林嘉宇刘荧《信号处理》2001,17(4):322-328

语音信号非线性建模符合语音信号的性质,可以提高语音信号处理的性能.神经网络是信号非线性建模的有效工具之一.本文深入研究了应用于语音信号非线性建模的RBF神经网络的训练方法,即k-均值法、OLS算法和梯度下降法.实验结果表明,在RBF神经网络的结构已定情况下,不宜使用k-均值法及OLS算法,而应该使用梯度下降法.文章阐述了各训练算法性能差别的原因,并讨论了语音信号非线性及线性建模的性能比较. 相似文献

15.

Statistical AM-FM models, extended Kalman filter demodulation,Cramer-Rao bounds, and speech analysis

Wan-Chieh Pai Doerschuk P.C. 《Signal Processing, IEEE Transactions on》2000,48(8):2300-2313

A stochastic dynamical system model for describing time signals that are jointly amplitude (AM) and frequency (FM) modulated is presented. The signal is assumed to be bandpass, perhaps originating from a filter bank applied to a broadband signal, and includes the constraint that the magnitude of the complex baseband signal is positive. Motivated by speech processing and the desire for narrowband modulating signals, time is divided into frames, and the modulating signals are smoothly interpolated across each frame. The model allows a detailed characterization of the bandwidth of the modulating signals and the statistical character of the measurement noise. An adaptive estimation algorithm based on extended Kalman filtering ideas for extracting the modulating signals from the measured signal is described and demonstrated on both voiced and unvoiced speech signals. The Cramer-Rao bound on the performance of any estimator is computed 相似文献

16.

混沌背景下语音信号提取算法的研究

韩丽娟《电子技术》2010,47(5)

有效语音信号的提取在说话人识别中起着重要的作用,是声纹识别的主要研究内容之一。由于语音信号的非平稳性和不可预知因素的影响,决定用基于非线性时间序列的状态空间投影算法提取强噪声下的语音信号。该算法对其他场合微弱信号的检测也行之有效。相似文献

17.

Nonlinear filtering of multiplied and convolved signals 总被引：2，自引：0，他引：2

《Proceedings of the IEEE. Institute of Electrical and Electronics Engineers》1968,56(8):1264-1291

An approach to some nonlinear filtering problems through a generalized notion of superposition has proven useful. In this paper this approach is investigated for the nonlinear filtering of signals which can be expressed as products or as convolutions of components. The applications of this approach in audio dynamic range compression and expansion, image enhancement with applications to bandwidth reduction, echo removal, and speech waveform processing are presented. 相似文献

18.

基于临界频带的子带滤波语音增强

徐晶晶赵振纲《无线电工程》2007,37(11):18-20

根据人耳的听觉感知特性,提出了一种基于子带滤波的优化语音增强方法。基于临界频带设计滤波器将输入信号分成若干子带,依据估计出的每个子带的短时信噪比来对相应子带的时域信号逐帧进行独立的自适应处理后再合成。语音增强性能评估结果表明,有效地去除背景噪声的同时还抑制了音乐噪声,减少了语音的听觉失真,提高了增强语音的可懂度。相似文献

19.

Controlled multifunctional processing of causal signals on the basis of nonlinear (quadratic and cubic) time-frequency distributions

I. S. Ryzhak 《Journal of Communications Technology and Electronics》2006,51(8):895-908

General laws of the controlled multifunctional processing based on nonlinear (quadratic and cubic) time-frequency distributions of finite duration arbitrarily shaped causal signals that do not coincide in time and that have different carrier frequencies are presented. These distributions are compared to the time-frequency representations used in the signal analysis based on the Wigner distribution, the uncertainty function, and other quadratic distributions. Examples of the real-time realization of controlled multifunctional processing of causal signals that is performed on the basis of quadratic and cubic distributions are given. These examples include direct and inverse Fourier transforms, convolution, spectral analysis with varied time and frequency scales, delay, compression, time-domain inversion, and other functions. 相似文献

20.

Waveform coding for low-power digital filtering of speech data

Wassner J. Kaeslin H. Felber N. Fichtner W. 《Signal Processing, IEEE Transactions on》2003,51(6):1656-1661

This paper evaluates waveform coding techniques known from low bit-rate communication for their usefulness in low-power digital FIR filtering of speech signals. The encodings considered include linear PCM, PCM with adaptive and logarithmic quantization, and differential PCM, combined with two's-complement and sign-magnitude number representation. Selected implementation aspects for each alternative are discussed. Experimental results are presented to quantify potential power savings subject to statistical signal properties and operating conditions. Guidelines for the choice of encoding in application-specific digital signal processing of speech data are provided. 相似文献