首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 192 毫秒
1.
连续汉语音流中声韵母切分研究   总被引:1,自引:0,他引:1  
根据汉语语音的特点,提出了一种连续汉语语音中声韵母自动切分的新算法.根据音素单元结构确定HMM模型中的状态数,利用HMM模型进行音素切分,再对切分结果进行合并,得到最终的声韵母子词单元.通过实验验证了子词单元产生的稳定性和准确性,实验结果表明,算法在这两方面均达到了较好的性能,且与话者无关.  相似文献   

2.
针对希望进一步掌握普通话口语学习的外国学习者,该研究提出了一种普通话游戏学习系统.系统的学习模式结合了计算机技术和语言学研究成果,打破了传统的教学模式的限制,对学习者进行实时评测,提供学习报告与口语学习的最终评定结果.结果表明,该系统能够较为有效地辅助外国学习者的普通话口语学习.  相似文献   

3.
系统采用AT89C55单片机为控制核心,高速红外线光电开关为输入信号,完成直线速度的测试和语音动画输出.在对语音芯片ISD1420深入实验研究的基础上,介绍了芯片工作模式和电气原理设计方法.分析研究了SED1335液晶显示模块,介绍了接口电路设计,以及汉字和图形的数据提取方法.  相似文献   

4.
针对语音信号的特点,提出一种稳健的语音传输路径自适应建模系统.它在引入宽带平稳训练信号克服非平稳输入自适应建模失配的基础上,用小延时预测滤波消除自适应建模的语音干扰,同时用补偿滤波来修正预测滤波导致的训练成分失真.计算机仿真表明,该建模系统在回声抵消、语音增强等领域均有很好的应用前景.  相似文献   

5.
为了解决连续语音识别在自然环境中噪声估计高误差、去除噪声和语言失真不能良好平衡、导致关键词识别率低下的问题,提出了一种全新的自动语音识别系统(ASR).本系统将双通道含噪语音信号通过空间增强模块进行噪声提取,通过均衡考虑语音信号和参考噪声输入谱减法模块进行去噪与语音失真的噪声去除和信号放大,最后进入基于隐马尔科夫模型(HMM)的自适应语音信号识别模块进行识别处理.实验显示,本系统可有效减少运算负载、提高关键词识别率.  相似文献   

6.
提出并实现了一种基于STRAIGHT模型的、合成语音质量较高的语音转换系统。一方面STRAIGHT模型可以对语音的基频、时长等参数进行较大幅度的修改而不引起合成语音质量的下降,另一方面引入“预测”谱参数的概念,利用搜索预测码书的方法进行转换,既避免了经典系统中GMM模型谱参数估计的过平滑问题,又克服了经典系统基于LPC模型合成语音时,在帧与帧连接处会产生较大脉冲波形的缺点。语谱图分析、ABX测试和MOS分评价结果表明:提出的语音转换算法在合成语音质量和目标说话人特征映射上都远远好于经典的基于LPC模型的GMM转换系统。  相似文献   

7.
提出一种邻域极值差分信号功率谱的分形维值算法,并用于低信噪比环境下的语音活动检测. 在时域信号邻域范围内作极值差分检索获得邻域极值差分信号,进一步根据差分信号功率谱估计的最小误差求解分维值.在安静环境下,对正常语音和耳语音的语音信号活动检测(speech activity detection, SAD)性能与盒维相似,明显好于谱熵算法. 多种噪声环境下的SAD检测结果显示,所提算法的误检率远低于谱熵算法,在除白噪声以外各种条件下的误检率均低于盒维算法,且计算量约为盒维算法的5%. 实验表明,该算法在SAD检测和效率两方面具有良好的综合性能.  相似文献   

8.
采用二阶差分耳蜗模型对语音信号进行特征参数提取,获得了基于听觉谱的语音识别前端特征参数,同时根据听觉谱特征提出了一种"幅和频差积"距离测度,识别算法采用端点放松两帧,路径斜率限制在1/2到2之间的改进型DTW算法.在小词汇量非特定人(SI)的识别环境下,计算机模拟结果表明此法在对0~9十个数字以及小词汇量的SI识别时,其正识率可达98%以上,且具有较好的鲁棒性.  相似文献   

9.
针对广播节目在传输过程中易受干扰的问题,提出了基于动态时间轴归整(DTW)算法的多词判别法语音识别技术,根据该方法通过提取Mel尺度倒谱参数,设计出基于DSP的广播节目抗干扰系统,实现广播信号的自动判别,实验表明该系统抗干扰能力显著增强.  相似文献   

10.
一种新的麦克风阵列自适应语音增强方法   总被引:1,自引:0,他引:1  
在复杂的语音环境中,利用麦克风阵列语音增强技术能有效地拾取目标语音信号并
消除噪声干扰,但传统的麦克风阵列波束形成的加权系数是固定的. 为了能灵活地控制麦克
风阵列波束的形成方向以及消除其波束旁瓣带来的残余噪声,提出了一种基于麦克风阵列的
自适应语音增强技术. 该技术将自适应滤波器和麦克风阵列相结合形成波束可控的广义旁瓣
消除器,然后在广义旁瓣消除器后面续接一个改进的谱减法,并加入契比雪夫窗函数. 仿真实
验结果表明,所提出的语音增强方法能有效去除语音信号中的噪声干扰,相比于传统广义旁
瓣消除器,信噪比大约提高了3.5 dB.  相似文献   

11.
针对机器识别人类情感过程中的精度不高、泛化能力不强等问题,提出了一种基于语音、文本和表情动作的3种模态情感识别融合方法。在语音模态中,设计深度波场延拓和改进波动物理模型,模拟长短期记忆(long short-term memory, LSTM)网络的序列信息挖掘过程;在文本模态中,利用含有多头注意力机制的Transformer模型捕捉语义上潜在的情感表达;在表情动作模态中,将提取面部表情和手部动作的序列特征与双向三层含有注意力机制的LSTM模型相结合。最终提出一种多性能指标下的模态融合方案,以实现高精度的、强泛化能力的情感识别。在通用的交互式情感二元运动捕捉语料库IEMOCAP中,将所提出的方法与现有的情感识别算法进行对比,实验结果表明:所提出的算法在单个模态和多个模态中的识别精度均较高,平均精度改善达到16.4%和10.5%,有效提升了人机交互中情感识别的能力。  相似文献   

12.
提出了一种基于蚁群聚类神经网络的汉语耳语音声调识别方法.根据耳语音发音特点,以听神经平均发放率、幅值包络、共振峰、声道长度等构成的多维矢量描述声调特征,采用蚁群聚类算法将多维特征矢量聚类后,送入局部有监督特征映射神经网络进行声调识别.这一方法通过对特征参数的聚类压缩了神经网络的输入神经元数目,因而可以有效避免在大数据条件下神经网络不易收敛及速度慢的问题.对多人耳语音声调的识别实验显示,采用蚁群聚类神经网络的耳语音声调识别方法与传统方法相比,性能明显提高,平均正识率达到87.5%.  相似文献   

13.
讨论了一种新型的模糊MLP神经网络及其在清浊音判决中的应用,该网络实现了多参量的综合评判,而且有效地处理了语音信号的模糊性,从而获得了较高的判决准确率。  相似文献   

14.
基于CNN和Bi-LSTM的脑电波情感分析   总被引:1,自引:0,他引:1  
针对目前大多数脑电波情感识别方法存在的依赖手动特征提取等问题,提出一种基于卷积神经网络(convolutional neural network,CNN)和双向长短时记忆(bidirectional long short-term memory,Bi-LSTM)网络的混合模型.首先将一维数据转换为二维数据,采用CNN提...  相似文献   

15.
自组织特征映射神经网络用于语音识别的研究   总被引:4,自引:0,他引:4  
该文提出了一种优化的自组织学习算法。基于自组织特征映射(SOM)神经网络和隐马尔柯夫模型(HMM)法,组成了一种新的语音识别系统,该系统采用SOM网络作为矢量量化器。SOM网络经过优化的自组织学习算法训练后,再用K均值聚类算法对其进行调整。实验结果表明,该文提出的语音识别方法确实能提高系统的识别率。  相似文献   

16.
传统的子空间语音增强方法在推导过程中,一般假定噪声的方差矩阵是满秩的.在窄带噪声或者音调噪声下这一条件就不能满足。本文采用直接对噪声信号进行子空间白化的方法,将传统的子空间语音增强方法推广到了窄带噪声的情况。仿真结果表明了该算法的有效性。  相似文献   

17.
针对传统的特征选择算法只专注于特征间的相关性和冗余性而没有考虑特征之间交互作用的问题,提出一种基于交互信息的混合特征选择(hybrid feature selection based onmutual information,MIHFS)算法,该算法以K-最近邻算法的分类准确率作为衡量所选特征分类性能的评价指标,有效地去除了冗余和不相关的特征,保留了具有交互作用的特征。为了评估该算法的性能,从分类准确率、所选特征数量以及算法稳定性三方面,与最大相关最小冗余、联合互信息等7种特征选择算法在8个数据集上进行了实验比较和分析。实验结果表明:MIHFS算法具有较强的稳定性,不仅有效降低了特征空间的维数,而且在所选特征的分类性能方面明显优于其他特征选择算法。最后将MIHFS算法与灰色关联分析法-逼近理想解的排序技术法相结合并应用到高邮凹陷永安地区戴一段地质评价中,其评价结果准确率为80%,与实际钻探结果基本吻合,具有较高的可靠性,能够有效指导油气地质评价。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号