首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
语音分类是语音信号处理的重要组成部分.准确快速地对语音进行分类在语音编码、语音合成中有着重要的意义.针对当前一些常用分类特征和分类算法的不足,本文提出一种利用语音的Mel频率子带能量作为分类特征,建立高斯混合模型(GMM),运用最大后验概率准则对清音、浊辅音、元音分类的算法.仿真实验表明,在噪音环境下该算法仍可准确进行语音信号分类.  相似文献   

2.
基于HMM的非特定人汉语语音识别系统   总被引:1,自引:0,他引:1  
设计了基于隐马尔可夫模型(Hidden Markov Model,HMM)的非特定人汉语语音识别系统,主要由录音、训练和识别三大模块构成."录音模块"首先录制一段指定长度的语音信号,然后通过对语音信号的短时能量和过零率进行门限检测,标志出有效语音段并保存."训练模块"利用Baum-Welch算法计算语音样本的MFCC(Mel Frequency Cepstrum Coefficient)参数生成识别用的语音模板."识别模块"利用HMM识别算法比较语音信号和语音模板的相似概率,找到最大值输出,完成语音识别功能.最后,在MATLAB中实现了该语音识别系统.实验结果表明,系统的识别率为60%以上,若结合足够的训练,识别率可以更高.  相似文献   

3.
语音识别与文本挖掘技术发展迅速,在客服语音挖掘领域作用明显。使用某电网公司电话客服数据进行分析,利用文本挖掘算法在该电话文本数据中获得重要特征信息,再根据聚类的结果对样本数据进行分类,更有针对性地解决客户的问题,提高电话客服的工作效率。  相似文献   

4.
为了尽可能降低不稳定特征点对识别率的影响,研究提出了基于序列图像提取稳定特征点的虹膜识别算法.该算法首先用二维Gabor滤波器对序列虹膜图像提取特征编码,然后对该序列特征编码求交集以提取稳定特征点,并利用这些稳定特征点建立虹膜的特征模板库,最后通过计算相似度,获得识别结果.在实验室采集的序列虹膜图库上,当等错率为0.3017%,分类阈值为0.6402时,正确识别率可以达到99.73%.实验证明该算法是有效、可行的,并更好地提高了虹膜的分类精度和改善了虹膜的识别性能.  相似文献   

5.
将生物认证技术与传统认证方法结合起来,针对不同安全等级需求,构建了一个基于密码、人脸和语音的多通道混合身份认证系统.在语音通道中,根据渐进最优矢量化理论的思想提出了一种改进型LBG算法(即CSLBG算法),采用码字转移方法,克服了经典LBG算法的局限性.实验结果表明,当真实人的人脸和语音随外界情况或时间变动而发生变化时,错误接收率始终低于1%,系统的识别性能和灵活性明显优于单通道身份认证系统.  相似文献   

6.
基于混沌振子的低信噪比语音端点检测新方法   总被引:6,自引:1,他引:5  
Duffing振子相变对与参考信号频差较小的周期小信号具有敏感性,对白噪声和与参考信号频差较大的周期干扰信号具有免疫力.利用语音的准周期性提出了一种基于混沌理论的语音端点检测新算法,讨论了如何利用Dufilng振子的间歇混沌特性来检测语音端点.将含噪语音作为Duffing振子的外部参考信号的摄动,根据系统相图是否改变来检测语音段和噪声段.通过尺度变换并设计了振子阵列以榆测频率范围较大的语音信号.实验结果表明,基于混沌的语音端点检测算法在低信噪比下明显优于传统的能量语音端点检测法.  相似文献   

7.
管必聪  吕虹 《机电工程》2008,25(2):50-52
国际电信联盟(ITU-T)于1996年提出了G.729A 8 kbps语音编码标准.通过分析该标准的核心算法CS-ACELP的算法原理,根据数字信号处理器的特点,将ITU给出的标准C代码移植到TMS320CV5509 DSP上并对源代码中运算量较大的模块进行了代码优化,实时实现了G.729A低速率语音编解码器.经过测试,结果表明合成语音具有较高的自然度和可懂度.  相似文献   

8.
针对面向对象的高光谱分类方法中分割参数设置问题,提出了一种基于区域增长技术的自适应高光谱分类算法。首先提出了带约束的区域增长方法,利用已知训练样本的空间信息,提供有效约束,从而降低区域增长过程中区域标记的错误传播率,以提高分类性能;其次,提出了自适应阈值计算方法,通过分析已知训练样本光谱的分布规律,自适应地计算出合理的区域划分阈值,从而代替经验阈值,提高算法的鲁棒性;最后,采用K近邻算法(KNN),对划分后各区域中心进行分类。实验结果表明:对于不同图像,提出的算法计算出的自适应阈值均与其经验值相符合,且其分类效果优于其他算法,来自AVIRIS传感器的高光谱数据Indian Pines在10%的已知训练样本下总体分类精度达92.94%、kappa系数达0.919 5,来自ROSIS传感器的高光谱数据Pavia University在5%的已知训练样本下总体分类精度达95.78%、kappa系数达0.944 0。该算法不仅增强了算法的鲁棒性,同时有效提高了分类性能,在高光谱应用中具有较强的实用性。  相似文献   

9.
帕金森病(PD)语音识别算法研究对于其及时诊疗具有重要意义,但现有 PD 语音识别算法面临小样本数据量问题挑 战。 针对问题,本文提出双面双阶段均值聚类包络和卷积稀疏迁移学习算法。 在双阶段学习方面,首先基于源数据集训练多组 卷积核,然后通过中间集得到最优卷积核并对目标集进行编码。 在深度样本聚类包络方面,首先设计迭代均值聚类算法构建深 度样本空间;然后进行样本特征同时选择并训练分类器模型;最后对不同样本空间的分类结果进行融合。 实验选取代表性的 PD 语音数据集进行验证。 实验结果表明,本文算法创新部分有效,与 10 多个经典和最新相关文献算法相比取得了显著改进, 准确率达 97. 8% 。 此外,本文算法的时间复杂度不高,满足临床应用要求。  相似文献   

10.
摘要:致痫区脑电识别能够为癫痫外科手术提供重要的参考价值。提出了一种基于深度网络迁移学习的致痫区脑电识别算法。首先利用连续小波变换(CWT)对脑电信号进行时频分析,获得脑电信号时频图;然后迁移学习AlexNet网络模型,调整网络结构使之适应于致痫区脑电识别,将模型第7层全连接层输出作为脑电信号时频图的特征表示,最后利用支持向量机(SVM)、BP神经网络、长短期记忆网络(LSTM)、基于稀疏表达分类算法(SRC)、线性判别分析(LDA)等分类算法进行特征分类。基于开源脑电数据集采用十折交叉验证的方法对算法进行了验证,比较6种分类器的效果,得到SVM算法的平均特异性为8881%,灵敏度为8807%,准确率为8844%,证明了该方法识别致痫区脑电信号的有效性。 .txt  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号