排序方式: 共有183条查询结果,搜索用时 15 毫秒
81.
基于MMSE-LSA语音增强算法在非平稳环境下的研究与实现 总被引:1,自引:0,他引:1
讨论了非平稳环境下基于语音短时对数谱的最小均方误差(MMSE-LSA)估计的语音增强算法.众所周知,语音信号为时变信号,在假设语音频谱分布为高斯分布的前提下,实验的工作重点是将MMSE-LSA算法与其它语音增强算法(以谱相减的语音增强为例)比较.实验结果表明:该MMSE-LSA算法的语音增强效果很好,特别是在信噪比低时的非平稳环境下效果更为明显. 相似文献
82.
83.
基于模糊神经网络的印刷体汉字容错识别方法 总被引:3,自引:0,他引:3
类似于人脑的工作方式,模糊系统善于表达人的经验性知识,能处理难以依靠数学模型清晰表达的模糊性信息,在对汉字模式的辨识中具有较强的抗噪性。文中利用4层神经网络方法实现的一种模糊分类器,弥补了单纯的神经网络和单纯的模糊系统各自的不足,实现了模糊系统中规则的自学习性和自优化性,使系统具有很好的鲁棒性能。利用建立在一组网络上的表决机制,不仅降低了网络的复杂性,而且实现了对任意类数分类器的构造。实验结果表明,文中提出的方法很好地解决了对印刷体汉字进行客错识别问题。 相似文献
84.
85.
在对轨迹流矢量进行量化编码的基础上,提出了一种基于深度优先搜索的轨迹分布模式提取算法,生成了能够描述轨迹分布的序列模式图,并给出了与之相应的异常检测和行为预测方法。对不同场景的可见光和红外序列图像的实验表明,本文方法不仅能够学习轨迹中流矢量的分布,而且能够反映它们之间的时序关系,可以应用于室外复杂场景的目标异常行为检测。 相似文献
86.
三维网格模型零水印技术 总被引:1,自引:0,他引:1
为解决网格模型水印算法中水印鲁棒性与透明性之间的矛盾,提出了一种适用于任意拓扑连通结构的网格模型零水印算法。水印由网格的几何数据经过空域特征提取及变换域能量集中后生成。实验结果表明:算法构造的水印不仅能抵抗顶点重排序、平移、旋转、各向一致缩放等攻击,而且对加噪、网格简化攻击也表现出较好的鲁棒性。 相似文献
87.
88.
89.
基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究 总被引:1,自引:0,他引:1
提出一个新颖的单流多状态动态贝叶斯网络(Single stream Multi-states Dynamic Bayesian Network, SM-DBN)模型,以实现大词汇量连续语音识别和音素切分.该模型在Bil m es等人提出的单流动态贝叶斯网络(Single stream Dynamic Bayesian Network, Phone-sh ared,SS-DBN-P)模型(识别基元为词)基础上,增加了一个隐含的状态节点层,每个词由它的对 应音素组成,而音素采用固定个数的状态描述,状态和观测向量直接连接.它的识别基元为音 素,描述了音素的动态发音变化过程.大词汇量语音识别的实验结果表明:在纯净语音环境下 ,SM-DBN模型的识别率比HMM和SS-DBN-P模型的识别率分别提高了13.01%和35.2%,而 音频流的音素切分正确率则分别提高了10%和44%. 相似文献
90.