首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
针对双矢量量化方法中语音的静态特征和动态特征的权重不满足可加性的情况,提出了一种新的说话人识别方法——基于Sugeno测度的动态不可加双矢量量化说话人识别方法。该方法在Sugeno测度空间上将说话人语音的静态特征和动态特征用Sugeno测度进行动态融合。然后,在噪声环境下研究了该方法的识别效果,找到了噪声环境下语音的静态特征和动态特征参数的较优的权重组合。实验结果表明,与双矢量量化识别方法相比,该方法可以使识别率明显提高。该方法为研究各类语音特征参数之间的关系、探寻最优的特征匹配方案提供了一种新的途径。  相似文献   

2.
针对现有关键词识别系统采用很难用硬件电路准确描述的连续隐马尔可夫模型CHMM作为识别模型,提出用离散隐马尔可夫模型DHMM作为系统的识别模型,研究了适用于硬件实现的状态机端点检测算法,并通过引入VQ矢量量化模块来保证离散关键词识别系统的识别率和识别速度;根据关键词训练模型,分析所采集语音信息中是否存在指定的关键词并进行准确识别。实验结果表明,该算法在便于硬件实现的基础上,具有良好的识别率和实时性,为关键词识别系统的FPGA硬件电路实现研究提供了参考。  相似文献   

3.
矢量量化方法是与文本无关的说话人识别系统中广泛应用的建模方法之一.在矢量量化过程中,经典的LBG算法收敛速度快,但极易收敛于局部最优点,无法保证根据有限样本数据得到最优码本,并最终影响系统识别性能.本文提出了一种基于遗传算法并结合LBG算法的码本设计方法.该方法通过遗传操作获得全局优化的说话人模板,把新的识别算法应用于说话人识别的实验.结果显示,对于一个小的码本集,新的码本算法比经典的LBG算法具有更好的识别性能.  相似文献   

4.
通过对四声调在基音图形上反映出的特征所作的分析,提出了一种合理地构成四声调特征矢量的方法,使VQ在识别四声问题的应用方案得到简化。综合两种判决方法各自的特点而设计的联合判决方案,有效地消除了大部分的误识现象。实验结果表明,基于上述方案的系统对1075个不同字的四声调的识别率达到99%以上。  相似文献   

5.
心音信号是一种典型的非平稳信号,传统信号处理方法的应用受到很大限制,为此该文提出了基于Teager边界谱和矢量量化的心音身份确认算法。实验表明,该算法取得很好的识别效果,正确识别率达到96.6%,等错误率仅为5.1%。  相似文献   

6.
矢量量化是一种非常重要的数据压缩技术.其应用最多的聚类算法复杂度随着码率和维数的乘积指数增长.为了减小复杂度,本文给出几种适用于特定信源的几何矢量量化方法如适用于高斯信源的椭球矢量量化(EVQ),适用于拉普拉斯信源的棱锥矢量量化(PVQ).最后,针对几何分布不规则的一般信源,给出一般的几何矢量量化方法--标量矢量量化(SVQ).  相似文献   

7.
本文介绍多码本离散隐马尔可夫模型用于含噪声语音识别的研究成果.特定人识别系统对孤立数字的识别率,在低噪声环境下可达100%,在高噪声环境下(信噪比 SNR 低于-7 dB)达63.9%.  相似文献   

8.
为了解决H.264可变大小块运动估计技术使得运动估计运算量剧增的问题,提出了一种自适应提前终止搜索算法.根据整数DCT变换和量化的特性,通过提前判定全零系数块来终止没有意义的运动搜索过程.利用运动矢量和预测运动矢量之间的高度相关性,采用预测块作为提前终止判决块.使用基于量化步长的自适应阈值以获得最佳性能.实验表明,该算法与已被H.264标准采纳的快速整像素搜索算法(UMHexagonS)结合使用,能够在保证图像质量和编码压缩率的前提下,进一步减少60%左右的搜索点数.该算法对量化步长具有良好的鲁棒性,适用于固定码率的实时应用环境.  相似文献   

9.
针对虚假数据注入(FDI)攻击下的信息物理系统(CPS),研究了一种基于滑模和扩张观测器的控制方法.首先对系统进行动态线性化,构造了扩张观测器并对观测误差的收敛条件进行了分析.其次,设计了积分滑模面,通过线性矩阵不等式的形式导出滑动模态系统的渐近稳定判据,求出了系统满足L2 增益性能的滑模向量.接着,基于指数趋近律,提出了用来消除量化误差和广义干扰的自适应积分滑模控制器,以使系统能到达滑模面.该方法估计精度高、响应速度快,对FDI攻击和量化参数失配具有较强的鲁棒性.最后,数值仿真验证了该方法的有效性.  相似文献   

10.
语音识别和控制环境中,非语音信号(噪音)很容易与语音信号相混淆,一部分噪音被机器误认为语音,导致系统性能恶化.针对这一问题,以说话人识别理论为基础,提出了一种采用矢量量化来对音频信号类型(噪音或语音)进行确认的方法,以便于后期对非语音信号的噪音进行鉴别并且予以消除,提高语音信号处理系统的工作效率.在此基础之上,在MATLAB平台上设计了一个基于此方法的语音与非语音识别的仿真系统.测试结果表明,系统实现了语音与非语音识别的基本功能,达到较好的工作效果.  相似文献   

11.
利用矢量量化的说话人识别系统的研究   总被引:2,自引:0,他引:2  
利用矢量量化(VQ)技术实现了与文本有关的说话人识别。系统采用语音信号的LPC倒谱系数、差值倒谱系数、基音周期和差值基音周期的混合特征参数作为识别的特征矢量集,对语音库中语音的平均识别率达到了92%,实时识别率达到90%以上。实验结果表明该系统具有识别精度高、速度快等特点,是一种有效的说话人自动识别的实现方法。  相似文献   

12.
一种改进的LBG算法在声纹识别中的应用   总被引:1,自引:0,他引:1  
提出一种改进的矢量量化VQ(Vector Quantization)算法,优化了现有的声纹识别技术,并已经得到了应用。对基于LBG(Linde Buzo Gray)算法中现有的倒谱参数MFCC(Mel-Frequency Ceptral Coefficients)在声纹识别中的提取以及声纹模型建立的相关改进,使得矢量量化局部最优的特点在新的声纹模型建立时得到更好的应用。在保证识别率的情况下减少了匹配次数,降低了运行时间。经过测试,语音的平均识别率达到了92%以上,实时识别率达到90%以上。实验结果表明,相对于LBG算法原型,改进的算法的识别精度和速度都有所提高,是一种有效的声纹自动识别的实现方法。  相似文献   

13.
为解决图像分类任务中词袋(Bag-of-Words)模型分类算法单一局部描述子信息缺失、特征量化误差较大、图像特征表现力不足等问题,提出一种基于多描述子分层特征学习的图像分类方法.结合尺度不变特征变换(SIFT)与形状核描述子(KDES-S)进行局部特征提取,并构建分层特征学习结构来减少编码过程中的量化误差,最后将图像特征分层归一化后进行线性组合并利用线性支持向量机(SVM)进行训练和分类.在Caltech-101、Caltech-256、Scene-15数据库上进行实验,结果表明:相比其他图像分类方法,本文方法在分类准确率上具有显著提升.  相似文献   

14.
MIMO广播有限反馈系统中联合预编码方法   总被引:2,自引:0,他引:2  
在接收用户为多天线多输入多输出(MIMO)广播有限反馈系统中,信道方向矩阵的量化存在误差,此误差影响预编码设计,从而降低系统容量.针对此问题,通过分析信道方向向量量化误差的统计特性,提出了一种具有鲁棒性的基于最小均方误差(MMSE)的预编码方案.分析和仿真结果表明,所提的预编码方法有效提升了系统容量,降低了误码率(BER),减缓了平顶效应.  相似文献   

15.
针对现有虹膜识别系统中全局纹理特征提取方法忽略了纹理类型信息的问题,提出了一种针对全局性纹理中虹膜色素块的检测与分类方法.该方法利用灰度聚类法实现虹膜图像中色素块可能存在区域的初定位,依据坑洞和色素斑这两类色素块的灰度空间分布特性,定义一组区域特征参数作为分类特征向量,利用支持向量机实现二者的检测与分类.算法对图库中图像的坑洞和色素斑的检测正确率分别为99.2%和86.5%,对无特征纹理存在的虹膜图像检测正确率为87.2%.实验结果表明,该方法具有较高的正确率,能够满足虹膜识别系统的纹理特征提取要求.  相似文献   

16.
Nakagami-m信道下有限反馈多天线系统性能分析   总被引:1,自引:1,他引:0  
为了探讨Nakagami-m衰落信道下反馈比特数、接收天线数与系统性能之间的联系,为实际系统应用提供理论依据,针对多个发送天线单个接收天线(MISO)系统,分析了采用随机向量量化(RVQ)有限反馈波束成形时系统的性能,推导出了平均比特错误概率和中断概率闭式解,并将得到的闭式解扩展到基于接收天线选择的多输入多输出(MIMO)系统.仿真结果表明,获得的平均比特错误概率和中断概率闭式解的理论值与实际系统仿真结果一致,验证了所得结果的正确性.  相似文献   

17.
To reduce the negative impact of channel quantization errors,a low-complexity transceiver joint design scheme for both the transmit beamformers and receive combining vectors is proposed in the two-user multiple-input multiple-output(MIMO) system.In the scheme,the channel null-space quantization vector is used as the transmit beamformer of the interference user directly based on channel null-space feedback.Since the interference can be determined at the receiver,interference rejection combining(IRC) is jointly utilized to cancel the inter-user interference.Simulation results show that the proposed scheme can provide substantial sum-rate improvement especially at high SNR.  相似文献   

18.
Mandarin Digits Speech Recognition Using Support Vector Machines   总被引:1,自引:0,他引:1  
A method of applying support vector machine (SVM) in speech recognition was proposed, and a speech recognition system for mandarin digits was built up by SVMs. In the system, vectors were linearly extracted from speech feature sequence to make up time-aligned input patterns for SVM, and the decisions of several 2-class SVM classifiers were employed for constructing an N-class classifier. Four kinds of SVM kernel functions were compared in the experiments of speaker-independent speech recognition of mandarin digits. And the kernel of radial basis function has the highest accurate rate of 99.33 %, which is better than that of the baseline system based on hidden Markov models (HMM) (97.08%). And the experiments also show that SVM can outperform HMM especially when the samples for learning were very limited.  相似文献   

19.
在多维矢量矩阵理论的基础上提出了四维矢量矩阵离散余弦变换(4D-VMDCT)算子,扩展了多维矢量矩阵正交变换理论,验证了该变换算子的正交性和能量集中性;提出了适应于三维数据的量化方法,并将该方法用于图像压缩。根据彩色图像的行、列、颜色分量之间的强相关性构建了多维矢量矩阵采样模型,进行多维正交变换,大幅降低了多维数据的相关性,并通过多维量化和无损熵编码,进一步消除统计冗余。理论分析和实验结果表明:在增加压缩比的同时,峰值信噪比也有明显的提高,实验结果优于国际标准JPEG。  相似文献   

20.
This paper proposes a new limited feedback bit partition algorithm to minimize the rate loss caused by the channel quantization error, based on the cooperative distributed antenna system (DAS). There are two kinds of interferences in multi-user cooperative DAS: multi-user interference (MUI) within the local cell and inter-cell interference (ICI) from adjacent cells. To suppress these two kinds of interferences, this paper uses the random vector quantization (RVQ) codebook to separately quantize the channel state information (CSI) from the local cell and adjacent cells. Under the condition that uses' total feedback overhead is fixed, we use a two-step optimization method to obtain the optimal solution of the feedback bit number allocated to local and adjacent cells. Simulation results show that the proposed algorithm effectively increases the average transmission rate compared with the equal-bit partition algorithm.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号