排序方式: 共有47条查询结果,搜索用时 609 毫秒
1.
吴镇扬 《东南大学学报(自然科学版)》1995,(Z1)
一些科学工作者对人类以及动物听觉的自由声场至耳膜的传递函数进行了测量,他们发现在宽带信号激励的情况下,不同频率分量之间的幅度差异是与声源的方向有关的,这一发现已被用于展现“真实”的三维听觉,称作虚拟听觉空间仿真。 相似文献
2.
基于SIFT特征的粒子群优化的视觉跟踪算法 总被引:1,自引:0,他引:1
提出了一种基于SIFT(scale invariant feature transform)特征的表观模型更新的粒子群优化(particle swarm optimization,PSO)跟踪算法.与现有的跟踪方法不同,该算法将当前帧检测到的SIFT特征与最近更新的目标模板相匹配,估计目标的位置,然后把此位置信息融入到PSO的结果中以得到更加精确的位置估计,并把其作为新的目标模板,从而更加鲁棒地应对表观模型的更新问题.实验结果表明,提出的SIFT-PSO算法在目标发生大的运动变化和局部遮挡条件下仍然能够可靠地跟踪目标. 相似文献
3.
由于训练环境和识别环境的失配,识别系统的性能会严重下降,为此提出了基于高斯相似度分析的最大后验概率非线性变换的环境自适应算法,它可以减小由于环境的失配所引起的系统性能的下降.在该算法中,首先将HMM模型中的高斯分量进行相似度分析并建立二叉树,然后根据数据自适应调整变换类数,在每一类内利用分段线性回归近似非线性变换将训练环境下的HMM变换到识别环境,减小环境的失配,变换参数的估计采用了最大后验概率估计(MAP).数字语音识别实验证明:该环境自适应算法的识别性能优于带有高斯相似度分析的MLST、MAPLR和MLLR等算法. 相似文献
4.
5.
一种抑制背景干扰的粒子滤波人脸跟踪算法 总被引:1,自引:0,他引:1
首先从理论上推导出基于MMSE状态估计在背景干扰下的偏差,然后通过实验说明基于MAP状态估计存在的问题,在此基础上提出一种新的跟踪目标状态参数估计方法.即在视频目标跟踪过程中,按照粒子权值大小的准则,筛选适当数量具有较大权值的粒子进行目标状态估计.由于该算法利用了参考目标与候选目标相似度大的特性,所以可以有效地剔除背景以及伪目标的影响.实验结果表明,该算法具有很好的鲁棒性,并且提高了在背景干扰下目标跟踪的精度. 相似文献
6.
研究了用于CHMM的MCE学习方法,提出了简单形式的识别函数、误差函数、扣池数等的定义方法以及总损失函数的最小化方法。通过对非特定人汉语连续语音识别实验,证明了提出了的函数形式和损失函数最小化方法对CHMM的MCE学习的有效性。 相似文献
7.
提出一种基于接收端的联合语音解码算法,根据信道或信道解码提供的参数软输出值,以及语音编码参数的冗余量计算接收参数的后验概率;利用后验概率基于MAP或MS准则进行参数估计,最佳估计值进行语音解码.仿真中采用G.711和GSM EFR两种语音编码标准,结果表明联合解码算法显著提高了解码语音信噪比. 相似文献
8.
为了提高受生物启发的定位算法的定位成功率,提出了一种基于双耳互相关函数的声源定位算法.该算法包括2个阶段:离线阶段和在线阶段.在离线阶段,测量与头相关脉冲响应(HRIR),并计算所有HRIR的双耳互相关函数(BCCF).当处于在线阶段时,首先,计算接收信号的BCCF;然后,计算接收信号的BCCF与所有HRIR的BCCF... 相似文献
9.
运用基于离散Teager能量算子的浊音端点检测技术,将浊音端点及其之后的若干帧作为丢帧补偿的增强保护帧.在研究窄带语音帧间独立编码算法iLBC的基础上,对G.722.2编码标准进行改造,使之能够对宽带输入语音进行类似的帧间独立编码,以增强其抗丢帧鲁棒性.针对不同的丢帧率,对不同数目的增强保护帧进行帧间独立编码,以编码速率的略微提高增强对丢帧的鲁棒性,因此本算法既有iLBC的鲁棒性,又有一般CELP编码的速率自适应性.实验结果表明,相对于G.722.2编码标准附件Ⅰ补偿方法,本算法可以提高丢帧补偿性能,在浊音端点丢失率较高的情况下的效果更好. 相似文献
10.
针对目标在复杂环境下容易受到外界干扰而发生漂移的问题,提出了一种基于超像素的局部判别式跟踪方法.首先,对视频序列前10帧的目标区域进行分割,得到超像素,并利用kmeans方法对其进行聚类以构造初始字典;其次,通过训练样本集来训练线性分类器;然后,为了减少目标发生漂移的可能性,将初始训练的分类器与更新后的分类器线性加权之和定义为似然函数;最后,在粒子滤波的框架下,将似然函数值最大的粒子作为跟踪的结果,每运行U帧更新一次字典和分类器参数,以捕获目标表观的变化.仿真结果表明,所提算法在目标发生遮挡、光照变化的复杂环境下仍然能够跟踪目标. 相似文献