排序方式: 共有19条查询结果,搜索用时 15 毫秒
1.
2.
针对在自然场景下,现有的手写体票据字符识别精度低的问题,提出了一种改进的端到端的网络文本识别方法.通过对Visual Geometry Group(VGG)卷积网络进行改进,从而获取深层次的图像特征;通过改进的双向长短时记忆网络(Long Short-Term Memory,LSTM)提取上下文信息,对不同长度的文本序... 相似文献
3.
培养具有良好工程素质的工程技术人才是高等工科院校的一项重要任务,如何培养大学生的工程素质成为高校教学改革的热点研究问题。本文从工程训练的课题来源及内容、课程的教学特点、评价模式以及训练效果等方面出发,探讨了"信号处理工程实践"课程对高等工科院校信息类大学生工程素质的培养。 相似文献
4.
针对复杂声学环境下,现有目标声源定位算法精度低的问题,该文提出了一种基于时频单元选择的双耳目标声源定位算法。该算法首先利用双耳目标声源的频谱特征训练1个基于深度学习的时频单元选择模型,然后使用时频单元选择器从双耳输入信号中提取可靠的时频单元,减少非目标时频单元对定位精度的负面影响。同时,基于深度神经网络的定位系统将双耳空间线索映射到方位角的后验概率。最后,依据与可靠时频单元相对应的后验概率完成目标语音的声源定位。实验结果表明,该算法在低信噪比和各种混响环境,特别是存在与目标声源类似的噪声环境下目标声源的定位精度得到明显改善,性能优于对比算法。 相似文献
5.
本文针对波形内插(WI)语音编码模型和参数量化等技术进行了研究,并最终提出了一种基于二维非负矩阵分解的1kb/s波形内插(2DNMF-WI)语音编码算法. 文中采用二维非负矩阵分解(2D-NMF)方法来分解语音特征波形(CW),该分解方法在行和列两个方向上同时压缩CW幅度谱矩阵的维数,使得CW幅度谱矩阵降维后得到的编码矩阵维数较小,易于量化. 此外,在甚低速率语音编码中,由于没有足够的比特数来描述编码参数,往往很难得到高质量的合成语音. 本算法采用两帧联合编码、帧间后向预测三级矢量量化、离散余弦变换(DCT)和分裂式矩阵量化等技术来降低编码速率和改善音质. 非正式主观听觉测试显示,1kb/s 2DNMF-WI编码器合成语音的质量稍差于2kb/s的NMF-WI语音编码算法. 相似文献
6.
一种基于分带谱熵和谱能量的语音端点检测算法 总被引:3,自引:0,他引:3
语音端点检测的精确度直接影响语音识别的准确度.在噪声环境下,语音端点检测很困难.信噪比下降,语音端点检测的正确率也随之下降,同时,噪声类型的变化影响端点检测的正确率.为此,提出了一种改进的、适合在电话语音城市名识别系统中应用的端点检测算法,并结合分带谱熵和谱能量形成了一个新的特征参数集,利用该参数集进行端点检测,弥补了分别采用分带谱熵和谱能量进行端点检测的缺陷,提高了检测性能. 相似文献
7.
8.
针对波形内插(Waveform Interpolation,WI)语音编码的特征波形分解问题,本文首先提出了基于离散余弦变换(Discrete Cosine Transform,DCT)的特征波形分解方法,避免了复杂的特征波形对齐运算;其次,针对WI的相位重建问题,提出了清/浊音相位判决和浊音相位分类的方法,提高了重建语音质量;最后,分别构建了速率为2.0kbps和1.6kbps的DCT-WI声码器.主观MOS分表明,2.0kbps的DCT-WI声码器质量优于2.4kbps MELP声码器,1.6kbps的DCT-WI声码器亦取得了良好的听觉效果. 相似文献
9.
GSM-R系统越区切换实现方案的研究 总被引:3,自引:0,他引:3
文章利用GSM-R小区线状分布的特点,提出了一种新邻小区表设计方案和适用于高速移动台的目标小区指定法;并借鉴现有提前切换技术实现的关键点,提出了一种以移动台运动速度为主要依据的提前切换技术;最后推导了三频组复用GSM-R系统的切换阻塞率,并应用对切换呼叫排队的方法降低阻塞率。 相似文献
10.
针对现有的助听器语音增强算法在非平稳噪声环境下,残留大量背景噪声的同时还引入了“音乐噪声”,致使增强语音可懂度和信噪比不理想等问题。提出了一种基于噪声估计的二值掩蔽语音增强算法,该算法利用人耳听觉感知理论,结合人耳的听觉特性和耳蜗的工作机理。采用最小值控制递归平均(Minima-Controlled Recursive Averaging,MCRA)算法获得估计噪声和初步增强语音;将估计噪声和初步增强语音分别通过可以模拟人工耳蜗模型的gammatone滤波器组进行滤波处理,得到各自的时频表示形式;利用人耳的听觉掩蔽特性,计算含噪语音在时频域的二值掩蔽;利用二值掩蔽得到增强语音。实验结果表明:该算法很大程度上去除了谱减法引入的“音乐噪声”,与基于MCRA谱减法相比,增强语音的语言可懂度指数(Speech Intelligibility Index,SII)、主观语音质量评估(Perceptual Evaluation of Speech Quality,PESQ)和信噪比(Signal to Noise Ratio,SNR)都得到了提高。 相似文献