首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 156 毫秒
1.
《Planning》2021,(1)
为实现噪声情况下的人声分离,提出了一种采用稀疏非负矩阵分解与深度吸引子网络的单通道人声分离算法。首先,通过训练得到人声与噪声的字典矩阵,将其作为先验信息从带噪混合语音中分离出人声与噪声的系数矩阵;然后,根据人声系数矩阵中不同的声源成分在嵌入空间中的相似性不同,使用深度吸引子网络将其分离为各声源语音的系数矩阵;最后,使用分离得到的各语音系数矩阵与人声的字典矩阵重构干净的分离语音。在不同噪声情况下的实验结果表明,本文算法能够在抑制背景噪声的同时提高分离语音的整体质量,优于结合声噪人声分离模型的对比算法。  相似文献   

2.
《Planning》2015,(13)
本文在分析线性混合模型和非负矩阵分解的基础上,对现有的基于非负矩阵分解的高光谱解混算法的研究现状进行了总结,最后对基于非负矩阵的高光谱解混的未来发展方向进行了展望。  相似文献   

3.
《Planning》2013,(4)
压缩感知(Compressed Sensing,CS)理论突破了经典采样定理的理论边界,为信号压缩提供了另一种途径。基于CS理论框架,做了两方面工作:为提高语音字典对信号的匹配性,设计了一种基于K-L展开的非相干语音字典;针对现有匹配追踪(MP,OMP)算法的不足,提出分段匹配追踪(Segment MP,SegMP)算法。首先对语音自相关函数进行建模并估计模型参数,构造语音自适应非相干字典,然后采用SegMP对语音稀疏向量分段观测,获得多个低维矢量,最后结合模型参数重建字典并重构信号,实现了语音压缩感知。语音测试结果表明:相比现有方案,本文方案对信号的稀疏表示更为精准,具有更好的重构质量,且降低了计算复杂度。  相似文献   

4.
《Planning》2019,(4)
提出一种室内环境下两步法监督式学习双耳声源距离估计算法,该算法通过预先估计声源方位角信息以克服声源方位角的变化对声源距离估计性能的不利影响.该算法第1步利用深度神经网络模型估计声源的方位角,并将不同方位角的双耳信号分类;第2步中对每个方位角的双耳信号采用独立的深度神经网络模型进行声源距离估计,其中距离特征选用双耳信号的一些双耳特征和统计特性。在仿真和实际环境下,本文提出的两步法声源距离估计算法的距离估计准确率比现有算法提高了3%~5%左右,并且在各种不匹配环境下的距离估计准确率比现有算法高出5%~10%左右。实验结果表明利用声源方位角信息可以有效提高双耳声源距离估计算法的性能。  相似文献   

5.
《Planning》2017,(5)
提出了一种基于极大似然的噪声对数功率谱估计方法,采用高斯混合模型对每一个频带上的功率谱包络构建统计模型,将时序包络划分为语音和非语音类,它们分别对应于高斯混合模型的两个高斯分量,描述语音和非语音的统计分布,其中非语音高斯分量的均值即为噪声功率谱的最优估计.采用序贯学习的方法,在极大似然准则下逐帧更新模型参数,并逐帧给出噪声功率谱的最优估计值。此外,由于序贯更新过程中语音信号长时缺失,容易导致模型失稳,提出了一种在线的最小描述长度准则(MDL)来判断语音信号是否长时缺失,从而保证了模型的稳定性.实验表明,算法性能整体优于经典的MS和IMCRA算法。  相似文献   

6.
《Planning》2016,(8)
提出了一种受非负条件约束、基于不完全矩阵隐特征分析的协同过滤模型,用以在非负条件约束下,预测未知的Web服务QoS(quality-of-service)数据。其主要原理是,将非负矩阵因式分解模型中基于矩阵操作的非负更新规则,扩展为只依赖于单一隐特征的非负更新规则,以获得仅依赖于所需模型中单一隐特征、以及目标稀疏矩阵中已知元素的非负训练过程。为提高最终模型的预测精度,模型中进一步引入了Tikhonov正则化,并对隐特征的非负更新规则进行了相应扩展。在2个大型Web服务QoS数据集上的实验表明,该模型能在满足非负条件约束的前提下,准确地预测未知的QoS数据。  相似文献   

7.
《Planning》2014,(5)
语音存在概率的估计是语音增强的核心技术之一,针对传统的存在概率估计方法是启发式的,没有把存在概率的估计统一到一个理论框架之中,不能保证估计最优,提出了一种基于序贯隐马尔可夫模型(SHMM)的存在概率估计方法,在每一子带上构建一个SHMM模型描述对数功率谱包络的时间序列,把谱包络序列看作一个在语音和噪声状态之间转移的动态一阶马尔可夫链,采用单高斯函数构建每一状态的概率模型,语音状态的后验概率即为语音信号的存在概率。为了满足算法实时性要求,SHMM参数估计简化为一阶回归过程,根据极大似然准则逐帧更新模型参数。实验表明:SHMM所描述的时序相关性对存在概率的估计起到关键作用,它优于一般的启发式估计方法;SHMM算法的语音增强分段信噪比(SegSNR)和对数谱失真(LSD)性能优于经典的改进型最小统计量控制递归平均(IMCRA)算法。  相似文献   

8.
《Planning》2017,(2)
针对现有稀疏低秩分解语音降噪方法对人耳听觉感知特性应用不充分、语音失真易被感知的问题,提出了一种用于语音降噪的听觉感知鲁棒主成分分析法。由于耳蜗基底膜对于频率感知具有非线性特性,该方法采用耳蜗谱图作为语噪分离的基础。此外,选用符合人耳听觉感知特性的板仓-斋田距离度量作为优化目标函数,在稀疏低秩建模过程中引入非负约束以使分解分量更符合实际物理含义,并在交替方向乘子法框架下推导了具有闭合解形式的迭代优化算法。文中方法在语音降噪时是完全无监督的,无需预先训练语音或噪声模型。多种类型噪声和不同信噪比条件下的仿真实验验证了该方法的有效性,噪声抑制效果较目前同类算法更为显著,且降噪后语音的可懂度和总体质量有所提高、至少相当。  相似文献   

9.
《Planning》2014,(3)
提出了一种采用感知语谱结构边界参数(PSSB)的语音端点检测算法,用于在低信噪比环境下的语音信号预处理。在对含噪语音进行基于听觉感知特性的语音增强之后,针对语音信号的连续分布特性与残留噪声的随机分布特性之间的不同点,对增强后语音的时-频语谱进行二维增强,从而进一步突出连续分布的纯净语音的语谱结构。通过对增强后语音语谱结构的二维边界检测,提出PSSB参数,并用于端点检测。实验结果表明,在白噪声-10 dB到10 dB的各种信噪比环境下,采用PSSB参数的端点检测算法,相对于其它端点检测算法,更有效地检测出语音的端点。在-10 dB的极低信噪比下,提出的方法仍然有75.2%的正确率。采用PSSB参数的端点检测算法,更适合于低信噪比白噪声环境下的语音端点检测。  相似文献   

10.
基于粒子群算法的RBF神经网络零件表面缺陷分类   总被引:1,自引:0,他引:1  
《Planning》2019,(4)
针对金属工件表面缺陷分类问题,提出一种基于粒子群算法的RBF(Radialbasisfunction)神经网络对金属工件表面缺陷进行分类的方法。本文采用线性递减权重法确定PSO算法中的惯性权重,用于消除PSO算法容易早熟及后期容易在全局最优解附近产生振荡现象。将线性递减权重法改进的粒子群算法运用于RBF神经网络,确定RBF神经网络中权值和阈值的最优解,并对RBF神经网络进行训练从而提高分类精度。对比实验结果表明,改进的RBF神经网络对工件表面缺陷的分类平均准确率可达94%,对比标准RBF神经网络分类和BP神经网络分类准确率有较大提高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号