首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 267 毫秒
1.
李应  吴灵菲 《电子与信息学报》2018,40(12):2905-2912
该文针对低信噪比噪声环境下的声音事件检测问题,提出基于多频带能量分布图离散余弦变换的声音事件检测的方法。首先,将声音数据转化为gammatone频谱,并计算其多频带能量分布;接着,对多频带能量分布图进行8×8分块与离散余弦变换;然后,对8×8的离散余弦变换系数进行Zigzag扫描,抽取离散余弦变换系数的主要系数作为声音事件的特征;最后,利用随机森林分类器对特征建模与检测。实验结果表明,在低信噪比及各种噪声环境下,该文提出的方法具有良好的检测效果。  相似文献   

2.
深度神经网络声音事件检测方法需要大量标记声音事件类别和起止时间的强标签音频样本,然而强标签标注非常困难和耗时.弱标签声音事件检测是解决这一困难的有效途径.本文将弱标签声音事件检测作为多实例学习问题,并基于卷积循环神经网络提出弱标签声音事件检测的空间-通道特征表征与自注意池化方法 .该方法研究多实例弱标签声音事件检测的特征表征和帧级预测结果池化两个方面的内容.在特征表征方面,为了增强卷积神经网络的特征表征能力,结合上下文门控和通道注意机制构建门控注意力结构并嵌入到卷积循环神经网络中,实现了音频样本特征的空间和通道特征选择;在预测结果池化方面,引入自注意思想设计音频帧预测结果的自注意池化方法,增强了音频样本中事件帧之间的相关度,使事件帧获得更大的权重.本文方法通过对卷积循环神经网络特征表征和预测结果池化的革新,有效提升了模型的检测性能.本文提出的方法在DCASE 2017任务4和DCASE 2018任务4数据集的评估集中分别取得了52.47%和31.00%的F1得分,性能优于当前绝大部分的弱标签声音事件检测方法 .实验结果表明:本文提出的空间-通道特征表征与自注意池化方法能显著改善弱标签声...  相似文献   

3.
提出一种基于奇异谱分析的降噪技术,用于降低目标声信号中的环境噪声分量,提升信号的信噪比。该方法将含噪声音信号分解为多个不同能量的声模态,通过提取包含大量目标声信号的主要声模态,舍去包含大量噪声信号的次级模态,实现目标声音与噪声的分离,达到降噪的目的。使用该方法对实验数据进行处理,能够大幅降低背景噪声的影响,提升信号的信噪比。  相似文献   

4.
王辉  袁淑丹 《电声技术》2013,(11):40-44
为了提高低信噪比下语音端点检测的准确性,提出一种基于经验模态分解与功率谱熵的语音端点检测方法。对带噪语音信号进行经验模态分解获得一系列语音本征模函数,选取功率谱熵作为语音端点检测的特征,并计算特定阶本征模函数的功率谱熵实现语音的端点检测。通过EMD分解可以有效地消除白噪声的影响,仿真结果表明,在低噪比情况下结合经验模态分解和功率谱熵的方法能够有效实现语音端点检测。  相似文献   

5.
语音端点检测中能零比方法的改进   总被引:1,自引:0,他引:1  
传统的基于语音信号短时能量与短时过零率之比的单参数双门限端点检测方法对高信噪比的语音信号能实现较好的检测,而在低信噪比的情况下检测正确率却很低。本文在研究了语音信号的非线性分析方法后,提出了一种改进的端点检测方法。首先,对分帧加窗后的每一帧带噪语音信号进行经验模态分解求其短时Teager能量;然后,求每一帧的短时过零率,平滑处理之后进行归一化;最后,求出短时Teager能量与归一化短时过零率之比用于端点检测。经过仿真实验证明,本文提出的改进方法能够在低信噪比的带噪环境下实现比传统能零比方法更好的端点检测效果。  相似文献   

6.
基于EMD拟合特征的耳语音端点检测   总被引:4,自引:0,他引:4  
耳语音作为人类发音的一种特殊形式,与正常语音相比具有信噪比低、元音的周期特征不明显等特性,因而耳语音处理比正常语音更为困难。耳语音处理研究的第1个关键步骤就是语音的端点检测,该文利用希尔伯特-黄变换(Hilbert-Huang Transform, HHT)中的经验模态分解(Empirical Mode Decomposition, EMD),首次提出了一种基于EMD拟合特征的耳语音端点检测新方法。利用EMD得到的内禀模态函数(Intrinsic Mode Function, IMF)能量,以其归一化拟合参数为耳语音端点检测的特征,可以准确地划分出耳语音端点。实验表明,该方法在耳语音端点检测中取得了很好的效果,在1200个信噪比为2~10dB的测试样本中,检测准确率为98.25%。  相似文献   

7.
针对进行实际大场景合成孔径雷达(SAR)图像舰船检测时容易出现众多陆地上的虚警问题,文中提出一种基于纯背景混合训练的方法来抑制大场景SAR舰船检测的虚警。该方法的核心是将不含有舰船的图像样本(纯背景样本)也输入到网络中进行训练,使网络能够学习纯背景样本特征,最终实现陆地上一些与舰船相似度高的强散射亮点的虚警抑制。由于现有公开的数据集缺少纯背景图像样本,为了便于验证该方法的有效性,文中还组建了由10幅Sentinel-1大场景SAR图像组成的纯背景混合训练SAR舰船检测数据集。在该数据集上,两种单阶段检测器(RetinaNet和SSD)和两种双阶段检测器(Faster R-CNN和Cascade R-CNN)的实验对比结果表明纯背景混合训练可以有效抑制大场景SAR图像中舰船检测的虚警。  相似文献   

8.
李宝岩 《移动通信》2016,(14):25-28
为了解决低信噪比条件下现有语音活动检测算法可靠性难以保证的问题,提出长时子带能量变化特征,度量短时谱子带能量沿时间轴的变化程度。基于TIMIT语音库采用高斯混合模型评价所提特征的性能。实验结果表明,在五种噪声的不同信噪比条件下,提出的语音活动检测算法性能优于传统的VAD。  相似文献   

9.
为了解决传统方法在强噪声环境下,语音检测性能急剧下降的缺陷,提高信号在低信噪比(0 db以下)语音端点检测的准确性,本文提出了一种将多窗谱估计谱减法和自适应子带能熵比相结合的检测算法.该算法利用增益因子可变的多窗谱估计谱减法对低信噪比信号进行降噪,提高其信号的信噪比,再将每帧信号分为若干个子带(其数量可自适应选择),提取每个子带能熵比参数进行端点检测.实验结果表明,当信噪比为-10 db时,信号检测准确性维持在95%左右.该方法能在低信噪比情况下,显著提高端点检测准确性和可靠性.  相似文献   

10.
杨硕  孙林 《激光杂志》2023,(4):103-106
针对膜片在生产的过程中,由于原材料和工艺的问题总会产生表面缺陷,而通过人为检测的效率低、成本较高的问题,提出传统图像处理和深度学习相结合的方式进行缺陷检测。首先通过图像处理使缺陷特征更为突出,得到去除复杂背景、特征更加明显的新样本,然后将图像和标签送入深度学习网络中进行训练,同时依据缺陷特征修改模型参数得到收敛模型,最后得出检测结果。实验结果表明,提出的检测方法能够有效分割出各种情况下的缺陷,准确率达到98.13%,且在检测速度上有所提升。  相似文献   

11.
Recently, deep recurrent neural networks have achieved great success in various machine learning tasks, and have also been applied for sound event detection. The detection of temporally overlapping sound events in realistic environments is much more challenging than in monophonic detection problems. In this paper, we present an approach to improve the accuracy of polyphonic sound event detection in multichannel audio based on gated recurrent neural networks in combination with auditory spectral features. In the proposed method, human hearing perception‐based spatial and spectral‐domain noise‐reduced harmonic features are extracted from multichannel audio and used as high‐resolution spectral inputs to train gated recurrent neural networks. This provides a fast and stable convergence rate compared to long short‐term memory recurrent neural networks. Our evaluation reveals that the proposed method outperforms the conventional approaches.  相似文献   

12.
文中针对在强环境噪声背景下,利用键盘敲击音对输入内容进行判定的精度受到很大影响的现象,通过对采集到的强噪背景下键盘敲击音进行盲分离,提取出清晰的键盘敲击音,从而提高判定精度。对实测数据进行盲分离的结果表明,快速独立分量分析方法是一种有效的盲信号提取方法,此方法可分离出湮没在强噪声环境中的键盘敲击音,具有很高的可靠性。  相似文献   

13.
低信噪比图像中目标检测提取方法   总被引:1,自引:0,他引:1  
在低信噪比图像中检测慢运动小目标,无法利用尺寸,形状和纹理特征,使待测目标与噪声干扰形成的虚假目标相区分.基于小目标的慢运动特性及背景噪声的随机性,首先可以用多帧累积的方法检测到目标,再用区域生长法提取目标像素,进而,分析并验证累积帧数目、目标质心移动速度、图像处理算法对单帧检测概率及目标提取效果的影响。通过目标在两种质心运动速度下帧累积效果的对比,指出对非慢运动目标,帧累积法虽然可以有效预测其运动轨迹,但存在较大的单帧漏检率.  相似文献   

14.
基于深度学习的异常事件检测   总被引:2,自引:0,他引:2       下载免费PDF全文
闻佳  王宏君  邓佳  刘鹏飞 《电子学报》2020,48(2):308-313
面对复杂场景下异常事件检测的准确率偏低的情况,本文提出一种基于深度学习的异常事件检测方法,并将此方法扩展为异常事件分类方法.利用神经网络模型提取特征,将群体发散聚集事件,群体密集聚集事件,群体逃散事件和追赶事件这4种异常事件进行检测和分类.通过PKU-SVD-B测试集对训练出来的模型进行测试实验,并在UMN数据集上与几种方法做了对比实验,验证了本文提出的基于深度学习的异常事件检测算法,在适应多种不同场景的前提下,对多种异常事件检测的准确率很高,表明训练出来的模型对异常事件检测具有极强的泛化能力.  相似文献   

15.
为提高语音活动检测(VAD)在低信噪比下的准确率,提出了一种基于子带长时信号变化特征的VAD算法.将语音信号转换到频域,并分解为几个不重复的子频带,对这些子带信号分别提取长时信号变化特征,然后采用GMM在线建立语音和非语音模型,以模型的似然比进行VAD判决.实验结果表明,算法在较低的信噪比下能够显著地提高语音活动检测的准确率,且在多种噪声环境和信噪比条件下具有较好的稳健性.应用于语音识别系统的实验表明,该算法能有效提高噪声环境下的语音识别率.  相似文献   

16.
王鹏  曾毓敏  沈红丽 《通信技术》2009,42(12):153-155
对背景噪声的估计,关键是使算法能跟得上噪声变化,以及时更新噪声的估计值。为了增强对非平稳噪声的跟踪估计能力,在Imrca算法的基础上,提出了基于前向和后向最小值搜索相结合的改进算法。验证实验内容包括:用改进算法、原Imrca算法,基本谱减法对含同种噪声不同信噪比的含噪语音处理后,恢复出来的语音的对比;以及在低输入信噪比情况下,对加入babble噪声的含噪语音经改进算法、原Imrca算法、基本谱减法处理后,所得到的平均分段信噪比的对比。实验结果表明,该改进算法对含噪语音的处理效果要优于原算法,对含有非平稳的噪声的含噪语音,取得了较好的增强效果。  相似文献   

17.
基于循环平稳PCA和AdaBoost的频谱感知算法   总被引:1,自引:1,他引:0  
针对无线信道环境中各低信噪比情况下主用户信号检测率较低的问题,提出一种基于循环平稳特征主成分分析和Ada Boost的主用户信号频谱感知算法。该算法首先对信号采用循环平稳PCA算法进行特征参数提取,获取信号主成分,并生成训练样本和待测样本,再采用Ada Boost算法分别对有无主用户情况下的信号进行分类检测。仿真实验表明,与人工神经网络和最大最小特征值算法相比较,所提算法在各低信噪比情况下,具有较高的分类检测性能,有效地实现了对主用户信号的感知。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号