排序方式: 共有20条查询结果,搜索用时 218 毫秒
11.
一种高精度改进型SHR基音检测算法 总被引:2,自引:0,他引:2
利用正弦语音模型中浊音存在的谐波与子谐波,在SHR(subharninctoharmonicratio)算法的基础上,提出了一种改进型高精度基音检测算法ISHR(improvingsubharninctoharmonicratio)。根据幅度调制和频率调制在语音分析中的特性、频域中幅度值和自相关频率比值,该方法采用基于正弦模型的均方误差对语音进行检测,提取出准确基音。仿真结果表明此种算法在基音提取中具有高精度及高可靠性。 相似文献
12.
基于鲁棒H∞滤波器理论和共轭梯度自适应参数估计方法提出了一种对复杂噪声有抑制效果的语音增强算法。应用这种方法自适应地从带噪信号中提取语音参数时不必预先知道噪声源的统计特性,只要求噪声信号能量有限。因为它基于H∞滤波器,所以可保证由外界干扰和附加噪声引起的性能指标恶化达到最小。仿真结果表明:该语音增强算法具有计算速度快、鲁棒性好、语音增强效果明显、易于实现、可抑制复杂背景噪声等特点。 相似文献
13.
为了克服目前诸多基音周期检测算法精度低、计算复杂度高、鲁棒性差的缺点,研究了一种采用二进小波变换模极大值进行基音周期检测的算法。仿真结果表明,该算法在强背景噪声下仍可以准确提取基音周期,并且具有复杂度低、分辨率高和实时性好的特点。 相似文献
14.
柔性应变传感器是一种将外界应力变化转变为电信号的设备,它克服了传统刚性传感器硬度大、人体适应性差等缺点,作为一种可穿戴设备在人体运动监测领域有很大发展前景。但在恶劣条件或极端环境下使用仍然存在信号输出失真、易被腐蚀等风险。超疏水柔性应变传感器将超疏水涂层的拒水、表面自清洁、防腐抗污与柔性应变传感器的高延展性、高灵敏度等优势相结合,增强了传感器的性能并拓宽了在人体运动监测等方面的应用。本文综述了超疏水柔性应变传感器的基本性能参数、常用的构建材料与构建方法及其在人体运动监测中的功能与应用,并对该领域做出展望。 相似文献
15.
异常数据是指偏离大量正常数据点的数据,往往会对各类系统产生负面影响,存在较大风险。异常检测作为一种有效的防护手段,能够检测数据中的异常,为各类系统的正常运转提供重要支撑,具有重要的现实意义。提出了一种基于混合高斯变分自编码网络的异常检测算法,该算法首先使用混合高斯先验构建变分自编码器,对输入数据进行特征提取,然后以混合高斯变分自编码器构建深度支持向量网络,压缩特征空间,并寻找最小超球体分离正常数据和异常数据,通过计算数据特征到超球体中心的欧氏距离衡量数据的异常分数,并以此进行异常检测。最后在基准数据集MNIST和Fashion-MNIST上评估了该算法,平均AUC分别达到了0.954和0.937。实验结果表明,所提出的算法取得了较好的异常检测效果。 相似文献
16.
目的 经典的聚类算法在处理高维数据时存在维数灾难等问题,使得计算成本大幅增加并且效果不佳。以自编码或变分自编码网络构建的聚类网络改善了聚类效果,但是自编码器提取的特征往往比较差,变分自编码器存在后验崩塌等问题,影响了聚类的结果。为此,本文提出了一种基于混合高斯变分自编码器的聚类网络。方法 使用混合高斯分布作为隐变量的先验分布构建变分自编码器,并以重建误差和隐变量先验与后验分布之间的KL散度(Kullback-Leibler divergence)构造自编码器的目标函数训练自编码网络;以训练获得的编码器对输入数据进行特征提取,结合聚类层构建聚类网络,以编码器隐层特征的软分配分布与软分配概率辅助目标分布之间的KL散度构建目标函数并训练聚类网络;变分自编码器采用卷积神经网络实现。结果 为了验证本文算法的有效性,在基准数据集MNIST (Modified National Institute of Standards and Technology Database)和Fashion-MNIST上评估了该网络的性能,聚类精度(accuracy,ACC)和标准互信息(normalized mutual information,NMI)指标在MNIST数据集上分别为95.86%和91%,在Fashion-MNIST数据集上分别为61.34%和62.5%,与现有方法相比性能有了不同程度的提升。结论 实验结果表明,本文网络取得了较好的聚类效果,且优于当前流行的多种聚类方法。 相似文献
17.
语音清浊音分类及浊音谐波提取算法——三阶累积量基于正弦语音模型的应用 总被引:2,自引:1,他引:2
在低信噪比和非平稳噪声干扰下,语音信号的清浊音检测是语音信号处理中的一个重要研究问题。论文基于语音正弦模型,提出了一种清浊音分类和浊音谐波提取算法。该方法在分析了语音的三阶累积量谱后,用子谐波-谐波方法取得基音,并计算出谐波参数和高低频能量比值。它利用谱包络估计器得到谱包络及尖峰信号,结合最小均方估计准则下的迭代算法计算语音谐波的信噪比;通过对上面各计算结果的综合评价得出语音帧的浊音度,从而得到语音清浊音的分类和浊音谐波数。仿真结果表明,该算法在复杂噪声背景下,能有效进行语音分类,准确得到浊音度。同时该算法还具有实时性好、语音参数分析精度高的特点。 相似文献
18.
针对现有LDP类算法在特征提取有效性和特征编码稳定性之间难以平衡的问题,提出一种吸引局部二阶梯度轮廓(ALSGC)模式,以提升人脸识别性能。首先,利用Kirsch算子计算人脸的邻域边缘响应图;其次,引入吸引描述子,参考边缘响应图的局部、全局平均灰度值和邻域中心灰度值完成局部吸引模式编码;再次,遍历整幅图像,得到人脸ALSGC特征图并对ALSGC特征图分块分别计算,得到各个分块中不同模式的统计直方图;最后,级联所有分块的统计直方图后生成对应的特征向量,以支持向量机完成分类识别。所提算法克服了LBP、LDP、LDN等算法提取一阶特征有效性的不足,以及DLDP、CSLDP、GCSLDP等算法提取的二阶特征对表情、姿态、饰物遮挡、光照、随机噪声等变化敏感的缺点,较好地实现了特征提取有效性与特征编码稳定性的平衡,兼顾了识别率和稳健性。 相似文献
19.
从语音情感特征的提取和分类建模出发,以混合卷积神经网络模型为基础,改进特征提取中的 Itti模型,包括:增加通过局部二值模式提取的纹理特征;结合听觉敏感度权重提取情感强相关特征。然后提出通过特征约束条件提取标定权重特征的约束挤压和激励网络结构;最后形成以 VGGnet 和长短时记忆网络混合网络为基础的微调模型,进一步提升了情感表征能力。通过在自然情感数据库和柏林德语数据库上进行验证,该模型在情感识别率上有明显的上升,相较于基准模型提升了 8. 43%,同时对比了本模型在自然数据库(FAU-AEC)和柏林数据库(EMO-DB)上的识别效果,实验结果证明模型具有良好的泛化性。 相似文献
20.
针对GaitSet算法中主干网络学习能力和分类能力较弱,提出基于多特征融合卷积网络的步态识别算法(MFFC-GaitSet)。算法通过多特征融合卷积重建GaitSet网络增强网络学习能力,同时对三元组损失函数进行平滑优化;利用形态学处理对步态轮廓图进行修补。算法在Casia-B数据集上进行验证,步态识别精度达到85.811%,提高2.6%;模型权重仅增加6%。算法可以有效减少复杂环境对步态识别的负面影响,实现复杂环境下高精度的步态识别。实验结果表明,方法能够实现较为精确的步态识别,并具有较佳的鲁棒性和泛化能力。 相似文献