期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

韦娟顾兴权宁方立《北京邮电大学学报》2020,43(5):112-117

为了优化组合特征在异常声音识别中的效率,提出一种用集合经验模态分解（EEMD）对异常声音帧信号进行有效性检测和提取多层特征的算法.首先对异常声音帧信号进行集合经验模态分解,得到固有模态函数;然后根据给定的固有模态函数层数阈值,对该帧信号进行有效性检测;再对有效帧信号的每一层固有模态函数提取梅尔频率倒谱系数、翻转梅尔频率倒谱系数、线性预测倒谱系数、短时能量和能量比,并将它们归一化后拼接成多层特征.根据提取的特征,用深度卷积神经网络实现异常声音识别分类.仿真结果表明,提出的新方法在4类异常声音识别中的识别率可以达到98.65%. 相似文献

2.

基于谱熵梅尔积的语音端点检测方法

吴新忠夏令祥张旭周成《北京邮电大学学报》2019,42(2):83-89

为了克服传统语音端点检测算法在低信噪比环境下准确率低的问题,提出一种基于谱熵梅尔积（MFPH）的语音端点检测算法.首先,提取带噪语音信号的梅尔频率倒谱系数中的第一维参数MFCC₀,将其与谱熵的乘积作为最终区分语音段和背景噪声段的融合特征参数;然后,结合模糊C均值聚类算法和贝叶斯信息准则（BIC）算法对MFPH特征参数门限值进行自适应估计;最后,采用双门限法进行语音端点检测.实验结果证明,与传统方法比较,该方法在-5~15 dB低信噪比环境下的语音端点检测准确率有较大提高. 相似文献

3.

一种基于伪随机序列水印的二维倒谱域图像水印算法

张敏瑞路陈红易克初《西安电子科技大学学报(自然科学版)》2006,33(6):858-861

将二维倒暗变换引入到图像水印算法，提出了一种新的倒谱域数字图像水印算法，该算法将一伪随机序列作为水印嵌入到宿主图像的二维倒谱系数中．水印检测不需要原始图像．计算机仿真结果表明所提方法满足水印的不可感知性．且可抵抗多种水印攻击．如JPEG压缩、加性和乘性噪声干扰、滤波以及其他图像处理操作等．相似文献

4.

基于融合特征MGCC的语种识别方法

王延凯龙华邵玉斌杜庆治王瑶《北京邮电大学学报》2023,(2):116-121

为了解决噪声环境下语种识别准确率低的问题，提出一种将梅尔倒谱系数和伽马频率倒谱系数融合的语种识别方法。首先提取语音的梅尔倒谱系数和伽马频率倒谱系数，并依据语种识别中的贡献度对特征进行筛选；接着将特征映射在由梅尔域-伽马域组成的空间坐标系中，以得到梅尔伽马倒谱系数(MGCC);最后，将特征输入深度神经网络中进行语种识别。实验结果表明，所提方法的识别准确率和速度远高于使用单一声学特征及其他语种特征的方法。在纯净环境下，所提方法的语种识别准确率可以达到99.38%,在-5 dB低信噪比环境下也可达到89%以上。这充分证明了所提方法的有效性和鲁棒性。相似文献

5.

粒子群优化算法在电力变压器声纹识别中的应用

季坤张晨晨丁国成刘锋田宇李坚林《沈阳工业大学学报》2023,(6):643-648

针对非接触式电力变压器在监测及运行状态识别过程中存在的问题，提出了一种基于粒子群优化的电力变压器声纹识别技术。通过利用加权优化的线性预测倒谱系数和差分组合的梅尔频率倒谱系数作为变压器声纹识别的特征向量，构建了应用于变压器声纹识别的粒子群优化神经网络模型。实验结果表明，特征向量为线性倒谱系数时，所提模型识别效率要比BP神经网络的识别效率高33%;采用梅尔倒谱系数作为特征量识别准确率比线性预测倒谱系数大约提高了5.3%,平均识别时间缩短了约25%。相似文献

6.

基于声道频谱参数的语种识别

邵玉斌刘晶龙华杜庆治李一民《北京邮电大学学报》2021,44(3):112-119

针对低信噪比下语种识别正确率低的问题,提出了一种声道冲激响应频谱参数和Teager能量算子倒谱参数融合的识别方法.根据语音中不同特征信息量分布特性,首先在特征提取前端引入低通滤波器滤除信号高频部分,并采用重采样方法降低采样率,再基于信号频谱提取声道冲激响应频谱参数,然后融合Teager能量算子倒谱参数,最后通过高斯混合通用背景模型进行语种识别验证.不同信噪比条件下性能测试表明,所提方法相对于基于单一的梅尔频率倒谱系数特征、单一的伽玛通频率倒谱系数特征和基于对数梅尔尺度滤波器组能量特征,在低信噪比下提升约15 dB,显著提高了识别正确率. 相似文献

7.

基于单边自相关序列的抗噪声语音识别特征提取算法

张春光张玉华《海军工程大学电子工程学院学报》2002,(4):11-15

基于单边自相关序列和频率规整的线性预测算法，提出了一种抗噪声的语音识别的新特征，它既符合入耳的听觉特性又具有良好抗噪性。通过汉语数字语音识别实验证明，新特征参数提高了语音识别系统的鲁棒性，优于传统的LPC倒谱系数。相似文献

8.

基于BP网络的孤立数字识别

金琰张健《辽宁工学院学报》2007,27(6):365-367,371

通过Mel频率倒谱系数的方法对语音信号波形进行处理,采用BP网络作为分类器,实现了孤立数字的语音识别系统,在matlab环境下对算法进行仿真。实验表明,这种方法具有计算简单,识别精度高的特点。相似文献

9.

基于Labview平台的与文本有关的说话人辨认系统的实现

杨纪刚华宇宁赵雷《沈阳理工大学学报》2005,24(1):36-39,49

在LABVIEW平台上，通过声卡获得语音信号，设计了以美尔频率倒谱系数及其差分作为语音识别的特征参数，通过动态时间规整算法来识别的与文本有关的说话人辨认系统．相似文献

10.

基于分段时间序列的试井数据相似性查询算法

杜奕李纪锋《上海第二工业大学学报》2008,25(2):97-102

从石油试井数据序列查询的实际需求出发,给出一种新的时间序列相似性查询算法。该算法首先通过中线距离阈值和极值点两个约束条件分段线性拟合时间序列,利用分段动态弯曲距离度量获得相似的分段子序列,逐点检索该子序列实现序列的精确查询。实验结果表明,该算法具有良好的相似性查询质量和效率。相似文献

11.

基于帧符号化的语音相似性度量方法

刘双君金小峰崔荣一《延边大学学报(自然科学版)》2014,(1):45-48

提出了将语音帧符号化后度量语音相似性的方法.首先,去除语音段中的静音部分,并提取每帧语音的MFCC参数;其次,将MFCC参数进行k均值聚类和KNN分类,并根据分类结果对语音信号进行符号化;最后,采用编辑距离计算语音段之间的相似性.实验表明,将语音符号化后,音频之间的可区分性更加明显,识别率也有了明显提高. 相似文献

12.

多格式音频感知哈希算法

张秋余省鹏飞黄羿博董瑞洪杨仲平《北京邮电大学学报》2016,39(4):77-82

提出一种基于双树复小波变换的多格式音频感知哈希算法,解决了现有音频认证算法音频格式单一、算法不通用、效率低的问题. 首先对预处理后的音频信号进行全局双树复小波变换,获得信号的实小波和复小波系数,对它们分别分帧,帧数相同;对实小波系数计算每帧信号Teager能量算子的模值,作为实小波系数的帧间特征,接着对每帧信号再分帧,提取再分帧帧信号的短时能量作为实小波系数的帧内特征;对复小波系数求取每帧信号的熵值作为复小波系数的帧间特征;最后对上述特征分别进行哈希构造,生成感知哈希序列. 实验结果表明,该算法对5种不同格式的音频都具有强鲁棒性,且区分性好,效率高,并能实现小范围篡改检测. 相似文献

13.

PAD三维情感空间中的语音情感识别 总被引：1，自引：0，他引：1

陈逸灵程艳芬陈先桥王红霞李超《哈尔滨工业大学学报》2018,50(11):160-166

离散情感描述模型将人类情感标注为离散的形容词标签,该类模型只能表示有限种类的、单一明确的情感类型,而维度情感模型从情感的多个维度量化了复杂情感的隐含状态.另外,常用的语音情感特征梅尔频率倒谱系数(MFCC)存在因分帧处理引起相邻帧谱特征之间相关性被忽略问题,容易丢失很多有用信息.为此本文提出改进方法,从语谱图中提取时间点火序列特征、点火位置信息特征对MFCC进行补充,将这三种特征分别用于语音情感识别,根据识别结果从PAD维度情感模型的三个维度(Pleasure-displeasure愉悦度、Arousal-nonarousal激活度、Dominance-submissiveness优势度)进行相关性分析得到特征的权重系数,加权融合后获得情感语音的最终PAD值,将其映射至PAD三维情感空间中.实验表明,增加的时间点火序列、点火位置信息不但能探测说话人的情感状态,同时考虑了相邻频谱间的互相关信息,与MFCC特征形成互补,在提升基本情感类型离散识别效果的基础上,将识别结果表示为PAD三维情感空间中的坐标点,采用量化的方法揭示情感空间中各种情感的定位与联系,展示出情感语音中糅杂的情感内容,为后续复杂的语音情感分类识别奠定研究基础. 相似文献

14.

语音特征匹配的图像配准方法

金小峰崔荣一洪炳镕《哈尔滨工业大学学报》2008,40(7):1152-1155

为了解决传统DTW算法准确度和效率不高的问题,提出了一种基于图像配准方法的语音特征匹配算法.该方法将MFCC参数映射为二值图像,并通过引入图像配准的方法进行模板匹配,达到了语音特征匹配的目的.实验结果表明,与传统的DTW算法相比,该方法的准确率、召回率和算法执行效率有了明显的提高. 相似文献

15.

基于Mel频率倒谱参数相似度的语音端点检测算法

王宏志徐玉超李美静《吉林大学学报(工学版)》2012,42(5):1331-1335

为提高噪声环境下语音端点检测的精确性,提出了一种基于Mel频率倒谱参数(MF-CC)相似度的端点检测方法。提取了每帧语音信号的Mel频率倒谱参数,然后将前十帧作为背景噪声,计算测试帧和背景噪声的MFCC相关系数距离,最后用得到的MFCC相似度距离曲线进行端点检测。实验结果表明,该方法在白噪声和粉噪声环境下均可得到理想的端点检测效果,并且在低信噪比时仍然有效。相似文献

16.

基于图像归一化和DCT的感知图像哈希算法

曾勇孙树森夏爱军《浙江丝绸工学院学报》2012,(1):84-88

提出一种基于离散余弦变换的感知哈希算法,先对原始图像进行归一化处理,使图像具有几何不变性,然后利用离散余弦变换进行图像特征系数的提取并用混沌序列发生器加密图像,最后通过量化和编码生成感知哈希序列。该算法可以抵抗任意角度的旋转攻击和仿射变换。相似文献

17.

用于版权保护与内容认证的多功能音频水印算法 总被引：1，自引：0，他引：1

刘海燕熊曾刚刘易《北京工业大学学报》2015,(1):68-75

针对现有的多功能音频水印算法恢复篡改区域的能力较弱问题,提出了一种多功能双音频水印算法.首先对原始音频信号分帧,结合Mel频谱倒谱系数计算每帧的相似帧,并将其作为鲁棒水印嵌入经过Torus映射的帧的低频小波系数的绝对平均值中;然后将高频小波系数的平均值作为初始值,利用Logistic序列生成认证水印信息,并通过单个量化高频系数的方法将其嵌入到音频信号中.仿真结果表明:所提出的算法具备很强的抗攻击性;脆弱水印对篡改敏感,而且篡改定位精确. 相似文献

18.

基于强边缘宽度直方图的图像清晰度指标

张天煜冯华君徐之海李奇陈跃庭《浙江大学学报(工学版)》2014,48(2):312-320

针对图像清晰度评价在图像、视频领域应用的重要性,提出一种新的无参考图像清晰度评价指标.算法从图像模糊会造成边缘扩散的原理出发,通过自适应阈值的梯度算子求取含强边缘信息的图像,在得到各强边缘宽度的基础上建立强边缘宽度直方图,以此提出基于直方图信息的距离因子,通过将该因子引入到加权平均求取强边缘平均宽度的模型中,得到清晰度评价指标.实验结果表明,相比于主流的基于边缘宽度的清晰度评价方法,该方法更能够满足与图像内容无关性的要求,该方法的结果更接近于人眼主观评价. 相似文献

19.

未确知均值聚类 总被引：1，自引：0，他引：1

庞彦军刘立民刘开第《河北工程大学学报(自然科学版)》2010,27(4):98-100

利用未确知系统理论分析特征对样本分类所作贡献,定义特征的分类权重,并作为启发性知识用于确定样本与各类间的加权距离及样本属于各类的隶属度,建立未确知均值聚类算法。IRIS数据检验表明,未确知均值聚类算法误判样本数少、收敛速度快、鲁棒性好,是一种实用、有效的无监督聚类算法。相似文献

20.

一种用于图像篡改定位的半脆弱数字水印算法

潘伟庞彦军《河北工程大学学报(自然科学版)》2010,27(1):109-112

设计并实现了一种用于数字图像内容认证的半脆弱水印方案。算法中,图像块的水印选择Logistic映射作为混沌系统从该图像块本身产生一系列混沌序列,作用于水印的嵌入;每个图像块产生的水印按照Torus,自同构映射嵌入另一个映射块的LSB(Least Significant Bit),对应关系通过密钥来确定,这样建立起图像块之间的相关性;利用混沌对初值极端敏感性的特点,能够定位检测对加入水印图像的篡改,且水印提取不需要原始图像。实验结果表明,嵌入水印后的图像的视觉好;算法具有图像内容局部篡改检测的有效性、敏感性以及良好的篡改定位能力。相似文献