期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

陈斌牛铜张连海李弼程屈丹《自动化学报》2014,40(12):2899-2907

提出了一种基于动态加权的数据选取方法, 并应用到连续语音识别的声学模型区分性训练中. 该方法联合后验概率和音素准确率选取数据, 首先, 采用后验概率的Beam算法裁剪词图, 在此基础上依据候选词所在候选路径的错误率, 基于后验概率动态的赋予候选词不同的权值; 其次, 通过统计音素对之间的混淆程度, 给易混淆音素对动态地加以不同的惩罚权重, 计算音素准确率; 最后, 在估计得到弧段期望准确率分布的基础上, 采用高斯函数形式对所有竞争弧段的期望音素准确率软加权.实验结果表明, 与最小音素错误准则相比, 该动态加权方法识别准确率提高了0.61%, 可有效减少训练时间. 相似文献

2.

卷积神经网络表征可视化研究综述 总被引：2，自引：0，他引：2

司念文张文林屈丹罗向阳常禾雨牛铜《自动化学报》2022,48(8):1890-1920

近年来, 深度学习在图像分类、目标检测及场景识别等任务上取得了突破性进展, 这些任务多以卷积神经网络为基础搭建识别模型, 训练后的模型拥有优异的自动特征提取和预测性能, 能够为用户提供“输入–输出”形式的端到端解决方案. 然而, 由于分布式的特征编码和越来越复杂的模型结构, 人们始终无法准确理解卷积神经网络模型内部知识表示, 以及促使其做出特定决策的潜在原因. 另一方面, 卷积神经网络模型在一些高风险领域的应用, 也要求对其决策原因进行充分了解, 方能获取用户信任. 因此, 卷积神经网络的可解释性问题逐渐受到关注. 研究人员针对性地提出了一系列用于理解和解释卷积神经网络的方法, 包括事后解释方法和构建自解释的模型等, 这些方法各有侧重和优势, 从多方面对卷积神经网络进行特征分析和决策解释. 表征可视化是其中一种重要的卷积神经网络可解释性方法, 能够对卷积神经网络所学特征及输入–输出之间的相关关系以视觉的方式呈现, 从而快速获取对卷积神经网络内部特征和决策的理解, 具有过程简单和效果直观的特点. 对近年来卷积神经网络表征可视化领域的相关文献进行了综合性回顾, 按照以下几个方面组织内容: 表征可视化研究的提起、相关概念及内容、可视化方法、可视化的效果评估及可视化的应用, 重点关注了表征可视化方法的分类及算法的具体过程. 最后是总结和对该领域仍存在的难点及未来研究趋势进行了展望. 相似文献

3.

一种基于RBM的深层神经网络音素识别方法

下载免费PDF全文

陈琦张文林牛铜李弼程《信息工程大学学报》2013,14(5):569-574

为提高连续语音识别中的音素识别准确率,采用深可信网络提取语音音素后验概率进行音素识别.首先利用受限玻尔兹曼机的学习原理,对深可信网络进行逐层的预训练;然后通过增加一个“软最大化（softmax）”输出层,得到用于音素状态后验概率检测的深层神经网络,并采用后向传播算法进行网络权值的精细调整;最后以后验概率为HMM发射概率,使用Viterbi解码器进行音素识别.针对TIMIT语料库的实验结果表明,该系统的音素识别率优于GMM/HMM,MLP/HMM和TANDEM系统性能. 相似文献

4.

基于音位属性检测的PSPL改进方法

下载免费PDF全文

陆明明张连海牛铜《信息工程大学学报》2012,13(4):426-431

为了提高PSPL(position specific posterior lattices)作为语音文档索引时的检索性能,提出一种基于音位属性检测的PSPL改进方法。该方法首先根据信源熵准则找出原始PSPL中不确定度较大的词弧集合,然后利用音位属性对这些词弧集合进行识别结果修正以及后验概率重估,从而实现对PSPL数据结构的改善。实验结果表明,改进后的PSPL在包含更多正确识别结果的同时,解决了后验概率取值不准确的问题,其解码性能和检索性能均优于原始PSPL。相似文献

5.

基于长时性特征的音位属性检测方法

下载免费PDF全文

许友亮张连海屈丹牛铜《计算机工程》2012,38(11):160-162,166

提出一种基于长时性信息的音位属性检测方法,该方法通过高、低两层时间延迟神经网络(TDNN)进行实现,低层TDNN在短时特征上进行音位属性的检测,高层TDNN在低层检测结果的基础上,对更长时段上的信息进行融合。实验结果表明,引入长时性特征使得音位属性检测率提升约3%,将音位属性后验概率作为音素识别系统的观测特征,使用长时性特征的识别结果提升约1.7%。相似文献

6.

基于对抗补丁的可泛化的Grad-CAM攻击方法

司念文张文林屈丹常禾雨李盛祥牛铜《通信学报》2021,(3):23-35

为了验证Grad-CAM解释方法的脆弱性,提出了一种基于对抗补丁的Grad-CAM攻击方法。通过在CNN分类损失函数后添加对Grad-CAM类激活图的约束项,可以针对性地优化出一个对抗补丁并合成对抗图像。该对抗图像可在分类结果保持不变的情况下,使Grad-CAM解释结果偏向补丁区域,实现对解释结果的攻击。同时,通过在数据集上的批次训练及增加扰动范数约束,提升了对抗补丁的泛化性和多场景可用性。在ILSVRC2012数据集上的实验结果表明,与现有方法相比,所提方法能够在保持模型分类精度的同时,更简单有效地攻击Grad-CAM解释结果。相似文献

7.

基于语音质量参数的语音传输信道检测算法

陈斌张连海牛铜屈丹《信息工程大学学报》2011,12(3):322-326

针对不同编码算法对语音质量的影响,采用语音质量改进参数构造特征矢量,提出了一种基于SVM多级判决的语音编码检测算法,实现了对不同信道的识别。采用统计方法对这组参数的区分性进行了分析,在此基础上设计了一种高效的信道检测方案,结合实际数据,测试了算法性能,并分析了语音长度对性能的影响。实验结果表明,该算法能有效地提高信道检测准确率。相似文献

8.

利用特征极值比的盲信道阶数估计方法

下载免费PDF全文

王玉红崔波金梁牛铜《信号处理》2015,31(5):528-535

确定性辨识方法是盲信道辨识的主流方法,然而确定性方法性能受信道阶数估计的严重影响。本文针对大多数信道阶数估计算法在坏信道条件下失效问题,分析子空间方法中噪声子空间矢量构成特殊矩阵的奇异性与信道阶数之间的关系,对该特殊矩阵最大特征值最小特征值的变化情况进行对比分析,利用特征极值的比值来反映信号子空间到噪声子空间的变化情况,从而提出特征极值比定理。针对观测数据有限且含噪声的实际应用条件,提出一种盲信道阶数估计算法,该算法以不同信道阶数的特征极值比作为参数构造目标函数,得到在真实信道阶数处目标函数取全局最大值,同时对该算法进行了复杂度分析。最后针对两种常用仿真信道参数对算法进行了验证,结果表明,在短数据和低信噪比条件下,本文算法能以较高的估计概率得到好信道和坏信道的有效阶数。相似文献

9.

连续语音解码阈值参数的优化

尹明明李弼程屈丹牛铜《模式识别与人工智能》2012,25(1):130-135

针对目前连续语音识别解码过程中剪枝阈值的确定不能兼顾解码速度与精度的不足,文中提出一种多维剪枝阈值参数联合优化算法。该算法主要研究全局阈值、词尾阈值、激活模型数、令牌数四维剪枝阈值参数的优化,其优化的主要过程是首先应用多目标优化理论对这四维阈值参数进行联合优化,然后根据优化结果采用分段动态阈值的方法进行后处理。实验结果表明,采用该方法优化后的阈值参数进行一遍解码,解码器的剪枝性能得到明显改善,搜索空间的大小得到有效控制,达到预期的速度与精度权衡的优化效果。相似文献

10.

基于MCE准则的语音识别特征线性判别分析

陈斌张连海牛铜屈丹李弼程《自动化学报》2014,40(6):1208-1215

提出了一种基于最小分类错误（Minimum classification error,MCE）准则的线性判别分析方法（Linear discriminant analysis,LDA）,并将其应用到连续语音识别中的特征变换.该方法采用非参数核密度估计方法进行数据概率分布估计;根据得到的概率分布,在最小分类错误准则下,采用基于梯度下降的线性搜索算法求解判别分析变换矩阵.利用判别分析变换矩阵对相邻帧梅尔滤波器组输出拼接的超矢量变换降维,得到时频特征.实验结果表明,与传统的MFCC特征相比,经过本文判别分析提取的时频特征其识别准确率提高了1.41%,相比于HLDA（Heteroscedastic LDA）和近似成对经验正确率准则（Approximate pairwise empirical accuracy criterion,aPEAC）判别分析方法,识别准确率分别提高了1.14%和0.83%. 相似文献