期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

练秋生石保顺陈书贞《自动化学报》2015,41(2):240-260

稀疏表示模型常利用训练样本学习过完备字典, 旨在获得信号的冗余稀疏表示. 设计简单、高效、通用性强的字典学习算法是目前的主要研究方向之一, 也是信息领域的研究热点. 基于综合稀疏模型的字典学习方法已经广泛应用于图像分类、图像去噪、图像超分辨率和压缩成像等领域. 近些年来, 解析稀疏模型、盲字典模型和信息复杂度模型等新模型的出现丰富了字典学习理论, 使得更广泛类型的信号能够被简单性描述. 本文详细介绍了综合字典、解析字典、盲字典和基于信息复杂度字典学习的基本模型及其算法, 阐述了字典学习的典型应用, 指出了字典学习的进一步研究方向. 相似文献

2.

用于超分辨率重建的同构过完备字典学习方法

谢宝陵徐国明《计算机工程与科学》2014,36(8):1441-1446

构造合适的过完备字典是基于稀疏表示的超分辨率重建中的关键问题之一。在最大似然估计准则下,建立基于混合高斯的同构过完备字典学习模型。模型采用加权的l2范数来刻画分解残差,由分解残差设计权值矩阵,并且将同构的双字典学习问题转化为单字典的学习。采用稀疏编码和字典更新的交替迭代策略完成目标函数的求解,由内点法进行稀疏编码,采用拉格朗日对偶法完成字典更新。最后将学习得到的字典用于超分辨率重建实验,并与其他方法进行比较。实验结果验证了该模型和算法的有效性。相似文献

3.

基于稀疏分解的数据分类算法

下载免费PDF全文

乔奕郭启勇沈一帆《计算机工程》2010,36(5):57-58,6

利用基于超完备字典的信号稀疏分解理论,提出一种基于稀疏分解的数据分类算法SRC。该算法通过学习不同类别数据的稀疏映射关系,把测试样本映射到高维空间中,根据稀疏重构的误差定义决策函数以确定测试样本的类别。采用UCI数据集评估该算法,并与SVM算法和Fld算法的实验结果进行对比,结果表明,SRC的分类准确率最高,不平衡数据集的实验结果显示了SRC的鲁棒性。相似文献

4.

基于稀疏分解的数据分类算法

下载免费PDF全文

乔奕郭启勇沈一帆《计算机工程》2010,36(5):57-58,61

利用基于超完备字典的信号稀疏分解理论,提出一种基于稀疏分解的数据分类算法SRC。该算法通过学习不同类别数据的稀疏映射关系,把测试样本映射到高维空间中,根据稀疏重构的误差定义决策函数以确定测试样本的类别。采用UCI数据集评估该算法,并与SVM算法和Fld算法的实验结果进行对比,结果表明,SRC的分类准确率最高,不平衡数据集的实验结果显示了SRC的鲁棒性。相似文献

5.

基于双正交基字典学习的图像去噪方法 总被引：1，自引：0，他引：1

解凯张芬《计算机应用》2012,32(4):1119-1121

为了提高图像去除白高斯噪声的性能,利用超完备字典作为图像的稀疏表示。超完备字典的冗余性可以有效地表示图像的各种几何奇异特征。在贝叶斯框架下,以图像块的稀疏表示定义了全局图像先验概率模型,给出了最大后验概率模型下的优化图像去噪算法。超完备字典使用两个不同的正交基构成,给出了基于奇异值分解（SVD）的优化字典计算方法。该方法充分利用正交基的特点,采用SVD方法进行高效的字典学习。基于双正交基字典的去噪算法提高了图像去噪性能,实验结果证实了所提方法的有效性。相似文献

6.

基于双密度双树复小波变换多字典的人脸特征稀疏分类方法

王成语李伟红《计算机应用》2011,31(8):2115-2118

基于超完备字典的人脸稀疏表示方法的难点是其字典构成。针对此问题,首先采用双密度双树复小波变换(DD-DT CWT)提取人脸图像不同尺度的高频子带,然后根据能量平均分布最大原则选择能量较大的部分子带构成对应尺度的超完备字典。同时,将测试样本相应的人脸DD-DT CWT子带特征看成超完备字典中原子的线性组合,并组合多字典上的稀疏表示进行识别。在AR人脸图像库上进行了实验,结果表明该方法是一种有效的人脸特征表示及分类方法。相似文献

7.

基于过完备字典稀疏表示的图像超分辨率研究

刘骅徐义奎杜晶凌佳俊《计算机光盘软件与应用》2013,(3)

提出一种基于过完备字典稀疏表示的通用图像超分辨率算法。利用过完备字典代替稀疏基,采用学习的方法得到低分辨率图像和高分辨率图像之间的关系,最终从高分辨率图像块的字典中重构出超分辨率图像。实现了基于matlab的稀疏表示(omp算法)和字典更新(K-SVD算法)的字典学习算法,并通过仿真实验,以PSNR等指标论证了编码算法的有效性。相似文献

8.

结合位置先验与稀疏表示的单帧人脸图像超分辨率算法

马祥《计算机应用》2012,32(5):1300-1302

提出了一种结合位置先验与稀疏表示的人脸图像超分辨率算法,可对单帧输入的低分辨率人脸图像基于训练集进行超分辨率重建。利用压缩感知理论中的信号分解方法,〖BP(〗明确哪些方法更好〖BP)〗,将稀疏表示与人脸位置先验信息相结合,使用经过分类的超完备冗余字典,来分别稀疏逼近输入信号的块向量结构。利用最佳的K项原子,线性组合重建出高分辨率图像块。最后按照图像块最初在人脸的位置,将它们拼接为整体人脸。在CAS-PEAL-R1人脸图库上的实验结果表明,该算法使用相对较少的原子,就可以重建出质量较好的高分辨率人脸图像。相似文献

9.

基于过完备字典的鲁棒性单幅图像超分辨率重建模型及算法

徐国明薛模根崔怀超《计算机辅助设计与图形学学报》2012,24(12):1599-1605

针对单幅含噪图像的超分辨率重建问题,基于图像在过完备字典下的稀疏表示建立了超分辨率重建模型.该模型中低分辨率字典采用K-SVD算法直接训练,高分辨率字典则由高分辨率图像块与低分辨率字典下的同构的表示系数进行逼近求得;近似的高分辨率图像块通过高分辨率字典乘以表示系数得到,为使重建结果对噪声具有鲁棒性,利用基于稀疏表示的噪声图像恢复的方法由重叠的近似高分辨率图像块求得最终结果.实验结果表明,文中模型无论是主观视觉还是客观评价指标均取得了较好的效果,并验证了模型及算法的有效性. 相似文献

10.

基于稀疏表达的遥感影像超分辨率重建

李健平《电脑开发与应用》2014,(7):12-13

针对其他超分辨率重建方法数据冗余量大,较为繁琐的问题,基于"稀疏表达"具备模型简单、容易理解、容易操作的特点,提出利用"稀疏表达"理论进行遥感图像的超分辨率重建的设想。先将整个图像空间分为几个不同的子空间,然后在各子空间内构建与正交匹配追踪算法迭代过程中各层面几何结构相适应的分层字典,即利用退化的遥感影像训练过完备字典。相似文献

11.

基于改进Citation-KNN算法的性别识别研究

下载免费PDF全文

朱俊梅顾明亮张世形贾晶晶《计算机工程与应用》2015,51(15):206-210

为了简化系统模型训练方法,提高性别识别系统的整体效率,提出了一种基于改进Citation-KNN算法的说话人性别识别方法。该方法将连续语音切分,训练每段语音的高斯混合模型（Gaussian Mixture Model,GMM）作为多示例包,其所有混合元为相应包中示例;采用改进的Hausdorff距离作为包与包之间的距离测度,通过Citation-KNN算法进行性别识别。该方法以多示例包间距离为分类依据,简化了系统训练,且识别率优于一些传统算法。相似文献

12.

基于量子隧穿效应的说话人真伪鉴别方法

黄亮潘平周超《计算机应用》2017,37(9):2617-2620

针对语音信号的非结构化特点,提出了一种基于量子隧穿效应的说话人真伪鉴别方法。以量子隧穿效应为理论依据,首先,在分析语音信号分帧的量子特性基础上,将每一帧语音信号看作一个量子态,实现算法的量子化;然后,利用势垒能分离能量的特性,通过构建势垒组以提取信号的能量谱特征,并以此作为特征参数;最后,通过高斯混合模型（GMM）进行语音信号建模,完成说话人的真伪鉴别。仿真结果表明,相对于传统方法,利用量子隧穿效应理论实现说话人鉴别可以有效降低算法的复杂度,提高识别的识别率和可靠性,为量子信息理论和说话人真伪鉴别方法提供了新的研究途径。相似文献

13.

基于时域波形的半监督端到端虚假语音检测方法

方昕黄泽鑫张聿晗高天潘嘉付中华高建清刘俊华邹亮《计算机应用》2023,43(1):227-231

现代语音合成和音色转换系统产生的虚假语音对自动说话人识别系统构成了严重威胁。大多数现有的虚假语音检测系统对在训练中已知的攻击类型表现良好,但对实际应用中的未知攻击类型检测效果显著降低。因此,结合最近提出的双路径Res2Net(DP-Res2Net),提出一种基于时域波形的半监督端到端虚假语音检测方法。首先,为了解决训练数据集和测试数据集两者数据分布差异较大的问题,采用半监督学习进行领域迁移;然后,对于特征工程,直接将时域采样点输入DP-Res2Net中,增加局部的多尺度信息,并充分利用音频片段之间的依赖性;最后,输入特征经过浅层卷积模块、特征融合模块、全局平均池化模块得到嵌入张量,用来判别自然语音与虚假伪造语音。在公开可用的ASVspoof 2021 Speech Deep Fake评估集和VCC数据集上评估了所提出方法的性能,实验结果表明它的等错误率（EER）为19.97%,与官方最优基线系统相比降低了10.8%。基于时域波形的半监督端到端检测虚假语音检测方法面对未知攻击时是有效的,且具有更高的泛化能力。相似文献

14.

FOA-LM算法及其在语音信号稀疏分解中的应用

肖正安罗海峰《计算机工程与应用》2015,51(12):219-222

信号的稀疏表示在信号处理的许多方面有着重要的应用,但稀疏分解计算量十分巨大,难以产业化应用。粒子群优化（PSO）及果蝇优化（FOA）等智能算法具备前期收敛速度快,全局搜索能力强的优点,应用到语音信号的稀疏分解中,虽然大大提高了语音信号稀疏分解的速度,但是该类算法后期的收敛速度较低,稀疏分解速度仍然偏低。拉凡格氏（LM）算法具有收敛速度快,精度高的特点,但是LM算法依赖初值,这使它的应用受到了限制。结合智能算法FOA及LM算法的优点,采用FOA算法求出Gabor原子参数初值,利用这些初值进行LM迭代搜索最优原子。仿真结果表明,基于FOA优化算法和LM算法相结合的方法,具有收敛速度快,精度高的特点,有较高的实用价值。相似文献

15.

改进稀疏表示算法在人脸识别中的应用

下载免费PDF全文

刘霞罗文辉苏义鑫《计算机工程与应用》2019,55(14):191-197

人脸识别的主要难度在于，受到光照变化、表情变化以及遮挡的影响，会使得采集的不同人的人脸图像具有相似性。为有效解决基于稀疏表示的分类算法（Sparse Representation-based Classification，SRC）在人脸训练样本不足时会导致识别率降低和稀疏表示求解效率较低的问题，提出了基于判别性低秩分解与快速稀疏表示分类（Low Rank Recovery Fast Sparse Representation-based Classification，LRR_FSRC）的人脸识别算法。利用低秩分解理论得到低秩恢复字典以及稀疏误差字典，结合低秩分解和结构不相干理论，训练出判别性低秩类字典和稀疏误差字典，并把它们结合作为测试时所用的字典；用坐标下降法来求解稀疏系数以提高了计算效率；根据重构误差实现测试样本的分类。在YALE和ORL数据库上的实验结果表明，提出的基于LRR_FSRC的人脸识别方法具有较高的识别率和计算效率。相似文献

16.

利用PCNN神经元点火位置信息的语音特征研究

下载免费PDF全文

张歆奕阮柏尧《计算机工程与应用》2009,45(34):124-126

语谱图是语音信号的时频表示,含有丰富的信息。把语谱图输入到脉冲耦合神经网络（PCNN）可以获得语音的特征矢量。传统的语音特征采用PCNN50次迭代的点火次数。提出了一种新的语音特征参数,该参数基于PCNN神经元点火位置的信息。说话人识别的实验表明,新语音特征比传统的特征更能反映话者语音信号的特点,获得更好的识别结果。相似文献

17.

基于BP神经网络的说话人识别技术的实现

陈仁林郭中华朱兆伟《电脑学习》2012,2(2):47-49

说话人识别就是从说话人的一段语音中提取出说话人的个性特征,通过对这些个人特征的分析和识别,从而达到对说话人进行辨认或者确认的目的。神经网络是一种基于非线性理论的分布式并行处理网络模型,具有很强的模式分类能力及对不完全信息的鲁棒性,为说话人识别技术提供了一种独特的方法。BP（Back-propagation Neural Network）是一种非循环多级网络训练算法,有输入层,输出层和N个隐含层组成。首先概述了语音识别技术,介绍了BP神经网络训练过程的7个步骤及其模型,如何建立BP神经网络模型。同时介绍了与其相关的特征参数的提取,神经网络的训练和识别过程,最后,通过编程在Linux系统下实现说话人身份的识别。相似文献

18.

Rapid speaker ID using discrete MMI feature quantisation

Jonathan T. Foote 《Expert systems with applications》1997,13(4):283-289

This paper presents a method of rapidly determining speaker identity from a small sample of speech, using a tree-based vector quantiser trained to maximise mutual information (MMI). The method is text-independent and new speakers may be rapidly enrolled. Unlike most conventional hidden Markov model approaches, this method is computationally inexpensive enough to work on a modest integer microprocessor, yet is robust even with only a small amount of test data. Thus speaker identification is rapid in terms of both computational cost and the small amount of test speech necessary to identify the speaker. This paper presents theoretical and experimental results, showing that perfect ID accuracy may be achieved on a 15-speaker corpus using little more than 1 s of text-independent test speech. Also presented is a demonstration of how this method may be used to segment audio data by speaker. 相似文献

19.

基于DNN处理的鲁棒性I-Vector说话人识别算法

下载免费PDF全文

王昕张洪冉《计算机工程与应用》2018,54(22):167-172

提出了一种将基于深度神经网络（Deep Neural Network,DNN）特征映射的回归分析模型应用到身份认证矢量（identity vector,i-vector）/概率线性判别分析（Probabilistic Linear Discriminant Analysis,PLDA）说话人系统模型中的方法。DNN通过拟合含噪语音和纯净语音i-vector之间的非线性函数关系,得到纯净语音i-vector的近似表征,达到降低噪声对系统性能影响的目的。在TIMIT数据集上的实验验证了该方法的可行性和有效性。相似文献

20.

基于稀疏表示的SAR图像目标识别方法

刘振姜晖王粒宾《计算机工程与应用》2014,(10):212-215,232

为了准确地进行SAR图像目标识别,提出一种基于稀疏表示的SAR目标识别方法,在用主成分分析（PCA）进行降维的前提下,利用降维后的训练样本构建稀疏线性模型,通过 ξ1范数最优化求解测试样本的稀疏系数解x,利用系数的稀疏性分布进行目标的分类识别。基于MSTAR数据进行了仿真验证,实验证明,基于稀疏表示的SAR目标识别方法在一定的特征维数下能够获得很好的识别性能,在目标方位角未知的情况下识别率仍可达到98%以上。相似文献