首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
李启飞  王栋  高迎明  李雅 《信号处理》2023,39(4):658-666
抑郁症是一种常见的精神障碍疾病,早期的检测和诊断对抑郁症预防和治疗至关重要。基于语音的抑郁症检测是当前计算机辅助检测方法中的一种高效、便捷的手段。为了探索不同的情感刺激是否对语音抑郁症检测存在影响,本文首先构建了抑郁症分析声学特征集,接着使用非参数检验的方法分析不同情感刺激性下抑郁与非抑郁个体之间声学特征的显著性差异,再采用情感刺激(积极、消极、中性)和任务类型(文本朗读、问答)组合的实验设计,通过机器学习和深度学习算法分别构建语音抑郁症检测模型。实验结果证明使用情感刺激会对抑郁症检测任务产生一定程度的影响,并且消极的情感刺激更容易诱发抑郁相关的情绪,对个体的发音特性产生影响,进而取得比积极刺激和中性语音更好的检测效果。  相似文献   

2.
任延珍  刘晨雨  刘武洋  王丽娜 《信号处理》2021,37(12):2412-2439
语音承载着人类语言和说话人身份信息,通过语音伪造技术可以精确模仿目标说话人的声音以达到欺骗人或机器听觉的目的。目前,深度伪造(Deepfake)正在对全球的政治经济及社会稳定带来极大的威胁,其中语音伪造是Deepfake实现舆论操控的核心技术之一。近年来语音伪造技术在拟人度、自然度方面有了显著进步,使得语音伪造检测技术面临着更大的挑战。本文对当前主流的语音伪造和伪造语音检测技术研究现状进行综述,主要包括:1)对主流语音伪造技术,包括语音合成、语音转换和语音对抗样本的基本概念、技术发展历程和研究进展进行综述;2)对伪造语音检测技术的基本概念、性能评价指标、主要技术实现原理和性能效果进行综述;3)对伪造语音检测相关的主流竞赛、常用数据集和可用代码工具资源进行介绍;最后对语音伪造和检测技术现存的挑战性问题和未来的研究方向进行讨论。   相似文献   

3.
由于目前语音增强方法或算法难以对语音频谱在时频域上的结构化信息进行有效建模和利用。然而,深度学习中的RBM、DNN等模型擅长对数据中的结构化信息进行建模,而且具有从数据的低层结构化信息提取更高层的结构化信息的能力。基于分类深度神经网络的语音增强,该方法对于低信噪比非平稳语音增强可得到高可懂度的增强语音,但语音音质损失严重。基于DNN的最小均方误差回归拟合语音增强方案,该语音增强方案还说明大语音数据训练能保证DNN较充分学习到噪声语音谱和干净语音谱之间复杂的非线性关系。  相似文献   

4.
针对通信语音干扰效果客观评估问题,提出了基于多测度与多模态融合的2种评估方法。首先,利用端点检测算法以及动态时间弯折算法对受扰语音数据进行预处理。然后,提取数据中的语音内容并与标准语音进行测度计算得到5种测度,将5种测度融合后利用随机森林模型进行质量等级评估。最后,结合多模态融合技术,设计了基于残差结构的神经网络模型,融合受扰语音数据的图域、测度域特征并进行质量等级评估。实验结果表明,2种方法的评估准确率均达到了90%以上。其中,多模态评估方法与现有的研究方法相比,准确率提升了约3.269%,证明所提方法具有更优的性能。  相似文献   

5.
目前抑郁症的诊断手段单一、诊断率低,为此,文章提出一种基于词向量的SVM集成学习社交网络抑郁倾向检测方法。人工标注和专家校验获得训练数据,使用词向量进行文本向量化。以SVM为基分类器进行Boosting集成学习。实验结果表明,文章提出的模型可以用于抑郁倾向的检测。  相似文献   

6.
基于语音数据分析的帕金森病(PD)诊断存在样本量小、训练与测试数据分布差异明显的问题。为了解决这些问题,需要从降维和样本扩充两个方面同时进行。因此,该文提出结合加噪加权卷积稀疏迁移学习和样本特征并行优选的PD分类算法。该算法可从源域的公共语音库中学习有利于表达PD语音特征的有效结构信息,同时完成降维和样本间接扩充。样本特征并行优选考虑到了样本和语音特征间的关系,从而有助于获取高质量的特征。首先,对公共语音库进行特征提取构造公共特征库;然后,以公共特征库对PD目标域的训练数据集及测试数据集进行稀疏编码,这里分别采用传统稀疏编码(SC)与卷积稀疏编码(CSC)两种稀疏编码方法;接着,对编码后的语音样本段和特征数据进行同时优选;最后,采用支撑向量机(SVM)进行分类。实验结果表明,该算法针对受试者的分类准确率最高值达到了95.0%,均值达到了86.0%,较相关被比较算法有较大提高。此外,研究还发现,相较于传统稀疏编码方法,卷积稀疏编码更有利于提取PD语音数据的高层特征;同样,迁移学习也有利于提高该算法性能。  相似文献   

7.
陈立春 《电声技术》2013,37(5):42-44,53
针对实时语音采集系统应用到工业行业中所面对的增加有效记录时间和提高噪声环境下的录音回放效果问题,研究了端点检测方法和语音增强方法。端点检测方法基于有限状态机模型,引入通信中AMR-WB标准的激活检测算法作为语音帧或噪声帧判据,端点检测可达到良好的实时性和准确性,并对于低幅度信号增加了过零率判据可进一步降低检测算法对语音的漏报率。语音增强方法以参数可配置的低频带阻滤波结合维纳滤波来增强语音采集系统对多种环境噪声的消除能力。实际使用表明该端点检测方法和语音增强方法对于提高工业领域应用中实时语音采集系统的记录长度和回放效果具有很强的实用性。  相似文献   

8.
何文龙  高长丰  黎塔  刘建 《信号处理》2021,37(5):893-901
为了进一步利用源文本数据来提高语音翻译的性能,本文提出了一种基于生成对抗网络的端到端语音翻译算法。通过加入判别网络来判断语音特征序列和文本特征序列的真伪,从而引导生成模型来学习文本真实序列的分布,以使语音序列特征分布更加逼近文本特征序列的分布。引入了Wasserstein GAN(WGAN)来计算语音特征序列和文本特征序列通过判别器的标量似然值的Earth-Mover(EM)距离,来解决语音特征序列和文本特征序列存在长度不一致的问题。整个模型遵从多任务学习和对抗学习的训练准则,本文在How2数据集上和MuST-C英中数据集上验证了本文提出算法的有效性,该方法可以显著提升翻译质量。   相似文献   

9.
基于语音识别的发音学习技术   总被引:7,自引:0,他引:7  
在语言发音学习中,有效的反馈对学习者有很大的帮助。计算机辅助发音学习系统可以给学习者有效的发音指导。就目前基于语音识别的发音学习技术进行介绍,给出系统原理框图,对一些关键技术和问题进行探讨,并对其发展进行展望。  相似文献   

10.
语音作为传递信息的一种常用手段,在人们的日常生活中有着非常重要的地位。随着科学的发展,语音识别愈来愈受到人们的重视。本文提出一种基于流形学习的特征提取方法———邻域保持嵌入( NPE)算法用于语音识别领域。流形学习是近几十年发展起来的降维方法,在图像识别领域已有应用,但在语音识别领域的应用非常之少。实验结果表明该算法可取得较好的识别率,同时所提取的特征稳定,计算速度快。  相似文献   

11.
语音情感识别是利用计算机建立语音信息载体与情感度量之间的关系,并赋予计算机识别、理解人类情感的能力,语音情感识别在人机交互中起着重要作用,是人工智能领域重要发展方向。本文从语音情感识别在国内外发展历史以及开展的一系列会议、期刊和竞赛入手,分别从6个方面对语音情感识别的研究现状进行了梳理与归纳:首先,针对情感表达从离散、维度模型进行了阐述;其次,针对现有的情感数据库进行了统计与总结;然后,回顾了近20年部分代表性语音情感识别发展历程,并分别阐述了基于人工设计的语音情感特征的情感识别技术和基于端到端的语音情感识别技术;在此基础之上,总结了近几年的语音情感识别性能,尤其是近两年在语音领域的重要会议和期刊上的语音情感识别相关工作;介绍了语音情感识别在驾驶、智能交互领域、医疗健康,安全等领域的应用;最后,总结与阐述了语音情感识别领域仍面临的挑战与未来发展方向。本文旨在对语音情感识别相关工作进行深入分析与总结,为语音情感识别相关研究者提供有价值的参考。  相似文献   

12.
深度学习就是机器学习研究的过程,主要通过模拟人脑分析学习的过程对数据进行分析。目前,深度学习技术已经在计算机视觉、语音识别、自然语言处理等领域获得了较大发展,并且随着该技术的不断发展,为网络流量分类和异常检测带来了新的发展方向。移动智能手机与大家的生活息息相关,但是其存在的安全问题也日益凸显。针对传统机器学习算法对于流量分类需要人工提取特征、计算量大的问题,提出了基于卷积神经网络模型的应用程序流量分类算法。首先,将网络流量数据集进行数据预处理,去除无关数据字段,并使数据满足卷积神经网络的输入特性。其次,设计了一种新的卷积神经网络模型,从网络结构、超参数空间以及参数优化方面入手,构造了最优分类模型。该模型通过卷积层自主学习数据特征,解决了传统基于机器学习的流量分类算法中的特征选择问题。最后,通过CICAndmal2017网络公开数据集进行模型测试,相比于传统的机器学习流量分类模型,设计的卷积神经网络模型的查准率和查全率分别提高了2.93%和11.87%,同时在类精度、召回率以及F1分数方面都有较好的提升。  相似文献   

13.
阐述了光电编码器的工作原理,按照编码方式的不同将光电编码器分为两类,总结比较两类编码器的性能特点及各自的优缺点。针对编码器检测技术的研究现状,介绍了常见编码器检测方法及模型,以及国内外现有的光电编码器检测技术及装置,并对比、分析、统计各检测方法的特点、适用场合及不足之处。并概括总结了未来光电编码器检测技术高精度、高效、高适用性的发展趋势。  相似文献   

14.
图像作为记录生活和储存信息的重要途径之一, 是人对视觉感知的物质的一种再现, 同时也是对现实场景的一种真实写照。面对海量的图像数据,如何准确高效的提取图像特征 ,获取有用信息,将信息转化为所需特征,是需要解决的问题。针对这一问 题,本文提出的基于CSLBP模糊图像特征提取与检测方法很好的解决了这一问题。同时结合H OG特征提取与检测、Haar特征提取与检测以及基于深度学习的人脸特征检测方法与本文算法 进行比较,对各类方法的基本原理 、步骤、应用等进行分析。其次,将对近年来出现的方法予以介绍,从解决问题的角度对经 典方法和新方法进行分析比较,对于存在的问题进行对比、归纳总结,并得出结论。结果得 知,本文提出的模糊图像特征匹配算法较经典算法与深度学习算法而言有一定的优势,但均 有改进之处。例如如何控制高噪声情况下的特征提取率,以及如何提高在光照强度下的稳定性,是今后研究的重点问题。  相似文献   

15.
当前基于预训练说话人编码器的语音克隆方法可以为训练过程中见到的说话人合成较高音色相似性的语音,但对于训练中未看到的说话人,语音克隆的语音在音色上仍然与真实说话人音色存在明显差别。针对此问题,本文提出了一种基于音色一致的说话人特征提取方法,该方法使用当前先进的说话人识别模型TitaNet作为说话人编码器的基本架构,并依据说话人音色在语音片段中保持不变的先验知识,引入一种音色一致性约束损失用于说话人编码器训练,以此提取更精确的说话人音色特征,增加说话人表征的鲁棒性和泛化性,最后将提取的特征应用端到端的语音合成模型VITS进行语音克隆。实验结果表明,本文提出的方法在2个公开的语音数据集上取得了相比基线系统更好的性能表现,提高了对未见说话人克隆语音的音色相似度。  相似文献   

16.
近年来,合成孔径雷达成像技术因具备全天时和全天候的目标感测能力,在海洋实时监测和管控等领域发挥着重要作用,特别是高分率SAR图像中的舰船目标检测成为当前的研究热点之一。首先分析基于深度学习的SAR图像舰船目标检测流程,并对样本训练数据集的构建、目标特征的提取和目标框选的设计等关键步骤进行归纳总结。然后对检测流程中的各部分对SAR图像舰船目标检测精度和速度的影响进行对比分析。最后根据当前研究现状,深入分析深度学习算法在舰船检测应用中存在的问题,探讨基于深度学习的SAR图像舰船目标检测的进一步研究方向。  相似文献   

17.
基于深度学习的图像目标检测算法综述   总被引:1,自引:0,他引:1       下载免费PDF全文
图像目标检测是找出图像中感兴趣的目标,并确定他们的类别和位置,是当前计算机视觉领域的研究热点。近年来,由于深度学习在图像分类方面的准确度明显提高,基于深度学习的图像目标检测模型逐渐成为主流。首先介绍了图像目标检测模型中常用的卷积神经网络;然后,重点从候选区域、回归和anchor-free方法的角度对现有经典的图像目标检测模型进行综述;最后,根据在公共数据集上的检测结果分析模型的优势和缺点,总结了图像目标检测研究中存在的问题并对未来发展做出展望。  相似文献   

18.
基于大数据的深度学习算法越来越完善,然而如何解决训练样本数非常少的情况,是目前神经网络研究领域中一个非常重要且极具挑战的问题.首先,介绍了少样本问题的定义;接着将现有的少样本学习方法分为数据增强、度量学习和元学习三类,分别从方法所用模型、数据集以及相应的实验结果进行分析;最后,总结了现有方法的不足,探讨了未来少样本研究的方向.  相似文献   

19.
基于深度学习的小目标检测研究与应用综述   总被引:1,自引:0,他引:1       下载免费PDF全文
目标检测在基于传统手工特征及深度学习算法上已经取得较大发展,然而针对小目标检测的研究近几年才开始出现,研究成果较少,且大都是在已有目标检测算法基础上进行改进,以提高小目标检测的检测精度.小目标像素点少,本身携带的特征少,多次下采样后就更难进行特征提取,因而小目标检测面临极大挑战.小目标检测在自动驾驶、遥感图像检测、刑侦等领域都有广泛应用需求,对于小目标检测技术的研究有重要的实用价值.本文对小目标检测的现有研究成果进行了详细综述.首先,将现有算法按照检测需要的阶段数分为一阶段、二阶段、多阶段,描述了RetinaNet、CornerNet-Lite、特征金字塔网络(Feature Pyramid Network,FPN)等算法的原理并进行了对比分析.其次,本文描述了小目标检测技术在不同领域的应用情况,并汇总了MS COCO、PASCAL VOC、DOTA、KITTI等数据集及算法性能评价指标.最后,总结了小目标检测面临的挑战,并展望了未来的研究方向.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号