首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 785 毫秒
1.
基于萤火虫算法的匹配追踪用于生态声音辨识   总被引:1,自引:0,他引:1  
针对生态环境中背景噪声对声音辨识产生干扰的问题,提出利用萤火虫算法优化匹配追踪的方法进行生态声音辨识。利用匹配追踪(MP)稀疏分解声音信号,在保留信号主体结构的前提下对其进行重构,减小噪声的影响。使用萤火虫(GSO)算法优化搜索最佳匹配原子,实现MP快速分解。对重构信号提取Mel频率倒谱系数(MFCCs),MP时频特征及基音频率。结合支持向量机(SVM)对56种生态声音在不同环境和信噪比情况下进行分类识别。实验结果表明,与传统MFCC与SVM的方法相比,该方法对生态声音在不同信噪比下的识别性能得到不同程度的改善并且具有较好的抗噪性,尤其适合低信噪比(30 dB以下)噪声情境下使用。  相似文献   

2.
杨曜  郭斌  於志文 《计算机科学》2014,41(10):62-66
随着智能手机和移动互联网的快速发展,人们的生活方式正在发生着变革。目前,智能手机终端集成了不同种类的传感器,如GPS、Wi-Fi、摄像头、麦克风等。通过内置传感器,可以搜集用户的相关信息,利用这些信息能有效地理解和识别用户行为,并为用户提供更好的个性化服务。文中主要面向大型工作或生活社区(如大学校园),提出基于背景声音识别的社会活动推荐系统MSSAR(Mobile Sound Sensing and Activity Recommender)。该系统通过音频传感器采集用户的背景声音,实时感知用户所处环境,并对用户实时活动(如在咖啡厅、在开会等)进行识别。MSSAR还能结合用户在线交互历史数据计算其偏好及社会关系亲密度,并据此为用户进行活动推荐。本系统基于以人为本的计算理念,对增强用户间社会联系、促进社区成员间活动交流具有积极意义。  相似文献   

3.
对声音识别技术进行了深入研究,提出一种声音识别传感器设计.该传感器首先采集声音信号,经过整形、放大后进行A/D转换,提取语音特征,并利用动态时间规整(DTW)算法进行识别;传感器采用C/S架构和外部设备进行通信,通过串口接收外部设备命令,分析处理后传回识别结果.最后设计并实现智能家居硬件环境,通过声音识别传感器完成智能家居的远程遥控,完成诸如开灯、关灯等动作.实验结果表明:该传感器工作稳定,识别率高,能够应用于各种场合.  相似文献   

4.
杜晓青  于凤芹 《计算机工程》2013,(11):197-199,204
Mel频率倒谱系数(MFCC)与线性预测倒谱系数(LPCC)融合算法只能反映语音静态特征,且LPCC对语音低频局部特征描述不足。为此,提出将希尔伯特黄变换(HHT)倒谱系数与相对光谱一感知线性预测倒谱系数(RASTA—PLPCC)融合,得到一种既反映发声机理又体现人耳感知特性的说话人识别算法。HHT倒谱系数体现发声机理,能反映语音动态特性,并更好地描述信号低频局部特征,可改进LPCC的不足。PLPCC体现人耳感知特性,识别性能强于MFCC,用3种融合算法对两者进行融合,将融合特征用于高斯混合模型进行说话人识别。仿真实验结果表明,该融合算法较已有的MFCC与LPCC融合算法识别率提高了8.0%。  相似文献   

5.
针对DTW算法在手势身份认证中存在的问题,提出了一种基于约束多维DTW算法(Constraints Multi-dimension Dynamic Time Wrapping,CM-DTW)的智能手机动态手势身份认证方法.该方法利用手机内置传感器获取代表用户生物行为特征的手势数据,通过Sakoe-Chiba窗约束下的DTW算法选择合法用户的候选模板集,采用线性升降采样归一化候选模板得到一个标准模板.该方法与DTW算法相比,不仅提高了身份认证的时间效率,并且保证了用户身份认证的准确率.  相似文献   

6.
交互学习是数据挖掘的一种重要手段。使用交互学习作为学习系统和用户的交互模型,以向用户提供最大效用结果为目标,通过对用户反馈质量进行定量描述,考察偏好反馈,提出一种基于最小遗憾度的偏好感知算法。此外,还对偏好感知算法的期望遗憾度界限进行分析,并给出该算法的几个扩展版本。最后利用电影推荐任务及网络搜索排名数据验证了该算法的有效性。  相似文献   

7.
为了提高肌电信号手势识别算法的准确度,增强实时性,提出了一种基于动态时间规整(DTW)算法的手势识别方法,该方法利用肌电信号(EMG)对个体间的手势进行识别。首先,采用滑动平均能量的方法对原始的EMG信号进行数据分割,探测有效动作;其次,对于分割的数据段使用平均绝对值(MAV)来提取信号特征;最后,用DTW算法将8维的EMG信号融合并计算测试样本和模版的相似度,其中采用了DTW算法寻找规整路径的方法进行了模板制作,实现了个体间的手势识别。实验结果表明,使用DTW算法对肌电信号进行手势识别,其动作识别的准确率达到96.09%,该方法计算速度快,实时性强。  相似文献   

8.
针对现有的超声波手势识别方法易受用户误操作手势的影响,难以对识别错误的手势进行实时修正等问题,提出一种融合情境感知信息的手势识别方法.首先通过对手势信号进行时频分析提取有效的手势特征,构建基于超限学习机算法的手势识别模型,并利用softmax函数将手势识别结果映射为手势的置信度;然后通过自定义的概率转化函数将情境信息转化为手势的情境置信度;最后融合手势的置信度和情境置信度,以利用情境感知结果过滤用户的误操作手势,修正识别错误的手势,输出符合用户意图的手势识别结果.将文中方法应用于超声波手势识别的实验结果表明,该方法的识别准确率能够达到94.7%,比无情境信息的超声波手势识别方法提高33.2%.  相似文献   

9.
陈秋菊  李应 《计算机应用》2017,37(2):505-511
针对各种环境声音对声音事件识别的影响,提出一种基于优化的正交匹配追踪(OOMP)和深度置信网(DBN)的声音事件识别方法。首先,利用粒子群优化(PSO)算法优化OMP稀疏分解,在实现正交匹配追踪(OMP)的快速稀疏分解的同时,保留声音信号的主体部分,抑制噪声对声音信号的影响;接着,对重构声音信号提取Mel频率倒谱系数(MFCC)、OMP时-频特征和基音频率(Pitch)特征,组成OOMP的复合特征;最后,使用DBN对提取的OOMP特征进行特征学习,并对40种声音事件在不同环境不同信噪比下进行识别。实验结果表明,OOMP特征结合DBN的方法适用于各种环境声下的声音事件识别,而且能有效地识别各种环境下的声音事件,即使在信噪比(SNR)为0 dB的情况下,仍然能保持平均60%的识别率。  相似文献   

10.
一种适用于说话人识别的改进Mel滤波器   总被引:1,自引:0,他引:1  
项要杰  杨俊安  李晋徽  陆俊 《计算机工程》2013,(11):214-217,222
Mel倒谱系数(MFcc)侧重提取语音信号的低频信息,对语音信号的频谱分布特性描述不充分,不能有效区分说话人个性信息。为此,通过分析语音信号各频段所含说话人个性信息的不同,结合Mel滤波器和反Mel滤波器在高低频段的不同特性,提出一种适于说话人识别的改进Mel滤波器。实验结果表明,改进Mel滤波器提取的新特征能够获得比传统Mel倒谱系数以及反Mel倒谱系数(IMFCC)更好的识别效果,并且基本不增加说话人识别系统训练和识别的时间开销。  相似文献   

11.
一个基于语境框架的文本特征提取算法   总被引:14,自引:0,他引:14  
介绍了一种新的文本语义形式化模型——语境框架。语境框架是一个三维的语义描述,它把文本内容抽象成领域(静态范畴)、情景(动态描述)、背景(褒贬、参照等)3个框架。在语境框架的基础上,设计实现了文本特征提取算法。算法从语义入手,实现了4元组表示的领域提取算法、以领域句类为核心的情景提取算法和以对象语义立场网络图为基础的褒贬判断。算法可以有效地处理语言中的褒贬倾向、同义、多义等现象,实际应用中表明具有很好的信息抽取能力。  相似文献   

12.
Automatic acoustic-based vehicle detection is a common task in security and surveillance systems. Usually, a recording device is placed in a designated area and a hardware/software system processes the sounds that are intercepted by this recording device to identify vehicles only as they pass by. An algorithm, which is suitable for online automatic detection of vehicles, which is based on their online acoustic recordings, is proposed. The scheme uses dimensionality reduction methodologies such as random projections instead of using traditional signal processing methods to extract features. It uncovers characteristic features of the recorded sounds without any assumptions about the structure of the signal. The set of features is classified by the application of PCA. The microphone is opened all the time and the algorithm filtered out many background noises such as wind, steps, speech, airplanes, etc. The introduced algorithm is generic and can be applied to various signal types for solving different detection and classification problems.  相似文献   

13.
通过研究移动社会网络中的多种上下文信息对节点移动模式的影响,提出了基于多维上下文认知的数据转发算法MCMF。该算法综合考虑物理邻接性、社会相似性以及社会交互性3个维度的上下文信息来进行动态数据转发决策。首先消息携带者节点通过物理邻接匹配获得邻居节点集合;然后通过社会相似性匹配在邻居节点集合中选出候选节点子集,并基于社会网络的社群特征,采用马尔可夫预测方法在候选节点子集中选出最优中继节点;最后设计高效的数据转发算法。仿真实验表明,相比于其他3种著名算法,该算法在交付比率和开销比率方面具有较好的性能。  相似文献   

14.
多通道界面是利用多个输入通道而进行人机交互的接口,用来提高人机交互的自然性、和谐性和高效性。本文以作者承担的省基金项目“肺音识别与软件测试系统的研究”为背景,结合任务的具体特点,提出了一种面向对象的多通道界面的软件结构模型,在此基础上详细描述了肺音数据分析的人机交互的对话结构,讨论了一种多通道人机界面的设计方法,实现了具有多通道界面特点的肺音分析与处理的人机交互设计,结果表明本界面有较好的交互自然性和较高的交互效率。  相似文献   

15.
针对复杂背景下手势运动过程中出现的手势形态变化、遮挡、光照变化等问题,提出了一种基于时空上下文的手势跟踪与识别方法。使用机器学习方法离线训练手势样本分类器,实现对手势的检测和定位;利用时空上下文跟踪算法对动态手势进行跟踪,同时为了避免跟踪过程中出现的漂移、目标丢失等情况,使用手势检测算法对手势位置信息进行实时校准;根据手势运动轨迹对手势运动进行跟踪与识别。实验表明,提出的方法可以实现对手势运动快速、准确、连续识别,满足人机交互的要求。  相似文献   

16.
在无人机跟踪过程中,遮挡、光照变化、背景干扰等影响会导致跟踪目标丢失。基于SiamRPN算法提出一种无人机目标跟踪算法。通过在网络中加入空间条带池和全局上下文模块建立远程上下文关系,以适应不同的跟踪场景。同时利用改进交并比的计算方法提取目标特征,并回归精准的预测框。在UAV123数据集上的实验结果表明,相比SiamRPN、SiamFC、SAMF等算法,该算法的跟踪性能较优且具有较强的鲁棒性,尤其在背景干扰环境下,其精确率和成功率较SiamRPN算法分别提升了6.54%和11.63%。  相似文献   

17.
图割用于图像分割需用户交互,基于激光雷达传感器,提出了阈值法得到目标的外截矩形,再映射到图像完成交互.针对GrabCut算法耗时、对局部噪声敏感和在复杂背景提取边缘不理想等缺点,提出了背景自适应的GrabCut算法,即在确定背景像素中选取可能目标像素邻近的一部分像素作为背景像素,使背景变得简单,尤其适用于前景像素在整幅图中所占比例较小和在目标像素周围的背景相对简单的情况.实验结果表明,所提算法与GrabCut算法相比,减少了图的节点数,降低了错误率,有效的提高了运行效率,提取的目标边缘信息更加完整、平滑.  相似文献   

18.
为解决基于视觉的情感识别无法捕捉人物所处环境和与周围人物互动对情感识别的影响、单一情感种类无法更丰富地描述人物情感、无法对未来情感进行合理预测的问题,提出了融合背景上下文特征的视觉情感识别与预测方法。该方法由融合背景上下文特征的情感识别模型(Context-ER)和基于GRU与Valence-Arousal连续情感维度的情感预测模型(GRU-mapVA)组成。Context-ER同时综合了面部表情、身体姿态和背景上下文(所处环境、与周围人物互动行为)特征,进行26种离散情感类别的多标签分类和3个连续情感维度的回归。GRU-mapVA根据所提映射规则将Valence-Arousal的预测值投影到改进的Valence-Arousal模型上,使得情感预测类间差异更为明显。Context-ER在Emotic数据集上进行了测试,结果表明,识别情感的平均精确率比现有最优方法提高4%以上;GRU-mapVA在三段视频样本上进行了测试,结果表明情感预测效果相较于现有方法有很大提升。  相似文献   

19.
约束概念格及其构造方法   总被引:5,自引:0,他引:5  
概念格是一种有效的数据分析和知识提取的形式化工具.然而,随着要处理的数据量的剧增,基于原始形式背景构造出的概念格结点数目庞大,占用大的存储空间,同时概念格结点中一些属性集形成的内涵,用户并不都感兴趣,因而从中提取用户需求知识费时.为了降低概念格构造的时空复杂性,增强实用性和针对性,首先采用谓词逻辑描述用户感兴趣的背景知识,并将背景知识引入到概念格结构中,提出了一种新的概念格:约束概念格.在此基础上,提出了基于背景知识的约束概念格构造算法CCLA.理论分析表明,该算法能有效地减少概念格的存储空间和建格时间.最后,采用恒星天体光谱数据作为形式背景,实验验证了该算法的有效性.  相似文献   

20.
针对普通Adaboost算法训练时间长,对复杂背景下(暗光、多角度、多姿态等)人脸检测识别率较低的问题,提出了一种改进的结合肤色检测及几何特征的Adaboost算法.采用肤色粗检筛选出候选人脸区域,同时采用新的非对称的Haar特征来训练分类器,进一步加强检测性能,提升鲁棒性和复杂背景下的宽容度实验将此算法应用到一个嵌入式系统中,结果表明:在各种复杂背景下的人脸检测中鲁棒性和宽容度均提升很多,误识率进一步降低,并且在嵌入式人脸检测的系统中具有很好的可移植性和实用性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号