首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 718 毫秒
1.
任东东  李金宝 《软件学报》2019,30(S1):94-104
现有的低光照图像目标识别方法通常将图像恢复与目标识别任务分开处理,且在图像恢复质量和计算时间上无法满足目标识别任务的要求.针对这些问题,首先,提出一种高效的图像恢复卷积神经网络架构,通过融合不同尺度的特征图来聚合多级上下文特征信息,减少卷积层的信息冗余,提高图像恢复任务的实时性.并且设计了一个局部-全局注意力模块,通过校准各特征图的局部信息和特征通道之间的关系,提高恢复网络对噪声和图像内容的区分能力.其次,提出了一种图像恢复和目标识别任务协同处理的方法.利用目标识别的高级语义信息指导图像恢复网络学习,从而突出目标的结构和纹理等特征,使恢复结果更加适应目标识别任务.实验结果表明,该方法在图像恢复质量、计算时间和目标识别率上明显优于已有方法.  相似文献   

2.
一种利用多传感器进行目标识别的方法   总被引:3,自引:0,他引:3  
针对传统单传感器目标识别利用目标信息有限、识别结果可靠性不高等缺陷 ,提出一种利用多传感器进行目标识别方法 ,这种方法充分利用了目标多重特征的信息 ,并考虑了不同特征信息在目标识别中的重要程度 ,从而得到更为接近实际效果的识别结果  相似文献   

3.
基于双基点法的多传感器数据融合   总被引:2,自引:0,他引:2  
针对具有多个特征指标的多传感器目标识别问题,提出一种基于双基点法的信息融合方法.该方法根据指标隶属度矩阵将多传感器目标识别问题转化为多目标决策问题.通过定义熵权和相对接近度,改进了传统的双基点法,从而给出目标识别算法.该方法利用熵权较好地避免了目标识别受主观因素的影响,特别适用于具有多个特征属性的多个目标的识别.仿真实例验证了所提出算法的有效性和可操作性.  相似文献   

4.
多传感器目标识别的理想点法   总被引:1,自引:0,他引:1  
针对具有多个特征指标的多目标识别问题,提出了一种基于理想点的多传感器信息融合方法.该方法根据多目标决策理论,采用TOPSIS法定义理想解,利用相对接近度给出目标识别规则.计算简单,易于计算机上实现.工件识别实例验证了算法的有效性.  相似文献   

5.
为提高目标识别的准确性和快速性,提出了基于全局和局部特征对目标识别的方法。基于颜色直方图提取全局颜色特征,利用多尺度空间来表达目标的局部特征,最后将全局和局部特征进行数据融合得到图像的识别结果。实验结果表明,该方法很好地结合了目标的整体和局部信息,能有效地识别目标,且识别效果优于单一的全局特征和局部特征的识别效果。  相似文献   

6.
针对海战场图像信息的目标检测与识别问题,论文提出一种基于 D‐S(Dempster‐Shafer)的海上舰船图像目标多特征信息融合识别方法。该方法包括三个主要内容:1)建立以舰船目标的几何特征为证据源的 D‐S 融合识别模型,这些特征计算简单,容易获取,且在舰船目标识别时具有良好的区分性;2)针对不同舰船特征,获取每个特征的基本信度赋值;3)根据舰船目标识别模型的特点,分析不同的比例冲突分配规则对舰船目标识别的鲁棒性,采用适于舰船目标识别的比例冲突分配规则。实验结果表明在舰船目标的识别中,该方法具有较高的识别精度。  相似文献   

7.
在目标检测网络(ObjectNet)和场景识别网络相结合的方法中,由于ObjectNet提取的目标特征和场景网络提取的场景特征的维度和性质不一致,且目标特征中存在影响场景判断的冗余信息,导致场景识别的准确率低。针对这个问题,提出一种改进的结合目标检测的室内场景识别方法。首先,在ObjectNet中引入类转换矩阵(CCM),将ObjectNet输出的目标特征进行转化,使得目标特征的维度与场景特征的维度相一致,以此减少特征维度不一致带来的信息丢失;然后采用上下文门控(CG)机制对特征中的冗余信息进行抑制,从而降低不相关信息的权重,提高了目标特征在场景识别中的作用。该方法在MIT Indoor67数据集上的识别准确率达到90.28%,与维护空间布局的对象语义特征(SOSF)方法相比识别准确率提高了0.77个百分点;其在SUN397数据集上识别准确率达到81.15%,与交替专家层次结构(HoAS)方法相比识别准确率提高了1.49个百分点。实验结果表明,所提方法提高了室内场景识别的准确率。  相似文献   

8.
针对人体行为最重要的motion特征,提出了基于时间上下文的二级递推异常行为识别方法.不同于传统深度学习的训练方法,本文方法不是直接从图像数据中学习特征,而是把提取的形状信息HOG特征作为训练输入.首先提取基于HOG算法的图像形状特征,采用提取到的特征训练DBN网络.其次利用已经训练好的DBN网络和Softmax分类器识别出人体粗目标区,然后根据粗目标区域的时序上下文信息,计算质心加速度.最后判断加速度的阈值,识别出异常行为的精目标区.本文将粗细目标结合的二级递推方法应用到课堂行为识别中,通过实验结果表明,该方法在运动模糊和目标密集遮挡的场景下都能较好地识别出课堂行为,识别率相比其他方法有较大提升.课堂异常行为数据分析,可在课堂动态管理和学习效果评估等方面发挥辅助作用.  相似文献   

9.
如何利用多传感器信息进行弹道导弹目标识别一直以来是反导预警系统需要解决的难点问题之一.论文从弹道导弹目标特性分析人手,提出了一种基于DSm理论的弹道导弹目标识别方法,该方法可以解决多传感器提供的关于弹道导弹特征的模糊的、相互矛盾的等信息的融合识别问题.通过仿真分析,验证了该方法的有效性.  相似文献   

10.
针对具有多个特征指标的目标识别问题,提出了基于数学规划的多传感器信息融合方法.该方法利用最大最小隶属度函数将识别系统特征矩阵转化为指标隶属度矩阵,通过求解各目标类型综合隶属度偏差最大的最优规划问题,客观地确定了特征指标的权重,根据综合隶属度给出目标识别方法.该方法较好地避免了特征指标权重选取的主观性缺陷,提高了目标识别结果的客观性和区分程度.算例分析验证了该方法的有效性和实用性.  相似文献   

11.
文章提出了一种基于识别结果反馈信息的闭环联机字符识别系统。通常的识别系统只是执行了从输入数据空间到识别结果空间的单向映射,可以看作为一种开环识别系统;而文中提出了一种闭环识别系统:它在完成初次的识别之后,还将识别结果信息反馈给系统中的规则库;规则库依据此反馈信息触发相应规则驱动识别器对输入字符进行再次识别,从而得到最终的识别结果。实验结果表明,在抽取的特征和识别方法相同的条件下,闭环识别系统的识别率将高于开环识别系统的识别率。  相似文献   

12.
杨健  杨力  盛武 《计算机仿真》2020,(1):444-447
针对传统方法存在识别时间过长、识别率较低等问题,提出一种新的识别方法———基于信息融合的光纤扰动传感故障识别方法。通过集合经验模态分解进行信号分解处理,并提取所得分量中的敏感分量。利用各敏感分量与原信号的关系值及互信息乘积绝对值作为评定标准,选择含系统信息的分量作为分析对象。利用轻量级协议算法及线性模型提取所选对象中的故障特征向量。以提取的故障特征向量为依据,利用系统灰色性故障识别方法和模糊性识别方法出发得到传感器系统故障诊断信息,获取传感器多角度信息融合故障识别,利用信息融合故障识别方法对光纤扰动传感器故障数据进行了识别。实验结果表明,所提方法有效减少了识别时间,提高了识别率。  相似文献   

13.
传统的说话人识别中,人们往往认为人耳对相位信息不敏感而忽略了相位信息对语音识别的影响。为了验证相位信息对说话人识别的影响,提出了一种提取相位特征参数的方法。分别在纯净语音和带噪语音条件下,基于高斯混合模型,通过将相位特征参数与耳蜗倒谱系数(CFCC)相结合,研究了相位信息对说话人辨识性能的影响。实验结果标明:相位信息在说话人识别中也有着重要的作用,将其应用于说话人辨识系统,可明显提高系统的识别率和鲁棒性。  相似文献   

14.
人机交互离不开情感识别,目前无论是单模态的情感识别还是多生理参数融合的情感识别都存在识别率低,鲁棒性差的问题.为了克服上述问题,故提出一种基于两种不同类型信号的融合情感识别系统,即生理参数皮肤电信号和文本信息融合的双模态情感识别系统.首先通过采集与分析相应情感皮肤电信号特征参数和文本信息的情感关键词特征参数并对其进行优化,分别设计人工神经网络算法和高斯混合模型算法作为单个模态的情感分类器,最后利用改进的高斯混合模型对判决层进行加权融合.实验结果表明,该种融合系统比单模态和多生理参数融合的多模态情感识别精度都要高.所以,依据皮肤电信号和文本信息这两种不同类型的情感特征可以构建出识别率高,鲁棒性好的情感识别系统.  相似文献   

15.
命名实体识别是文本信息处理的重要基础,已逐步成为自然语言处理的一项关键技术。文章分析了Web招聘信息抽取中的命名实体识别方法,研究了基于自然语言理解方式识别组织机构名、职位名,并实现了一个Web招聘信息抽取原型系统。经测试,本系统在命名实体识别方面取得了较满意的实验结果。正确率和召回率都在77%以上。  相似文献   

16.
在汉语语音识别中应用声调信息的研究   总被引:6,自引:0,他引:6  
声调信息在汉语普通话语音识别系统中,具有非常重要的意义。文章实现了声调特征提取的算法,并主要研究了如何应用这些特征,才能最大限度地发挥声调信息的作用,提高识别系统的性能。实验结果表明,声调特征可以和识别系统原有的特征很好地结合,合理应用声调信息能有效地提高识别系统的性能,系统的误识率下降了22.26%。  相似文献   

17.
Speech separation is an essential part of any voice recognition system like speaker recognition, speech recognition and hearing aids etc. When speech separation is applied at the front-end of any voice recognition system increases the performance efficiency of that particular system. In this paper we propose a system for single channel speech separation by combining empirical mode decomposition (EMD) and multi pitch information. The proposed method is completely unsupervised and requires no knowledge of the underlying speakers. In this method we apply EMD to short frames of the mixed speech for better estimation of the speech specific information. Speech specific information is derived through multi pitch tracking. To track multi pitch information from the mixed signal we apply simple-inverse filtering tracking and histogram based pitch estimation to excitation source information along with estimating the number of speakers present in the mixed signal.  相似文献   

18.
Recording a personal life log (PLL) of daily activities in a ubiquitous environment is an emerging application of information technology. In this work, we present a single tri-axial accelerometer-based PLL system capable of human activity recognition and exercise information generation. Our PLL system exhibits two main functions: activity recognition and exercise information generation. For activity recognition, the system first recognizes a state of daily activities based on the statistical and spectral features of the accelerometer signals. An activity within the recognized state is then recognized using a set of augmented features, including autoregressive coefficients, signal magnitude area, and tilt angle, via linear discriminant analysis and hierarchical artificial neural networks. Upon the recognition of each activity, the system further estimates exercise information that includes energy expenditure based on metabolic equivalents, stride length, step count, walking distance, and walking speed. Our PLL system operates in real-time, and the life log information it generates is archived in a daily log database. We have validated our PLL system for six daily activities (i.e., lying, standing, walking, going-upstairs, going-downstairs, and driving) via subject-independent and subject-dependent recognition on a total of twenty subjects, achieving an average recognition accuracy of 94.43 and 96.61%, respectively. Our results demonstrate the feasibility of a portable real-time PLL system that could be used for u-lifecare and u-healthcare services in the near future.  相似文献   

19.
Audio-visual speech recognition (AVSR) has shown impressive improvements over audio-only speech recognition in the presence of acoustic noise. However, the problems of region-of-interest detection and feature extraction may influence the recognition performance due to the visual speech information obtained typically from planar video data. In this paper, we deviate from the traditional visual speech information and propose an AVSR system integrating 3D lip information. The Microsoft Kinect multi-sensory device was adopted for data collection. The different feature extraction and selection algorithms were applied to planar images and 3D lip information, so as to fuse the planar images and 3D lip feature into the visual-3D lip joint feature. For automatic speech recognition (ASR), the fusion methods were investigated and the audio-visual speech information was integrated into a state-synchronous two stream Hidden Markov Model. The experimental results demonstrated that our AVSR system integrating 3D lip information improved the recognition performance of traditional ASR and AVSR system in acoustic noise environments.  相似文献   

20.
针对音、视频双模态语音识别能有效地提高噪声环境下的识别率的特性,本文设计了车载语音控制指令识别实验系统。该系统模拟车载环境,把说话时的视频信息融入到语音识别系统中,系统分为模型训练、离线识别和在线识别3部分。在线识别全程采用语音作为人机交互手段,并具备用户自适应的功能。离线识别部分将系统产生的数据分层次进行统计,非常适合进行双模态语音识别算法研究。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号