首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 78 毫秒
1.
场景分类是将多幅图像标记为不同语义类别的过程。该文针对现有方法对复杂图像场景分类性能欠佳的不足,提出一种新的基于空间语义对象混合学习的复杂图像场景分类方法。该方法以多尺度分割得到的图像对象而非整幅图像为主体进行产生式语义建模,统计各类有效特征挖掘对象的类别分布信息,并通过空间金字塔匹配,构建包含层次数据和语义信息的中间向量,弥补语义鸿沟的缺陷,训练中还结合判别式学习提高分类器的可信性。在实验数据集上的结果表明该方法具备较高的学习性能和分类精度,适用于多种类型和复杂内容图像的解译,具有较强的实用价值。  相似文献   

2.
基于形状统计模型的多类目标自动识别方法   总被引:1,自引:0,他引:1  
形状是人类视觉系统分析和识别目标的基础。针对现有方法的不足,该文提出了一种新的基于形状统计模型的多类目标自动识别方法。该模型定义形状基元对作为特征描述子,从样本图像中抽取典型基元对,聚类量化后组成形状字典。然后综合分析各类信息,通过无监督学习来统计目标的特征分布状况,构建类别形状模型。快速定位目标区域并辨识对象类别后,可结合图像分割获取精确形状。实验结果表明,该方法能准确、高效地提取多种类型和复杂结构的目标,较好解决了噪声干扰、旋转侧偏等问题,具有较强的实用价值。  相似文献   

3.
基于复杂背景的红外机场目标自动识别算法研究   总被引:2,自引:2,他引:2       下载免费PDF全文
根据复杂背景下前视红外机场目标的特点,提出了基于知识的自动目标识别算法,算法的设计以实用性为宗旨,在不影响算法性能的前提下尽量提高其实时性能:通过提取感兴趣区域来缩小处理范围,采用双阈值最大类间方差快速算法快速准确找到分割阈值,采用快速标记算法标记分割图像,利用Freeman链码描述机场的轮廓特征,根据模糊综合评判机制分析机场的目标特征。通过硬件处理平台的仿真验证,该算法对机场目标红外图像有一定的识别能力,且具有较高的实时性。  相似文献   

4.
陶冠宏  范振军 《电讯技术》2023,63(7):1036-1042
目前防窃照技术手段主要依靠图像采集设备实时采集视频流,对拍照行为进行识别检测,但受复杂环境影响,现有识别方法存在精确度低、实时性差等问题。针对上述问题,提出了一种基于实例语义图的屏幕反窃照识别算法。该算法首先通过图像分割模型U2-Net提取原图像的显著视觉目标后生成实例语义图,然后通过微调单阶段的目标检测模型YOLO-v5实现对语义图中感兴趣对象的目标检测,最后通过设计的基于Inception-ResNet的拍照识别二分类模型实现对屏幕窃照行为的识别。实验结果表明,该算法在实际场景下的平均识别准确率达到95%以上。  相似文献   

5.
该文提出一种基于空间语义模型的方法,用于高分辨率遥感图像复杂场景中典型地物目标的自动检测。该方法通过分割获取图像对象,引入主题模型统计对象的多维特征,提高了对象特性描述的精度。在此基础上,对图像中有意义的地物目标及它们之间的空间关系建模表达和定量计算,通过获取场景的语义解析树,辅助实现对复杂地物目标的准确提取和定位。在测试数据集上的实验结果表明,该文方法具有较高的智能化程度和较强的稳定性。  相似文献   

6.
基于机器学习的SAR图像目标识别方法研究   总被引:1,自引:1,他引:0  
为了提高SAR(合成孔径雷达)图像的目标识别能力,提出基于机器学习的目标识别技术。该技术以马尔可夫网络为体系,从大量的例子中学习并获得网络参数,利用贝叶斯信任传播机制为原图像找到理想的后验概率,从而生成一个边缘信息丰富的结果图。  相似文献   

7.
8.
为了改善混合高斯模型在光照突变时容易产生大量误检的缺陷,采用了一种高斯模型与均值法相结合并为前景像素建立计数器的方法。在建立背景模型时,运用多帧图像求平均值的方法初始化混合高斯模型的背景;为每帧图像的前景像素数建立计数器,并以此消除被误判为前景的区域;对检测出的前景区运用数学形态学处理,得到图像真正的前景区域。结果表明,该算法不仅克服了初始背景中的干扰,而且消除了光照突变时的误检,提高了运动目标的检测率。  相似文献   

9.
智能学习的目标识别算法研究   总被引:1,自引:0,他引:1  
李君 《红外》2003,1(2):11-17,32
学习的目的就是强化对可塑性结构的有效刺激,并形成固化的记忆模式。基于数据的机器学习是信息系统获取外界(环境)知识的重要途径,也是人工智能的一项关键技术。越来越多的研究者认为,一个系统的成功与否,不仅取决于系统所采用的结构模型,而且更取决于这个系统所包含的知识内容--“智力”含量。采用自适应优化学习的目的,就是使滤波模型具有图像目标的固有特征,从而赋予结构参数特定的知识,使图像滤波过程融入特有的智能,进而实现对复杂交化的图像具有良好的滤波性能和稳健的适应能力。  相似文献   

10.
空间目标姿态估计是有效实现各类航天任务的重要前提,基于空间光学观测图像的目标姿态估计关键一环在于快速准确地建立起观测图像与空间目标之间的“二维特征点-三维实体结构”映射关系。传统的方法往往将这一任务分解为特征提取和特征关联两个步骤序贯进行,然而在空间目标光学观测场景中,高动态的光照变化和目标的相对高速运动特点会显著降低图像特征提取的可靠性,影响后续特征关联匹配的正确率并最终降低对空间目标的姿态估计精度。针对这一问题,本文提出了一种基于语义关键点提取的光学图像空间目标姿态估计方法,利用Hourglass网络端到端地提取包含语义信息的关键点,直接实现了光学图像中二维特征点与目标三维实体结构的关联映射,并在此基础上利用EPnP算法求解待估计的目标姿态值。实验结果表明,本文所提的方法能较好地兼顾算法精度与效率,其在仿真数据集上的姿态估计最小误差为0.83°,且在数据降质的情况下平均误差依然优于传统方法。   相似文献   

11.
李青  钟将  李立力  李琪  张淑芳  张剑 《电子学报》2020,48(4):763-771
本文设计并实现了依需聚合的语义深层网查询模型——SemtoSql+.提出以长短期记忆网络为基础,采用词嵌入技术将语料库训练为模型输入的词向量;并结合依赖关系图,将SQL语句四个层级的生成问题转换为依赖关系图中槽的填充问题,同时引入注意力机制有效避免了传统模型中的顺序问题;采用随机蒙蔽机制,构建依需聚合的增强型SemtoSql+模型.  相似文献   

12.
该文针对行人识别中的特征表示问题,提出一种混合结构的分层特征表示方法,这种混合结构结合了具有表示能力的词袋结构和学习适应性的深度分层结构。首先利用基于梯度的HOG局部描述符提取局部特征,再通过一个由空间聚集受限玻尔兹曼机组成的深度分层编码方法进行编码。对于每个编码层,利用稀疏性和选择性正则化进行无监督受限玻尔兹曼机学习,再应用监督微调来增强分类任务中视觉特征表示,采用最大池化和空间金字塔方法得到高层图像特征表示。最后采用线性支持向量机进行行人识别,提取深度分层特征遮挡等与目标无关部分自然分离,有效提高了后续识别的准确性。实验结果证明了所提出方法具有较高的识别率。  相似文献   

13.
一种基于复数域中二维特征提取的人脸识别方法   总被引:2,自引:0,他引:2  
该文提出了一种新的基于复数域中的二维特征提取方法进行人脸识别。该方法首先对人脸样本进行镜像变换,根据原始人脸样本和相应的镜像样本分别计算偶对称样本和奇对称样本,通过奇偶加权因子将偶对称样本与奇对称样本组成复数样本,然后在复数域中分别定义复图像类内散布矩阵和复图像类间散布矩阵,并求解一组最优复投影轴,将复人脸样本投影到这组最优复投影轴上来提取人脸特征,最后采用最近邻距离分类器来分类所提取的特征。该方法在NUST603人脸图像库中进行了实验,实验结果表明该方法获得了较好的识别效果。  相似文献   

14.
孟昕 《电子科技》2019,32(12):84-86
为了提升数字化法律文书知识库的建设效率,文中提出了基于深度学习理论的法律文书识别方法。该方法基于长短期记忆(LSTM)网元结构构建深度神经网络,引入遗忘门进行网元的状态更新,使用Softmax函数作为非线性传播函数,实现自然语言中的实体识别。经测试,该方法可以有效的提取法律文书中的当事人姓名、案由和审判机构等;在文中所采用的测试集上,相较于CRFs算法,该方法在准确率、召回率和F上均可以取得约10%的提升。  相似文献   

15.
一种基于目标红外特征的目标分类识别方法   总被引:3,自引:2,他引:1  
基于目标的红外选择性,提出了目标的9个特征量,并以它们为分量组成目标的特征向量,以此来进行目标的分类识别。由于特征量单位不统一,提出了一种近邻分类法。文中用3类飞机的红外图像进行实验。实验表明,用这种方法把提出的红外特征量用于目标的分类识别效果很好。  相似文献   

16.
基于语义的文本流形研究   总被引:2,自引:0,他引:2       下载免费PDF全文
杨震  范科峰  雷建军  郭军 《电子学报》2009,37(3):557-561
 本文通过引入包括Isomap流形降维、查询语义词典(WordNet)等高度非线性的方法,期望将文本信息处理领域长期专注于"语法"层次的研究,演进到"语义"的层次.利用流形学习工具研究了中文词汇在语义空间(分类空间)的分布聚集情况,通过利用WordNet词典进行了短信聚类的研究.实验结果表明,本文的方法能够更好地反映文本之间的内在联系.  相似文献   

17.
古籍碑刻承载着丰富的历史文化信息,但是由于自然风化浸蚀和人为破坏使得碑石上的文字信息残缺不全。古碑文语义信息多样化且样例不足,使得学习行文语义补全识别残损文字变得十分困难。该文试图从字形空间语义建模解决补全残损汉字进行识别理解这一挑战性任务。该文在层级拆分嵌入(HDE)编码方法的基础上使用动态图修补嵌入(DynamicGrape),对待识别汉字的图像进行特征映射并判别是否残损。如未残损直接转化为层级拆分编码,输入二部图推理字节点到部件节点的边权重,比对字库编码识别理解;如残损需要在字库里检索可能字和部件,对汉字编码的特征维度进行选择,输入二部图推理预测可能的汉字结果。在自建的数据集以及中文自然文本(CTW)数据集中进行验证,结果表明二部图网络可以有效迁移和推理出残损文字字形信息,该文方法可以有效对残损汉字进行识别理解,为残损结构信息处理开拓出了新的思路和途径。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号