首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
为改进传统识别方法中各种分类器对目标区域分类错误的状况,在分类器中加入语义联想的机制,通过语义网的语法结构对分类出错的区域进行重新分类,直到将目标区域分类满足语法结构;为实现多目标的准确定位,引入视觉焦点吸引力的概念,通过分块操作提取最佳吸引力点来定位目标。实验结果表明,这两个改进将目标识别率提高了2%-8%,实现了对复杂场景中遮挡的多目标数目的确定和具体位置的定位。  相似文献   

2.
为了实现复杂自然场景中多类目标的识别与分割,本文利用条件概率模型(CM)对目标特征进行建模,融合了纹理特征、纹理环境特征和位置特征,并采用场景类别对各类目标间的相互约束关系进行建模,在此基础上研究基于场景类别的条件概率模型(sCM)在多类目标识别与分割中的应用。本文选用Oliva&Torralba数据库对模型进行实验并与国外其他方法进行了比较。实验结果表明,该算法在多类目标识别与分割中取得很好的结果,在提高总体识别率的同时提高了物体边缘部分识别与分割的正确率,更有效地提高了视觉效果。  相似文献   

3.
张怡萌  陈宁  余顺年 《计算机仿真》2022,(2):476-481,486
针对于场景识别问题,提出一种基于开源的室外场景数据集以及自定义采集的数据集在deepLabV3+深度学习模型上进行实验,并运用一种改进的K-近邻算法对DeepLabV3+深度学习模型进行优化.与现有的测试数据集的方法不同,省去了对数据集进行标签的工作,减少了大量的前期准备工作,提高了模型的计算效率以及分类模型的准确率和...  相似文献   

4.
视频聚类是视频索引和检索的重要组成部分.本文针对镜头已分割好的视频如何提取更高语义层次的场景,考虑帧图像间以帧分块的局部似然比特征和小波变换的全局边缘特征相结合的综合相似性度量,利用视频编辑的一种常用特征及代表性镜头的选取原则,给出了一种新的语义场景的提取算法.数值实验表明该算法对基于对话类的视频类型有很好的场景提取效果,与WBS(Window-based Sweep Algorithm)算法相比,查全率和查准率分别提高了8.7%和28.4%.  相似文献   

5.
《计算机工程》2019,(12):308-313
多层次多视图模型是在不确定需求环境下进行业务建模的主要方法,不同层次或不同视图模型之间的语义一致性直接影响业务建模的完整性。鉴于此,设计一种业务目标模型与业务场景模型的语义一致性验证方法。分别以范畴模型和扩展Petri网模型代表业务目标模型和业务场景模型,通过定义形式化业务目标模型的紧邻序列和形式化业务场景模型的执行顺序序列,设计这两种模型之间完全语义一致性、部分语义一致性和弱语义一致性的验证条件和验证步骤。Travel Agency业务系统上的一致性验证结果证明了该方法的可行性和有效性。  相似文献   

6.
图像场景分析是目前计算机视觉领域的研究热点,体现了场景与目标之间的包含关系。在分析过程中合理的使用基于上下文关系的知识可以提高场景分析模型的适用性和目标识别的准确率。从"图像集——场景——目标——部分——视觉词汇"这种层次的角度进行场景分析,将全局上下文信息和局部上下文信息同时融入到基于HDP的生成图模型中,在场景层和目标层这两个不同的层次上,共同作用于场景分析。场景分析的结果可以用来约束目标识别,目标识别的结果可以反馈作用于场景分析。  相似文献   

7.
目的 场景图能够简洁且结构化地描述图像。现有场景图生成方法重点关注图像的视觉特征,忽视了数据集中丰富的语义信息。同时,受到数据集长尾分布的影响,大多数方法不能很好地对出现概率较小的三元组进行推理,而是趋于得到高频三元组。另外,现有大多数方法都采用相同的网络结构来推理目标和关系类别,不具有针对性。为了解决上述问题,本文提出一种提取全局语义信息的场景图生成算法。方法 网络由语义编码、特征编码、目标推断以及关系推理等4个模块组成。语义编码模块从图像区域描述中提取语义信息并计算全局统计知识,融合得到鲁棒的全局语义信息来辅助不常见三元组的推理。目标编码模块提取图像的视觉特征。目标推断和关系推理模块采用不同的特征融合方法,分别利用门控图神经网络和门控循环单元进行特征学习。在此基础上,在全局统计知识的辅助下进行目标类别和关系类别推理。最后利用解析器构造场景图,进而结构化地描述图像。结果 在公开的视觉基因组数据集上与其他10种方法进行比较,分别实现关系分类、场景图元素分类和场景图生成这3个任务,在限制和不限制每对目标只有一种关系的条件下,平均召回率分别达到了44.2%和55.3%。在可视化实验中,相比...  相似文献   

8.
潜在语义分析在进行大规模语义检索时计算效率较低、存储开销较大。针对该问题,提出一种基于聚类的潜在语义检索算法。通过文档之间的结构关系对文档进行聚类,利用簇代替文档分析潜在语义,以此减少处理文档的个数。实验结果表明,该算法能减少查询时间,且检索精确度较高。  相似文献   

9.
小波分析和神经网络在水下目标识别中的研究   总被引:1,自引:0,他引:1  
研究水下目标识别问题.由于环境因素的影响,采集到的水下目标回波信号中含有大量噪声且信号频率范围大,传统方法不能有效提取信号特征导致水下目标识别率低.为了提高水下目标识别的准确率,提出一种基于小波分析和BP神经网络组合的水下目标识别方法(W-BPNN).采用小波对水下目标回波信号进行去噪处理,滤除噪声信号.通过小波包对信号的特征进行提取,提取出最能反映目标本质性质的特征向量,对提取的特征向量作为BP神经网络的输入进行识别.为了验证W-BPNN算法有效性,在Matlab平台上对3类水下目标进行了仿真.结果表明,相对于传统识别算法,W-BPNN获得了更高的识别准确率,证明是有效的水下目标识别方法.  相似文献   

10.
为了实现复杂自然场景中多类目标的识别与分割,利用条件随机场(CRF)对目标特征进行建模,并在此基础上运用过分割算法将图片分为有限个连续区域,提出一种新的基于区域的CRF模型,即R-CRF模型,并采用Joint-boost算法对标注样本进行训练,研究基于主题的R-CRF模型在多类目标识别与分割中的应用。MSRC-21类数据库的实验结果表明,该算法在多类目标识别与分割中取得的结果优于国内外其他算法,尤其对于其他算法中正确率很低的形状多变而样本少的高结构物体的识别和分割取得了很好的结果。  相似文献   

11.
A probabilistic 3D object recognition algorithm is presented. In order to guide the recognition process the probability that match hypotheses between image features and model features are correct is computed. A model is developed which uses the probabilistic peaking effect of measured angles and ratios of lengths by tracing iso-angle and iso-ratio curves on the viewing sphere. The model also accounts for various types of uncertainty in the input such as incomplete and inexact edge detection. For each match hypothesis the pose of the object and the pose uncertainty which is due to the uncertainty in vertex position are recovered. This is used to find sets of hypotheses which reinforce each other by matching features of the same object with compatible uncertainty regions. A probabilistic expression is used to rank these hypothesis sets. The hypothesis sets with the highest rank are output. The algorithm has been fully implemented, and tested on real images.  相似文献   

12.
针对大规模Bayes网络的知识表示和推理等问题,使用面向对象的方法扩展Bayes网络结构,提出了一种新的概率图模型——对象概率模型(OPM).该模型充分利用层次结构中所蕴含的条件独立性,有效地降低了知识表示的复杂度.在Bayes网络消元推理算法的基础上设计了OPM的一种有效的推理算法,该算法可以根据需要调节推理的计算量,在一定程度上解决了概率推理的计算的复杂度问题.将OPM用于解决图像中文本的自动检测与定位问题,实验结果验证了模型的有效性.  相似文献   

13.
随着科技的发展与进步,人工智能已逐渐成为新一轮产业变革的核心驱动力,其中自动驾驶领域被给予了前所未有的关注。基于深度学习算法,设计了一个道路场景物体识别模型。首先为数据集制作,收集道路场景数据,做数据增强操作;其次,设计道路场景物体识别方案,选取深度学习网络VGG16和SSD框架进行构建;再次,将传统的车道线检测算法与深度学习物体识别算法相结合,使得模型在识别车辆、行人、动物等物体的同时,进行车道线检测,增加了模型检测功能;最后,在不同的天气,光照环境下,对模型进行测试。测试结果表明,设计的道路场景物体识别模型具有较好的检测识别效果,在光照变化和天气影响下,亦能达到较高的准确率。  相似文献   

14.
韦向峰  张全  熊亮 《计算机科学》2006,33(10):152-155
汉语语音识别的研究越来越重视与语言处理的结合,语音识别已经不是单纯的语音信号处理。N-gram语言模型应用到语音识别系统中,大大增强了系统的正确率和稳定性,但它也有其自身的局限性,使得语音识别出现许多语法和语义的错误结果。本文分析了语音识别产生语音和文字方面的错误的原因和类型,在概念层次网络语言模型的基础上提出了一种基于语句语义分析和混淆音矩阵的语音识别纠错方法。通过三个发音人、5万字的声音语料和216句实验语句的纠错测试,本文的纠错系统在纠正语义搭配型错误方面有比较好的表现,可克服N-gram语言模型带来的一些缺陷。本文提出的纠错方法还可以融合到语音识别系统中,以便更好地为语音识别的纠错处理服务。  相似文献   

15.
混合概率典型相关性分析   总被引:4,自引:0,他引:4  
典型相关性分析(canonical correlation analysis, CCA)是一种用来分析2组随机变量之间相关性的统计分析工具,但作为一种线性数学模型,CCA不足以揭示真实世界中大量存在的非线性相关现象.采用局部化的方法,在概率典型相关性分析(probabilistic CCA, PCCA)的基础上,使用概率混合模型框架,提出了混合概率典型相关性分析模型(mixture of probabilistic CCA, MixPCCA)以及估计模型参数的2阶段期望最大化(expectation maximization, EM)算法,并给出了使用聚类融合确定局部线性模型数量的方法和MixPCCA模型应用于模式识别的理论框架.在手写体数据集USPS和MNIST上的实验证明,MixPCCA模型通过混合多个局部线性PCCA模型不仅提供了一种捕捉复杂的全局非线性相关性的解决方案,而且还具备检测只在局部区域才存在的相关性的能力.  相似文献   

16.
针对城市场景标签获取的高额成本问题,文中提出结合自集成和对抗学习的域自适应城市场景语义分割方法.对于源域和目标域的较大域间差异问题,采用风格转换的方法将源域数据集合成具有目标域风格的新数据集,作为新的源域数据集,从而有效减少源域与目标域的域间差异.对于目标域的域内差异问题,引入自集成方法,构造教师网络,利用教师网络在目...  相似文献   

17.
杜晓旭  钱沄涛 《计算机工程》2005,31(22):164-166
在很多应用中,组合使用多个分类器可以降低分类错误率。该文就是基于这个思想提出了新的人脸识别算法,即加强概率推理模型。在该算法中,将分类任务划分成多个子分类器,每个子分类器集中于一些难分类的样本,然后组合这些子分类器形成一个强的分类器。试验结果表明算法的识别率比原来的概率推理模型的识别率提高了1.8%。  相似文献   

18.
提出了一种基于目标识别与显著性检测的图像场景多对象分割方法。该方法的步骤包括:在图像训练集上训练语义对象的检测器,用来检测输入图像中对象的位置,标定对象的包围盒;对输入的图像进行过分割处理,得到超像素集合,根据包围盒的位置和超像素的语义概率值计算兴趣区域;在3种稠密尺度上进行场景显著性检测,得到输入图像的显著图;在兴趣区域内计算超像素的邻接关系,形成邻接矩阵,构建条件随机场模型,将多对象分割问题转化成多类别标记问题,每一个对象是一种类别;以每个超像素作为场模型的节点,超像素的邻接关系对应场模型中节点之间的连接关系,将显著性和图像特征转化为节点和边的权重值;利用图割算法,在条件随机场模型上进行优化,迭代终止时得到像素的对象标记结果,从而实现对多个对象的分割。实验结果表明该方法效果较好。  相似文献   

19.
Probabilistic Models of Appearance for 3-D Object Recognition   总被引:6,自引:0,他引:6  
We describe how to model the appearance of a 3-D object using multiple views, learn such a model from training images, and use the model for object recognition. The model uses probability distributions to describe the range of possible variation in the object's appearance. These distributions are organized on two levels. Large variations are handled by partitioning training images into clusters corresponding to distinctly different views of the object. Within each cluster, smaller variations are represented by distributions characterizing uncertainty in the presence, position, and measurements of various discrete features of appearance. Many types of features are used, ranging in abstraction from edge segments to perceptual groupings and regions. A matching procedure uses the feature uncertainty information to guide the search for a match between model and image. Hypothesized feature pairings are used to estimate a viewpoint transformation taking account of feature uncertainty. These methods have been implemented in an object recognition system, OLIVER. Experiments show that OLIVER is capable of learning to recognize complex objects in cluttered images, while acquiring models that represent those objects using relatively few views.  相似文献   

20.
In order to solve low separability and rough details in scene recognition,remote sensing image scene oriented convolutional neural network recursive recognition model is presented.Firstly,deep convolutional neural network with multi|convolutional layers and multi|pooling layers is constructed by multi|resolution scenes.Then quad|grids are subdivided to DCNN scene recursive recognition based on Confusion Index (CI)by softmax probability,and multi|sliding windows are used to tune recursively for accurately locating scene targets.Experimental results show that the proposed model can adapt scene recognition with different scale,and significantly improve the accuracy compared with the commonly used DCNN.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号