首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 0 毫秒
1.
图像多尺度表示是图像处理的重要内容,常规的离散处理方法常依赖于坐标或网格的选取,因此处理结果很不稳定,本文提出了不依赖网格划分方法、不依赖坐标选取方式的快速、直接多尺度表示算法.应用该算法可直接得到任意指定一层(指定尺度)的图像,因而没有大多数算法因为逐层计算所带采的误差传播或误差扩散现象,同时该算法因保持处理前后图像的“整体”相似,因而能最大限度地体现形状保持乃至拓扑保持,算法计算非常简单,且不局限于特定类型的图像,可用于高要求的图像处理领域。  相似文献   

2.
针对以往基于关键点的目标检测存在小尺度上的检测结果不太理想,忽略关键点之间的类别语义信息的问题,提出了一种新的关键点检测算法Point-GAT。该算法通过在Hourglass和ResNeXt主干网络上加入快捷连接,解决网络深度增加带来的学习退化问题;使用反卷积和特征融合增强小尺度目标的检测效果;同时算法使用了图注意力机制,通过构建有向有权重图映射类别之间的语义关系,获得关键点之间的类别语义信息;在优化定位和回归函数的同时,加入分类损失函数分支来反映类别语义信息。在COCO数据集上实验结果表明,该算法平均精度达到了48.3%,在PASVAL VOC 2007和PASVAL VOC 2012数据集上平均精度均高于其他算法。  相似文献   

3.
一幅图像可以分解成几何特征不同的纹理部分和卡通部分,基于这两大特征提出了一种图像融合方法.利用卡通和纹理特征的差异,通过学习分别得到卡通字典和纹理字典.在融合过程中,分别利用特定的卡通和纹理字典对源图像的卡通和纹理部分进行融合,融合后的卡通和纹理部分经简单相加得到融合图像.实验结果表明,所提方法是有效的.  相似文献   

4.
土地利用信息是国土资源管理的基础和重要依据,随着高分辨率遥感图像数据的日益增多,迫切需要快速准确的土地利用分类方法。目前应用较广的面向对象的分类方法对空间特征的利用尚不够充分,在特征选择上存在一定的局限性。为此,提出一种基于多尺度学习与深度卷积神经网络(deep convolutional neural network,DCNN)的多尺度神经网络(multi-scale neural network,MSNet)模型,基于残差网络构建了100层编码网络,通过并行输入实现输入图像的多尺度学习,利用膨胀卷积实现特征图像的多尺度学习,设计了一种端到端的分类网络。以浙江省0.5 m分辨率的光学航空遥感图像为数据源进行了实验,总体分类精度达91.97%,并将其与传统全卷积网络(fully convolutional networks,FCN)方法和基于支持向量机(support vector machine,SVM)的面向对象方法进行了对比,结果表明,本文所提方法分类精度更高,分类结果整体性更强。  相似文献   

5.
土地利用信息是国土资源管理的基础和重要依据,随着高分辨率遥感图像数据的日益增多,迫切需要快速准确的土地利用分类方法。目前应用较广的面向对象的分类方法对空间特征的利用尚不够充分,在特征选择上存在一定的局限性。为此,提出一种基于多尺度学习与深度卷积神经网络(deep convolutional neural network,DCNN)的多尺度神经网络(multi-scale neural network,MSNet)模型,基于残差网络构建了100层编码网络,通过并行输入实现输入图像的多尺度学习,利用膨胀卷积实现特征图像的多尺度学习,设计了一种端到端的分类网络。以浙江省0.5 m分辨率的光学航空遥感图像为数据源进行了实验,总体分类精度达91.97%,并将其与传统全卷积网络(fully convolutional networks,FCN)方法和基于支持向量机(support vector machine,SVM)的面向对象方法进行了对比,结果表明,本文所提方法分类精度更高,分类结果整体性更强。  相似文献   

6.
随着视频数据爆发式增长,视频描述任务越来越被研究者们关注。如何让计算机像人类一样理解视频的内容并能够准确无误地用语言表达出来,是视频描述任务领域尚未得到完美解决的难题之一。针对现有代表性视频描述模型中存在的未充分利用语义信息、生成描述不准确等问题,本文基于编码器-解码器框架的视频描述模型,提出了一种融合语义增强与多注意力机制的视频描述方法。该方法首先通过视觉文本特征聚合方法,为模型编码提供高层语义指导。然后,使用Faster-RCNN网络提取视频对象特征,通过图卷积网络获取视频对象的潜在语义信息,得到增强特征。最后,引入多重注意力机制,使模型更好地利用输入信息,增强模型的学习能力。MSVD和MSR-VTT数据集上的实验结果表明,相比于基准模型,本文提出的方法能合理优化视频描述模型的输入信息,有效提取视频潜在语义,从而解决视频文本跨模态问题和生成语句的语法结构问题,并能有效提升视频描述模型的准确度和对复杂场景的描述能力,更具先进性。  相似文献   

7.
图像的多尺度表示在多种领域有着重要应用.基于形心的多尺度表示方法能有效应用于二值图像.作者提出了应用于灰度图像的基于形心的多尺度表示方法.同样,该方法能保持源图像的对称性,并且具有形状乃至拓扑的基本保持.其次,还提出了将灰度图像转为三维二值图像进行多尺度表示的方法.实例表明,以上方法在多种领域均能有效应用于灰度图像的多尺度表示.  相似文献   

8.
提出了一种基于多尺度特征提取网络的图像美学客观量化评分方法,该模型主要由多个多尺度特征提取单元级联组成,每个单元包含由3个不同卷积核组成的特征提取层、融合层和映射层。特征提取层通过联合图像的全局视图和局部视图组成网络输入端,在输出端以EMD函数为损失函数,输出分布为1~10分的概率密度质量函数,并以分布均值作为图像美学量化值。实验证明,本文方法具有可行性和有效性,解决了传统方法只进行美感二进制等级分类的问题,给出了(模拟人类思维对)图像的客观量化评分;同时在AVA数据集上获得了优于几种主流算法的分类准确度。  相似文献   

9.
PM2.5小时浓度多为单步预测。为实现PM2.5小时浓度的多步预测,基于“编码器-解码器”的序列-序列预测(Seq2Seq)模型,集合图卷积神经网络提取非欧式空间数据特征的能力以及注意力机制自适应关注特征的能力,提出了融合图卷积神经网络和注意力机制的PM2.5小时浓度多步预测(GCN_Attention_Seq2Seq)模型。并与Seq2Seq模型和使用了图卷积神经网络、未使用注意力机制的GCN_Seq2Seq模型进行了对照,以2015—2016年北京市22个空气质量监测站点的空气质量数据为样本进行实例验证,结果表明,Seq2Seq模型和图卷积神经网络(GCN)可对PM2.5小时浓度数据的时空依赖进行有效建模,注意力机制有助于减缓多步预测中的预测精度衰减,提升PM2.5小时浓度多步预测的精度。GCN_Attention_Seq2Seq模型可有效应用于多种长度的PM2.5浓度预测窗口。  相似文献   

10.
针对传统的1-v-1 SVM算法测试未知样本速度较慢的缺点提出了一种改进的1-v-1 SVM算法。该方法采用多轮投票策略减少测试过程中使用分类器的次数从而提高分类未知样本的速度。实验证明改进的算法是有效的。  相似文献   

11.
针对显微图像灰度对比度低,内容复杂度高的特点,提出一种基于小波的显微图像融合算法.将图像变换到小波域,并在此基础上进行四叉树分解融合,以消除块效应,不同于现有的小波几何分块算法,可依据图像实际情况调整,符合显微图像结构多样化、内容多变化的实际情况.实验结果表明,本文算法的融合效果理想,与同类算法相比具有更强的稳定性和适用性.  相似文献   

12.
经典的UNet网络可用于预测全分辨率空间域的密集位移场,在医学图像配准中取得了巨大成功。但对大变形的三维图像配准,还存在运行时间长、无法有效保持拓扑结构、空间特征易丢失等缺点。为此,提出一种基于交叉注意的大内核多尺度可变形医学图像配准网络(large kernel multi-scale deformable medical image registration network based on cross-attention,LK-CAUNet)。在经典UNet模型基础上,通过引入交叉注意力模块,实现高效、多层次的语义特征融合;配备大内核非对称并行卷积,使其具有多尺度特征和对复杂结构的学习能力;通过加入平方和缩放模块,实现拓扑守恒和变换可逆。基于脑部MRI数据集,将LK-CAUNet与18种经典图像配准模型进行了比较,结果表明,LK-CAUNet的配准性能较其他模型有明显提升,其Dice得分较TransMorph配准方法提高了8%,而参数量仅为TransMorph的1/5。  相似文献   

13.
为了提高隐写分析的检测率和效率,本文提出了一种加权融合的联合图像专家小组JPEG(joint photographic experts group)图像通用隐写分析方法.该方法分别计算离散余弦变换DCT(discrete cosine transform)系数块内和块间的水平、垂直和zigzag三向差分数组,采用联合概率密度矩阵来挖掘信息嵌入对DCT系数间相关性的影响,生成块内和块间三向特征.利用特征与分类类别间的互信息对特征权值进行量化,加权融合得到最终的特征向量,并使用支持向量机进行分类.对3种安全性较高的JPEG隐写算法F5、Outguess和MB2,在不同嵌入率下进行隐写分析.实验结果表明,在不同嵌入率的情况下其检测率均高于88.4%,同时特征融合算法使该方案具有更高的检测效率.  相似文献   

14.
一种基于多光谱波段选择的白细胞图像分类法   总被引:1,自引:0,他引:1  
基于多光谱波段的优化理论,在白细胞图像各波段问相关性分析的基础上,对传统最大似然分类法进行改进,提出一种对白细胞图像选择最有效部分波段进行识别的分类方法.该方法通过贝叶斯理论与其他先验知识进行融合,提高了分类准确度,克服了传统最大似然分类法在图像识别过程中具有的数据量庞大、计算程度繁冗和识别速度慢等缺点.实验结果表明,在保证分类精度基本不变的条件下使计算效率提高了2倍以上,为今后图像特征提取和图像分割奠定良好的基础。  相似文献   

15.
针对移动机器人视觉图像间的连续特性,提出了一种基于小波模极大值的图像特征匹配算法,该算法利用小波模极大值提取图像轮廓及模方位矩阵,并在轮廓图像中寻找极大区域,以该区域中心点作为图像特征点,且将区域小波模方位、特征点区域图像重心坐标和区域轮廓重心方向组合生成这些特征点的特征向量,利用这些特征向量实现图像间的特征点匹配.并通过相应的实验证明提出的新算法高效可靠.  相似文献   

16.
针对目前传染病时空分析中存在时间尺度单一的问题,提出一种面向多尺度的传染病时空分析框架.该框架综合利用自组织神经网络、核密度估计和时空扫描统计量等模型方法,从年份、季节、月份多个尺度对杭州市2006-2013年淋病、细菌性痢疾和流行性腮腺炎的时空分布特征进行了系统分析.结果表明,在人口密度高的辖区,3类传染病发病率年际变化明显,总体呈逐年下降趋势,而在人口稀疏的区县,发病率处于较低水平;各类传染病均具有明显的时空聚集性,各季节疾病高发区主要集中在杭州主城区,淋病的发病热度值无明显季节性差异,细菌性痢疾表现为夏、秋高发,冬、春低发,流行性腮腺炎则相反;淋病的时空聚类在月份分布上较分散,而细菌性痢疾的聚集时间多为每年的6-11月,流行性腮腺炎则为12月至次年5月.  相似文献   

17.
医学图像分割是计算机视觉和图像处理领域近年来研究的热点问题之一。一种基于k-means聚类和半监督学习的医学图像分割新算法被提出。在k-means聚类模型中,相似度函数是关系到聚类效果好坏的关键因素。所使用的相似度函数通过基于side-information的半监督学习方法来确定;确定后的相似度函数又被运用回k-means聚类模型中来实现对医学图像的分割。为了检验该算法效果,脑部肿瘤患者的磁共振图像被运用在实验中。分析结果表明:该算法在本文所采用的实例中能获得优于传统算法的分割效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号