首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
针对目前细粒度图像分类算法存在的局部区域特征捕捉不全面的问题,在B-CNN算法基础上提出了一种基于注意力机制的细粒度图像分类算法。首先利用数据增强的6种方式对训练数据集进行扩充,然后在B-CNN算法的特征提取中引入注意力机制,使用卷积注意力模块CBAM精准获取图像局部区域特征,最后融合特征进行分类。改进后的算法分别在CUB-200-2011和Stanford Cars两个数据集上进行实验,与当前先进算法比较,所提算法提高了细粒度图像的分类效果。  相似文献   

2.
针对现有的大部分细粒度图像分类算法都忽略了局部定位和局部特征学习是相互关联的问题,提出了一种基于集成迁移学习的细粒度图像分类算法。该算法的分类网络由区域检测分类和多尺度特征组合组成。区域检测分类网络通过类别激活映射(class activation mapping,CAM)方法获得局部区域,以相互强化学习的方式,从定位的局部区域中学习图像的细微特征,组合各局部区域特征作为最终的特征表示进行分类。该细粒度图像分类网络在训练过程中结合提出的集成迁移学习方法,基于迁移学习,通过随机加权平均方法集成局部训练模型,从而获得更好的最终分类模型。使用该算法在数据集CUB-200-2011和Stanford Cars上进行实验,结果表明,与原有大部分算法对比,该算法具有更优的细粒度分类结果。  相似文献   

3.
以舰船为研究对象,研究高分辨遥感图像的多尺度多目标检测中的关键技术,主要解决多尺度多目标识别和细粒度分类准确率低等问题.在目标定位方面,利用特征金字塔深度网络定位多目标区域,创建一个在所有尺度上均具有语义信息的特征金字塔,有效解决多尺度多目标数据定位准确率低这一关键问题;在目标识别方面,利用共享CNN网络重建输入图像、优化多任务损失函数提取细粒度分类目标结构特征,提高细分目标识别准确率.与GoogLeNet、Faster R-CNN和Yolo三种目标检测算法对比实验表明,利用特征金字塔和重建输入图像可有效检测多目标多尺度的细粒度船舶对象,漏检率为1.5%,细粒度分类识别平均准确率为92.67%.  相似文献   

4.
细微的类间差异和显著的类内变化使得细粒度图像分类极具挑战性。为了对鸟类图像进行细粒度识别,提出一种基于跨层精简双线性池化的深度卷积神经网络模型。首先,根据Tensor Sketch算法计算出多组来自不同卷积层的精简双线性特征向量;其次,将归一化后的特征向量级联送至softmax分类器;最后,引入成对混淆对交叉熵损失函数进行正则化以优化网络。提出的模型无需额外的部件标注,可进行端到端的训练。结果表明,在公开的CUB-200—2011鸟类数据集上,该模型取得了较好的性能,识别正确率为86. 6%,较BCNN提高2. 5%。与多个先进细粒度分类算法的对比,验证了提出模型的有效性和优越性。  相似文献   

5.
细粒度图像分类是对某一类别下的图像子类进行精确划分.细粒度图像分类以其特征相似、姿态各异、背景干扰等特点,一直是计算机视觉和模式识别领域的研究热点和难点,具有重要的研究价值.细粒度图像分类的关键在于如何实现对图像判别性区域的精确提取,已有的基于神经网络算法在精细特征提取方面仍有不足.为解决这一问题,本文提出了一种多尺度反复注意力机制下的细粒度图像分类算法.考虑到高、低层级的特征分别具有丰富的语义、纹理信息,分别将注意力机制嵌入到不同尺度当中,以获取更加丰富的特征信息.此外,对输入特征图先后采取通道和空间注意,该过程可以看作是对特征矩阵的反复注意力(re-attention);最后以残差的方式,将注意力结果与原始输入特征相结合,将不同尺度特征图的注意结果拼接起来送入全连接层,以更加精确地提取显著性特征.在国际上公开的细粒度数据集(CUB-200-2011、FGVC Aircraft和Stanford Cars)上进行实验仿真,分类准确率分别达到86.16%、92.26%和93.40%;与只使用ResNet50结构相比,分别提高了1.66%、1.46%和1.10%;明显高于现有经典算法,也高于人类表现,验证了本文算法的有效性.  相似文献   

6.
针对现有细粒度图像分类算法普遍存在的模型结构复杂、参数多、分类准确率较低等问题,提出一种注意力特征融合的SqueezeNet细粒度图像分类模型.通过对现有细粒度图像分类算法和轻量级卷积神经网络的分析,首先使用3个典型的预训练轻量级卷积神经网络,对其微调后在公开的细粒度图像数据集上进行验证,经比较后选择了模型性能最佳的SqueezeNet作为图像的特征提取器;然后将两个具有注意力机制的卷积模块嵌入至SqueezeNet网络的每个Fire模块;接着提取出改进后的SqueezeNet的中间层特征进行双线性融合形成新的注意力特征图,与网络的全局特征再融合后分类;最后通过实验对比和可视化分析,网络嵌入Convolution Block Attention Module(CBAM)模块的分类准确率在鸟类、汽车、飞机数据集上依次提高了8.96%、4.89%和5.85%,嵌入Squeeze-and-Excitation(SE)模块的分类准确率依次提高了9.81%、4.52%和2.30%,且新模型在参数量、运行效率等方面比现有算法更具优势.  相似文献   

7.
针对SSD多尺度目标检测过程中存在的目标漏检和错检问题,提出了一种融入多维空洞卷积和多尺度特征融合的目标检测算法。在卷积神经网络输出的多尺度特征中,浅层具有更多的细节信息,深层具有更多的语义信息,根据这一特点,对浅层网络采用了3种多维空洞卷积的浅层特征增强模块,获得具有语义信息的特征图,将增强后的特征图进行下采样,融合不同层的特征;同时在深层网络引入通道注意力模块,对通道进行权重分配,抑制无用信息,提高目标的检测性能。研究结果表明:该算法在PASCAL VOC数据集上检测精度为79.7%,比SSD算法提高了2.4%;在KITTI数据集上检测精度为68.5%,比SSD算法提高了5.1%,检测速度达到了实时性的要求,有效地改善了目标的漏检和错检。  相似文献   

8.
为解决精细车型识别中特征不具有代表性,且识别准确率低的问题,提出了基于多尺度跃层卷积神经网络(CNN)的车型识别方法。通过多个不同尺度的跃层卷积神经网络,提取适用于精细车型识别的低层局部特征和高层全局特征,并分别训练Softmax分类器。利用自适应方式融合方法,将多个单一尺度跃层卷积神经网络的识别结果进行融合,调整不同网络对识别结果的贡献。实验中车型识别准确率达到97.59%。实验结果表明多尺度跃层卷积神经网络适用于精细的车型识别,并能提高识别的准确率。  相似文献   

9.
广泛应用于道路车辆检测的环形线圈车辆检测器对于车辆车型的实时分类正确率较低,主要原因是面对各种车辆电磁感应特性的复杂多变和未知车型的新车辆层出不穷问题,其模式固定的分类模型难以胜任.基于通过环形线圈时车辆电磁感应特性波形提出一种新的车辆车型实时判别方法:运用主分量分析法提取特征,采用自适应共振神经网络聚类建立车辆类别模式,动态划分各车型包含的类别模式;以半监督学习方式在线增加未知车型的新车辆模式,算法自适应新车辆的车型识别. 7种车型的道路现场实时车型识别实验平均正确率为91.3%,加入新模式自动识别后提高至92.5%;Alexnet多层卷积神经网络算法的对比实验中,训练集和测试集正确率分别为99.5%和87.1%,相差较大.实验结果验证了本文方法在道路车辆模式不断变化情况下实现车型识别的可行性.  相似文献   

10.
在对中分辨率遥感图像进行场景分类时,传统的特征提取方法无法提取全面的特征,若使用卷积神经网络进行场景分类,同一大小的卷积核无法提取尺寸大小各异的地物特征,导致分类精度降低.为了提取不同尺寸的地物特征,提高分类精度,本文提出一种基于多尺度特征融合的中分辨率遥感场景分类算法.对传统的卷积神经网络进行改进以适应中分辨率遥感数据集,并在其基础上添加多尺度池化,将连接多层次的特征图谱输入到全连接层进行分类.实验表明,多层特征融合方法提取的特征信息比单层多尺度池化方法提取的特征信息更全面,分类效果更优.与其他的传统分类方法相比,本文方法获得更好的分类结果.  相似文献   

11.
针对传统卷积神经网络(CNN)稀疏的网络结构无法保留全连接网络密集计算的高效性和在实验过程中卷积特征利用率低造成的分类结果不准确或收敛速度较慢的问题,提出了一种基于CNN的多尺度方法结合反卷积网络的特征提取算法(MSDCNN)并对腺癌病理图像进行分类。首先,利用反卷积操作实现不同尺度特征的融合,然后利用Inception结构不同尺度卷积核提取多尺度特征,最后通过Softmax方法对图像进行分类。在腺癌病理细胞图像进行的分类实验结果表明,在最后的卷积特征尺度相同的情况下,MSDCNN算法比传统的CNN算法分类精度提高了约14%,比同样基于多尺度特征的融合网络模型方法分类精度提高了约1.2%。  相似文献   

12.
针对高光谱图像分类中光谱特征的高度非线性问题,提出一种基于多层感知器卷积层和批标准化层的改进卷积神经网络模型,提高模型在光谱域处理的非线性特征提取能力.该算法通过构建七层网络结构,实现多层局部感知结构,逐个像素对光谱信息开展分析,区分不同目标物的光谱信息,将全光谱段集合作为输入,舍去空间信息,利用动量梯度下降训练算法对多层局部感知卷积神经网络训练,实现对不同目标物体光谱特征的提取与分类.实验中,采用两组高光谱遥感影像进行对比分析,以Pavia University数据集为例,在3 600个训练样本情况下,测试集为1 800个样本,本文方法正确率为90.23%,LeNet-5正确率为87.94%,Linear-SVM正确率为90.00%;在21 000个训练样本情况下,测试集为全部样本,本文方法正确率为97.23%,LeNet-5正确率为96.64%,Linear-SVM正确率为92.40%.实验结果表明,在训练集较小的情况下,本文方法优于传统神经网络,能有效提取数据特征,并且在精度上和计算成本上略优于在小样本分类中具有高效和鲁棒性良好的SVM算法.在大规模训练集时,本文方法表现出良好的学习能力,在分类精度上优于LeNet-5.本文提出的多层局部感知网络结构增强了对非线性特征的学习能力,无论训练集规模大小,都比传统的SVM和一般的深度学习网络更能有效的利用高光谱图像中的逐像素点的光谱域信息,能有效提高分类精度.  相似文献   

13.
语义分割的目标是对图像进行像素级分类并分割为表示不同语义的区域,以便实现对更复杂场景的分析及理解。考虑到更大的卷积核对目标的定位及分割都有促进作用,故提出的网络里使用了一种基于上下文情景结构层(contextual structure)的卷积神经网络,既增大了感受野的范围,同时解决了增大传统卷积核带来大量参数的问题。自然图像中的目标往往具有不同的尺度和纵横比,提取丰富的细节信息和上下文信息对于像素级的预测至关重要。提出的网络同时实现了多尺度特征的提取,从规模较小区域到规模较大区域,再到完整目标,可以有效提取局部信息和全局信息,达到分割多尺度目标的效果。实验中使用PASCAL VOC 2012数据集对提出的方法进行评测,在综合考虑算法复杂度以及运行时间效率的基础上,提出算法取得了更好的实验结果。  相似文献   

14.
为了能够在细粒度图像特征表示中探索出相似层结构中的共享信息,提出了一种多任务学习框架,联合优化卷积神经网络中的Softmax Loss和Triplet Loss,基于此框架,设计广义三元组嵌入标签结构,以发现不同级别中具有相似性的相关图像。在Stanford Cars和CUB200-2011两个细粒度数据集上进行实验,结果表明这种方法不仅可以实现较好的分类性能,还能够提高在细粒度数据集上不同级别的标签结构的图像检索精度,这在电子商务中相关产品的推荐方面具有重要意义。  相似文献   

15.
为了解决行人检测过程中漏检的问题,提出一种将传统检测方法与区域候选网络相结合的方法。运用局部无关通道特征(LDCF)方法对图片进行粗检测,筛选出在训练集上漏检的窗口。采用k均值(k-means)算法对数据集中漏检的目标框进行聚类,得到合适的尺度与长宽比。针对相应的尺度与长宽比训练区域候选网络(RPN),提高粗检测阶段的召回率。利用改进的颜色自相似特征以及简化的卷积网络结构对窗口特征进行更为准确的描述。使用改进的深度网络提取特征,并训练级联分类器,对粗检窗口进行精细判断。在行人检测数据集TUD-Brussels和Caltech上进行实验,得到的平均对数漏检率分别为46%和9%。  相似文献   

16.
细粒度识别的主要目的是在相同基本类别下对其繁多的子类别进行区分。不只局限于头和躯干的定位现状,提出了一种基于Faster RCNN联合语义提取和检测的分类方法。通过引入自上而下的方法来生成七个小语义部位,既大大减少了候选区域的个数,又提高了分类的效率。检测子网可以和区域候选生成网络(RPN)共享卷积特征,结果使得区域建议几乎不花时间,从而可以生成高质量并且具有局部特征的区域建议框,便于Fast RCNN的检测。相对于其他鸟类识别研究,实验中鸟类识别准确率达到了88.37%,提高了识别效率。说明联合语义的Faster RCNN网络适用于鸟类的细粒度识别。  相似文献   

17.
针对旋转机械故障诊断需要复杂特征提取过程,且对混有噪声的信号故障识别准确率偏低的问题,提出了一种基于注意力机制的多尺度端到端故障诊断方法。该方法在输入端引入随机丢弃抑制输入噪声,然后利用故障信号具有多个固有振动模态的特点,通过多尺度粗粒度层获取不同尺度下振动信号,进而利用全卷积网络实现多尺度特征提取,接着采用注意力机制将多尺度特征进行融合,最后利用多分类函数实现旋转机械故障诊断。分别在凯斯西储大学轴承数据集和变速箱数据集对该方法的有效性进行验证,结果表明:该方法的故障识别率高达100%;人为引入噪声信号的信噪比为-4dB时,在凯斯西储大学轴承数据集F上的故障识别正确率为84.77%,在齿轮箱数据集上的识别正确率为78.365%,识别正确率明显高于其他机器学习算法,证明了该方法具有较强的抗噪声干扰能力。  相似文献   

18.
由于X光胸片影像受到各类组织阴影及病灶的影响,目前肺野分割算法的结果往往存在空洞或者边缘不光滑等问题。针对此类问题,该文提出了一种基于多尺度卷积和特征金字塔的肺野分割网络,此网络利用多尺度卷积模块和多尺度特征融合模块提取和融合多尺度特征,在JSRT数据集上PA和Dice指标分别达到98.76%和97.94%,在Montgomery数据集上PA和Dice指标分别达到了98.96%和97.85%。该文将肺野分割网络进一步应用到肺炎筛查任务中,提出了一种基于肺野分割的数据增强方法,该方法通过分别“擦除”左右肺部的随机区域增加了样本的多样性,从而提高了肺炎分类任务的准确率。实验表明,这种数据增强方法可以将新冠肺炎检出率至少提高2.2%。  相似文献   

19.
提出了一种新颖的细粒度图像分类算法。首先从神经网络VGG 16中提取出卷积特征后进行特征筛选,得到选择性卷积特征;然后利用最大后验高斯混合模型对特征进行分类,从而解决细粒度图像分类问题。造成细粒度图像分类困难的主要原因是类内差异和类间差异。利用卷积特征对图像具有更细致的描述能力,可以有效地减小类内差异;同时,对从VGG 16中得到的卷积特征进行筛选,能够较大程度地摆脱背景干扰,从而提高类间差异。最后,采用基于最大后验的高斯混合模型对这些选择性卷积特征进行分类。实验结果表明,本文算法不仅克服了两种差异带来的问题,还解决了传统高斯混合模型缺少大量实验数据的困难。在目前流行的5种细粒度图像数据集上,本文算法都有更好的分类效果。  相似文献   

20.
针对复杂驾驶场景下的目标检测问题,提出一种基于扩张卷积特征自适应融合的目标检测算法.采用单阶段目标检测网络RetinaNet作为基本框架,其包含卷积特征提取、多尺度特征融合以及目标分类与回归子网.为提高网络对多尺度特征的提取能力,设计了基于不同扩张率组合的残差卷积分支模块,以获取不同感受野下的目标特征图;然后,将不同尺度下的特征通过网络自适应学习的参数融合后输出,用于后续的目标预测;最后在大规模且多样化的复杂驾驶场景数据集BDD100K上进行实验.结果 表明,利用扩张残差卷积分支模块与特征自适应融合算法能够分别将网络的平均精度均值由0.330提升至0.338与0.344,并在采用扩张卷积特征自适应融合的情况下达到了0.349.所提算法能够有效提升目标检测算法在复杂驾驶场景下的检测性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号