排序方式: 共有424条查询结果,搜索用时 78 毫秒
401.
针对目前面向注意力机制语义分割算法不能兼顾分割精度与实时性,以及难以满足在现实场景中应用的问题,提出一种基于条带池化注意力的实时语义分割算法.首先采用轻量级骨干网络提取特征信息,结合不同网络层语义差异构建特征融合模块获得不同尺度的上下文信息以提升分割精度;然后利用基于注意力的条带注意力模块(SAM)提高远距离信息被弱化的注意力,并在SAM中加入水平方向的条带池化以降低编码全局上下文的运算量.实验结果表明,所提算法能够得到较高分割精度且满足实时性要求;在Cityscapes测试集上平均交并比为70.6%,分割速度达到了92帧/s;在CamVid测试集上平均交并比为66.4%,分割速度达到了196帧/s. 相似文献
402.
知识蒸馏能有效地将教师网络的表征能力迁移到学生网络,无须改变网络结构即可提升网络的性能.因此,在性能优异的目标分割主干网HRNet(High-Resolution Net)中构建自蒸馏学习模型具有重要意义.针对HRNet并行结构中深层与浅层信息充分融合导致直接蒸馏难以实现的挑战,本文提出一种基于多尺度池化金字塔的结构化自蒸馏学习模型:在HRNet分支结构中引入多尺度池化金字塔表示模块,提升网络的知识表示和学习能力;构造“自上而下”和“一致性”两种蒸馏模式;融合交叉熵损失、KL(Kullback-Leibler)散度损失和结构化相似性损失进行自蒸馏学习.在四个包含显著性目标和伪装目标的分割数据集上的实验表明:本文模型在不增加资源开销的前提下,有效提升了网络的目标分割性能. 相似文献
403.
基于视觉图像的城市道路车辆检测是计算机视觉领域重要的研究课题之一。目前,其在白天环境下已取得良好的成果,但夜间环境的车辆检测问题仍存在许多研究难点。文章主要基于深度学习中目标检测(YOLOv5)算法进行改进,使用K-Means++算法获取先验框,提高收敛速度和检测准确率,使用空洞空间金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)替换原模型的快速空间金字塔池化(Spatial Pyramid Pooling-Fast,SPPF),提高了召回率和平均准确率。实验表明,提出的YOLOv5x+ASPP较原网络YOLOv5x在驾驶数据集BDD100K上平均准确率提高了2.1个百分点。 相似文献
404.
山坡地区是落石频发的区域,凭人力难以及时发现灾害的发生。为及时检测到落石的发生并做出应对措施,提出一种基于改进YOLOX的落石检测方法,自动检测并报告落石的发生情况;通过自制落石数据集训练YOLOX网络,优化空间金字塔池化结构,获取更多语义信息,并引入ECA-Net(Efficient Channel Attention Module,高效通道注意力模块),提高特征的提取能力和特征间的信息传播,同时改进损失函数并使用数据增强,提高网络训练效果;实验结果表明,改进YOLOX算法的mAP@0.5为92.50%,每秒检测帧数为62.6,相较于YOLOX算法,mAP@0.5提高3.45%,每秒检测帧数上涨0.3;与原算法相比,在不损失性能的情况下,精度有较大的提升,同时满足图片与视频数据的实时检测要求。 相似文献
405.
针对胶囊网络(CapsNet)在复杂数据集上的分类效果差,而且在路由过程中参数数量过大等问题,提出一种基于多路径特征的胶囊网络(MCNet),包含新的胶囊特征提取器和新的胶囊池化方法。该胶囊特征提取器从多个不同路径中并行地提取不同层次、不同位置的特征,然后将特征编码为包含更多语义信息的胶囊特征;胶囊池化方法则在胶囊特征图的每个位置选取最活跃的胶囊,用少量的胶囊表示有效的胶囊特征。在4个数据集(CIFAR-10、SVHN、Fashion-MNIST、MNIST)上与CapsNet等模型进行了对比。实验结果显示,MCNet在CIFAR-10数据集上的分类准确率为79.27%,可训练的参数数量为6.25×106,与CapsNet相比,MCNet的分类准确率提升了8.7%,参数数量减少了46.8%。MCNet能够有效提升分类准确率,同时减少可训练的参数数量。 相似文献
406.
针对复杂任务场景中,目标检测存在的多尺度特征学习能力不足、检测精度与模型参数量难以平衡的问题,提出一种基于CSE-YOLOv5(CBAM-SPPF-EIoU-YOLOv5,CSE-YOLOv5)模型的目标检测方法。模型以YOLOv5主干网络框架为基础,在浅层引入卷积块注意力机制层,以提高模型细化特征提取能力并抑制冗余信息干扰。在深层设计了串行结构空间金字塔快速池化层,改进了统计池化方法,实现了由浅入深地融合多尺度关键特征信息。此外,通过改进损失函数与优化锚框机制,进一步增强多尺度特征学习能力。实验结果显示,CSE-YOLOv5系列模型在公开数据集RSOD、DIOR和DOTA上表现出良好的性能。m AP@0.5的平均值分别为96.8%、92.0%和71.0%,而m AP@0.5:0.95的平均值分别为87.0%、78.5%和61.9%。此外,该模型的推理速度满足实时性要求。与YOLOv5系列模型相比,CSE-YOLOv5模型的性能显著提升,并且在与其他主流模型的比较中展现出更好的检测效果。 相似文献
407.
将基于深度学习的图像分类方法用于辅助病理学诊断优势突出,但获取病理学切片过程中产生的噪声会影响网络的泛化性能,进而降低分类算法的准确率.针对该问题,提出了一种鲁棒的病理学图像分类算法——多尺度小波池化协方差(multi-scale wavelet pooling covariance,MWPC)网络.MWPC网络主要由小波池化层、复合卷积层、多尺度特征融合和协方差特征提取层4个核心模块构成,其中小波池化层在抑制噪声影响的同时,保护了有效特征不受损失.多尺度特征融合将浅层特征与深层特征结合,使深层特征能够保留更多图像细节.协方差特征提取层可以获取图像的高阶统计特征,提高网络的泛化性能.在病理图像数据集上的测试结果表明,MWPC网络针对组织病理学图像分块级别的五分类任务,在无噪声条件下准确率可以达到90.90%,比ResNet提高1.68%,比Inception-v3分类网络提高0.43%;在模拟椒盐噪声、高斯噪声和柯西噪声等条件下,其噪声鲁棒性能提升明显,且能够降低平均噪声误差.多种网络模块的消融实验结果表明,MWPC网络能够提高网络分类性能和噪声鲁棒性. 相似文献
408.
协同过滤(CF)是推荐算法中一个重要的研究方向,近期的工作表明CF可以有效地挖掘用户-物品交互背后的潜在意图来精细化建模用户和物品的表示,从而服务下游的推荐任务。然而,本文认为现有的工作没有很好地解决用户-物品交互无偏化问题,它们一般根据假定的而非显式建模的意图生成用户和物品的解离表示。对此,本文提出了一个新的无偏差解离协同过滤(DebiasedCF)推荐框架,该框架利用用户的个人历史来提取其潜在意图,用于表示学习。具体地说,首先利用意图提取模块对用户意图进行显式建模;然后分别对各意图子图进行无偏化;再执行嵌入传播,从而为每个意图生成相应的解离表示;最后设计了一个意图嵌入聚合层来进一步融合在不同意图子图中学得的解离表示。实证结果表明,本文的框架能够在最先进的基线方法基础上取得实质性的改进。进一步的分析验证了提取的用户意图在去偏差和用户-物品表示建模方面的优势。 相似文献
409.
航拍图像存在目标小、背景复杂、目标与背景占比失衡等问题。YOLO算法对小目标的检测效果不佳,易出现漏检或误检的情况;YOLO的骨干网络参数量庞大,增加了运行设备的负担。为此,以YOLOv4算法为基础进行改进。首先,将YOLOv4的骨干网络CSPDarkNet53与MobileNetV3相结合,以轻量化网络的参数量;其次,采用混合池化结构(MPM)替换空间金字塔池化结构(SPPM),混合池化结构可丰富感受野,捕获相距较远目标之间的特征,减少目标被漏检或误检的情况发生;最后,对路径聚合网络(PANet)进行改进并融入残差结构(ResNet),提升网络对小目标的检测精度。改进后算法参数量仅为YOLOv4的19.6%;虽然平均精准度下降2.3%,但针对小目标检测的精准度提升10.2%;检测速度每秒增加4.2帧。 相似文献
410.
为解决传统PCB裸板缺陷检测效率低、误检率高、通用性差等问题,提出一种基于改进MobileNetV3的PCB表面缺陷检测模型。首先对PCB数据集进行预处理,然后采用多方向协调注意力代替原网络中的挤压和激励注意力模块,提升特征定位精度从而增强感受野;最后利用软池化优化MobileNetV3的末端结构,以在简化后的激活映射中保留更多的特征信息。实验结果证明,提出的模型对PCB裸板缺陷检测的平均准确率可达96.1%,图片平均检测速度为25.1 ms,能够高效识别PCB裸板的多种缺陷类型,对工业生产中PCB裸板的质量检测有实际应用价值。 相似文献