首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 468 毫秒
1.
孙运达  万雪  李盛阳 《光学精密工程》2021,29(12):2915-2923
为了满足空间任务实施过程中对航天器部件的精细定位需求,针对相同类别部件易出现的混淆问题,本文提出了一种基于孪生网络结构的航天器部件追踪算法.首先通过神经网络模型将航天器部件追踪问题描述为基于数据驱动的航天器部件相似性度量问题,以改进AlexNet网络结构为孪生单元设计本文所用孪生网络模型.其次,使用公开大型数据集GOT-10k训练孪生网络,以随机梯度下降作为网络优化方法,提升网络表征能力.最后针对航天器同类部件外观相似造成的定位混淆问题,提出一种结合运动时序特征的追踪策略,提高了追踪精度.以ESA公开的航天器视频数据作为测试数据,验证所提出算法性能,实验结果表明:本文所提出算法在未使用航天器相关数据训练的条件下,在舱体与太阳能帆板追踪结果交并比达到57.2%与73.1%,速度达到38 FPS,基本满足航天器部件追踪稳定可靠、精度高、抗干扰能力强等要求.  相似文献   

2.
随着人们对于公共安全的要求越来越重视,视频监控设备的安装已经变得非常普遍,行人再识别作为针对监控视频中行人进行分析的技术也受到更多人的关注。基于现有的深度学习网络提出了一种以最小化三元组损失为训练目标的非监督行人再识别算法。该设计主要通过预训练模型对数据进行特征提取,然后通过k-means聚类,最后对聚类后的数据进行三元组配对进行网络训练优化。通过在相关数据集上的测试结果可以看出,该设计在处理非标签数据行人再识别方面具有一定的有效性。  相似文献   

3.
针对爬罐机器人在球罐上对焊缝的识别和跟踪困难导致焊缝检测效率低的问题,自制了罐体表面焊缝数据集,并提出了一种基于深度学习的焊缝视觉跟踪方法。首先,以Patch Expanding替换双线性插值作为上采样方法,减少上采样带来的精度损失;然后,在掩码分割前嵌入了递归空洞自注意力机制,提高模型的表征能力,从而获得更好的分割精度;最后,在罐体表面焊缝数据集上进行实验,实验结果表明,对比原始模型,改进SegFormer图像语义分割模型的平均交并比提高了2.41%。在改进算法分割焊缝的基础上,利用分割出的焊缝掩码图像提取中心线作为焊缝路径,用于引导爬罐机器人运动,以实现焊缝视觉跟踪。  相似文献   

4.
一种三维部件形状检索方法   总被引:1,自引:0,他引:1  
提高基于实例设计的效果,有效的实例检索是关键之一。利用三维部件与其外包立方盒体积比作为特征提取的依据,提出了一种实例检索算法,能够处理形状不规则的产品部件实例。根据形状不规则部件形状特征分析的结果,首先进行部件方位规范化,接着分割计算体积比并建立相似度计算模型,最后根据检索结果提供相关反馈进行学习。在此基础上提出了不同精确度的部件实例索引方法。  相似文献   

5.
手写数字识别属于图像分类问题。因个体手写数字的差异,传统的图像分类方法实现快速有效识别的难度相对较大。随着人工智能和计算机硬件技术的快速发展,基于深度学习卷积网络的手写数字识别逐渐成为研究热点。使用PyTorch搭建了经典的网络模型LeNet-5和改进的ResNet18模型进行手写数字识别。采用交叉熵损失函数和Adam优化算法,并设置学习率为0.001,在MNIST数据集上进行了训练和测试,鉴于ResNet18比LeNet-5网络结构深,在训练时花费的时间比LeNet-5多。经过100个Epoch后,使用LeNet-5模型在测试集上准确率达到了99.18%,使用ResNet18卷积模型的准确率高达99.55%,可以识别自制的手写数字,为人工智能识别系统的发展提供了一定的参考价值。  相似文献   

6.
针对视觉即时定位与地图构建(SLAM)中的静态假设限制其在动态现实环境中应用的问题,提出了一种在高动态环境下基于傅里叶梅林变换的视觉SLAM算法。首先,采用傅里叶梅林算法配准以补偿相机运动,应用帧间差分算法获取运动掩膜。同时利用短时密集连接网络进行语义分割确定潜在运动物体掩膜。结合运动掩膜与物体掩膜,获得最终的物体运动区域,剔除该区域的特征点。最后,依据稳定的静态特征点跟踪优化,提升位姿精度。实验结果表明,本算法的绝对轨迹误差与相对位姿误差相比于ORB-SLAM2减少了95%以上,相比于DS-SLAM减少了30%以上,验证其在复杂动态场景下具有良好的定位精度与鲁棒性,有效降低运动模糊与光照变化对运动检测的影响,同时,克服了传统动态SLAM难以检测非先验运动对象的弊端。  相似文献   

7.
针对全监督视频实例分割网络训练数据高度依赖精细掩码标注,时间和人工成本过高,导致智能机器无法快速适应新场景的问题,提出一种端到端的掩码生成动态调控弱监督视频实例分割(Weakly Supervised Video Instance Segmentation,WSVIS)网络。为克服初始掩码预测层通道维度突降导致的实例激活特征丢失问题,构建多级特征融合模块,利用特征复用策略预测初始实例特征并融合相对位置信息生成初始预测掩码。然后,提出动态调控机制在通道和空间维度上建立掩码特征依赖关系,强化初始预测掩码与实例感知信息之间的动态交互。最后,网络设计二元颜色相似性生成伪亲和标签取代精细掩码标注,联合边界框与掩码一致性损失实现仅边界框标注的弱监督视频实例分割。实验结果表明,在BoxSet和YT-VIS数据集上,WSVIS网络能达到与全监督网络相近的分割精度和分割效果,同时能够满足实时推理要求,为智能机器快速适应新场景实现实时环境感知和理解提供了理论支撑和算法依据。  相似文献   

8.
摘要:介绍了复值独立分量分析(Complex ICA)的基本原理和算法,并提出了基于复值独立分量分析的目标识别方法。该方法首先利用快速独立分量分析算法(FICA)对目标训练集图像进行ICA分解,然后分别提取基于独立分量的训练集和测试集目标特征,采用线性判据对训练集目标特征进行分类训练,找到合理的分类阈值,最后对测试集图像进行分类识别。本文的创新点在于把复数值独立分量分析的方法应用于多传感器融合的目标识别。实验结果表明,本文提出的方法是可行的,并能获得较高的目标识别准确率。  相似文献   

9.
低压台区拓扑关系识别是实现电网智能化的一个关键基础,相对于人工识别,从数据挖掘角度进行识别,具有成本低、准确率高、时效性好的优势.就其相序识别问题,提出了基于随机森林算法的低压台区相序关系自动识别方法.首先基于随机算法原理搭建了用于台区相序识别的随机森林算法模型,并提出采用F1 score统计值作为识别模型的评价指标;然后将搭建好的模型应用到实际台区进行训练,训练方式设置了两类测试集:口袋内台区测试集与口袋外台区测试集;最后将训练好的算法模型对测试样本进行相序分许.实证结果证明,所提方法对台区的相序拓扑分析有较高准确性,为低压台区拓扑分析提供了一种技术思路和可行方法.  相似文献   

10.
针对陆战场人、装备等典型目标图像,提出了一套战场可疑目标智能识别与跟踪框架,用于目标检测与图像识别,以及对可疑目标进行跟踪。人脸检测基于MTCNN网络,可以有效检测人脸及人脸中的5个关键点;人脸识别基于FaceNet网络,并且使用随机森林算法作为分类器,训练用于识别10位在影视剧中饰演军人的演员模型,在测试集上的准确率为94.76%;装备目标检测与识别基于YOLO v3模型,能够检测与识别20种武器装备;可疑目标跟踪基于BACF算法,在10个10s测试视频中,跟踪准确率为90%,平均输出速率为24fps。  相似文献   

11.
起重机攀爬机器人是一种代替人力检测起重机的机械设备。为解决起重机攀爬机器人自动寻路的车道识别问题,文中设计了一种针对起重机金属结构特点优化,将MobilenetV2作为特征提取部分与Unet网络相结合的M2-Unet卷积神经网络。用攀爬机器人在门式起重机上采集1 979张图像数据,由专业标注软件Labelme制作成数据集进行训练与测试,并使用其他2种主流的语义分割网络在相同的数据集上作对比实验。实验结果表明,相较于其他2种图像分割网络,改进的M2-Unet卷积神经网络的分割准确率最高;M2-Unet网络对测试集479张图片的平均识别准确率在96%以上,平均运行时间远小于0.5 s,能同时满足起重机攀爬机器人车道识别任务的实时性和精度要求。  相似文献   

12.
提出了一种基于监控视频信号的电梯门运动轨迹识别算法。首先,为了提高电梯门识别的准确度,将边缘检测、阈值分割两种思想相结合,提出了一种基于两者的电梯门识别算法,能够较为准确地识别电梯门的运动轨迹;然后,依据运动轨迹预测和跟踪的思想提出类高斯加权模型对原算法进行改进,提高了算法的鲁棒性。实验结果表明,该算法能够在复杂的环境下准确且稳定地对电梯门的运动轨迹进行识别和追踪。  相似文献   

13.
输电杆塔关键弱纹理部件的通用检测方法依赖大量样本的标注和学习。在无相关部件样本训练情况下,本文提出一种可迁移的输电杆塔弱纹理部件检测方法。本文方法结合了孪生神经网络和互相关卷积用于融合样本块与待搜索区域的特征,其中通过样本部件掩膜裁剪以有效滤除背景噪声,最后在尺度、位置、交并比3个方面提出了对应的分数修正策略以提高检测精度。实验结果表明,本文提出的掩膜裁剪和分数修正策略有效提高了弱纹理部件的检出精度,按照AP_(50)的标准,本文检测方法的平均准确率达到了98.0%,能有效避免由于观测视角、尺度以及光照带来的干扰。  相似文献   

14.
鉴于SAR图像获取的困难,无法保证机器学习算法时需要的大数据量训练样本,因此影响了识别结果。首次提出了应用虚拟样本来扩大SAR图像目标识别训练集,提高SAR图像目标识别率的方法。通过使用重采样算法,奇异值重构与轮廓波重构等方法构建虚拟样本,与原有样本组成训练集,并通过SVM支持向量机进行训练识别在MSTAR公共数据集上的识别实验结果表明,对于不同数量的实际训练样本,通过添加本文方法构建的虚拟样本扩大训练集后,SAR图像目标识别率均会得到提高,尤其在小样本的情况下,识别率提高非常显著。该文证实了虚拟样本应用于SAR图像目标识别的有效性。在样本数目有限时,添加虚拟样本对SAR图像目标识别性能具有明显的改善作用。  相似文献   

15.
帕金森病(PD)语音识别算法研究对于其及时诊疗具有重要意义,但现有PD语音识别算法面临小样本数据量问题挑战。针对问题,本文提出双面双阶段均值聚类包络和卷积稀疏迁移学习算法。在双阶段学习方面,首先基于源数据集训练多组卷积核,然后通过中间集得到最优卷积核并对目标集进行编码。在深度样本聚类包络方面,首先设计迭代均值聚类算法构建深度样本空间;然后进行样本特征同时选择并训练分类器模型;最后对不同样本空间的分类结果进行融合。实验选取代表性的PD语音数据集进行验证。实验结果表明,本文算法创新部分有效,与10多个经典和最新相关文献算法相比取得了显著改进,准确率达97.8%。此外,本文算法的时间复杂度不高,满足临床应用要求。  相似文献   

16.
几种改进BP算法在气液两相流流型识别中的比较   总被引:1,自引:0,他引:1  
通过流型识别的实例对几种具有代表性的用以训练BP网络的改进算法进行性能对比研究.首先分析了基于标准梯度下降法和基于标准数值优化方法获得的各种改进算法的优缺点,然后对各种改进算法在训练中所需要的收敛时间及其达到的误差进行对比分析,为在BP网络识别流型时选择算法提供一些借鉴.  相似文献   

17.
为了实现宫颈癌的早期筛查与诊断,使用来自丹麦Herlev大学医院的宫颈细胞图像数据集,训练了D-LinkNet语义分割神经网络,用来分割宫颈细胞图像中的细胞核、细胞质和背景。使用OpenCV,从分割之后的细胞图像中,提取几何、色度和纹理三大类共75个特征。使用Scikit-Learn搭建了使用单一算法的分类器和集成多个算法的投票分类器,对正常和异常的宫颈细胞进行二分类。将提取到的特征数据按照4:1的比例分为训练集和测试集。结果显示:集成了多种分类算法的投票分类器在测试集上的分类效果最好,获得了0.9334的分类准确率。  相似文献   

18.
针对手工进行耕地语义分割存在耗时长、效率低下、分割结果严重依赖于工作人员的经验以及传统方法无法较好地满足耕地语义分割要求的问题,首次提出了一种基于U-net的多时相高分遥感影像耕地语义分割方法。首先对多时相高分遥感影像进行数据预处理,然后对其进行数据增强,接着构建U-net神经网络,使用训练集进行训练,并用测试集来测试神经网络的性能。结果以人工标注的结果作为参考,在保持相同训练集和测试集的情况下,分别用FCN、SegNet和U-net做对照实验。实验结果表明,U-net的分割准确率高于FCN和SegNet,且对边缘分割得较为平整;U-net神经网络能够有效地实现耕地语义分割任务。  相似文献   

19.
针对仓储环境下叉车机器人托盘识别的应用场景,以及提高托盘目标检测的准确性和鲁棒性,提出了一种基于YOLOv3算法改进后的物体识别方法.运用K-Means++聚类方法重新聚类出更适合托盘检测的Anchor Box,通过分析托盘成像在图像坐标系中横轴和纵轴的密度分布,继而调整了划分网格机制,改进损失函数.并在运用数据增强手段的托盘数据集上进行训练以及测试,与其他算法进行对比,结果显示基于改进的YOLOv3托盘检测方法在测试集上的准确率达到94.6%,识别速率达到47帧/s.  相似文献   

20.
针对目前印刷标签复杂多样难以识别和分类,以及各种缺陷造成识别准确率低的问题,提出了一种基于机器视觉的多种类标签检测方法。首先搭建由相机、镜头和光源组成的采样平台,将各种类标签采集后用作模型训练的数据集,然后利用最小外接矩形并稳健回归的方式对图像进行畸变矫正,通过Laplacian算子、高斯滤波算法、Otsu算法消除噪声产生的影响,最后建立了一个改进的CRNN+CTC网络结构模型,其中加入BN算法和Adam算法提高模型的泛化能力和收敛速度,使用双向BLSTM网络减小梯度消失或爆炸,再加入CTC损失函数实现输入数据与给定标签的对齐问题。实验结果表明,改进后的方法相较于传统分割字符算法,识别准确率提升至98.2%;相较于原CRNN+CTC算法,识别速度提升至37 ms/张,达到了工业使用需求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号