首页 | 官方网站   微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 734 毫秒
1.
基于YOLO模型的柔索并联机器人移动构件快速定位方法   总被引:1,自引:0,他引:1  
针对柔索并联机器人移动构件实时定位问题,提出一种基于YOLO目标检测模型的柔索并联机器人移动构件快速定位方法。首先根据YOLO目标检测模型设计深度卷积神经网络结构,根据PASCAL VOC数据格式构建自己的数据集,并在该数据集上训练及测试模型,然后将工业摄像机采集得到的图像数据输入模型中进行标靶检测,记录标靶的类别和位置。分析标靶的颜色特征,并将标靶图像进行二值化,进一步计算出柔索并联机器人的精确位置。试验表明该方法能对图像中的目标进行准确分类和定位,定位误差在1°以内,图片处理帧率可达33帧,满足实时性要求,同时算法具有良好的准确性和有效性。  相似文献   

2.
SVM是图像识别与分类中的重要方法。对家电标签图像的自动分类问题进行研究,设计了图像采集、预处理、特征提取、特征向量分类整套算法流程。对除噪后的标签图片,利用标签矩形边框这一信息校正因标签拍摄角度而引起的畸变。选取校正后标签图像的HSV统计直方图、ASM能量、逆差矩、对比度和自相关性5项参数构成特征向量对图片进行描述。采用决策树+SVM分类器的结构对特征向量进行分类,最终获取标签图像所属类别。实验结果表明,决策树+SVM结构在训练样本个数极少的条件下,仍能完成模型训练,并以一定的准确率快速完成目标图像的分类工作。  相似文献   

3.
针对多数机构面临的大规模报表数据录入问题,提出了一种基于BP神经网络的手写数字识别系统。对输入图像进行图像预处理、图像分割和特征提取,随后将提取的特征信息输入到已经训练好的BP神经网络进行分类识别。训练数据包含140幅大小归一的数字图片,其中100幅作为训练集,40幅作为验证集,并以10幅带有若干手写体数字的图片作为测试集进行识别分析。经Matlab仿真实验结果表明,该分类器具有较短的收敛时间和较为理想的识别精度,在实际工作中具有良好的应用价值。  相似文献   

4.
为了减少神经网络模型对手写数字数据集的训练计算耗时和最佳训练次数,同时保证手写数字图像的分类准确率,引入了压缩感知技术,提出了基于压缩感知和单隐层前馈网络(Compressive Sensing and Single Hidden Layer Feedforward Network,CS-SHLNet)的手写数字图像快速分类算法。首先,利用高斯随机矩阵对具有稀疏性的手写数字图像进行线性观测,将高维图像信号投影到低维空间得到观测值;其次,通过误差反向传播(Error BackPropagation,BP)算法不断调整单隐层前馈网络权值建立适应于观测值的神经网络模型,将观测值嵌入神经网络中对图像进行特征提取;最后,采用单隐层前馈网络模型对手写数字进行图像分类,以训练计算耗时、最佳训练次数和分类准确率等指标对模型进行定量评估。实验结果表明:相比较单隐层神经网络和深度学习对MNIST手写数字数据集的高维图像信号图像分类,先通过CS技术利用观测数M=235的高斯随机矩阵线性观测得到图像的观测值,再利用单隐层前馈网络对观测值进行图像分类,网络模型的训练计算耗时缩短为13.05 s,最佳训练次数缩短为3次,分类准确率保持97.5%。该算法中的压缩感知线性观测可以有效减少神经网络模型对手写数字数据集的训练计算耗时和最佳训练次数,而且可以保证分类准确率。  相似文献   

5.
轮毂的识别是轮毂自动化生产线自动分拣的重要前提.为了克服轮毂生产结束后手动搬运和分拣的弊端,提出了一种基于梯度方向直方图特征和非线性支持向量机的轮毂识别方法.首先分别提取轮毂自动化生产线上三种不同照明条件下的轮毂图片,将轮毂图片转化为灰度图像;再对其进行缩放裁剪至检测窗口大小,完成正负样本的制作;最后提取正负样本的HOG特征集合并用libsvm工具箱对其进行训练,训练后得出的分类模型对三种不同照明条件的轮毂图片分别进行识别,结果表明,该方法可以有效地克服光照条件对识别效果的干扰.  相似文献   

6.
为解决目前市场上车牌识别设备的高时延以及对高性能处理器高依赖性的问题,提出了一种基于yolov3的车牌定位识别方法,实现对车辆的车牌进行自动定位与识别。该方法通过收集5000张车辆图像数据,打包为VOC数据集,使用LabelImg工具对图像进行标注,并构建13个卷积层的yolo模型,在loss曲线趋于稳定之后,完成模型的训练,最终使用已训练的模型对车辆图像数据进行车牌识别。实验表明:在1000个测试数据中,该方法识别率达97.5%,平均耗时18.19 ms,能够快速精准的对车辆进行车牌识别。  相似文献   

7.
针对报废汽车企业对不同型号汽车换挡面板自动分类的需求,提出了一种基于机器视觉的面板自动分类方法。该方法首先使用Blob分析对图像进行预处理,分割出图像中的换挡面板目标对象,接着提取被分割图像的11个形状特征作为特征向量,利用特征向量训练多层感知器(Multi-Layer Perceptron,MLP),最后使用完成训练的MLP神经网络模型对不同类型的汽车换挡面板进行分类预测。实验结果表明,该方法的分类准确率达到99%,每幅图像的分类时间小于100 ms,验证了该方法的有效性与高效性,能够作为报废汽车换挡面板自动分类的一种手段。  相似文献   

8.
目前,智能小车由于其应用广泛,是研究的热点之一,而基于神经网络与摄像头的智能车由于其在价格以及可靠性等方面的优越性更是受到了广大研究人员的青睐。然而,在端对端的卷积神经网络智能小车避障系统中,有时无论对网络结构和参数进行何种微调,总有一些图像是难以正确分类的,或者说要对某些图像进行正确分类,需要进行相当繁复的参数调整以及结构改变。针对上述问题,考虑采用双流卷积神经网络,利用原始图片与光流图片分别通过预训练的网络后,再将评分结果进行融合,得到最终的分类结果。事实证明,采用该方法可以有效改善传统卷积神经网络一些分类错误的问题。  相似文献   

9.
TSV三维封装内部缺陷难以用传统方法检测。然而其内部缺陷的存在会导致热阻发生变化,对系统温度分布产生影响,因此可以通过对红外图像的分析达到对缺陷进行识别及定位的目的。文中研究了缺陷对温度场的影响,分别通过理论分析、有限元仿真及实验方法对TSV三维封装系统进行了热-电耦合分析,得到了缺陷铜柱类型及位置不同时的温度分布数据集,搭建了卷积神经网络(CNN)模型对2组数据集单独进行分类预测。实验结果表明:利用仿真数据集与试验数据集分别对CNN模型进行特征训练,得到的缺陷识别与定位准确率为98.65%,98.36%。由上可知,缺陷类型及位置的不同会对温度场产生不同影响,利用CNN模型对TSV红外热图像进行特征训练可以有效识别与定位内部缺陷。  相似文献   

10.
提出了一种低精度视觉设备布置环境下的单目视觉人体动态定位方法,通过构建的人体定位多元回归预测模型,建立人体从2D图像空间到3D位置空间的映射关系,无需对视觉相机进行内外参数标定。首先,采集人体的2D图像序列和3D坐标位置序列,构建时间同步的视觉人体定位样本集;其次,通过人体骨架检测算法提取样本集中2D图像的人体骨架信息,进而选取并构建适用于人体定位的关键特征;然后,训练基于多元回归的人体定位模型,采用基于L_1惩罚项的嵌入型特征选择方法和K-fold交叉验证方法,在模型训练过程中实现特征选择和超参数估计;最后,对获取的人体定位模型进行定位误差评估,实验结果表明模型的均方根定位误差为2.95 cm,验证了所提方法的可行性及有效性。  相似文献   

11.
针对机械产品装配维修诱导中零件和装配体的识别、监测问题,对装配体零件识别及装配监测进行了研究,对LBP算子进行了改进,提出了一种基于像素局部二值模式(PX-LBP)和像素分类的装配体零件识别及装配监测方法。首先将LBP算子与像素分类融合,提出了PX-LBP算子;然后对深度图像进行了PX-LBP特征提取,生成了训练集和测试集;最后训练随机森林分类器,并利用训练好的随机森林分类器实现了对测试集深度图像的像素分类,生成了像素预测图像,通过像素预测图像与标记图像对比实现了装配体零件的识别及装配过程的监测。研究结果表明:该方法对于模型深度图像的像素识别率可达到98.81%,对于真实装配体深度图像的像素识别率也可达到77.51%;该方法兼具了一定的实时性与鲁棒性,可用在装配维修诱导、装配监测和自动化装配邻域中。  相似文献   

12.
火星表面地形地貌复杂,为了保证火星车行驶安全,需要对巡视器周边土壤的图像信息进行判别和分类。首先,根据试验场地和图像信息等对图像进行预处理,建立鸟瞰图像。接着,以鸟瞰图像为基础建立图像块并建立数据集,建模集和预测集分别包含315组和135组数据。然后,在划分的数据集基础上建立神经网络模型,并对数据进行训练和分类。最后,根据得到的分类模型对图像进行分类,得到感兴趣区域。分类结果表明:应用ResNet50得到的模型其建模集和预测集的分类准确率分别为75.56%和81.48%。该方法可实现巡视器周边地表类型的分类,并提取图像的感兴趣区域,以便实现更为精准的判别,可用于实现火星车通过性感知、风险预测和路径规划,为未来智能星球车移动系统研制和探测提供理论和技术支持。  相似文献   

13.
运用TRIZ物场模型分析目前人工分拣不同口味盒装蛋黄酥的方法,在建立了物场模型后,采用驱动装置和图像采集装置及深度学习算法来替代该物场模型中的人手和人眼,设计了自动分拣不同口味盒装蛋黄酥系统。用改进的Visual Geometry Group(VGG)卷积人工神经网络对盒装蛋黄酥的图案进行分类。由于盒装蛋黄酥图案所在识别环境背景固定、识别角度固定,造成其训练数据集小,因此采用数据增强的方法对数据集进行扩展。在使用1845张蛋黄酥图片进行训练,经过28次迭代后,改进的VGG网络成功收敛。经测试,615张测试样本的分类率都达到100%的正确率。  相似文献   

14.
为解决SAR图像目标识别中样本缺乏和方位角敏感问题,提出了一种基于DRGAN和SVM的SAR图像目标识别算法。首先,采用多尺度分形特征对SAR图像进行增强,经过分割得到目标二值图像,基于Hu二阶矩估计目标的方位角。然后对估计得到的目标方位角进行量化编码,结合原始图像作为输入,对设计的DRGAN模型参数进行训练与优化。由于DRGAN中的深度生成模型将目标姿态与外观表示进行解耦设计,故可利用该模型将SAR图像样本变换到同一方位角区间。基于变换后的训练样本分别提取归一化灰度特征,利用SVM训练分类器。采用MSTAR数据集在多个不同操作条件下对提出的算法进行测试,实验结果表明,在带变体的标准操作条件下,能够达到97.97%的分类精度,优于部分基于CNN模型的分类精度,在4种扩展操作条件下的分类精度分别为97.83%,91.77%,97.11%和97.04%,均优于传统方法的分类精度。在SAR图像目标方位角估计存在一定误差的情况下,训练得到的GAN模型作为SAR图像目标旋转估计器,能够使得在不进行复杂样本预处理的前提下,仍然取得较高的SAR图像目标识别精度。  相似文献   

15.
针对流水线产品上的文本图片含有较多噪声和缺陷,造成机器视觉产品中字符识别准确率低,鲁棒性差的问题,对文本识别中的图像预处理、字符切分和归一化、字符识别等方面进行了研究,采用机器视觉技术中基于仿射变换的预处理方法对文本图片进行了倾斜校正,保证了后续字符的精确切分;提出了一种基于改进的BP神经网络算法,显著提高了字符识别的准确率和鲁棒性,利用附加动量法和自适应学习速率方法,避免了传统BP神经网络训练过程中易陷入局部极小值的情况,并提高了神经网络模型的收敛速度。研究结果表明:该方法能使倾斜的图片得到有效校正,神经网络模型的训练效率得到有效提高,且在含有噪声和缺陷的字符图片中仍能保持较高的识别率和鲁棒性。  相似文献   

16.
为了解决传统水果图像分类识别算法人工提取特征的缺陷,将卷积神经网络应用到水果图像识别上,基所创建的数据集,参照经典的卷积神经网络模型Le Net-5结构,提出更适合本数据集的卷积神经网络结构,首先对水果数据集进行分类标签,将苹果、梨、橙子、橘子、桃子分别标记为0、1、2、3、4,然后将图片分批次投入模型训练,该模型构建了一个输入层、两个卷积层、两个池化层、两个全连接层和一个输出层。卷积神经网络通过底层提取特征,再进一步更深层次提取特征,最后得到目标的分类。实验结果表明,所提出的卷积神经网络结构不仅在数据集上取得了较高的识别准确率,而且与传统的水果图像分类识别算法相比较,卷积神经网络避免了人工提取特征的繁琐过程。  相似文献   

17.
为提高废旧铅酸蓄电池回收效率和金属回收质量,提出采用自动化手段分类废旧铅酸蓄电池。针对该识别分类问题,首先将主成分分析法、线性判别分析法应用于废旧铅酸蓄电池的X射线图像的特征提取。通过支持向量机对提取的训练集图像特征向量进行训练,分别对测试集的图像数据进行分类实验,并对比了不同数量的训练集和不同特征空间维度下各种方法的识别率。实验结果表明,主成分分析法、线性判别分析法可用于废旧铅酸蓄电池X射线图像的识别,并且随着训练集与测试集样本量的增加,二次线性判别分析法表现出较为稳定的识别率。  相似文献   

18.
为优化源头分类,减缓末端分拣压力,基于深度学习设计了一款家用智能垃圾桶。这一设备采用YOLOv2网络作为垃圾检测与分类模型,结合K210芯片处理不同种类垃圾的图像特征和位置信息,实现垃圾的分类与检测。通过实际测试,这一设备可以有效识别四种不同类别的垃圾,分类准确度高,使用简单、便捷。  相似文献   

19.
针对CT模态医学图像采用卷积神经网络训练时的特征提取不充分、特征维度较高等问题,本文提出了基于融合多尺度图像的非负稀疏协同表示分类的密集神经网络肺部肿瘤(Multi Scale DenseNet-NSCR)的识别方法。第一,使用迁移学习将预训练密集神经网络模型初始化参数;第二,将肺部图像预处理,提取多尺度病灶ROI区域;第三,采用多尺度CT图像训练密集神经网络,提取全连接层的特征向量;第四,针对融合特征维度较高问题,采用非负稀疏协同表示分类器(NSCR)对特征向量进行表示,求解系数矩阵;第五,利用残差相似度进行分类。最后,采用AlexNet,DenseNetNet-201模型及三种分类算法(SVM、SRC、NSCR)两两组合模型进行对比试验,实验结果表明,Multiscale-DenseNet-NSCR分类效果优于其它模型,且特异性和灵敏度等各项评价指标也较高,该方法具有较好的鲁棒性和泛化能力。  相似文献   

20.
汽车牌照定位是公认的较难解决的图像分割问题.本文基于HSI颜色模型给出了汽车牌照定位的新方法:首先对图像进行倾斜校正处理.然后将图像转换到HSI颜色空间,对该模型的H分量和S分量进行过滤获得二值化的汽车牌照图像,再通过孔洞检测去除未含有孔洞的连通域.并填充孔洞.运用数学形态学方法对二值图像处理,最后根据车牌照特征定位出车牌照区域.试验证明该方法达到了很好的定位效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号