排序方式: 共有3条查询结果,搜索用时 15 毫秒
1
1.
城市道路场景下的行人目标尺寸变化大,并且人群密集容易引起遮挡问题,增加了行人检测难度。为了提高城市道路区域行人检测的准确性和实时性,更好应对驾驶场景的实际需求,对You Only Look Once(YOLO)方法进行改进。原YOLO模型分为行人特征提取阶段和行人坐标回归阶段,将浅层特征与深层特征多尺度融合,增加骨架网络的特征提取效果;添加注意力机制,在特征融合后加入空间通道增强模块,并且将GIoU损失引入网络训练过程,提高对遮挡目标的识别能力;结合行人尺寸,提出CrossYOLO层对网络宽度进行调整,加快了模型运算速度。在Caltech行人基准数据集下进行验证实验,结果表明YOLO-Person模型与原YOLO以及其他流行方法相比,对小目标和遮挡目标误检率更低,并且速度更快,具有一定的实际应用价值。 相似文献
2.
表情识别技术是计算机从静态表情图像或动态表情图像中识别出特定的表情,是实现人机交互的基础。提出一种融合卷积神经网络(CNN)与SIFT特征的人脸表情识别方法。通过图像预处理得到规范化的表情图像;采用视觉词袋模型将图像提取的SIFT特征作进一步处理,将得到的图像特征向量作为局部特征,CNN提取的特征作为全局特征,全局特征用以描述表情的整体差异,局部特征用以描述表情的局部差异;将提取出的两组特征融合后采用Softmax分类。与流形稀疏表示(Manifold Sparse Representation,MSR)及3DCNN等方法在CK+及FER2013数据集上的实验表明,该方法是一种有效的表情识别方法。 相似文献
3.
针对锂电池X-Ray图像中电极排布密集且模糊导致工业生产中难以高效检测的问题,提出了一种锂电池电极位置检测的方法。首先通过调整YOLOv5的骨干网络来增强模型对于目标特征的提取能力;其次,针对目标排布密集且像素占比较小的问题,增加目标检测层来提升模型对于小目标的检测性能;同时由于图像中的阴阳极特征较弱,引入注意力机制来进一步加强网络的特征提取能力;最后选取CIoU损失函数来提高定位精度。实验结果表明,提出的方法与主流目标检测方法YOLOv3、YOLOv4、RetinaNet、YOLOv5、TPH-YOLOv5相比,在性能上具有优势,与原始YOLOv5算法相比,mAP提高了约15.2%。提出的方法可以有效改善锂电池电极位置检测的准确性,有助于提高工业生产中锂电池缺陷检测的效率。 相似文献
1