基于注意力机制的安全帽检测卷积神经网络建立

3.0 闻远设计 2024-03-09 16 4 826.03KB 12 页免费

侵权投诉

基于注意力机制的安全帽检测卷积神经网络建

立

Abstract:In a complex construction environment,the helmet wearing recognition algorithm based on

machine vision technology often fails and misdetects,and its recognition ability is limited.In order to

improve the accuracy of helmet wearing recognition,this paper establishes a helmet recognition

convolutional neural network based on the bidirectional feature pyramid of the attention mechanism

isproposed.In order to improve the expression ability of shallow position information and deep

semantic information in the convolutional neural network,and increase the recognition rate of vague

and small helmets,the network introduces the jump connection and the attention mechanism CBAM

technology into the bidirectional feature fusion feature pyramid network PANet module,and

bidirectional feature pyramid module based on the attention mechanism is constructed.In order to

improve the convergence ability of the model,CIoU is used instead of IoU to optimize the anchor

frame regression prediction,which reduces the complexity of the network training.The results of

comparative experiment show that the mAP value of our proposed recognition network is

0.82,4.43,23.12 and 23.96 higher than that of YOLOv3,RFBNet,SSD,Faster RCNN,respectively,and

its detection speed reaches 21 frame/s,thus satisfy with height real-time accuracy of helmet recognition

in the construction environment.

Keyword:target detection; feature fusion; PANet; CBAM; CIoU;

　　 1　引言

在施工环境中，施工人员佩戴安全帽可以有效避免或减小安全事故的伤害。通过人工巡检监控

视频实现安全帽佩戴检测费时费力，且容易造成误检和漏检。利用机器视觉技术对施工现场工

作人员是否佩戴安全帽进行检测，可有效地代替人工巡检，提高识别的精度，避免安全事故的

发生。

传统的安全帽检测主要通过对监测视频进行目标检测，提取目标的几何、颜色等特征进行对比

识别。刘晓慧等人[1]利用肤色检测实现人头区域的定位，再采用 SVM 分类器对安全帽的 Hu

矩特征进行识别；周艳青等人[2]将人头区域的统计特征、局部二进制模式特征和主成分特征训

练分类器，建立了多特征的安全帽检测算法；贾峻苏等人[3]结合局部二值模式直方图、梯度直

方图和颜色特征，利用 SVM 对安全帽进行检测。基于目标图像特征提取的传统检测方法，泛

化能力较差[4],而实际施工环境复杂多样，通常存在雨雾、遮挡等的影响。因此，基于目标图

像特征提取的传统检测方法检测能力有限。

近年来，基于深度学习的目标检测技术能够利用卷积网络自动学习大样本数据有用的特征，建

立的检测网络模型泛化能力较强，有效地实现了特殊环境下的安全帽识别。基于深度学习的目

标检测技术主要为基于区域建议和基于回归策略的目标检测网络。基于区域建议的目标检测网

络需要先生成可能含有待检测物体的预选框，然后再利用主干网络提取特征信息进行分类和回

归。基于回归策略的单阶段目标检测算法则直接在网络中提取特征预测出物体的类别以及位置

[5].通常二阶段的检测算法精度高，但检测速度远低于单阶段的检测速度。经典的二阶段网络

Faster RCNN[6]采用 RPN 预选框生成网络和主干特征提取网络，实现目标的准确识别，但检测

耗时较大。徐守坤等人[7]在二阶段检测算法 Faster RC-NN 的基础上利用多层卷积特征优化区

域建议网络，建立改进的 faster-RCNN 算法，虽然提高了网络检测的准确率，但是延长了检测

时间，其检度时间仍然远大于一阶网络，未能达到实时检测的要求。基于回归策略的目标检测

网络主要是 YOLO、SSD、RFBNet 等[8,9,10,11,12].为提高单阶段网络的检测精度，董永昌等人

[13]在SSD 检测算法的基础上，引入了 DenseNet 作为主干网络提取特征，充分利用了各层的特

征信息，提高了网络的检测精度。陈柳等人[14]在RFBNet 检测算法的基础上，引入 SE-Ghost

模块来轻量化检测模型，并利用 FPN 提高网络对小目标检测的鲁棒性。唐悦等人[15]针对单阶

段算法 YOLOv3 的缺点，引入 GIoU 代替 IoU 来优化锚框选取，但是 GIoU 具有在锚框包含时

会退化为 IoU 的缺点。同时检测网络采用了密集连接结构来加强特征的传递，所得到算法的检

测效果优于传统 YOLOv3.以上改进的单阶段网络虽然都提高了检测精度，但是检测速度有所下

降。

本文针对施工现场的复杂环境与实时性要求，以 YOLOv3 网络为基础建立一种基于回归策略的

高精度安全帽检测网络。该网络在 YOLOv3 的检测网络中，构建特征金字塔网络 CPANet 模块

提高弱小安全帽目标的检测精度，同时采用了 CIoU 来代替 IoU 进行回归预测，在优化锚框回

归的同时能够提高模型的收敛能力。通过对比实验证明，在有遮挡的复杂施工环境下，该网络

能实现弱小安全帽目标的准确检测，且检测速度较快，满足实时检测的要求。

　　 2　YOLOv3 目标检测网络

YOLOv3 是基于回归策略的目标检测算法，网络包括 Darknet53 特征提取网络和检测网络两部

分，其中 Darknet53 主要用来提取图像特征信息，检测网络用来进行多尺度的目标预

测。DarkNet53 是全卷积网络，共有53 个卷积层，采用 1×1 和3×3 的卷积组成带有跳跃连接的

残差块来构建残差网络，减少了因网络太深而带来的梯度消失现象，能够提取更加深层的语义

信息。同时，使用步长为 2的卷积来代替最大池化进行下采样，降低了池化带来的梯度负面效

果。

为了提高网络对目标的检测能力，YOLOv3 检测层中使用了类似特征金字塔网络的上采样和特

征信息融合的做法。当输入图像归一化到 416×416 送入网络进行检测时，Darknet53 会输出3

个检测尺度，分别为 13×13,26×26,52×52.根据特征金字塔网络结构，13×13 与26×26 大小的特

征图要依次经2倍上采样操作与26×26 和52×52 大小的特征图进行信息融合，将深层的语义信

息通过快捷连接传入到浅层，得到3个带有语义和位置信息融合的特征图。YOLOv3 的网络结

构如图1所示。

图1 YOLOv3 算法结构示意图

Fig.1 Diagram of YOLOv3algorithm structure

YOLOv3 网络能够快速实现目标的检测，并利用 FPN 引入多尺度的目标预测来提高其检测能

力。但其 FPN 网络只采用 3个尺度，只进行了一次自上而下的特征融合，各层信息利用不足，

对于一些小目标和有遮挡目标，其检测能力有限。

YOLOv3 在实现边界框预测时，通过 kmeans 算法对数据集中的目标框进行维度聚类，得到9

组不同大小锚框，将锚框平均分配到3个检测尺度上，每个尺度的每个锚点分配3组锚框。但

是这样操作会带来大量的锚框，于是 YOLOv3 采用了最大交并比（IoU）来对锚框进行回

归。IoU 计算的是预测边界框和真实边界框的交集和并集的比值，一般来说预测边界框和真实

边界框重叠度越高，则其 IoU 值越大，反之越小。并且 IOU 对尺度变化具有不变性，不受两个

物体尺度大小的影响。其计算公式如式（1）所示：

其中，A属于真实框，B属于预测框。

但是 IoU 无法精确地反应真实框和预测框重合位置的关系，存在两个较大的缺点，第一，无法

衡量两个框之间的距离，如图2所示，图 2（a）明显要比图 2（b）中的距离近，但仅从 IoU 数

值上无法判断两框的远近；第二，无法反映真实框与预测框的重叠方式，如图2（c）与图

2（d）的重叠方式完全不一样，从IoU 的数值上无法判断其重叠方式。当上述情况出现时，会

导致网络没有梯度回传，造成模型难以收敛等问题的出现。

图2 真实框与预测框位置表示图

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

免费 4人已下载

立即下载

摘要：

基于注意力机制的安全帽检测卷积神经网络建立Abstract:Inacomplexconstructionenvironment,thehelmetwearingrecognitionalgorithmbasedonmachinevisiontechnologyoftenfailsandmisdetects,anditsrecognitionabilityislimited.Inordertoimprovetheaccuracyofhelmetwearingrecognition,thispaperestablishesahelmetrecognitionconvolutionalneuraln...

展开>> 收起<<

基于注意力机制的安全帽检测卷积神经网络建立.docx

共12页,预览4页

还剩页未读，继续阅读

基于注意力机制的安全帽检测卷积神经网络建立

相关推荐

开通VIP享超值会员特权

作者详情

相关内容

推荐作者

热门标签

举报选择: