基于注意力机制的安全帽检测卷积神经网络建立
基于注意力机制的安全帽检测卷积神经网络建
立
Abstract:In a complex construction environment,the helmet wearing recognition algorithm based on
machine vision technology often fails and misdetects,and its recognition ability is limited.In order to
improve the accuracy of helmet wearing recognition,this paper establishes a helmet recognition
convolutional neural network based on the bidirectional feature pyramid of the attention mechanism
isproposed.In order to improve the expression ability of shallow position information and deep
semantic information in the convolutional neural network,and increase the recognition rate of vague
and small helmets,the network introduces the jump connection and the attention mechanism CBAM
technology into the bidirectional feature fusion feature pyramid network PANet module,and
bidirectional feature pyramid module based on the attention mechanism is constructed.In order to
improve the convergence ability of the model,CIoU is used instead of IoU to optimize the anchor
frame regression prediction,which reduces the complexity of the network training.The results of
comparative experiment show that the mAP value of our proposed recognition network is
0.82,4.43,23.12 and 23.96 higher than that of YOLOv3,RFBNet,SSD,Faster RCNN,respectively,and
its detection speed reaches 21 frame/s,thus satisfy with height real-time accuracy of helmet recognition
in the construction environment.
Keyword:target detection; feature fusion; PANet; CBAM; CIoU;
1 引言
在施工环境中,施工人员佩戴安全帽可以有效避免或减小安全事故的伤害。通过人工巡检监控
视频实现安全帽佩戴检测费时费力,且容易造成误检和漏检。利用机器视觉技术对施工现场工
作人员是否佩戴安全帽进行检测,可有效地代替人工巡检,提高识别的精度,避免安全事故的
发生。
传统的安全帽检测主要通过对监测视频进行目标检测,提取目标的几何、颜色等特征进行对比
识别。刘晓慧等人[1]利用肤色检测实现人头区域的定位,再采用 SVM 分类器对安全帽的 Hu
矩特征进行识别;周艳青等人[2]将人头区域的统计特征、局部二进制模式特征和主成分特征训
练分类器,建立了多特征的安全帽检测算法;贾峻苏等人[3]结合局部二值模式直方图、梯度直
方图和颜色特征,利用 SVM 对安全帽进行检测。基于目标图像特征提取的传统检测方法,泛
化能力较差[4],而实际施工环境复杂多样,通常存在雨雾、遮挡等的影响。因此,基于目标图
像特征提取的传统检测方法检测能力有限。
近年来,基于深度学习的目标检测技术能够利用卷积网络自动学习大样本数据有用的特征,建
立的检测网络模型泛化能力较强,有效地实现了特殊环境下的安全帽识别。基于深度学习的目
标检测技术主要为基于区域建议和基于回归策略的目标检测网络。基于区域建议的目标检测网
络需要先生成可能含有待检测物体的预选框,然后再利用主干网络提取特征信息进行分类和回
归。基于回归策略的单阶段目标检测算法则直接在网络中提取特征预测出物体的类别以及位置
[5].通常二阶段的检测算法精度高,但检测速度远低于单阶段的检测速度。经典的二阶段网络
Faster RCNN[6]采用 RPN 预选框生成网络和主干特征提取网络,实现目标的准确识别,但检测
耗时较大。徐守坤等人[7]在二阶段检测算法 Faster RC-NN 的基础上利用多层卷积特征优化区
域建议网络,建立改进的 faster-RCNN 算法,虽然提高了网络检测的准确率,但是延长了检测
时间,其检度时间仍然远大于一阶网络,未能达到实时检测的要求。基于回归策略的目标检测
网络主要是 YOLO、SSD、RFBNet 等[8,9,10,11,12].为提高单阶段网络的检测精度,董永昌等人
[13]在SSD 检测算法的基础上,引入了 DenseNet 作为主干网络提取特征,充分利用了各层的特
征信息,提高了网络的检测精度。陈柳等人[14]在RFBNet 检测算法的基础上,引入 SE-Ghost
模块来轻量化检测模型,并利用 FPN 提高网络对小目标检测的鲁棒性。唐悦等人[15]针对单阶
段算法 YOLOv3 的缺点,引入 GIoU 代替 IoU 来优化锚框选取,但是 GIoU 具有在锚框包含时
会退化为 IoU 的缺点。同时检测网络采用了密集连接结构来加强特征的传递,所得到算法的检
测效果优于传统 YOLOv3.以上改进的单阶段网络虽然都提高了检测精度,但是检测速度有所下
降。
本文针对施工现场的复杂环境与实时性要求,以 YOLOv3 网络为基础建立一种基于回归策略的
高精度安全帽检测网络。该网络在 YOLOv3 的检测网络中,构建特征金字塔网络 CPANet 模块
提高弱小安全帽目标的检测精度,同时采用了 CIoU 来代替 IoU 进行回归预测,在优化锚框回
归的同时能够提高模型的收敛能力。通过对比实验证明,在有遮挡的复杂施工环境下,该网络
能实现弱小安全帽目标的准确检测,且检测速度较快,满足实时检测的要求。
2 YOLOv3 目标检测网络
YOLOv3 是基于回归策略的目标检测算法,网络包括 Darknet53 特征提取网络和检测网络两部
分,其中 Darknet53 主要用来提取图像特征信息,检测网络用来进行多尺度的目标预
测。DarkNet53 是全卷积网络,共有53 个卷积层,采用 1×1 和3×3 的卷积组成带有跳跃连接的
残差块来构建残差网络,减少了因网络太深而带来的梯度消失现象,能够提取更加深层的语义
信息。同时,使用步长为 2的卷积来代替最大池化进行下采样,降低了池化带来的梯度负面效
果。
为了提高网络对目标的检测能力,YOLOv3 检测层中使用了类似特征金字塔网络的上采样和特
征信息融合的做法。当输入图像归一化到 416×416 送入网络进行检测时,Darknet53 会输出3
个检测尺度,分别为 13×13,26×26,52×52.根据特征金字塔网络结构,13×13 与26×26 大小的特
征图要依次经2倍上采样操作与26×26 和52×52 大小的特征图进行信息融合,将深层的语义信
息通过快捷连接传入到浅层,得到3个带有语义和位置信息融合的特征图。YOLOv3 的网络结
构如图1所示。
图1 YOLOv3 算法结构示意图
Fig.1 Diagram of YOLOv3algorithm structure
YOLOv3 网络能够快速实现目标的检测,并利用 FPN 引入多尺度的目标预测来提高其检测能
力。但其 FPN 网络只采用 3个尺度,只进行了一次自上而下的特征融合,各层信息利用不足,
对于一些小目标和有遮挡目标,其检测能力有限。
YOLOv3 在实现边界框预测时,通过 kmeans 算法对数据集中的目标框进行维度聚类,得到9
组不同大小锚框,将锚框平均分配到3个检测尺度上,每个尺度的每个锚点分配3组锚框。但
是这样操作会带来大量的锚框,于是 YOLOv3 采用了最大交并比(IoU)来对锚框进行回
归。IoU 计算的是预测边界框和真实边界框的交集和并集的比值,一般来说预测边界框和真实
边界框重叠度越高,则其 IoU 值越大,反之越小。并且 IOU 对尺度变化具有不变性,不受两个
物体尺度大小的影响。其计算公式如式(1)所示:
其中,A属于真实框,B属于预测框。
但是 IoU 无法精确地反应真实框和预测框重合位置的关系,存在两个较大的缺点,第一,无法
衡量两个框之间的距离,如图2所示,图 2(a)明显要比图 2(b)中的距离近,但仅从 IoU 数
值上无法判断两框的远近;第二,无法反映真实框与预测框的重叠方式,如图2(c)与图
2(d)的重叠方式完全不一样,从IoU 的数值上无法判断其重叠方式。当上述情况出现时,会
导致网络没有梯度回传,造成模型难以收敛等问题的出现。
图2 真实框与预测框位置表示图
摘要:
展开>>
收起<<
基于注意力机制的安全帽检测卷积神经网络建立Abstract:Inacomplexconstructionenvironment,thehelmetwearingrecognitionalgorithmbasedonmachinevisiontechnologyoftenfailsandmisdetects,anditsrecognitionabilityislimited.Inordertoimprovetheaccuracyofhelmetwearingrecognition,thispaperestablishesahelmetrecognitionconvolutionalneuraln...
相关推荐
-
2024年党建工作要点工作计划5篇供参考
2023-12-16 999+ -
2025年专题生活会对照带头严守政治纪律和政治规矩,维护党的团结统一等“四个带头方面”个人对照检查发言材料4110字文稿
2024-12-21 999+ -
2025年医保局局长、科技局领导干部专题“四个带头”方面对照检查材料2篇例文(附:反面典型案例剖析情况)
2025-02-09 458 -
2025年国有企业党委书记、市总工会党组书记民主生活会“四个带头”方面对照个人检查发言材料2篇文(附:典型案例、上年度整改+个人情况)
2025-02-09 507 -
2025年市委组织部部长、教育局党委书记生活会“四个带头”个人对照检查发言材料2篇文(典型案例+个人事项)
2025-02-09 627 -
2025年市财政局党组书记、局长、市检察院党组领导班子对照“四个带头”方面生活会个人对照检视发言材料2篇文(含以案为鉴反思、以案促改促治方面)
2025-02-09 509 -
市检察院党组、市财政局领导班子2025年生活会对照“四个带头”方面检视发言材料2份文【含以违纪行为为典型案例剖析】
2025-02-09 461 -
2025年市财政局领导对照“四个带头”生活会检视发言材料2篇例文【含以违纪行为为典型案例剖析】
2025-02-09 586 -
单位领导班子2025年聚焦“四个带头”生活会对照检查材料2篇文(含:典型案例剖析反思、落实意识形态责任制)
2025-02-09 758 -
2025年镇党委副书记、市科学技术局领导班子生活会对照“四个带头”检视材料2篇文【含违纪行为典型案例分析】
2025-02-09 257
作者:闻远设计
分类:其它行业资料
价格:免费
属性:12 页
大小:826.03KB
格式:DOCX
时间:2024-03-09

