卷积神经网络论文(名师推荐6篇)
卷积神经网络论文(名师推荐 6篇)
摘要:针对目前卷积神经网络实现面部表情分类的模型和参数较复杂、识别准确率较低的问
题,本文提出了轻量化的卷积神经网络,在深度可分离卷积网络的基础上改进,引入 ELU 激
活函数解决神经元"坏死"问题,同时轻量化模型。实验结果显示,本文所提的方法在 FER2013
数据集上可达到 68.91%的准确率,识别效率也大大提升。
1 概述
计算机视觉技术飞速发展,人脸情绪识别技术也得到了快速推进,作为传达感情的一种方式,
面部表情传达的信息占到了交流时传递信息总量的 55%.常见的情感分为七类,包括开心、生
气、惊讶、悲伤、害怕、厌恶和中性。人脸情绪识别主要包括图像采集、数据处理、特征提取
以及情绪识别四部分,其中关键是对表情特征的提取,传统的检测方法设计较为复杂且已经不
能满足准确性的要求,因此深度学习识别情绪方法随之诞生。大规模视觉识别挑战赛等竞赛提
供了丰富的情绪数据,推动了深度学习技术的发展,其中卷积神经网络在分类识别任务上取得
了显著成效。包含 Alex Net、VGG、Res Net 等网络。
本文采用深度学习方法,在 Xception 网络的基础上,设计训练轻量卷积神经网络,在 FER2013
数据集上进行训练,在减少训练参数的同时提高识别准确率,最终达到了 68.91%的识别率。
2 改进的卷积神经网络
2.1 卷积神经网络
卷积神经网络由传统的多层神经网络发展而来,加入了有效的特征提取部分、卷积层以及池化
层,用来有效地提取特征以及减少训练参数,降低网络复杂度。最后的全连接层进行损失计算
并得到分类结果。
2.2 改进的网络模型
本文在 Xception 网络的基础上进行简化和改进,深度可分离卷积相较于正常卷积可以节省更多
参数,其先对输入图像的三个通道 RGB 分别进行空间卷积(单通道卷积),然后进行 1*1 通
道卷积,与 Inception 网络恰好相反。
本文模型首先在激活函数的选取上进行改进,常用的激活函数 RELU,其优点很明显,因其无饱
和区从而解决了梯度消失的问题,计算效率高,收敛快,但其负数部分恒为 0,称为单侧抑制,
学习率(Learning rarte)较大时,容易出现神经单元坏死,对数据无响应的问题。SELU,Scaled
Exponential Linear Units (如公式(1)),存在饱和区,不存在死区,以及 ELU,Exponential
Linear Units(如公式(2)),都解决了 Relu 函数造成的神经元"死亡"问题,也不存在梯度消
失和梯度爆炸现象,本文分别采取两种激活函数进行实验。
其中 α=1.6732632423543772848170429916717
其次对深度可分离卷积网络进行轻量化处理,改进后的模型总参数为 50263 个,而训练参数降
为49287 个,先将输入图像进行两次 3*3 卷积,Relu 激活,批归一化处理后,送入四个以
SELU 或ELU 为激活函数的可分离卷积模块,每个模块中进行两次深度可分离卷积,批归一
化,激活函数 SELU 或ELU 激活,最大池化层以及残差直连,最后一个模块输出的数据经过
1*1 卷积及全局均值池化后送入Softmax 激活函数进行分类。
3 实验
3.1 实验环境
在windows10 64 位操作系统进行实验,实验采用 Pycharm 软件编程,在 Keras 深度学习框架下
搭建网络,其高度模块化,高级API 大大简化了代码量,几十行代码即可迅速搭建深度学习框
架,且搭建的网络浅显易懂。在软件中安装 keras、tensorflow、scikit-
klearn、numpy、matplotlib、xlrd 等依赖包进行模型训练与数据处理。
3.2 数据集选取
3.2.1 FER2013
FER2013 表情数据集在 Kaggle 人脸表情分析比赛提出。含有 28709 张训练样本,验证集与测试
集的样本数量均为3859 张,像素大小规整。包含生气、厌恶、害怕、开心、悲伤、惊讶和中
性七种类别的图像,对应数字0-6.该数据库人眼判别的准确率为 65%±5%.
3.2.2 CK+数据集
CK+数据集是进行人脸表情识别最大的实验室数据集,发布于2010 年。包含有 123 个对象的
327 个被标签的序列。包含愤怒,轻视、厌恶、悲伤、惊讶、恐惧、快乐七种情绪。也是人脸
识别中较为常用的一个数据库。
本实验采用 FER2013 数据集进行模型训练。
3.3 数据处理
3.3.1 数据增强
在实际中,为了增加神经网络的学习能力,我们往往会增加神经网络的深度和广度,网络的加
深会使学习的参数增多,数据集较小时,参数会拟合数据的全部特点,而不是数据间的共同特
征,容易导致过拟合,使训练出来的模型缺乏泛化能力,准确率低。
数据增强即人为的对图像进行翻转、切割、旋转,可以防止过拟合现象,常见的数据增强方式
包括随机旋转、随机裁剪、色彩抖动、高斯噪声等,可以增加数据的多样性,从而扩大数据
量,增强训练网络的鲁棒性。本文设置参数随机旋转度数范围为10 度,随机缩放范围为0.1,水
平及垂直偏移的参数设为 0.1,设置随机水平翻转,不进行去中心化及标准化。
3.3.2 训练参数
采用经过数据增强的FER2013 数据集,利用Keras 深度学习平台搭建改进的深度可分离卷积神
经网络进行训练,并指定训练集的 20%作为验证集,验证集与训练集无公共部分,设置分类个
数(num_classes)为 7类,训练总轮数(epochs)为 200 次,批大小(batch_size)为 32 个,即
每次训练时在训练集中选 32 个样本,输入图像大小为1通道,大小为48*48,并采用 Adam 优化
器降低损失。
3.4 实验结果分析(混淆矩阵)
通过多次实验得到实验结果,采用 ELU 激活函数的识别率优于 SELU.ELU 激活函数在
FER2013 数据集得到的混淆矩阵如表1.
表1 FER2013 数据集七类表情混淆矩阵
由混淆矩阵可知,FER2013 数据集的七种表情中开心和惊讶的识别率较高,分别为:0.86 和
0.81,而悲伤和害怕的识别率较低,为 0.54 和0.46.可能是因其两种情绪的面部表情较为接近,
难以分辨,以及可能存在的标签错误以及头发、手等遮挡物的遮挡。
模型识别的训练集与验证集的准确率如图1.
图1 训练集与验证集的准确率
摘要:
展开>>
收起<<
卷积神经网络论文(名师推荐6篇) 摘要:针对目前卷积神经网络实现面部表情分类的模型和参数较复杂、识别准确率较低的问题,本文提出了轻量化的卷积神经网络,在深度可分离卷积网络的基础上改进,引入ELU激活函数解决神经元"坏死"问题,同时轻量化模型。实验结果显示,本文所提的方法在FER2013数据集上可达到68.91%的准确率,识别效率也大大提升。 1 概述计算机视觉技术飞速发展,人脸情绪识别技术也得到了快速推进,作为传达感情的一种方式,面部表情传达的信息占到了交流时传递信息总量的55%.常见的情感分为七类,包括开心、生气、惊讶、悲伤、害怕、厌恶和中性。人脸情绪识别主要包括图像采集、数据处理、特征...
相关推荐
-
2024年党建工作要点工作计划5篇供参考
2023-12-16 999+ -
2025年专题生活会对照带头严守政治纪律和政治规矩,维护党的团结统一等“四个带头方面”个人对照检查发言材料4110字文稿
2024-12-21 999+ -
2025年医保局局长、科技局领导干部专题“四个带头”方面对照检查材料2篇例文(附:反面典型案例剖析情况)
2025-02-09 458 -
2025年国有企业党委书记、市总工会党组书记民主生活会“四个带头”方面对照个人检查发言材料2篇文(附:典型案例、上年度整改+个人情况)
2025-02-09 507 -
2025年市委组织部部长、教育局党委书记生活会“四个带头”个人对照检查发言材料2篇文(典型案例+个人事项)
2025-02-09 627 -
2025年市财政局党组书记、局长、市检察院党组领导班子对照“四个带头”方面生活会个人对照检视发言材料2篇文(含以案为鉴反思、以案促改促治方面)
2025-02-09 509 -
市检察院党组、市财政局领导班子2025年生活会对照“四个带头”方面检视发言材料2份文【含以违纪行为为典型案例剖析】
2025-02-09 461 -
2025年市财政局领导对照“四个带头”生活会检视发言材料2篇例文【含以违纪行为为典型案例剖析】
2025-02-09 586 -
单位领导班子2025年聚焦“四个带头”生活会对照检查材料2篇文(含:典型案例剖析反思、落实意识形态责任制)
2025-02-09 758 -
2025年镇党委副书记、市科学技术局领导班子生活会对照“四个带头”检视材料2篇文【含违纪行为典型案例分析】
2025-02-09 257
作者:闻远设计
分类:其它行业资料
价格:免费
属性:8 页
大小:547.55KB
格式:DOCX
时间:2024-03-11

