卷积神经网络论文(名师推荐6篇)
卷积神经网络论文(名师推荐 6篇)
摘要:针对目前卷积神经网络实现面部表情分类的模型和参数较复杂、识别准确率较低的问
题,本文提出了轻量化的卷积神经网络,在深度可分离卷积网络的基础上改进,引入 ELU 激
活函数解决神经元"坏死"问题,同时轻量化模型。实验结果显示,本文所提的方法在 FER2013
数据集上可达到 68.91%的准确率,识别效率也大大提升。
1 概述
计算机视觉技术飞速发展,人脸情绪识别技术也得到了快速推进,作为传达感情的一种方式,
面部表情传达的信息占到了交流时传递信息总量的 55%.常见的情感分为七类,包括开心、生
气、惊讶、悲伤、害怕、厌恶和中性。人脸情绪识别主要包括图像采集、数据处理、特征提取
以及情绪识别四部分,其中关键是对表情特征的提取,传统的检测方法设计较为复杂且已经不
能满足准确性的要求,因此深度学习识别情绪方法随之诞生。大规模视觉识别挑战赛等竞赛提
供了丰富的情绪数据,推动了深度学习技术的发展,其中卷积神经网络在分类识别任务上取得
了显著成效。包含 Alex Net、VGG、Res Net 等网络。
本文采用深度学习方法,在 Xception 网络的基础上,设计训练轻量卷积神经网络,在 FER2013
数据集上进行训练,在减少训练参数的同时提高识别准确率,最终达到了 68.91%的识别率。
2 改进的卷积神经网络
2.1 卷积神经网络
卷积神经网络由传统的多层神经网络发展而来,加入了有效的特征提取部分、卷积层以及池化
层,用来有效地提取特征以及减少训练参数,降低网络复杂度。最后的全连接层进行损失计算
并得到分类结果。
2.2 改进的网络模型
本文在 Xception 网络的基础上进行简化和改进,深度可分离卷积相较于正常卷积可以节省更多
参数,其先对输入图像的三个通道 RGB 分别进行空间卷积(单通道卷积),然后进行 1*1 通
道卷积,与 Inception 网络恰好相反。
本文模型首先在激活函数的选取上进行改进,常用的激活函数 RELU,其优点很明显,因其无饱
和区从而解决了梯度消失的问题,计算效率高,收敛快,但其负数部分恒为 0,称为单侧抑制,
学习率(Learning rarte)较大时,容易出现神经单元坏死,对数据无响应的问题。SELU,Scaled
Exponential Linear Units (如公式(1)),存在饱和区,不存在死区,以及 ELU,Exponential
Linear Units(如公式(2)),都解决了 Relu 函数造成的神经元"死亡"问题,也不存在梯度消
失和梯度爆炸现象,本文分别采取两种激活函数进行实验。
其中 α=1.6732632423543772848170429916717
其次对深度可分离卷积网络进行轻量化处理,改进后的模型总参数为 50263 个,而训练参数降
为49287 个,先将输入图像进行两次 3*3 卷积,Relu 激活,批归一化处理后,送入四个以
SELU 或ELU 为激活函数的可分离卷积模块,每个模块中进行两次深度可分离卷积,批归一
化,激活函数 SELU 或ELU 激活,最大池化层以及残差直连,最后一个模块输出的数据经过
1*1 卷积及全局均值池化后送入Softmax 激活函数进行分类。
3 实验
3.1 实验环境
在windows10 64 位操作系统进行实验,实验采用 Pycharm 软件编程,在 Keras 深度学习框架下
搭建网络,其高度模块化,高级API 大大简化了代码量,几十行代码即可迅速搭建深度学习框
架,且搭建的网络浅显易懂。在软件中安装 keras、tensorflow、scikit-
klearn、numpy、matplotlib、xlrd 等依赖包进行模型训练与数据处理。
3.2 数据集选取
3.2.1 FER2013
FER2013 表情数据集在 Kaggle 人脸表情分析比赛提出。含有 28709 张训练样本,验证集与测试
集的样本数量均为3859 张,像素大小规整。包含生气、厌恶、害怕、开心、悲伤、惊讶和中
性七种类别的图像,对应数字0-6.该数据库人眼判别的准确率为 65%±5%.
3.2.2 CK+数据集
CK+数据集是进行人脸表情识别最大的实验室数据集,发布于2010 年。包含有 123 个对象的
327 个被标签的序列。包含愤怒,轻视、厌恶、悲伤、惊讶、恐惧、快乐七种情绪。也是人脸
识别中较为常用的一个数据库。
本实验采用 FER2013 数据集进行模型训练。
3.3 数据处理
3.3.1 数据增强
在实际中,为了增加神经网络的学习能力,我们往往会增加神经网络的深度和广度,网络的加
深会使学习的参数增多,数据集较小时,参数会拟合数据的全部特点,而不是数据间的共同特
征,容易导致过拟合,使训练出来的模型缺乏泛化能力,准确率低。
数据增强即人为的对图像进行翻转、切割、旋转,可以防止过拟合现象,常见的数据增强方式
包括随机旋转、随机裁剪、色彩抖动、高斯噪声等,可以增加数据的多样性,从而扩大数据
量,增强训练网络的鲁棒性。本文设置参数随机旋转度数范围为10 度,随机缩放范围为0.1,水
平及垂直偏移的参数设为 0.1,设置随机水平翻转,不进行去中心化及标准化。
3.3.2 训练参数
采用经过数据增强的FER2013 数据集,利用Keras 深度学习平台搭建改进的深度可分离卷积神
经网络进行训练,并指定训练集的 20%作为验证集,验证集与训练集无公共部分,设置分类个
数(num_classes)为 7类,训练总轮数(epochs)为 200 次,批大小(batch_size)为 32 个,即
每次训练时在训练集中选 32 个样本,输入图像大小为1通道,大小为48*48,并采用 Adam 优化
器降低损失。
3.4 实验结果分析(混淆矩阵)
通过多次实验得到实验结果,采用 ELU 激活函数的识别率优于 SELU.ELU 激活函数在
FER2013 数据集得到的混淆矩阵如表1.
表1 FER2013 数据集七类表情混淆矩阵
由混淆矩阵可知,FER2013 数据集的七种表情中开心和惊讶的识别率较高,分别为:0.86 和
0.81,而悲伤和害怕的识别率较低,为 0.54 和0.46.可能是因其两种情绪的面部表情较为接近,
难以分辨,以及可能存在的标签错误以及头发、手等遮挡物的遮挡。
模型识别的训练集与验证集的准确率如图1.
图1 训练集与验证集的准确率
摘要:
展开>>
收起<<
卷积神经网络论文(名师推荐6篇) 摘要:针对目前卷积神经网络实现面部表情分类的模型和参数较复杂、识别准确率较低的问题,本文提出了轻量化的卷积神经网络,在深度可分离卷积网络的基础上改进,引入ELU激活函数解决神经元"坏死"问题,同时轻量化模型。实验结果显示,本文所提的方法在FER2013数据集上可达到68.91%的准确率,识别效率也大大提升。 1 概述计算机视觉技术飞速发展,人脸情绪识别技术也得到了快速推进,作为传达感情的一种方式,面部表情传达的信息占到了交流时传递信息总量的55%.常见的情感分为七类,包括开心、生气、惊讶、悲伤、害怕、厌恶和中性。人脸情绪识别主要包括图像采集、数据处理、特征...
相关推荐
-
甘蔗自动去皮机设计--开题报告
2023-06-18 877 -
AUTOCAD壳体多轴钻孔加工夹具设计开题报告
2023-06-24 420 -
基于PLC控制的水塔水位控制系统设计开题报告
2023-08-10 444 -
落叶清扫机-开题报告
2023-08-16 286 -
往复式自动提升机 任务书
2023-08-20 386 -
1_毕业设计开题报告-旅游观光汽车底盘设计
2024-02-16 231 -
落叶清扫压缩机结构设计-道路清扫机-压缩机-树叶回收设备
2024-08-16 178 -
机械毕业设计资料-开题报告仿生四足机器人
2024-08-27 197 -
物流搬运机器人-实习周日志
2024-08-27 145 -
开题报告-钢管切割机构设计
2024-12-03 140
作者:闻远设计
分类:其它行业资料
价格:免费
属性:8 页
大小:547.55KB
格式:DOCX
时间:2024-03-11

