卷积神经网络论文（名师推荐6篇）

3.0 闻远设计 2024-03-11 102 4 547.55KB 8 页免费

侵权投诉

卷积神经网络论文（名师推荐 6篇）

摘要：针对目前卷积神经网络实现面部表情分类的模型和参数较复杂、识别准确率较低的问

题，本文提出了轻量化的卷积神经网络，在深度可分离卷积网络的基础上改进，引入 ELU 激

活函数解决神经元"坏死"问题，同时轻量化模型。实验结果显示，本文所提的方法在 FER2013

数据集上可达到 68.91%的准确率，识别效率也大大提升。

　　 1　概述

计算机视觉技术飞速发展，人脸情绪识别技术也得到了快速推进，作为传达感情的一种方式，

面部表情传达的信息占到了交流时传递信息总量的 55%.常见的情感分为七类，包括开心、生

气、惊讶、悲伤、害怕、厌恶和中性。人脸情绪识别主要包括图像采集、数据处理、特征提取

以及情绪识别四部分，其中关键是对表情特征的提取，传统的检测方法设计较为复杂且已经不

能满足准确性的要求，因此深度学习识别情绪方法随之诞生。大规模视觉识别挑战赛等竞赛提

供了丰富的情绪数据，推动了深度学习技术的发展，其中卷积神经网络在分类识别任务上取得

了显著成效。包含 Alex Net、VGG、Res Net 等网络。

本文采用深度学习方法，在 Xception 网络的基础上，设计训练轻量卷积神经网络，在 FER2013

数据集上进行训练，在减少训练参数的同时提高识别准确率，最终达到了 68.91%的识别率。

　　 2　改进的卷积神经网络

2.1 卷积神经网络

卷积神经网络由传统的多层神经网络发展而来，加入了有效的特征提取部分、卷积层以及池化

层，用来有效地提取特征以及减少训练参数，降低网络复杂度。最后的全连接层进行损失计算

并得到分类结果。

2.2 改进的网络模型

本文在 Xception 网络的基础上进行简化和改进，深度可分离卷积相较于正常卷积可以节省更多

参数，其先对输入图像的三个通道 RGB 分别进行空间卷积（单通道卷积），然后进行 1*1 通

道卷积，与 Inception 网络恰好相反。

本文模型首先在激活函数的选取上进行改进，常用的激活函数 RELU,其优点很明显，因其无饱

和区从而解决了梯度消失的问题，计算效率高，收敛快，但其负数部分恒为 0,称为单侧抑制，

学习率（Learning rarte）较大时，容易出现神经单元坏死，对数据无响应的问题。SELU,Scaled

Exponential Linear Units （如公式（1）），存在饱和区，不存在死区，以及 ELU,Exponential

Linear Units（如公式（2）），都解决了 Relu 函数造成的神经元"死亡"问题，也不存在梯度消

失和梯度爆炸现象，本文分别采取两种激活函数进行实验。

其中 α=1.6732632423543772848170429916717

其次对深度可分离卷积网络进行轻量化处理，改进后的模型总参数为 50263 个，而训练参数降

为49287 个，先将输入图像进行两次 3*3 卷积，Relu 激活，批归一化处理后，送入四个以

SELU 或ELU 为激活函数的可分离卷积模块，每个模块中进行两次深度可分离卷积，批归一

化，激活函数 SELU 或ELU 激活，最大池化层以及残差直连，最后一个模块输出的数据经过

1*1 卷积及全局均值池化后送入Softmax 激活函数进行分类。

　　 3　实验

3.1 实验环境

在windows10 64 位操作系统进行实验，实验采用 Pycharm 软件编程，在 Keras 深度学习框架下

搭建网络，其高度模块化，高级API 大大简化了代码量，几十行代码即可迅速搭建深度学习框

架，且搭建的网络浅显易懂。在软件中安装 keras、tensorflow、scikit-

klearn、numpy、matplotlib、xlrd 等依赖包进行模型训练与数据处理。

3.2 数据集选取

3.2.1 FER2013

FER2013 表情数据集在 Kaggle 人脸表情分析比赛提出。含有 28709 张训练样本，验证集与测试

集的样本数量均为3859 张，像素大小规整。包含生气、厌恶、害怕、开心、悲伤、惊讶和中

性七种类别的图像，对应数字0-6.该数据库人眼判别的准确率为 65%±5%.

3.2.2 CK+数据集

CK+数据集是进行人脸表情识别最大的实验室数据集，发布于2010 年。包含有 123 个对象的

327 个被标签的序列。包含愤怒，轻视、厌恶、悲伤、惊讶、恐惧、快乐七种情绪。也是人脸

识别中较为常用的一个数据库。

本实验采用 FER2013 数据集进行模型训练。

3.3 数据处理

3.3.1 数据增强

在实际中，为了增加神经网络的学习能力，我们往往会增加神经网络的深度和广度，网络的加

深会使学习的参数增多，数据集较小时，参数会拟合数据的全部特点，而不是数据间的共同特

征，容易导致过拟合，使训练出来的模型缺乏泛化能力，准确率低。

数据增强即人为的对图像进行翻转、切割、旋转，可以防止过拟合现象，常见的数据增强方式

包括随机旋转、随机裁剪、色彩抖动、高斯噪声等，可以增加数据的多样性，从而扩大数据

量，增强训练网络的鲁棒性。本文设置参数随机旋转度数范围为10 度，随机缩放范围为0.1,水

平及垂直偏移的参数设为 0.1,设置随机水平翻转，不进行去中心化及标准化。

3.3.2 训练参数

采用经过数据增强的FER2013 数据集，利用Keras 深度学习平台搭建改进的深度可分离卷积神

经网络进行训练，并指定训练集的 20%作为验证集，验证集与训练集无公共部分，设置分类个

数（num_classes）为 7类，训练总轮数（epochs）为 200 次，批大小（batch_size）为 32 个，即

每次训练时在训练集中选 32 个样本，输入图像大小为1通道，大小为48*48,并采用 Adam 优化

器降低损失。

3.4 实验结果分析（混淆矩阵）

通过多次实验得到实验结果，采用 ELU 激活函数的识别率优于 SELU.ELU 激活函数在

FER2013 数据集得到的混淆矩阵如表1.

表1 FER2013 数据集七类表情混淆矩阵

由混淆矩阵可知，FER2013 数据集的七种表情中开心和惊讶的识别率较高，分别为：0.86 和

0.81,而悲伤和害怕的识别率较低，为 0.54 和0.46.可能是因其两种情绪的面部表情较为接近，

难以分辨，以及可能存在的标签错误以及头发、手等遮挡物的遮挡。

模型识别的训练集与验证集的准确率如图1.

图1 训练集与验证集的准确率

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

免费 4人已下载

立即下载

摘要：

卷积神经网络论文（名师推荐6篇）　　摘要：针对目前卷积神经网络实现面部表情分类的模型和参数较复杂、识别准确率较低的问题，本文提出了轻量化的卷积神经网络，在深度可分离卷积网络的基础上改进，引入ELU激活函数解决神经元"坏死"问题，同时轻量化模型。实验结果显示，本文所提的方法在FER2013数据集上可达到68.91%的准确率，识别效率也大大提升。　　1　概述计算机视觉技术飞速发展，人脸情绪识别技术也得到了快速推进，作为传达感情的一种方式，面部表情传达的信息占到了交流时传递信息总量的55%.常见的情感分为七类，包括开心、生气、惊讶、悲伤、害怕、厌恶和中性。人脸情绪识别主要包括图像采集、数据处理、特征...

展开>> 收起<<

卷积神经网络论文（名师推荐6篇）.docx

共8页,预览3页

还剩页未读，继续阅读

卷积神经网络论文（名师推荐6篇）

相关推荐

开通VIP享超值会员特权

作者详情

相关内容

推荐作者

热门标签

举报选择: