卷积神经网络论文(名师推荐6篇)

3.0 闻远设计 2024-03-11 91 4 547.55KB 8 页 免费
侵权投诉
卷积神经网络论文(名师推荐 6篇)
   
摘要:针对目前卷积神经网络实现面部表情分类的模型和参数较复杂、识别准确率较低的问
题,本文提出了轻量化的卷积神经网络,在深度可分离卷积网络的基础上改进,引入 ELU
活函数解决神经元"坏死"问题,同时轻量化模型。实验结果显示,本文所提的方法在 FER2013
数据集上可达到 68.91%的准确率,识别效率也大大提升。
    1 概述
计算机视觉技术飞速发展,人脸情绪识别技术也得到了快速推进,作为传达感情的一种方式,
面部表情传达的信息占到了交流时传递信息总量的 55%.常见的情感分为七类,包括开心、生
气、惊讶、悲伤、害怕、厌恶和中性。人脸情绪识别主要包括图像采集、数据处理、特征提取
以及情绪识别四部分,其中关键是对表情特征的提取,传统的检测方法设计较为复杂且已经不
能满足准确性的要求,因此深度学习识别情绪方法随之诞生。大规模视觉识别挑战赛等竞赛提
供了丰富的情绪数据,推动了深度学习技术的发展,其中卷积神经网络在分类识别任务上取得
了显著成效。包含 Alex NetVGGRes Net 等网络。
本文采用深度学习方法,在 Xception 网络的基础上,设计训练轻量卷积神经网络,在 FER2013
数据集上进行训练,在减少训练参数的同时提高识别准确率,最终达到了 68.91%的识别率。
    2 改进的卷积神经网络
2.1 卷积神经网络
卷积神经网络由传统的多层神经网络发展而来,加入了有效的特征提取部分、卷积层以及池化
层,用来有效地提取特征以及减少训练参数,降低网络复杂度。最后的全连接层进行损失计算
并得到分类结果。
2.2 改进的网络模型
本文在 Xception 网络的基础上进行简化和改进,深度可分离卷积相较于正常卷积可以节省更多
参数,其先对输入图像的三个通道 RGB 分别进行空间卷积(单通道卷积),然后进行 1*1
道卷积,与 Inception 网络恰好相反。
本文模型首先在激活函数的选取上进行改进,常用的激活函数 RELU,其优点很明显,因其无饱
和区从而解决了梯度消失的问题,计算效率高,收敛快,但其负数部分恒为 0,称为单侧抑制,
学习率(Learning rarte)较大时,容出现神经单元坏死,对数据无响应的问题。SELU,Scaled
Exponential Linear Units 如公式(1)),在饱和区,不在死区,以及 ELU,Exponential
Linear Units如公式(2)),解决了 Relu 函数成的神经元""问题,也不在梯度消
失和梯度爆炸,本文分别采取种激活函数进行实验。
其中 α=1.6732632423543772848170429916717
对深度可分离卷积网络进行轻量化处理,改进后的模型总参数为 50263 个,而训练参数降
49287 个,先输入图像进行两次 3*3 卷积,Relu 激活,批归一化处理后,入四个以
SELU ELU 为激活函数的可分离卷积模个模中进行两次深度可分离卷积,批归
化,激活函数 SELU ELU 激活,最大池化层以及残差直连,最后一个模输出的数据经
1*1 卷积及全局均值池化后Softmax 激活函数进行分类。
    3 实验
3.1 实验环境
windows10 64 位操统进行实验,实验采用 Pycharm 软件编程,在 Keras 深度学习框架下
搭建网络,其高度模化,高API 大大简化了代码量,几十代码即搭建深度学习
,且搭建的网络易懂。在软件安装 kerastensorflowscikit-
klearnnumpymatplotlibxlrd 依赖包进行模型训练与数据处理。
3.2 数据集选取
3.2.1 FER2013
FER2013 表情数据集在 Kaggle 人脸表情分析比赛提出。含有 28709 训练本,验集与测
集的本数量3859 ,像。包含生气、厌恶、害怕、开心、悲伤、惊讶和中
性七种类别的图像,对0-6.数据眼判别的准确率为 65%±5%.
3.2.2 CK+数据集
CK+数据集是进行人脸表情识别最大的实验数据集,发2010 。包含有 123 个对
327 被标签序列。包含愤怒,轻视、厌恶、悲伤、惊讶、恐惧、快七种情绪。也是人脸
识别中较为常用的一个数据
本实验采用 FER2013 数据集进行模型训练。
3.3 数据处理
3.3.1 数据增强
在实中,为了加神经网络的学习能我们往往会增加神经网络的深度和广度,网络的加
会使学习的参数多,数据集较时,参数会拟合数据的全部特点,而不是数据间的同特
征,容易导致过拟合使训练出来的模型缺乏泛化能,准确率低。
数据增强即人为的对图像进行翻转切割旋转,可以防止过拟合,常见的数据增强方式
包括随机旋转、随机裁剪色彩抖动、高斯噪声等,可以加数据的多性,从而大数据
量,增强训练网络的鲁棒性。本文设参数随机旋转度数范围10 度,随机缩放范围0.1,
垂直偏移的参数设为 0.1,随机水平翻转,不进行中心化及准化。
3.3.2 训练参数
采用经数据增强FER2013 数据集,Keras 深度学习平台搭建改进的深度可分离卷积神
经网络进行训练,并指定训练集的 20%作为验集,验集与训练集无公共部分,设分类个
数(num_classes)为 7类,训练总数(epochs)为 200 batch_size)为 32 个,
每次训练时在训练集中选 32 本,输入图像大1通道,大48*48,并采用 Adam 优化
降低损失。
3.4 实验结果分混淆矩阵
实验得到实验结果,采用 ELU 激活函数的识别率优于 SELU.ELU 激活函数在
FER2013 数据集得到的混淆矩阵如1.
1 FER2013 数据集七类表情混淆矩阵
混淆矩阵FER2013 数据集的七种表情中开心和惊讶的识别率较高,分别为0.86
0.81,而悲伤和害怕的识别率较低,为 0.54 0.46.可能是因其种情绪的面部表情较为接
以分,以及可能在的标签错误以及发、遮挡物遮挡
模型识别的训练集与验集的准确率1.
1 训练集与验集的准确率
摘要:

卷积神经网络论文(名师推荐6篇)  摘要:针对目前卷积神经网络实现面部表情分类的模型和参数较复杂、识别准确率较低的问题,本文提出了轻量化的卷积神经网络,在深度可分离卷积网络的基础上改进,引入ELU激活函数解决神经元"坏死"问题,同时轻量化模型。实验结果显示,本文所提的方法在FER2013数据集上可达到68.91%的准确率,识别效率也大大提升。  1 概述计算机视觉技术飞速发展,人脸情绪识别技术也得到了快速推进,作为传达感情的一种方式,面部表情传达的信息占到了交流时传递信息总量的55%.常见的情感分为七类,包括开心、生气、惊讶、悲伤、害怕、厌恶和中性。人脸情绪识别主要包括图像采集、数据处理、特征...

展开>> 收起<<
卷积神经网络论文(名师推荐6篇).docx

共8页,预览3页

还剩页未读, 继续阅读

相关推荐

作者:闻远设计 分类:其它行业资料 价格:免费 属性:8 页 大小:547.55KB 格式:DOCX 时间:2024-03-11

开通VIP享超值会员特权

  • 多端同步记录
  • 高速下载文档
  • 免费文档工具
  • 分享文档赚钱
  • 每日登录抽奖
  • 优质衍生服务
/ 8
客服
关注