相同关键词【facial expression recognition】论文列表 -- 中国光学期刊网

作者单位

摘要

陕西科技大学电子信息与人工智能学院，陕西西安710021

针对ResNet18网络模型在面部表情识别时存在网络模型大、准确率低等问题，提出了一种基于注意力机制ResNet轻量网络模型（Multi-Scale CBAM Lightweight ResNet，MCLResNet），能够以较少的参数量、较高的准确率实现面部表情的识别。首先，采用ResNet18作为主干网络提取特征，引入分组卷积减少ResNet18的参数量；利用倒残差结构增加网络深度，优化了图像特征提取效果。其次，将CBAM（Convolutional Block Attention Module）通道注意力模块中的共享全连接层替换为1×3的卷积模块，有效减少了通道信息的丢失；在CBAM空间注意力模块中添加多尺度卷积模块获得了不同尺度的空间特征信息。最后，将多尺度空间特征融合的CBAM模块（Multi-Scale CBAM，MSCBAM）添加到轻量的ResNet模型中，有效增加了网络模型的特征表达能力，另外在引入MSCBAM的网络模型输出层增加一层全连接层，以此增加模型在输出时的非线性表示。该模型在FER2013和CK+数据集上的实验结果表明，本文提出的模型参数量相比ResNet18下降82.58%，并且有较好的识别准确率。

ResNet轻量网络多尺度空间特征融合面部表情识别注意力机制 lightweight resnet network multi-scale spatial feature fusion facial expression recognition attention mechanism

PDF全文 Full Text

液晶与显示

2023, 38(11): 1503

图像处理

多区域融合轻量级人脸表情识别网络

唐宏 ^1,2向俊玲 ^1,2,*陈海涛 ³吕榕城 ¹夏泽昊 ³

作者单位

摘要

¹ 重庆邮电大学通信与信息工程学院，重庆 400065

² 重庆邮电大学移动通信技术重庆市重点实验室，重庆 400065

³ 重庆邮电大学国际学院，重庆 400065

由于人脸表情特有的微妙性和复杂性，对全局面部进行研究时无法突出表情特性。为了增强表情识别在自然环境下的鲁棒性并且优化模型参数，提出一种基于多区域融合的轻量级人脸表情识别方法，融合局部细节特征和全局整体特征，实现粗细粒度结合，增强模型对表情细微变化的判别能力。首先，通过一个分支从人脸子区域提取局部特征，以眼部和嘴部作为细节区域输入，描述面部细节。其次，通过另一个分支从人脸全局自适应地获取面部整体特征，以关键点生成掩模，辅助调节面部注意力图。注意力图作用于全局特征，突出未遮挡部位权重，描述整体高级语义信息。并且，采用剪枝算法对整体模型进行轻量级优化，使用更少的运行内存和计算操作，得到更紧凑的网络。最后，在公开数据集RAF-DB和AffectNet上，所提方法对表情的识别精度分别达85.39%和58.81%。实验结果表明：所提方法的识别精度高于其他先进方法，并显著减少了参数量，有效性和先进性得到证明。

图像处理人脸表情识别注意力图轻量级网络剪枝算法多区域融合

PDF全文 Full Text

激光与光电子学进展

2023, 60(6): 0610006

机器视觉

基于注意力拆分卷积残差网络的表情识别

陈加敏 ¹徐杨 ^1,2,*

作者单位

摘要

¹ 贵州大学大数据与信息工程学院，贵州贵阳 550025

² 贵阳铝镁设计研究院有限公司，贵州贵阳 550009

人脸表情识别是神经网络应用于模式识别上一项极具挑战性的任务，而表情识别过程中特征提取尤为重要。因此，提出了一种注意力拆分卷积残差网络来增强特征表现。该网络以ResNet18为骨干网络，用Coordinate Attention Split Convolution Block（CASCBlock）替换ResNet18中的basic block。CASCBlock首先使用两个拆分卷积将特征在通道维度先拆分后融合降低冗余特征表现；然后在第2个拆分卷积后融入坐标注意力机制；最后构建一个全连接分类器进行表情识别。将所提方法在FER2013和RAF-DB数据集上进行了实验，实验结果表明，所提方法在FER2013和RAF-DB数据集上识别准确率相较于ResNet18分别提高了2.897个百分点和2.575个百分点，且模型的参数量下降了60%左右。

机器视觉拆分卷积残差网络特征融合表情识别注意力机制

PDF全文 Full Text

激光与光电子学进展

2022, 59(18): 1815009

光学图像处理与识别

利用双流卷积神经网络的人脸表情识别方法

翟海庆 ^1,2,*刘丹 ^1,2刘晙 ^1,3

作者单位

摘要

¹ 河南工学院计算机科学与技术学院, 河南新乡 453003

² 河南省生产制造物联大数据工程技术研究中心, 河南新乡 453003

³ 武汉理工大学计算机科学与技术学院, 湖北武汉 430063

近年来, 人脸表情识别(FER)方法已经取得比较好的识别准确度, 但实际环境中由于姿态、遮挡、光照等因素, 会对其检测准确度有不小的减弱效果。针对这些问题, 提出了一种新的基于双流卷积神经网络(CNN)的FER算法。从外观和几何特征差异两方面入手, 建立双流CNN, 基于外观特征的网络是提取预处理后图像的局部方向模式(LDP)特征作为该网络的输入, 而基于几何特征的网络主要是基于动作单元(AUs)标志点的坐标变化, AUs标志点主要是标志面部做表情时运动肌肉的位置。此外, 利用了一种自动编码器技术生成具有中性情绪的面部图像的技术。算法在CK+和JAFFE数据集上进行了验证, 检测准确度分别为98.81%和96.05%, 与其他最新方法比较均显示出更好的效果。

人脸表情识别双流卷积神经网络 LDP特征几何特征深度学习 facial expression recognition Dual-stream convolutional neural network LDP features geometric characteristics deep learning

PDF全文 Full Text

光学技术

2020, 46(6): 712

机器视觉

基于集成卷积神经网络的面部表情分类

下载：1806次

周涛 ¹吕晓琪 ^1,2,3,*任国印 ¹谷宇 ^1,3[ ... ]李菁 ¹

作者单位

摘要

¹ 内蒙古科技大学信息工程学院模式识别与智能图像处理重点实验室, 内蒙古包头 014010

² 内蒙古工业大学信息工程学院, 内蒙古呼和浩特 010051

³ 上海大学计算机工程与科学学院, 上海 200444

⁴ 大连海事大学信息科学技术学院, 辽宁大连 116026

针对传统机器学习中人工提取特征复杂度高,以及单卷积网络提取特征不充分导致识别率不高的问题,提出了一种基于集成卷积神经网络的面部表情识别新方法。该方法是将VGGNet-19改进后的VGGNet-19GP模型和ResNet-18模型进行集成,构建了集成网络(EnsembleNet)模型。该模型首先在训练集上对单模型进行训练,使单模型达到实验最优,然后在测试集上进行集成测试。在FER2013和CK+数据集上分别获得了73.854%和97.611%的平均准确率。与VGGNet-19GP和ResNet-18模型以及现有方法进行对比,结果表明,基于集成的面部表情分类方法具有分类更加准确和泛化能力更强的优点。

机器视觉人脸表情识别卷积神经网络集成学习

PDF全文 Full Text

激光与光电子学进展

2020, 57(14): 141501

信息科学

多模深度卷积神经网络应用于视频表情识别

潘仙张 ^*张石清郭文平

作者单位

摘要

台州学院智能信息处理研究所, 浙江台州 318000

由于视频中的手工特征和主观情感之间的直接相关性很小, 识别视频序列中的面部表情是一项很有挑战性的任务, 为了克服这个缺陷, 有效提高视频中的人脸表情识别性能。本方法采用两个深度卷积神经网络, 即空间卷积神经网络和时间卷积神经网络, 用于视频中的时空表情特征学习。其中, 空间卷积神经网络用于提取视频中每一帧静态的表情图像的空间信息特征, 而时间卷积神经网络用于从视频中多帧表情图像的光流信息中提取动态信息特征。然后, 将这两个深度卷积神经网络学习到的时空特征进行基于深度信念网络(DBN)的特征层融合, 输入到支持向量机实现视频中的人脸表情分类任务。在公共的RML和BAUM-1s视频情感数据集的测试结果表明, 该方法分别取得了71.06%和5218%的正确识别率, 明显优于现有文献报导的结果。多模深度卷积神经网络的人脸表情识别方法能提高视频中人脸表情的识别性能。

深度卷积神经网络多模深度学习表情识别时空特征深度信念神经网络 deep convolutional neural network multimodal deep learning facial expression recognition temporal-spatial features Deep Belief Network(DBN)

PDF全文 Full Text

光学精密工程

2019, 27(4): 963

图像处理

基于概率协作表示的多表情序列融合识别

下载：888次

王秀友 ^1,2,*范建中 ¹刘华明 ¹徐冬青 ¹刘争艳 ¹

作者单位

摘要

¹ 阜阳师范学院计算机与信息工程学院, 安徽阜阳 236037

² 安徽大学计算机科学与技术学院, 安徽合肥 230601

传统表情识别往往是基于单一图像进行特征提取、训练及识别,缺乏在动态时间上的细微表情变化提取。利用时间前后的人脸表情变化信息,提出了一种基于概率协作表示的多视频序列融合表情识别方法。先采用主动外观模型(AAM)定位出人脸表情的68个特征点,利用提出的融合策略将相邻3帧表情图像的AAM特征进行融合,最后利用概率协作表示的分类优势进行识别。实验结果表明,在CK+表情数据库上,所提出的方法能够把握表情的时间变化信息,相比于近几年的表情识别算法,在识别率上取得了较好的效果。

机器视觉人脸表情识别主动外观模型多序列融合概率协作表示

PDF全文 Full Text

激光与光电子学进展

2019, 56(13): 131004

图像处理

基于AR-WLD和分块相似度加权的遮挡表情识别

下载：892次

王晓华 ^1,*陈影 ¹胡敏 ¹任福继 ^1,2

作者单位

摘要

¹ 合肥工业大学计算机与信息学院情感计算与先进智能机器安徽省重点实验室, 安徽合肥 230009

² 德岛大学先端技术科学教育部, 日本德岛 7708502

针对非约束环境下,局部遮挡可能会对表情识别造成干扰并影响最终判别结果的问题,提出一种基于非对称邻域韦伯局部描述子(AR-WLD)和分块相似度加权的表情识别算法。在特征描述上,相比传统的韦伯局部描述子 (WLD),AR-WLD将原有的方形邻域扩展成非对称邻域,并进行了多尺度分析,增强了算子的表征能力。在分类判别时,为了区分不同面部区域对表情识别的贡献度,对表情区域进行了不重叠分块;引入了信息熵来衡量不同子块包含的不确定信息,依据信息量定义相似性距离的权重;通过分块相似度加权求和,实现表情判别。在JAFFE库和CK库上的实验结果表明:当表情图像存在遮挡时,AR-WLD可以有效地提高WLD的分类能力和稳健性,分块相似度加权的分类算法则进一步降低遮挡区域对表情识别的干扰。

图像处理遮挡表情识别非对称邻域韦伯局部描述子分块相似度信息熵加权

PDF全文 Full Text

激光与光电子学进展

2018, 55(4): 041013

机器视觉

用于人脸表情识别的多分辨率特征融合卷积神经网络

下载：1123次

何志超赵龙章 ^*陈闯

作者单位

摘要

南京工业大学电气工程与控制科学学院，江苏南京 211816

在人脸表情识别任务中，传统的机器学习方法是基于人工来提取特征，其特征提取过程时间复杂度高且稳健性差，而现有依赖单通道卷积核的卷积神经网络提取特征不够充分，进而导致识别率不高。针对这些问题，提出一种多分辨率特征融合的卷积神经网络。利用两个相互独立且深度不同的通道对图片进行特征提取，使卷积神经网络自主学习同一图像下不同分辨率的特征，然后将不同分辨率的特征送入全连接层并进行特征融合，最后经过softmax分类器进行表情分类。在JAFFE和CK+表情数据库上进行了多次实验，结果表明，与传统的机器学习方法和现有的卷积神经网络结构相比，所提卷积神经网络结构模型具有稳健性好、泛化能力强、收敛速度快的优点。

机器视觉人脸表情识别特征提取卷积神经网络多分辨率特征融合

PDF全文 Full Text

激光与光电子学进展

2018, 55(7): 071503

信息光学与图像处理

基于位移特征与随机森林的表情识别方法研究

林子澄 ^1,*黄元亮 ²刘一民 ¹

作者单位

摘要

¹ 暨南大学理工学院, 广州 510632

² 暨南大学电气自动化研究所, 广东珠海 519070

为了有效地对图像序列进行面部表情识别, 提出一种基于主动形状模型(active shape model, ASM)结合Lucas-Kanade(LK)光流法的方法提取位移特征, 采用随机森林分类器对提取到的位移特征进行分类与识别。在Extended Cohn-Kanade(CK+)人脸表情数据库上的实验表明, 该特征提取方法能够很好地描述图像序列中所包含的表情信息和特征点运动变化信息, 比常用的K-近邻、贝叶斯网络和支持向量机等分类器所表现出来的效果要好, 其识别率达到95.1%。

人脸表情识别位移特征主动形状模型随机森林 LK光流法 facial expression recognition displacement feature active shape model random forest LK optical flow

PDF全文 Full Text

光学技术

2018, 44(1): 25

关于本站 Cookie 的使用提示

全站搜索

热点聚焦

学术活动

关于本站 Cookie 的使用提示

全站搜索