结合自注意力特征过滤分类器和双分支GAN的面部表情识别

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:gengyuefeng009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有面部表情识别方法提取表情特征时通常容易与其它面部属性混合,不利于面部表情的识别.对此,文中提出结合自注意力特征过滤分类器和双分支生成对抗网络的面部表情识别方法.首先,使用双分支生成对抗网络学习辨别性的表情表示,提出自注意力特征过滤分类器作为表情的分类模块.使用级联的LayerNorm和ReLU将低激活单元归零并保留高激活单元,生成多级特征.使用自注意力融合输出多级特征的预测结果,在一定程度上消除噪声对识别结果的影响.然后,提出基于滑动模块的双重图像一致性损失监督模型,学习具有辨别性的表情表示,使用滑动窗口计算重构损失,关注细节信息.最后,在CK+、RAF-DB、TFEID、BAUM-2i数据集上的实验表明文中方法识别效果较优.
其他文献
跨媒体数据搜索中不同媒体类型的数据间存在特征异构和语义鸿沟问题,且社交网络数据往往呈现语义稀疏性、多样性等特性.针对上述问题,文中提出基于多模态图和对抗哈希注意力网络的跨媒体细粒度表示学习模型,获取统一的跨媒体语义表示,应用于社交网络跨媒体搜索.首先,构建图像-单词关联图,并基于图随机游走策略挖掘图像和文本单词间直接语义关联和隐含语义关联,实现语义关系扩展.然后,构建基于跨媒体协同注意力机制的跨媒体细粒度特征学习网络,通过互相指导的跨媒体注意力机制协同学习图像和文本的细粒度语义关联.最后,构建跨媒体对抗哈
针对现阶段人脸素描-照片合成方法合成的图像存在清晰度较低、面部细节模糊等问题,提出基于多残差动态融合生成对抗网络的人脸素描-照片合成方法.首先设计多残差动态融合网络,从不同的密集残差模块分别提取特征并进行残差学习.然后根据不同层次的多样化残差特征生成对应的偏移量,不同位置的卷积核依据偏移量改变采样坐标,使网络自适应地关注特征中重要信息.在避免特征信息逐级丢失和冗余信息干扰的前提下,网络有效整合几何细节信息与高级语义信息.方法同时引入多尺度感知损失,对不同分辨率的合成图像进行感知对比,使网络可由粗到细地对合
随着信息技术的发展,汽车逐渐成为移动的互联网终端.越来越多的信息,通过汽车驾驶室的图形界面反馈给用户,本文通过分析现有的图标为基础,介绍了图标符号设计的基本方法和原则,阐述了现在的汽车驾驶室人机交互界面中的图标的释义与存在的问题.本文发现,部分图标不够合理,可以对汽车驾驶室人机交互界面的图标设计进行更合理的改进,提高识别率,给用户带来更好的驾驶体验.
探究风险驾驶行为发生时语音预警以何种语速和音量提醒驾驶人效果最佳.以典型风险驾驶行为高速超速驾驶的语音预警为研究对象,通过Adobe Audition分别设计出五种语速和五种音量取值下的语音预警语料,采用模拟驾驶器分别对24位被试进行高速超速驾驶下的语音预警干预实验;构建风险驾驶行为下的语音预警语速和音量主观评价指标并通过李克特量表收集主观评价数据,对得到的数据结果进行评价和对比分析.结果表明,在噪音为66-68dB的模拟超速驾驶条件下,驾驶人对语速和音量取值为309wpm和83dB的语音预警感知效果最佳
现有医疗产品的研究对功能关注往往大于外观,随着经济的增长和医疗水平的提高,人们的感受和情感需求也逐渐受到重视,感性工学作为感性与理性结合的理论,应用于医疗产品的研究有显著的现实意义.本文对现阶段感性工学应用于医疗产品设计的一般研究流程进行了梳理,归纳了现阶段的理论研究方向与特点,最后提出了感性工学在医疗产品研究中的未来发展趋势,为后续的相关研究提供参考.
建立中深层套管式地埋管换热器数值传热模型,基于有限差分法将控制方程离散求解.对不同运停比下地埋管换热器连续运行15个供暖期的出水温度、热损失率进行模拟分析.随着运行时间的延长,4种运停比(8∶ 16、12∶ 12、16∶8、24∶0)供暖期结束时地埋管换热器的出水温度均逐年降低,前期温降速率比较大,后期比较平稳.相同供暖期,供暖期结束时地埋管换热器的出水温度由高到低对应的运停比顺序为:8∶ 16、12∶ 12、16∶ 8、24∶ 0,以第1个供暖期结束时地埋管换热器的出水温度为基准,第15个供暖期结束时地
针对人才基础薄弱、实践研究不足、教研成果推广性欠佳等教育装备教研工作现实存在的问题,提出将广大师范专业大学生纳入到基础教育装备教研人才队伍中去,基于提升师范专业大学生教具设计能力的视角,给出了提升基础教育装备教研工作的策略.
互联网检索中普遍存在排名竞争这种对抗攻击行为,会产生许多不良影响,因此对攻击方法的研究有助于设计更鲁棒的排序模型.已有的攻击方法容易被人识别且无法有效攻击神经排序模型.因此,文中提出基于梯度的对抗排序攻击方法.方法分为3个模块:基于梯度大小的词重要度排序、基于梯度的排序攻击和基于词嵌入的同义词替换.针对给定的目标排序模型,首先基于构建的排序攻击目标进行梯度回传,利用梯度信息在指定文档上找到最重要的词.然后,基于投影梯度攻击原理,在词向量空间上对这些最重要的词进行扰动.最后,利用同义词替换技术将这些最重要的
在程序性知识的评估中,技能是指与项目的解决相关的操作路径.基于程序性知识的学习评价,文中提出由项目自身的状态结构诱导多分知识结构的方法,目的是建立适用于问题解答的多分评估体系.首先,根据各项目的解答或操作过程设定响应值,得到项目特定的响应值集.通过项目状态转移函数定义项目状态空间,将问题空间推广到多分情形.然后,由操作路径导出合取的技能映射,讨论由合取的技能映射诱导的多分知识结构.结果表明由技能映射通过合取模型诱导的多分知识结构满足逐项交封闭.最后,给出诱导多分知识结构的算法步骤,并举例说明算法的有效性.
方面情感三元组抽取旨在识别一条评论中的方面项及其情感倾向,并提取与其相关的观点项.现有方法大多将该类任务分为多个子任务,将子任务组成流水线并完成这类任务.然而,基于流水线思想的方法在实际应用中会受到误差传播、不易使用等因素的影响.为此,文中提出词对关系学习方法,将方面情感三元组抽取任务转化为端到端的词对关系学习任务.方法包含一种可将句中的词对关系进行统一标注以表示所有三元组的词对关系标注的方法,以及为此特别构建的可输出词对关系的词对关系网络.首先,使用双向门控循环单元和混合式注意力对句子进行编码表示.然后