基于多特征融合的专注度识别

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:laobo999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科技的发展,学生的专注程度自动分析正在成为人工智能和教育领域的一个重要交叉课题。它可以应用于人工智能辅助教育、仿人服务机器人、机器人学伴或机器人老师等智能交互系统中,通过智能系统来判断学生的学习状态,并向教师或家长提供反馈,或作为人机交互的某种决策依据。相比于传统的人工识别方法,以及基于单一信息的识别方法,利用多特征融合策略结合机器学习的自动专注度识别方法具有明显优势。但是,专注度自动识别是一个极具挑战性的难题,其关键在于如何构建一个合理的框架来提取并融合多种特征信息,同时,需要结合有效的算法来实现高准确度的专注度识别。本文通过多特征融合策略,将人脸位置、面部表情、人眼视线信息进行融合,构建了一个高鲁棒性的专注度识别模型。本文的研究内容如下:在专注度定义方面,将专注度的高低与可观察到的姿态、行为等视觉信息进行匹配,以找到多种有效的信息来反映专注度。本文选择使用面部表情、人眼视线和人脸位置作为有效信息进行结合,以定义不同层次的专注度水平。在数据集的构建方面,由于没有开源的专注度识别数据集,因此构建数据集是一个重要环节。本文采集了16位志愿者的学习视频作为原始数据,进一步提取出62792张图像,2425段5秒时长的视频片段;制定了筛选规则对数据进行分析和清洗;制定了标注原则,为数据标注“处于专注状态”和“处于非专注状态”的标签。在特征提取方面,本文通过基于残差神经网络(Resnet50)的人脸检测预训练模型,提取了人脸图像以及人脸位置特征;接着利用基于卷积神经网络(VGG-19)的面部表情识别预训练模型从人脸图像中提取面部表情特征,利用基于堆叠沙漏网络(Stacked Hourglass Networks)的视线检测预训练模型从原始图像中提取眼睛视线特征。在特征融合方面,本文提出了一种基于堆叠(Stacking)模型的特征融合策略,通过五折交叉堆叠训练,利用不同分类器从不同特征信息中提取有效特征,接着生成更具代表性的融合特征,以提高专注度识别算法的准确性和鲁棒性。在专注度分类方面,本文在专注度识别框架中利用融合特征对专注度进行分类,计算“处于专注度状态”这一类别的置信度分数的高低,再利用置信度分数对专注度进行进一步的层次划分,最终将专注度分为“极佳专注度”、“优秀专注度”、“良好专注度”、“一般专注度”、“差专注度”五个层次。在专注度识别图像数据集上进行测试,以F1分数(F1_score)作为评价指标,利用本文的融合特征识别专注度的F1分数为93.47%,比本文所提取的最优的单一特征信息识别专注度的F1分数高1.03%,结果表明多特征信息的融合对提高专注度的识别准确度是有效的。在视频数据集上进行测试,以准确率(Accuracy)为评价指标,本文的专注度识别准确率为92.8%,比目前最先进的基于单一特征信息的专注度识别准确率高16.48%,比目前最先进的基于多特征的专注度识别准确率高17.5%。
其他文献
乳液泵又称按压式乳液泵,通过利用大气平衡原理,将包装瓶内的乳液泵出,并通过按压方式把外界的空气补充进入瓶内的一种液体分配器。目前乳液泵已广泛应用于化工、日用品和医药等多个领域,如生活中常见的洗浴、护肤护发、美容和香氛等产品。随着经济社会的持续发展,人们不再满足于护发产品单一的使用场景和功能。过去的洗头后使用护发素的简单护发方式,逐渐转变为洗发后和睡眠前滋养、出门前和出门后保护、吹发和烫染前后修复等
随着老龄化形势不断严峻,我国因罹患帕金森、心脑血管疾病、脑卒中等老年性疾病而致肢体运动功能障碍的人数不断上升,不仅给老年患者家庭带来沉重的经济与精神负担,同时也严重影响患者的身心健康。根据医学及神经机能康复研究发现,人的大脑具有可塑性,可以通过重复、有针对性的康复锻炼实现患肢活动功能的有效恢复,且患者的主动运动意识对神经恢复也有重要的意义。但目前传统的康复训练模式易受人力、物力、地点等因素的限制,
传统菜市场是居民日常购物消费的公共场所,是社区邻里交流的重要平台,也是最具烟火气和城市记忆的地方。但由于人们购物方式的转变、购物体验需求的提高、用户需求的转变、物流方式的变革及城市化进程的发展和“农改超”政策等影响,加上传统菜市场的环境卫生不达标、基础设施不完善及服务质量低下等内部问题,降低了消费者对其体验的满意度与认可度,导致传统菜市场逐渐失去活力,面临着巨大的生存危机。本课题研究了近年来国家级
随着互联网技术的快速发展,以及近几年共享经济的兴起,新模式的O2O物流平台也应运而生,并在近几年得到蓬勃发展。物流平台的买方(需求方)和卖方(提供方)不仅关心价格,而且对彼此之间的空间距离十分敏感(因为距离越长,服务等待时间就越长),目前对于双边市场的所有研究中都没有将平台两边的空间距离纳入到研究中来,因此传统的双边市场模型已经不再适用于O2O物流平台这一领域,整个物流平台的收费定价问题亟待解决。
胶体光子晶体(胶体晶)具有特殊的周期性微纳结构、光禁带及结构色,这使其在显示、印刷、检测及防伪等领域具有广泛的应用前景。传统胶体晶的制备方法存在组装条件苛刻、耗时、无法宏量制备等问题,限制了其应用范围。发展简单、高效的方法用于制备具有新功能的响应型胶体晶并拓展其应用范围仍是一项巨大挑战。本论文共分为五章。第一章:绪论。第二章:SiO2-聚乙二醇甲基丙烯酸酯胶体晶的制备及其对溶剂检测的研究。第三章:
人体脊髓损伤会导致神经源性膀胱,损伤膀胱运动功能和感觉功能。对于膀胱感觉功能受损患者,目前临床常采取间歇清洁导尿措施将膀胱尿液排出体外,但频繁导尿会使患者痛苦,且导尿管容易引发下尿路感染。因此,研究膀胱尿液容量或压力监测装置,从工程学角度重建患者的尿意具有重要的现实意义。针对现有膀胱尿液容量或压力监测系统存在结构复杂、损伤膀胱组织、电池供电寿命短、无线供电功耗大和易受空间位置影响、难以在人体多姿态
21世纪互联网新媒体技术的革命给广告行业带来巨大变革,以H5广告为代表的新媒体广告呈现一片繁荣态势,从H5广告初期以创意玩法为主到现在以内容为主、形式为辅新阶段,此视阈下的H5广告从“创新玩法”转向品牌故事的趣味性与情感互动的“叙事传播”。营销机构利用H5技术和媒介特性讲述品牌故事,借助“移动+社交”分享的传播机制,从而形成良好的传播效果。本文的研究目的是探讨H5广告的叙事传播策略,从而指导H5广
应力状态是评价工程构件是否安全和可靠的一项重要指标。金属薄板结构在加工制造过程中往往会在其表面和内部产生残余应力,而在服役过程中又通常会承受各种外界作用力。过大的应力会使薄板产生变形,而且在腐蚀环境作用下容易产生应力裂纹,严重影响整体结构的正常工作。因此,定期、准确的应力测量对于保证在役薄板的安全与稳定是非常重要的。在现有应力无损检测技术中,超声法已被证明是一种有效的应力测量方法。但是对金属薄板的
马蹄焰玻璃窑炉是生产玻璃的热工设备。蓄热室作为一种马蹄焰玻璃窑炉的典型的能源回收设备,在热工领域上发挥重要作用。对蓄热室进行能效优化有利用节省成本和保护环境。如何实现蓄热室模型的构建和优化是解决其能耗问题的关键。目前,蓄热室的建模方法主要有实验法、解析法和数值模拟法。实验法因其材料和人工成本,存在不足。解析法因数学公式难以精确表达蓄热室物理过程,也有不足。数值模拟法只需在计算机上进行,方便实现的特
随着工业生产的发展,机器人的离线编程与示教逐渐满足不了工业要求。目前生产线从单一化产品生产向多元化产品混批生产转变,而且人机协作的要求也逐渐增多,因此也产生了工作环境包括了人的变化以及动态的生产线,缺乏灵活性的传统机器人局限性越发明显。因此增强机器人的智能化程度是机器人在工业生产线应用的一个重要环节。而视觉作为机器人的一个主要感知来源,深度学习能赋予机器人学习认知的能力,能够解决生产线上的工件位置