基于表观和头部姿态的视线估计算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:kaka88899999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着“渐冻症”、“卢伽雷氏症”患者的生活受到社会广泛关注,辅助生活设备的研究也成为了人们关切的重点之一。由于常规的交互方式不能满足病患使用需求,使用视线控制成为了人机交互的首选方案。而这一方法的核心就在于视线估计技术的研究与应用。视线估计,是计算视线方向、注视点位置的过程。作为一种高效的、非接触式的人机交互方法,在各领域都具备极大发展潜力。当前基于表观的视线估计方法逐步成为该技术的重点突破方向,但仍旧面临算法结构复杂多样、模型准确度不高的问题。本文设计了一套图像采集与视线估计系统,利用笔记本电脑自带的相机采集图像,经预处理后使用改进的卷积神经网络(Convolutional Neural Network,CNN)建立并训练视线估计模型,最终输出注视点位置。具体完成工作如下:1.基于改进AdaBoost算法的人脸检测算法。为在保证准确性的同时提高人脸检测的时效性,利用肤色空间的稳定性进行肤色分割,去除背景区域,降低人脸检测的特征扫描时间,提升检测的实时性。实验结果表明,优化后的人脸检测时间效率明显提高。2.基于人脸特征点的头部姿态估计方法。本文首先使用受限制的局部模型(Constrained Local Model,CLM)获取人脸特征点,之后使用灵活模型的方法计算头部姿态。基于CLM的方法首先需要建立形状模型和图像块模型用于搜索;搜索过程通过对响应图的响应策略进行优化,获取接近最优解的结果。基于灵活模型的姿态估计则是通过计算特征点与三维模型在平面投影的变化来估计头部姿态。3.基于浅层残差网络的视线估计算法。为了提高算法的性能,使用残差块改进传统的LeNet-5结构,提高特征提取能力的同时降低训练难度。使用MPIIGaze公开数据集和按本文方法采集的本地数据集进行的实验结果表明,改进的浅层残差网络模型的准确度明显提升,与传统Le Net-5结构训练的模型相比,改进后的网络结构准确度分别提升了11.4和15%,验证了算法改进的有效性。综上,本文在研究视线估计工作流程与相关算法的基础上,基于简单硬件环境,建立了基于CNN算法的视线估计系统,同时使用浅层残差网络改进算法,在公开数据集和本地数据集的实验都验证了改进的效果。
其他文献
目的探讨IgA、C3和IgA/C3比值在原发性IgA肾病的诊断及牛津分类中的价值。方法收集具有IgA、C3值的原发性IgA肾病患者667例和非原发性IgA肾病患者699例,采用散射免疫比浊法检测
检修实践证明,卫星电视接收机高频头损坏的常见原因主要有遭雷击、高频头供电电压偏高、静电感应和进水腐蚀等,以下逐一介绍检修方法,供参考。
描述了TG12864B的功能特点和MB90F594A的主要性能,详细分析了TG12864B的接口时序,并采用软件模拟方法实现了TG12864B与MB90F594A的接口技术。
求真游记散文应写真山真水,切忌无中生有。但这并不是说游览的具体过程都需要一一记叙无遗,也不是所有的风景都需要一一照录,而是需要精心剪裁。渗情“一切景语,皆情语也。”
读着“绕床饥鼠”,很自然想到它的下句“蝙蝠翻灯舞”。但它没有古词里的境界,有的只是当今大学生宿舍的一些常态,如“臭鞋烂袜之类”,虽没有什么可
自二十世纪末,耐碳青霉烯类抗生素的肺炎克雷伯杆菌(CRKP)首次被分离出来以后,CRKP菌株所导致的感染在细菌感染疾病中的比重日渐增加。超广谱β-内酰胺酶(ESBL)基因使肺炎克雷伯杆
“苍蝇”是鄙人的绰号,从小学到高中,叫声“经久不衰”。也不知是何时何人给了我这个“雅号”,虽说不怎么高雅,却给我带来了许多欢乐,许多尴尬。生物课上,老师正侃侃而谈生物
照明用LED系列国家标准宣贯、产品CCC认证和技能认证暨技术研讨会近日召开,东莞质检中心已成功获批筹建国家LED产品监督榆验中心,一年后可建成。东莞生产LED产品的企业要检测其
在我们大家所处的这种“浑身是假雄赳赳”的世态中,人们对弄虚作假已经恨之入骨。小说《考试》从曾老师的视角,揭露了一次大规模的弄虚作假事件,其特别丑恶之点是,作为人民教
投影型是实现大屏幕显示的方法之一。在投影型中有CRT投影。液晶光阀投影、微镜显示、硅基液晶显示等投影类型。目前前景比较看好的是数字光处理(DLP)投影和硅基液晶(LCOS)投影。