基于眼动的多屏精准控制系统的研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zsj_bj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术、传感技术、人工智能的发展,眼动跟踪与视线估计技术取得了巨大突破,应用领域也不断扩展。然而将眼动作为自然人机交互手段,还面临诸多问题。例如,设备佩戴复杂或具有侵入性、米达斯接触问题、手眼冲突问题等。本文在研究了国内外的相关视线估计方法后,对现存问题进行分析后提出了相应的算法进行解决,进而设计了基于眼动的多屏控制系统对本文提出的算法进行验证与应用。具体包括以下内容:为确保设备在无侵入性的同时能具有较高的精度,本文提出了基于单目图像的凝视点识别算法。因为视线方向与头部位姿关系密切,所以在计算视线方向前需要先对头部位姿进行估计。本文首先使用Pn P算法对2D-3D人脸特征点的对应关系进行求解,从而得到头部的位姿。接着基于3D眼球模型及眼部特征点计算出眼球中心与瞳孔中心,进而得到眼睛光轴与视轴的方向。最后基于得到的头部位姿与视线方向,对眼睛、相机、屏幕三者的空间关系进行建模,计算出用户的凝视点。本算法对硬件要求低且无侵入性,只需在屏幕上方固定一个用于采集人脸图像的摄像头即可,经过实验表明,本算法在有较高的精度的同时且能保证较好的实时性。针对米达斯接触问题,本文提出了基于凝视点序列的操控意图预测算法。在本文中,首先对交互行为进行分析,接着设计实验采集交互行为数据,通过分析数据得到凝视点序列与交互行为间的关系,进而提出操控意图预测算法。该算法的思想在于,在不确定用户的操控意图时,将用户实时的凝视点序列与根据用户操控习惯生成的序列集合进行模式匹配,从而确定用户的操控意图。另外,针对眼动与手控的冲突问题,本文根据采集的交互行为数据提出了一系列策略进行解决。为了对本文所提出的算法进行测试、验证与应用,本文设计了一套基于眼动的多屏控制系统。此系统分为硬件、算法、软件交互三个部分,其中硬件系统负责采集图像,算法模块负责基于凝视点识别算法对图像进行处理,软件交互模块会根据算法模块生成的凝视信息预测用户的操控意图,对手眼冲突进行协调,最后向界面上的控件发送控制信号完成与用户的交互。本文设计实验对眼控系统进行测试,结果表明,眼控系统可以大幅减少用户手控鼠标移动的距离,有效提高用户操作效率。本文提出的基于眼动的多屏精准控制系统对硬件要求低,具有良好的用户体验,可以有效提高人机交互效率,对非侵入式桌面眼控系统的研究具有重要意义。同时,本文提出的眼控系统对多通道融合的人机交互系统的研究具有借鉴意义。
其他文献
超宽禁带半导体材料氧化镓(Ga2O3)因其具有更宽带隙、更高理论临界击穿电场强度以及更优的Baliga品质因子等优良特性,成为宽带隙功率半导体领域的研究热点之一。β相Ga2O3结构稳定。目前肖特基二极管(Schottky Barrier Diode,SBD)和场效应晶体管(Field-Effect Transistor,FET)等器件研究都采用β相。其中β-Ga2O3SBDs发展迅速,但是其严重的
学位
随着微波毫米波波段移动通信系统的快速发展,现代社会对大带宽、高可靠性、大功率和低噪声的微波毫米波器件和集成电路需求大大增加,而微波毫米波电路是由电阻、电容、电感和声表面波滤波器等在内的无源器件组成,开发关键材料构筑这类无源器件成为提升器件性能的重要解决措施之一。硅基氮化镓材料具有宽带隙、高临界电场强度、强极化系数、高电子饱和速度等优良特性,在5G及B5G通信系统的射频前端中具有广阔的应用前景。但是
学位
目的:评价遗传因素和非遗传因素对吉林省某三甲医院长期使用华法林的汉族患者稳态剂量的影响,并筛选出适合本院患者华法林稳态剂量的预测模型,考察临床药师用药干预下华法林的抗凝效果与安全性。方法:以190例吉林省某三甲医院2016年8月-2018年9月长期服用华法林抗凝药的患者为研究对象,采用探针法对患者进行VKORC1和CYP2C9基因检测,分析不同位点VKORC1和CYP2C9基因型患者华法林日均稳态
学位
航天器中通过软件实现的功能越来越复杂,软件的可信性保障至关重要。中断数据访问冲突是当前影响航天嵌入式软件的关键可信问题之一,这个问题指的是,主程序和中断或者不同优先级中断同时对同一个共享数据进行访问导致数据一致性被破坏。中断数据访问冲突是一种典型的并发缺陷,非常难以测试发现。在航天软件研制过程中,目前主要依靠静态分析工具辅助人工审查进行检测,静态分析工具首先进行共享数据分析,在此基础上进行冲突检测
学位
随着现代集成电路规模越来越大,对片上系统(So C,System on Chip)的研究变得愈发重要。因为So C设计的复杂度不断提升,对其内部IP核之间的通信速度有着更高的要求,AMBA(Advanced Microcontroller Bus Architecture)总线中的AXI(Advanced Extensible Interface)以其高带宽、高性能、低延时的特点在高速通信中应用广
学位
随着电子信息时代的快速发展,新型集成电路与系统对微型化和功能化的电子器件的需求日益增加。作为核心供能单元,能源存储器件需要相应发展以实现集成电子系统的一体化应用。近年来,微型超级电容器具有极佳的功率密度和循环稳定性,得到了广泛的关注和发展。以石墨烯为代表的碳基材料,具有比表面积大,电子迁移率高等优异的物理化学性质,被广泛应用在能源存储领域。然而,受制于材料自身的结构与特性,利用该类材料所构筑的微型
学位
近年来中国的航空事业发展迅速,飞机的飞行时间不断增加,长期运转使得留机导管部件表面出现不同程度的磨损,及时有效的检修工作对于提高飞机的利用率具有重要意义。目前对于留机导管的缺陷检测工作大多依赖于人工目测和传统图像处理方法,存在主观性强、检测效率低、劳动强度大和通用性较差等问题,不能满足智能化留机导管缺陷实时检测需要。为解决上述问题,本文提出了基于深度学习的航空留机导管缺陷检测方法,该方法具有实时性
学位
脑分区分割是神经影像分析中至关重要的一环,也是计算机辅助进行脑部疾病检测、术前评估和手术规划等相关研究的基础。然而,人工进行脑分区标注需要大量有经验的医生且非常繁琐,极易引入人为错误。多脑分区分割是指使用同一个模型同时分割多个脑区,这比单个的脑分区分割更有挑战性。一方面,不同病人的脑部结构存在较大差异,另一方面,不同脑分区之间的尺寸差距也很明显。这对所设计的深度学习模型提出了更高的性能要求。目前,
学位
随着互联网和社交媒体技术的发展,每天都有海量的事件信息以文本为载体在网络中发布传播,由于网络中的信息是离散的,使得用户难以通过传统的检索方式了解事件的完整信息,因此如何能够及时高效地从海量文本数据中检测出人们感兴趣的主题事件,并经过有效筛选和有序组织形成完整明确的主题事件信息,已经成为文本处理和信息挖掘领域的研究热点。对于特定领域的用户而言,主题事件中包含的一系列子事件活动往往具有潜在的意图指向,
学位
随着信息技术的快速发展,寄存于第三方的数据隐私安全难以得到保障,个人用户以及企业会选择将数据加密后再传至云端,这使得传统的基于明文的关键词检索方案不再适用,可搜索加密技术应运而生。现今的可搜索加密方案大多是根据关键词与文档的联结关系直接构建索引的,查询关键词时并没有深入挖掘文档语义信息,有时无法返回给用户智能化的检索结果,同时文件索引结构复杂且空间开销较大,检索效率易受到文档数量递增的影响,设计方
学位