基于Dirichlet自由变形算法的人脸表情动画技术研究

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:jiqt001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器智能化步伐的加快,越来越多的服务型机器人走进千家万户,人们已经不再满足于过去的“一问一答”式虚拟机器人,多功能、高要求的虚拟机器人成为研究的热点。人们在与虚拟机器人交流的过程中,希望得到虚拟机器人的反馈,尤其是情感上的反馈,而反映情感最重要的信息是面部表情。因此,如何给虚拟机器人一个逼真的外形并能够像人类那样自如的做各种表情动作是当前急需解决的问题。具体表现在:首先,如何对虚拟人的嘴唇、眼睛、眉毛、牙齿和舌头等部位进行精准建模并模拟动作。其次,怎样保证每个运动部位之间协调运动、互相关联,不会出现运动失调的情况。接着,如何保证三维虚拟说话人在说话过程中,语音信息、面部动作轨迹以及所要表达的内容三者之间的一致性。为了解决上述的问题,本文设计并实现了基于Dirichlet自由变形算法的人脸表情动画合成系统。该系统主要有两个部分组成:第一部分使用Facial Motion Capture(面部运动捕捉系统)采集真人表演者的面部运动数据,该部分主要包括面部运动数据的采集、分析及处理,以便将处理后的数据作为人脸表情动画合成系统的驱动数据。第二部分将DFFD(Dirichlet free-form deformations)算法应用于三维虚拟人脸变形上。通过以DFFD算法为基础,结合C++语言可移植性和OpenGL图形库的跨平台性,实现三维虚拟人脸表情动画合成系统。另外,通过将构建的3D说话人语音、视觉数据库,经长短期记忆-递归神经网络(LSTM-RNN)模型训练后的输出作为人脸表情动画合成系统的输入,可以实现语音驱动唇形动画。本文的主要研究工作如下:(1)使用C++语言设计并实现了DFFD算法,并将DFFD算法进行类的封装,对外提供了一个友好的调用接口,以便使用者调用。并提出改进型加权DFFD算法,实现了对变形强度的控制,使得变形效果更好。(2)利用DFFD算法并结合OpenGL图形处理库实现包括眼睛、眉毛、鼻子、嘴唇、牙齿和舌头等部位的动作模拟,结合各区域运动的关联性,使用真人动作数据同步驱动各部位的运动,实现面部各区域的协调、同步运动,使得动画效果更逼真。(3)利用LSTM-RNN模型作为训练模型,构建输入语音和输出唇部动作轨迹之间的映射关系,实现语音驱动唇部动画,增加了将语音数据作为系统驱动数据的功能,使得系统功能更加完善。(4)设计了系统的应用型实验。通过将系统合成的表情视频和与之对应的真人表情视频作为刺激材料,研究人在观察两种视频时观察模式的差异性,以便将系统用于后期的实验研究。经过实验对比和主观人工评估,结果证明本文中的人脸表情动画合成系统能够很逼真的模拟真人说话时的表情动作,并且该系统能够很好的保证三维虚拟说话人在说话过程中,视觉方面、听觉方面以及所要表达内容三者之间的一致性。
其他文献
随着信息科技发展,网络图书商城的出现,使得大众足不出户便可购买各类图书产品,极大促进了社会文化传播。然而面对浩繁的图书,大众要找到符合自身兴趣的图书,是一件困难的事
在当今大科学时代背景下,我们所面临的科学研究问题越来越综合且复杂,仅依靠单一学科的力量很难解决,需将多个学科的知识进行交叉融合来发挥作用。这一过程中,大量新兴交叉学科不断涌现。国外学者普遍使用“interdisciplinary”一词表示交叉学科,该词最早由美国哥伦比亚大学心理学家伍德沃斯(R.S.Woodworth)于1926年提出。我国在1985年召开的第一届交叉学科大会,表明交叉学科在我国的
边缘计算作为一种在网络边缘执行计算的新型计算模式,可以使得用户在电量资源和计算能力有限的情况下,完成复杂的任务。用户直接与部署在附近的边缘服务器连接并获得所需的资源,避免了数据在网络节点间的传输,有效减少用户等待时间。然而,边缘服务器为用户提供服务也有其自身的限制。一方面,边缘服务器的资源有限,如果在一段时间内,连接同一边缘服务器的用户过多,可能会造成该服务器的过载,使得服务的响应时间增加,严重影
2003年《普通高中语文课程标准》(实验)提出了“全面提高学生的语文素养,充分发挥语文课程的育人功能”的理念,这一理念也是近年来广大语文教育教学工作者认同的一种教育理论和策略。本文以语文素养相关理论研究成果为基础,通过借鉴学者已有研究结论界定了本文采用的语文素养概念内涵,采用SPSS19.0软件运用描述性统计、独立样本T检验、相关分析等多种数理统计方式,对新疆博州高中生语文素养的语文知识与能力水平
本论文研究了 NBS(N-溴代丁二酰亚胺)存在条件下无金属参与的底物选择性环化反应,高效构建了两类具有潜在生物活性的杂环化合物。本论文的研究内容主要包含以下两个部分:第一
激子极化激元是半导体激子和微腔光子强耦合而形成的一种新的具有玻色子特性的准粒子。由于其小的有效质量和强的相互作用,理论上,可以在普通低温甚至室温下达到玻色爱因斯坦
本文采用CFD方法对一种催化裂化装置旋流快分系统内部流场进行了模拟研究,深入了解其内部流场特性,系统地考察了相关操作参数对其分离性能的影响,并进行了结构的优化设计研究
Markov过程是随机过程中的重要部分,模糊性是自然界及社会活动中普遍存在的不确定现象,针对模糊Markov过程中λ-截集计算的复杂性,利用模糊结构元理论建模及求解.对于一元模
吐哈盆地在中新生界发现了大量的煤系原油,但随着勘探开发的不断进行,其深层非煤系来源原油的成藏规律和深部源岩有效性的研究日益显得重要。本文据原油物性和生标物组成特征
无证书密码体制与签名和签密相结合所提出的无证书签名、无证书签密方案在信息传输过程中提供信息的认证以及加密认证等功能,继承了基于身份密码体制无需使用公钥证书的特点,又对其密钥托管问题进行改进,广泛地应用到电子支付、密钥管理、智能电网等领域。目前,无证书签名、签密方案还存在一些设计不足,无法满足安全性要求,计算效率不高等问题,其方案的改进过程已成为该领域研究的热点和难点。针对上述问题,分别提出改进的无