韵律文本驱动的三维口型动画研究

来源 :北京工业大学 | 被引量 : 3次 | 上传用户:liongliong422
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
合成真实准确的可视语音动画一直是虚拟人领域一个艰难而有趣的研究方向。它在增强嘈杂环境下的语言可懂度,教育培训,电影甚至医疗方面都有着广泛的应用。通过机器学习的方法,一段可视语音动画可以通过同步捕获的音频和唇动数据来进行驱动。这种方法的好处是动作的韵律信息已经隐含在驱动数据当中,因此使唇动模拟富于变化。在本文的合成系统中,三维口型动画是由一种带有韵律信息的文本来驱动的。由于文本具有灵活、易修改和高压缩比的性质,因此在国际互联网上被广泛应用。但是却很难通过分析普通文本得到音调、音长和强调等轻易能从音频中取得的信息。由于缺乏韵律信息,以往的合成系统效果会显得很呆板。在本文中,设计了一种新的文本驱动的方法来生成三维口型动画。基本思想是:由用户借助一种韵律标记语言给普通文本添加携带韵律信息的标签,而合成系统则将标签转化为控制动画曲线的参数值,从而达到利用韵律信息来合成动画的目的。本文的技术借鉴行为驱动的方法,利用一种新的面向减小合成错误率的方法来生成三维动态视位。在参考已有对韵律研究的基础上,定义了一种汉语韵律标记语言来将普通文本转化为韵律文本。通过分析视频中发音的特征,建立了基于分段指数函数的参数模型,它将已得到的三维动态视位和韵律信息作为输入,输出则为生动的口型动画。实验结果显示:(1)依赖不同的韵律信息,系统可以合成出不同的结果;(2)此技术相对于以往方法可以减少生成动画时所用的数据量。合成真实准确的可视语音动画一直是虚拟人领域一个艰难而有趣的研究方向。面向汉语的三维口型动画的研究具有重要的理论意义和应用价值。能够利用宝贵的网络资源,使其应用的环境不局限于PC机,也包括PDA等移动设备。该技术具有广泛的应用前景,可以用于多种场合,例如:聋哑人教学、网页手语导播等领域,为制作准确的口型动画大大减少手工劳动的负担。
其他文献
IPv6作为Internet协议的下一版本,取代IPv4已成必然。但从IPv4向IPv6的过渡不可能一蹴而就,在很长一段时间内两者会共存。所以有必要考虑如何渐进地从IPv4升级到IPv6。IPv6不
数学作为高中课程的一门基础学科,对其他学科的学习有着很重要的促进作用,所以高中数学的学习尤为的重要.但是,由于高中数学的学习需要抽象思维,学习范围较广,需要较多的技巧
在数学学习中,数学能力不是靠老师教会的,而是在老师的引导下,靠自己主动的思维去获取的.在数学学习的各个环节中,利用数学试题的订正来培养良好的主动思维习惯、对提升数学
嵌入式实时系统中任务最坏情况执行时间(Worst-Case Execution Time,WCET)分析是指在任务或者程序片段执行之前获得其最坏情况执行时间的估值。在程序运行前得出任务的WCET估值
新课程改革的进行带动了很多科目教学方式的变革,很多新的教学理念被提出来.对于生成性课堂,主要是指在课堂教育中,重视课堂的多变性和复杂性,并加强学生、教师与教材之间的
从初中开始,学生就有了关于函数概念方面的学习,高中的函数教学也是高中数学的一个重点学习内容,在升入大学之后,学校仍然开设有数学函数课程.另外,在之后的日常生活和学习以
现有的Internet存在着用户数据传输平台层次结构复杂、传输效率低下和服务质量(QoS,Quality of Service)较难得到保障的缺点,难以适应“三网合一”的大趋势。为此,四川省网络
远程教育是我国教育体制的重要组成部分,是终身教育的重要环节,计算机及网络技术的发展、尤其是Internet的应用普及极大地促进了远程教育的发展。考试是检验和促进教育水平的
海洋底栖生物是海洋生态系统中的重要组成部分,在底层生态系统的能量流动和物质循环过程中发挥着重要作用.我国海洋底栖生物学起步较晚,经过数十年的发展,已取得许多研究进展
一、高中算法教学存在的主要问题笔者通过调查发现,由于诸方面的原因,算法思想的渗透尚不尽如人意,主要表现在:1.教师的算法素养.绝大部分数学教师,特别是中老年教师对程序设