语音驱动三维唇形动画算法研究

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:maruijun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音驱动三维唇形动画算法属于语音信号处理与三维动画技术交叉范畴,可应用于各种需要语音与唇形同步的三维动画领域,如三维动画电影或视频、3D游戏、虚拟主播、教学视频等。目前国内外关于语音驱动唇形动画的研究较少,进行唇形动画制作时多以人工制作为主,费时费力,因此研究语音驱动三维唇形动画算法具有一定的社会意义与应用价值。在语音驱动三维唇形动画算法中,语音到唇形的映射直接影响到唇形动画的真实感。在现有的语音驱动唇形动画算法中,主要存在以下难点和问题:(1)不同语言间音素的发音规律有所不同,难以与唇形形成统一的映射关系;(2)使用BP神经网络进行语音特征参数到唇形的映射,通常速度和精度高度受限于训练样本数量和网络结构;(3)三维人脸模型的格式多种多样,没有统一的唇形动画标准,通用性存在不足。本文针对上述问题,在现有的语音驱动唇形动画算法基础上,做了如下改进工作:首先,分析了汉语普通话和英语的发音规律,尝试用国际音标将两种语言的发音规律统一起来,并以此为依据录制了训练语音库。其次,尝试适用高斯混合模型算法和基于有向无环图的支持向量机多分类算法(DAG-SVM)代替神经网络进行音素分类,并对DAG-SVM进行了改进。最后,利用DirectX中的三维网格渐变动画技术实现了通用性强且具有真实感的三维人脸唇形动画,并与分类算法相结合,编写了图形界面。实验结果表明本文提出的算法性能较好,能达到预期要求。
其他文献
影响犯罪嫌疑人做出真实和完全供述的心理活动,称为供述心理障碍(也称拒供心理)。通过研究犯罪嫌疑人产生供述心理障碍的原因、种类,侦查人员可以制定出相应的讯问对策,选择
在新课标理论背景下,课程的设计都非常注重数学知识的应用,多以身边的生活实例来编排教学的题材。新课标不仅要求学生掌握数学知识,还要求学生会灵活应用数学知识,用数学知识解决
《圆的认识》教学策略的选择着重考虑两点:一是学生对圆的知识已经知道了多少?认知起点在哪里?二是怎样的知识内容需要探究?围绕这两个问题,我们对学生的情况进行了了解,发现学
<正> 据Trans.ISIJ1988,N0.7,P601报道SUS304L 和316L 不锈钢板或包覆钢板已广泛用于盛装化学载体的容器。近年来,在这些应用方面为了减少材料用量提高焊接性.要求更高的强度
给中国民歌下个定义?(下)余咏宇五、是定义,还是概念?本文主旨为探求对中国民歌较有代表性的定义。初步分析结果,在各种中西民歌学说中,似较难找到符合"定义"结构的说明。如我们以'精确
随着社会经济的发展和城市化进程的加快,城市雨水排水系统的作用越来越重要。文中从城市雨水排水系统的设计、施工以及运行管理等方面,对于我国城市雨水排水系统中存在的问题
文中概括说明计算机信息技术与机械电子技术的发展的情况,重点介绍计算机技术在机械生产制造领域、汽车新技术及日常工作的广泛应用。
在高性能计算中,基于对象存储的分布式文件系统Lustre文件系统具有极为广泛的应用,并取得了较好的效果.随着存储规模的不断扩大,Lustre文件系统内部的请求数量呈线性增长趋势
《雾都孤儿》是狄更斯的代表作之一,作品中对女性角色的刻画和描述往往能展示作者对于女性性别群体的概念和印象。本文即由此出发,选取南茜和露梓作为主要代表人物,通过分析
目的分析各地区FRAX干预阈值与BMD之间的关系,探讨各地区FRAX干预阈值在无锡地区临床应用中的价值。方法收集本院职工体检资料,通过HOLOGIC双能X线(DXA)骨密度仪测定骨密度,