语音驱动的人脸建模与动画技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户：a574150767

【摘要】

：

语音驱动的人脸建模与动画技术即先根据人脸信息构建适于动画的三维模型,再根据给定的语音在模型唇部产生相应的口型,从而加深人们对语言内容的理解。该技术对于推进三维游戏

【作者】

：

李皓

【出处】

：

国防科学技术大学

【发表日期】

：

2011年期

【关键词】

：

语音驱动人脸建模与动画主动形状模型 closed-form算法边界区域似然度肌肉模型声韵母切分动态视位唇部子运动

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音驱动的人脸建模与动画技术即先根据人脸信息构建适于动画的三维模型,再根据给定的语音在模型唇部产生相应的口型,从而加深人们对语言内容的理解。该技术对于推进三维游戏制作、电影配音、媒体内容修改、辅助教学和可视通信等方面应用的简易性及实用性,具有重要的理论与实际意义。本文以人脸建模及语音驱动动画技术研究为主线,首先提出了三维人脸模型的建立方法;然后在该模型之上,通过提取唇部运动参数及构建具有真实感的唇部动画模型控制唇部动画;最后对输入语音进行分析,提取出语音特征驱动唇部运动,并生成相应的口型。论文具体研究工作及创新包括:提出了一种先利用全局模板进行总体定位,再利用局部模板进行精确定位的多模板ASM算法。在局部定位过程中,首先在各模板特征点中构建窄条带,然后利用closed-form图像分割算法对窄条带区域进行纹理分割,最后利用局部模板与图像进行匹配,得到人脸特征点位置信息。实验结果表明,改进算法显著改善了传统ASM算法对纹理平滑区域特征点定位不准确的问题,提高了特征点的提取精度,由此提高了三维人脸模型建立的准确度。改进了传统的Mean-Shift算法对唇部进行跟踪与检测。改进的算法通过引入目标边界区域似然度及Level Set模型,实时调整跟踪窗大小,能获取说话人发音时的内外唇运动信息。在Level Set模型中将小区域放置于跟踪窗中心,联合唇部梯度信息,以及小区域与唇部边界的似然度进行唇部检测,相对于单纯采用梯度信息的唇部检测结果具有更高的准确度。通过加入ASM模型与目标边界区域似然度结合,能进一步提高外唇检测精度,从而为唇部动画提供可靠的数据支持。提出了肌肉模型与Mpeg-4融合的唇部动画方法。该方法在Candide-3人脸模型中定义皮肤点和骨骼点,以及肌肉控制范围,采用骨骼点限制唇部特征点运动,对肌肉控制范围以内的非特征点通过肌肉模型调整,对控制范围以外的非特征点采用唇部动画定义表调整。采用Loop细分方法,及简化的肌肉模型方法,提高了动画的细腻性和效率,实验结果证明该控制方法有效的提高了唇部动画的真实感。提出了一种建立损失函数,并利用浊音的“准”周期性和声母时长进行声韵母切分的方法。该方法首先计算语音的自相关函数,接着建立代价损失函数,对计算结果采用动态规划方法检测浊音,然后根据声母段长分布规律确定声母的检测范围,最后在检测范围内对浊音段起始点前后采用听觉事件检测方法分割出声韵母。实验结果表明,在浊音段的基础上对声韵母进行切分能够减少噪声及汉语音变现象的影响,提高切分的正确率,由此能提高语音驱动动画生成口型的准确性。提出了一种汉语动态视位的模型。根据汉语是基于音节的语言,发音过程具有“枣核型”的特点,模型分别对音节自身和音节之间的唇部运动建模。对音节通过扩展的DTW算法与子运动模型进行匹配,从而将音节利用唇部子运动模型描述。在音节间采用元音影响分级的权重函数模拟协同发音影响,先分析各元音与其后接辅音的口型影响,再通过权重函数控制实际发音口型。实验结果表明,相对于声韵母、音节对应的发音过程以及三视素表征汉语动态视位,方法提高了语音驱动动画的连贯性及合理性,适于表现汉语的协同发音现象。

其他文献

新生意和老团队

9月下旬，新能源汽车企业及出行方案提供商威马汽车创始人沈晖在上海露面，首次公开了自己的造车计划，宣布会在2017年推出威马出行服务，

期刊

生意汽车企业创始人提供商新能源造车

对等网络环境下三维GIS优化策略研究

目前热门的“数字地球”实现了从二维到三维的跨越,使得三维虚拟地球已经成为一个应用广泛的地理信息公共服务平台。由于目前GIS的发展具有海量数据特征,并且其数据规模还在

学位

对等网三维GIS数据组织非均匀四叉树节点分组动态协调缓存

面向运动轨迹的高效表示和快速识别的综合签名描述与动态索引

运动轨迹包涵了复杂长行程空间运动的大量信息,因此,运动轨迹被广泛研究用来识别移动物体的自由形式运动,例如人的行为,机器人的活动以及其他物体的运动。基于轨迹的动态运动

学位

计算机视觉视觉跟踪运动轨迹识别不变量签名描述运动索引多目标运动机器学习

沙特阿拉伯的救赎

典型的石油王国沙特阿拉伯，正在酝酿一项可能是全球最大规模的太阳能投资。

期刊

沙特阿拉伯救赎最大规模太阳能石油投资

常州体育中心体育场超长结构中预应力的应用

常州市体育中心体育场采用了超长混凝土框架结构体系,由于混凝土收缩及温度下降会在结构中产生拉应力,使结构可能出现有害裂缝。通过对楼板施加无粘结后张预应力来控制结构有

期刊

超长混凝土结构框架结构无粘结后张预应力收缩应力温度应力

基于创新型人才培养的大学生科研训练模式探析

培养创新型人才是中国高等教育的重要使命。日前，部分高等学府在创新型人才培养模式中所推行的大学生科研训练，在意识层面、行为实施层面及成果展示层面均存在若干不足。应建构

期刊

创新型人才大学生科研训练模式

区域网络教研改进教师专业发展公平感的效能研究——以重庆市某区为案例

该研究探索在较大的行政区域中利用网络教研改进不同学校间教师专业发展公平感的效能如何。研究通过自编调查问卷,对案例区的教师进行了网络调查,经过数据分析发现,案例区采

期刊

区域网络教研教师专业发展公平感教育资源共享文本讨论音视频研讨

浅议中国民族民间舞蹈学习中的继承与发展

民族民间舞蹈是中华民族灿烂文化的重要组成因素,它以具有特定文化内涵和形态特征的肢体语言来回顾和保留本民族的历史、风俗、文化,追求符合人民生产生活、文化审美、精神生

期刊

民族民间舞蹈借鉴继承发展

如何提高初中数学课堂教学的有效性

本文结合自己教育实习的教学实践，对如何提高初中数学课堂教学的有效性进行了初步的探讨，主要内容包括：理论联系实际；虚心使人进步；做好教学设计；用学习理论指导教学；帮助学生理解所

期刊

初中数学课堂教学提高有效性

中承式劲性骨架砼拱桥施工程序对结构行为的影响分析

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

学位

桥梁工程劲性骨架混凝土拱桥外包混凝土浇筑方案优化

语音驱动的人脸建模与动画技术研究

与本文相关的学术论文