基于机器学习的语音驱动人脸动画方法

来源 :软件学报 | 被引量 : 0次 | 上传用户:lialiaoliao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音与唇动面部表情的同步是人脸动画的难点之一.综合利用聚类和机器学习的方法学习语音信号和唇动面部表情之间的同步关系,并应用于基于MEPG-4标准的语音驱动人脸动画系统中.在大规模音视频同步数据库的基础上,利用无监督聚类发现了能有效表征人脸运动的基本模式,采用神经网络学习训练,实现了从含韵律的语音特征到人脸运动基本模式的直接映射,不仅回避了语音识别鲁棒性不高的缺陷,同时学习的结果还可以直接驱动人脸网格.最后给出对语音驱动人脸动画系统定量和定性的两种分析评价方法.实验结果表明,基于机器学习的语音驱动人脸动画不仅能有效地解决语音视频同步的难题,增强动画的真实感和逼真性,同时基于MPEG-4的学习结果独立于人脸模型,还可用来驱动各种不同的人脸模型,包括真实视频、2D卡通人物以及3维虚拟人脸.
其他文献
WTO是当代国际关系和世界经济中的重要国际组织,在全球治理的历史与现实进程中扮演着中心角色。自诞生之日起,WTO始终处于"边缘化"争议或非议中。近年来,伴随诸多WTO框架外的
从新神话主义的概念出发,梳理国产奇幻剧发展的过程以及期间表现出的不同形态,有助于进一步研究国产奇幻剧井喷现象与新神话主义在中国的发展情况之间的内在联系。随着科技的
幼淋巴细胞白血病(prolymphocytic leukemia,PLL)是一种罕见但恶性程度极高的成熟淋巴肿瘤,其中T-细胞幼淋巴细胞白血病(T-cell prolymphocytic leukemia,T-PLL)这种亚型被认为难
如今,物联网技术已经延伸到智能家居、数字医疗、智能交通和智慧城市等众多领域,物联网通过对传感、网络、通信等技术的整合将物理世界的感知传递给计算机系统,实现物理信息和人类自然感知的融合,其核心即信息服务。然而,在不同的需求领域,存在着多样性的物联网硬件,现有的物联网系统需要针对于不同应用进行特定地硬件开发。因此,一个通用性的物联网硬件平台能对物联网方案的开发及应用带来很大便捷。本课题针对现有物联网开
在我国,随着社会体制的迅速变革以及竞争的不断加剧,员工的工作压力问题日益突出。而过多的压力会对工作者的身心健康造成很大损害,对组织也会产生消极影响,所以工作压力管理
故障定位问题理论上已经证明为NP-Hard问题.为了降低计算复杂度,以概率加权的二分图作为故障传播模型,提出了一种基于贝叶斯疑似度的启发式故障定位算法(Bayesian suspected
目的:研究T幼淋巴细胞白血病(T-eell prolymphocytic leukaemia,T-PLL)小细胞变异型的临床和免疫表型特点。方法:对2例以外周血淋巴细胞增高为主要表现的病人,进行外周血和骨
涉法信访的存在是对现代法治的破坏,但从另一方面说又是一种客观必然。引起涉法信访原因主要包括思想文化、制度、工作机制等多方面因素。对涉法信访问题应当客观、理性、辩
上市公司法人治理结构近年来始终是公司法中的一个热点和难点,也是法学界、经济学界普遍关注的问题,特别是我国证券市场上披露的许多事件,暴露出我国的上市公司法人治理结构
在社会主义市场经济条件下,人力资本被认为是企业拥有巨大经济价值的资源日益受到重视,而人力资本价值评估理论和实践则显得相对滞后,从而导致长期以来对企业资产重要组成部