基于深度学习网络模型实现语音驱动的人脸动画合成

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:zeratel
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音驱动的人脸动画生成项目是作者所在公司的实际项目,具体使用场景是在电器所搭载的语音助手上,例如5G时代下,搭载在电梯,洗衣机等设备上的语音助手和使用者进行“面对面”的对话。利用语音来合成面部动画是对声音进行处理,并且合成与语音对应的口型动画和面部表情,此研究方向是自然人机交互领域的重要内容,可以被看作是一种面向语音的翻译。通过相关心理学知识可以得知,和普通的听觉感受相比,视觉与听觉的共同输入可以更好的提高使用者的互动感受。通过接受听觉和视觉相互匹配的动画人脸人物,会让使用语音助手的用户对其听到的语音内容有更好的感受,减少用户因为单纯的语音输入而产生的不真实感和不确定感。从以上的目的出发,作者设计了语音驱动的人脸动画合成系统,旨在通过语音控制的方式来驱动人脸图片中的面部特征点运动,从而达到和语音相匹配的面部动画效果。一个真实的面部动画涉及眉毛、眼睛、嘴唇、牙齿等各个部位的移动。基于以上目的,作者设计了复合神经网络模型(CNN-LSTM),并与条件生成对抗网络结合来实现项目,通过神经网络的学习过程来将各个特征点所表示的部位进行合理的移动。本文的主要研究内容及创新点如下:(1)通过设计和实现CNN-LSTM网络模型,将音频的梅尔频谱图作为网络的训练数据,将面部特征点的68组二维坐标作为训练数据的标签,按照视频中的帧顺序共同输入到CNN-LSTM网络中进行训练。CNN网络将提取梅尔频谱图的特征进行有监督的学习,从而将梅尔频谱图和面部特征点进行联系。LSTM进行时序性输入数据的相关性学习。实现了向CNN-LSTM神经网络中输入数据集中的音频梅尔频谱图,输出结果为与音频相对应的面部特征点图片。(2)通过设计和实现条件生成对抗网络模型,将CNN-LSTM模型中输出的面部特征点图像还原为真实人脸图像,最后通过FFmepg多帧静态图像组合的方式将连续变化的面部图像合成为“动图”,并将音频与“动图”结合,从而形成视频。目前,本文基于实验得到了CNN-LSTM预测的可连续移动的面部特征点,模型的结果均值偏差较小,收敛速度快,连续输出之间的表情特征点变化明显。对于条件生成对抗网络产生的人脸面部图像来说,在训练轮次为200轮时,生成图像与真实图像的均方误差为0.1082,基本可以还原面部五官图像。目前作者设计的神经网络模型实现了仅需要一段音频,一张真实人脸图片,便可以生成一段语音与面部动作相匹配的视频动画。
其他文献
随着环境问题和能源危机日益严重,探索环境友好型新能源已成为社会发展的当务之急。新型能源中清洁、可再生的氢能是最具前景的化石燃料替代能源之一。在氢气制备方法中,电解
鄂尔多斯盆地延长组石油富集规模巨大,原油主要来自长7烃源岩。长7烃源岩包括页岩和泥岩两类,两类烃源岩在岩电特征、生烃潜力、供烃范围及生物标志化合物特征等存在一定的差
A356合金是一种典型的铝硅铸造合金,由于铸造流动性好、耐大气腐蚀、热膨胀系数低等,在汽车工业领域中得到了广泛的应用。随着汽车轻量化技术的发展,对铝合金的力学性能提出
移动社交媒体是移动互联网上基于用户关系的内容生产和交换平台,即是人们彼此之间用来分享日常生活、经历和观点的平台。随着移动设备的推广,越来越多的用户加入移动社交媒体
目的:瞬时受体电位香草酸亚型1(TRPV1)是肥胖等脂肪细胞代谢功能性疾病临床研究的一个热门靶点,在前脂肪细胞及脂肪细胞中均有表达,参与脂肪分化及褐化过程的调节。脂肪源性干细胞(adipose derived stem cells,ADSCs)作为体内脂肪细胞的重要来源,可定向分化为多种细胞,因其来源丰富,且不存在伦理问题限制,已成为组织工程和再生医学的热门种子细胞。最近有研究报道,TRPV1在人
由于市场竞争压力加剧以及企业自身经营管理不善,促使众多房地产公司尤其是中小房地产公司在近几年举步维艰。在竞争加剧、顾客强势、变化成为常态的时代背景下,企业粗放式发展以及陈旧的职能管理模式早已不能满足企业生存的需要。论文以业务流程理论和成熟度模型理论为基础,构建了 ZD公司的成熟度评价系统,并利用该系统对企业“流程因素”和“组织能力”成熟度进行综合评价,并根据评价结果为该企业的成熟度等级提升提供方向
基于方坯结晶器内冷却水、铜壁和铸坯之间的传热行为,创建了结晶器内二维流-固-热耦合数值模型。铜壁冷面最低温度区出现在冷却水入口处,温度与进水温度基本相同;热面最高温
随着互联网技术的发展,很多仅通过传统零售商销售产品的制造商开始开辟网络渠道销售产品。因此,未来将是双渠道分销模式的发展舞台。双渠道供应链包括零售渠道和直销渠道,这两种渠道吸引不同消费偏好的消费者,可以满足更多的市场需求。然而双渠道供应链中供应商和零售商既是上下游的供应关系,又是同级的竞争关系,渠道冲突和双重边际效应的同时存在使协调更加复杂。因此,双渠道供应链中的协调问题是本文研究的重点。本文首先构
学位
微生物间的相互作用在临床疾病治疗、生态系统修复、污染防治等多个领域扮演着重要角色,研究微生物互作是我们更好的利用微生物的前提条件,其中细菌间的相互作用在生态学以及