助老机器人语音合成方法研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户：ceylong2000

【摘要】

：

【作者】

：

封宝鼎

【机构】

：

东南大学

【出处】

：

东南大学

【发表日期】

：

2020年01期

【关键词】

：

助老服务机器人语音合成 HMM 情感语音说话人转换语音合成软件

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

由于政治经济发展、医疗水平提升以及计划生育等政策,中国社会已经自2000年开始正式进入人口老龄化阶段。2019年11月22日附近,中共中央、国务院印发了《国家积极应对人口老龄化中长期规划》。为响应规划的号召,为可敬可亲的老年人开发助老服务机器人产品是一种很好的服务,语音交互作为十分方便、快捷、易于操作的人机交互方式势必会应用于其上。本文研究语音交互技术中的“嘴巴”部分——语音合成系统,提出了语音合成的三个层次,一是从文本到语音,二是情感的转换,三是说话人的转换。建立汉语中性语音合成系统,根据嵌入式设备的特点,由于HMM的合成系统具有巨大的优势,然后针对基于HMM的语音合成,首先阐述HMM的原理与算法,然后详细介绍汉语言合成的技术关键,最后给出本文所建立基于HMM的语音合成系统的效果。建立多种情感的转换系统,分析了研究中出现的比较主流的若干情感空间模型,并且主要研究基于HMM的情感语音合成方法流程,基于中科院的CASIA情感语音库,对语音韵律参数的统计规律进行分析与总结,论证了基于HMM的情感语音合成中,对韵律参数进行调整而进行情感模拟的可行性,并且在本文设计的基于HMM的语音合成系统中加入了情感调整模块,实现了六种情感的表达。建立说话人转换技术系统,分析主流框架与流程,研究中比较主流的几种说话人转换的方法,并且进行了优劣分析。介绍了基于HMM的说话人转换方法,详细论述了MLLR算法和Eigen Voice算法的原理,并通过实验对比性能。在本文设计的HMM语音合成系统中加入了说话人转换的模块,通过50句话的语音录入,实现了一个说话人转换模块。建立完整的可用软件系统,开发了完整的前后端软件以实现服务机器人平台上的语音合成需求。前端主要使用android studio开发,采用广播机制的在线合成直接播放和表单输入的离线合成获取语音文件两种形式,并且介绍了说话人录音提交的详细交互流程;在后端主要用Python编写应用服务器程序,采用My SQL实现数据表的操作,并采用开源ASR项目ASRT进行录音质量检测。系统功能和性能测试表明本系统可用性高,响应较快,性能可靠。

其他文献

基于因果性的网络群体智能信息挖掘算法研究

目前在生物群体和人类社会中的集群行为得到了深入的研究。然而,动物的协同行为与人类有着显著不同。一般而言,描述动物协同行为的短期网络相比于人类有着较高的阶数,这就需要用高阶网络去刻画。在本文中提出了一种使用集群行为时序数据的方法来确定动物群体的最优极大马尔科夫阶数从而反映交互网络的最大记忆能力。我们的方法结合了时延的因果推断算法以及高阶图模型。一方面因果推断算法基于信息论,通过聚合因果邻居和删除非直

学位

集群行为因果网络信息熵高阶图模型高阶马尔科夫链

伺服系统齿隙补偿与谐振抑制方法研究

伺服控制是运动控制领域的一个重要分支,伺服系统在现代工农业、国防和医疗等高新科技领域有着十分广泛的应用。伺服系统的典型机械传动结构是由高速伺服电机驱动减速传动机构,再由传动机构带动负载运动,完成能量的转换。一方面,这样的机械传动结构中一定会存在齿隙等非线性环节,齿隙非线性既是一种力矩传动过程中不可缺少的非线性因素,同时也是一种影响系统性能的非常重要的因素;另一方面,由于传动机构的刚度不是理想的无穷

学位

永磁同步电机齿轮齿隙机械谐振抗干扰控制高阶滑模观测器非奇异终端滑模控制器陷波滤波器

基于深度学习的无监督单目图像序列深度估计

深度估计作为计算机视觉领域的一项基础性研究,在自动驾驶、三维视频、增强现实等领域具有广泛应用。单目深度估计具有价格低廉、适用性广等特点,因此近年来逐步成为研究热点。现阶段,深度学习技术在图像分类、目标检测和语义分割等多个领域都取得了显著进步。借助深度模型强大的特征表达能力,大量学者设计了一系列端到端的单目深度估计算法,并在性能上获得明显的提高。但是,现有的方法仍存在某些问题:这些算法大都遵循静态环

学位

单目深度无监督学习深度学习光流多任务学习

基于多传感器融合的目标检测和跟踪算法应用和研究

随着社会的发展和科技的进步,智能图像算法被广泛应用到军事、医疗、交通等各个领域,其中目标检测和跟踪算法是智能图像算法中最热门的分支。工程环境下的大量虚警以及计算平台性能的限制,给目标检测与跟踪带来了更大的挑战。本文以周界监控项目为背景,研究实时的目标检测和目标跟踪算法,并通过多枪一球的多传感器融合策略,兼顾周界全景的同时自动跟踪放大目标细节,以满足快速告警、精准定位、全景探测的实际项目需求。首先,

学位

目标检测目标跟踪目标关联多传感器联动跟踪

基于深度学习的弱小目标检测

弱小目标检测技术与国民安全密切相关,其在保障领空安全、机场净空防护以及军事敏感地区的空中管制等领域具有广泛的运用和重要的价值。小目标成像区域小、特征信息弱、尺寸变化范围大,这些特性导致其在实时系统中难以被准确地检测出来,因此如何从复杂变化的背景中实时、准确地捕获目标并及时发出预警是该项技术的核心关键,也是本课题的研究重点。基于该问题,论文做了以下工作:基于传统弱小目标检测方法,论文提出了一种多尺度

学位

弱小目标检测背景抑制MobileNetV2＿SSD特征金字塔网络卷积自编码器

基于多源文本分析的机器人领域知识图谱构建

人工智能和机器人是当前技术发展的重要领域,专利及其他科学技术文献反映了基础研究和技术创新的进展。应用自然语言处理技术,将机器人等重要技术发展领域和专利等科学技术文件结合起来进行深入研究,可以帮助领域从业人员高效地找到产品设计问题的解决方案,实现领域知识挖掘、学科发现与关联性评价、以及演化趋势分析。这对于理解不同科学技术领域的互动与渗透、发现潜在商业机会具有重要意义。知识图谱是Google为了优化搜

学位

知识图谱远程监督实体关系抽取机器人专利Neo4j

面向带未知输入目标的分布式估计算法设计及其应用

多智能体系统已经在智能电网,智慧交通,自动驾驶,军事集群系统等领域被广泛应用。多无人机与多机器人所构成的多智能体系统在多目标跟踪与监控,协同编队,智能网联车队等实际应用中扮演着重要角色。目标的跟踪与包围是多智能体系统中的一个重要研究问题。其中,目标状态估计又是实现多智能体目标跟踪问题的重要技术。传统的目标估计问题,一般都会假设目标的系统方程和输入信息已知。然而实际应用中,目标中不可避免地存在一些未

学位

多智能体系统目标跟踪输出调节分布式估计编队包围

面向大型船舶外立面的喷涂机器人离线编程与仿真系统

将机器人引入大型船舶喷涂作业是目前船舶制造业发展的必然趋势。现有的机器人应用主要以人工示教的方式进行,而人工示教方式存在着对大型工件示教操作难度大、效果差等缺点,限制了机器人在大型船舶喷涂任务中的应用。一种有效的解决方式是采用离线编程进行喷涂机器人轨迹规划,然而目前已有的离线编程系统大多只适用于中小型简单喷涂场景,面向大型复杂场景的轨迹规划能力较弱,无法解决大面积、变曲率的大型船舶外立面喷涂问题。

学位

船舶喷涂工业机器人三角网格模型离线编程轨迹规划

智能立体车库云数据采集和控制系统研究与设计

随着我国汽车保有量的迅速增长和人口向城市集聚的趋势不断加剧,立体车库成为满足快速增长的停车需求的重要解决手段。目前的立体车库多是本地采集数据和控制,随着“互联网+”和云计算的兴起,把传感器数据采集到云端进行基于人工智能的大数据处理,进而实现“无人值守”的立体车库成为发展趋势。基于此,本学位论文在江苏省重点研发计划项目的支持下,以智能立体车库云数据采集和控制系统为目标,研究车牌信号提取和立体车库电机

学位

立体车库DSP车牌识别小波去噪ARM云数据采集PLC控制系统

基于深度学习的人脸编辑系统研究与应用

人脸属性编辑旨在操纵面部图像的单个或多个属性,生成具有所需属性的新面部图像,同时保留其他原始细节,在智能监控、娱乐社交等诸多领域有着广泛的应用需求。传统的人脸编辑需要借助专业的图像编辑软件完成,但由于普通用户往往缺少专业的图像编辑技能,因此这种方式并不符合大多数普通用户的需求。目前很多公司推出了针对性的人脸编辑应用,例如美图公司出品的美图秀秀,字节跳动推出的激萌和轻颜相机等。这些产品在一定程度上满

学位

人脸检测人脸关键点检测人脸分割人脸属性编辑模型压缩

助老机器人语音合成方法研究与实现

其他学术论文