助老机器人语音合成方法研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:ceylong2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于政治经济发展、医疗水平提升以及计划生育等政策,中国社会已经自2000年开始正式进入人口老龄化阶段。2019年11月22日附近,中共中央、国务院印发了《国家积极应对人口老龄化中长期规划》。为响应规划的号召,为可敬可亲的老年人开发助老服务机器人产品是一种很好的服务,语音交互作为十分方便、快捷、易于操作的人机交互方式势必会应用于其上。本文研究语音交互技术中的“嘴巴”部分——语音合成系统,提出了语音合成的三个层次,一是从文本到语音,二是情感的转换,三是说话人的转换。建立汉语中性语音合成系统,根据嵌入式设备的特点,由于HMM的合成系统具有巨大的优势,然后针对基于HMM的语音合成,首先阐述HMM的原理与算法,然后详细介绍汉语言合成的技术关键,最后给出本文所建立基于HMM的语音合成系统的效果。建立多种情感的转换系统,分析了研究中出现的比较主流的若干情感空间模型,并且主要研究基于HMM的情感语音合成方法流程,基于中科院的CASIA情感语音库,对语音韵律参数的统计规律进行分析与总结,论证了基于HMM的情感语音合成中,对韵律参数进行调整而进行情感模拟的可行性,并且在本文设计的基于HMM的语音合成系统中加入了情感调整模块,实现了六种情感的表达。建立说话人转换技术系统,分析主流框架与流程,研究中比较主流的几种说话人转换的方法,并且进行了优劣分析。介绍了基于HMM的说话人转换方法,详细论述了MLLR算法和Eigen Voice算法的原理,并通过实验对比性能。在本文设计的HMM语音合成系统中加入了说话人转换的模块,通过50句话的语音录入,实现了一个说话人转换模块。建立完整的可用软件系统,开发了完整的前后端软件以实现服务机器人平台上的语音合成需求。前端主要使用android studio开发,采用广播机制的在线合成直接播放和表单输入的离线合成获取语音文件两种形式,并且介绍了说话人录音提交的详细交互流程;在后端主要用Python编写应用服务器程序,采用My SQL实现数据表的操作,并采用开源ASR项目ASRT进行录音质量检测。系统功能和性能测试表明本系统可用性高,响应较快,性能可靠。
其他文献
目前在生物群体和人类社会中的集群行为得到了深入的研究。然而,动物的协同行为与人类有着显著不同。一般而言,描述动物协同行为的短期网络相比于人类有着较高的阶数,这就需要用高阶网络去刻画。在本文中提出了一种使用集群行为时序数据的方法来确定动物群体的最优极大马尔科夫阶数从而反映交互网络的最大记忆能力。我们的方法结合了时延的因果推断算法以及高阶图模型。一方面因果推断算法基于信息论,通过聚合因果邻居和删除非直
伺服控制是运动控制领域的一个重要分支,伺服系统在现代工农业、国防和医疗等高新科技领域有着十分广泛的应用。伺服系统的典型机械传动结构是由高速伺服电机驱动减速传动机构,再由传动机构带动负载运动,完成能量的转换。一方面,这样的机械传动结构中一定会存在齿隙等非线性环节,齿隙非线性既是一种力矩传动过程中不可缺少的非线性因素,同时也是一种影响系统性能的非常重要的因素;另一方面,由于传动机构的刚度不是理想的无穷
深度估计作为计算机视觉领域的一项基础性研究,在自动驾驶、三维视频、增强现实等领域具有广泛应用。单目深度估计具有价格低廉、适用性广等特点,因此近年来逐步成为研究热点。现阶段,深度学习技术在图像分类、目标检测和语义分割等多个领域都取得了显著进步。借助深度模型强大的特征表达能力,大量学者设计了一系列端到端的单目深度估计算法,并在性能上获得明显的提高。但是,现有的方法仍存在某些问题:这些算法大都遵循静态环
随着社会的发展和科技的进步,智能图像算法被广泛应用到军事、医疗、交通等各个领域,其中目标检测和跟踪算法是智能图像算法中最热门的分支。工程环境下的大量虚警以及计算平台性能的限制,给目标检测与跟踪带来了更大的挑战。本文以周界监控项目为背景,研究实时的目标检测和目标跟踪算法,并通过多枪一球的多传感器融合策略,兼顾周界全景的同时自动跟踪放大目标细节,以满足快速告警、精准定位、全景探测的实际项目需求。首先,
弱小目标检测技术与国民安全密切相关,其在保障领空安全、机场净空防护以及军事敏感地区的空中管制等领域具有广泛的运用和重要的价值。小目标成像区域小、特征信息弱、尺寸变化范围大,这些特性导致其在实时系统中难以被准确地检测出来,因此如何从复杂变化的背景中实时、准确地捕获目标并及时发出预警是该项技术的核心关键,也是本课题的研究重点。基于该问题,论文做了以下工作:基于传统弱小目标检测方法,论文提出了一种多尺度
人工智能和机器人是当前技术发展的重要领域,专利及其他科学技术文献反映了基础研究和技术创新的进展。应用自然语言处理技术,将机器人等重要技术发展领域和专利等科学技术文件结合起来进行深入研究,可以帮助领域从业人员高效地找到产品设计问题的解决方案,实现领域知识挖掘、学科发现与关联性评价、以及演化趋势分析。这对于理解不同科学技术领域的互动与渗透、发现潜在商业机会具有重要意义。知识图谱是Google为了优化搜
多智能体系统已经在智能电网,智慧交通,自动驾驶,军事集群系统等领域被广泛应用。多无人机与多机器人所构成的多智能体系统在多目标跟踪与监控,协同编队,智能网联车队等实际应用中扮演着重要角色。目标的跟踪与包围是多智能体系统中的一个重要研究问题。其中,目标状态估计又是实现多智能体目标跟踪问题的重要技术。传统的目标估计问题,一般都会假设目标的系统方程和输入信息已知。然而实际应用中,目标中不可避免地存在一些未
将机器人引入大型船舶喷涂作业是目前船舶制造业发展的必然趋势。现有的机器人应用主要以人工示教的方式进行,而人工示教方式存在着对大型工件示教操作难度大、效果差等缺点,限制了机器人在大型船舶喷涂任务中的应用。一种有效的解决方式是采用离线编程进行喷涂机器人轨迹规划,然而目前已有的离线编程系统大多只适用于中小型简单喷涂场景,面向大型复杂场景的轨迹规划能力较弱,无法解决大面积、变曲率的大型船舶外立面喷涂问题。
随着我国汽车保有量的迅速增长和人口向城市集聚的趋势不断加剧,立体车库成为满足快速增长的停车需求的重要解决手段。目前的立体车库多是本地采集数据和控制,随着“互联网+”和云计算的兴起,把传感器数据采集到云端进行基于人工智能的大数据处理,进而实现“无人值守”的立体车库成为发展趋势。基于此,本学位论文在江苏省重点研发计划项目的支持下,以智能立体车库云数据采集和控制系统为目标,研究车牌信号提取和立体车库电机
人脸属性编辑旨在操纵面部图像的单个或多个属性,生成具有所需属性的新面部图像,同时保留其他原始细节,在智能监控、娱乐社交等诸多领域有着广泛的应用需求。传统的人脸编辑需要借助专业的图像编辑软件完成,但由于普通用户往往缺少专业的图像编辑技能,因此这种方式并不符合大多数普通用户的需求。目前很多公司推出了针对性的人脸编辑应用,例如美图公司出品的美图秀秀,字节跳动推出的激萌和轻颜相机等。这些产品在一定程度上满