机器人语音交互系统的研究与设计

被引量 : 5次 | 上传用户:ggb1977
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多媒体技术的兴起,成为计算机与人之间信息交流的关键技术,语言作为人类相互交流和通信最快捷的手段,两者之间的结合实现语音传输、存储或通过语音实现人机交互成为重要的研究课题。为计算机增加语音交互方式,使人机交互像人与人交流那样自然友好,这种自然和谐的交互技术已经成为人机交互领域的发展趋势之一。本实验室设计开发了BME-1服务型机器人,针对该机器人语音识别的要求,设计了适合BME-1机器人的语音交互系统,介绍了实现人机信息交互的开发方法。使人与机器人的沟通过程中可以通过语言进行交流,满足科学性、交互性的要求。本文在对语音互动系统功能及关键技术分析研究的基础上,对系统进了详细设计并初步实现了该交互系统的功能。本文针对汉语音设计开发了三个语音互动系统模块,即语音分析模块、语音识别模块以及语音合成模块,其中语音分析模块主要包括语音增强处理以及语音信号特征参数的提取。针对不同的模块进行了汉语语音的分析和研究,其中语音信号的前端处理主要包括语音信号的预加重以及分帧加窗处理,同时经过计算得到了合适的汉语语音传感器阵列参数,根据系统要求选择圆形阵列,并研究了汉语语音增强算法,本论文中选择了基于子空间线性估计器的增强算法。在汉语语音信号特征参数的分析部分,主要研究了语音信号端点检测以及基因周期估计的方法,论文提出了基于短时能量和短时过零率的双门限端点检测法和基于短时自相关函数(Short Time Autocorrelation Function, AMD)、短时平均幅度差函数(Short Time Average Difference Function, AMDF)的基音周期估计法,同时对语音信号进行了平滑滤波处理,对清浊音进行了二次判定。最后根据该系统的要求选择Speech SDK实现机器人语音交互系统的设计,利用Speech SDK提供的应用程序编程接口SAPI进行汉语语音识别与合成,对识别结果在逻辑程序中处理,实现人机对话和汉语语音控制。
其他文献
《鲁滨逊漂流记》是英国现实主义作家丹尼尔·笛福的第一部小说,也被认为是英国小说的开山之作。生态女性主义为《鲁滨逊漂流记》中女性角色的失语提供了新的解读角度。在自
冠心病是常见的心血管疾病之一,我国近年来有升高的趋势,其血脂紊乱是心血管疾病发展过程中可调整的重要危险因子.流行病学研究已提出血清脂蛋白和冠心病之间具有一定相关性
伴随我国国民经济的快速发展,人民的消费水平普遍提高,人们的消费需求和消费方式呈现多元化和休闲化的发展趋势。其中,最典型的便是休闲食品。以潜力巨大的消费需求为引擎,国
教练技术的训练在中国已经近20年了,整个的发展一直充满了争议,其中很重要的原因是传播者和受众大部分没有心理学的基础知识,而这套训练技术恰恰是在心理学的基础上研发出来
目的对地震灾后重建过程中家长群体的自我和谐、生活满意度以及父母自我效能感的关系进行研究。方法采用自我和谐量表(SCCS)、生活满意度量表(LSR)和父母自我效能感量表对灾
国有企业高层管理者作为战略性人力资源,不仅是企业生产的组织者、协调者,也是企业发展的推动者,其领导胜任力的构成和发展是关系到国有企业发展的重要因素。因此,对国有企业
<正>一、制定专家共识的背景二、制定指南的意义1.目前缺乏全面、系统的临床麻醉指南2.学习和遵循临床麻醉指南的意义3.临床麻醉指南需要不断完善4.麻醉手术期间液体治疗专家
会议
孔庙是以孔子为主祀,历朝历代的先贤、先儒为从祀的礼制庙宇。孔子的儒家思想是其意识形态,而孔庙则是国家意识形态的实物载体,历代的统治阶层通过孔庙来影响国家中上层知识
本课题来源于国家自然科学基金项目“柔性车间设施布局与带装载约束的AGV(Automated Guided Vehicle)路径规划集成优化方法”(No.61304206)和企业的实际需求。设备布局和物料
针对极区(特别是近极点地区)超视距目标跟踪中,地理北作为方位基准带来的目指信息偏差问题,提出采用虚拟方式对地球表面进行重新划分,使地理极点区域转变为虚拟赤道区域,提出