语音唤醒技术在语音助手系统中的应用与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zhangyongqiangis250
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术和通信技术的飞速发现,人们被带入到了全球信息化的时代,计算机、手机成为人们进行工作、交流以及娱乐的重要工具。在人工智能时代大背景下,AI语音也得到了极大的发展,语音助手更是成为了智能终端设备不可或缺的软件,使人们走上了“解放”双手的智能之路。语音识别是人类与计算机进行交互关键技术,而语音唤醒是语音识别的入口,是人类可远距离操控智能设备的首要条件。语音唤醒的研究工作近些年才开始,相比于语音识别的研究工作,在技术上要显得不成熟得多。本文研究了语音唤醒技术在语音助手系统上应用与实现,实现了唤醒词“小T小T”在语音助手上的应用,主要工作如下:1、研究了语音唤醒技术的核心算法,语音唤醒任务是一种小资源级的关键词检索任务,目前常用的系统结构是基于隐马尔科夫模型的Keyword/Filler系统和端到端系统,本文讨论端到端系统,即输入的是语音特征,输出的是关键词结果。文中采用了基于注意力机制的端到端关键词检索系统,针对编码器结构、注意力机制、添加卷积层等进行实验,综合对比选出最佳语音唤醒神经网络模型。2、噪音和混响是影响语音唤醒的因素,对此,本文研究了基于神经网络的语音增强,用生成对抗网络模型进行实验研究,对比三种训练方式:单去噪、单去混响、以及去噪和去混响联合训练的方式,经实验表明,采用去混响和去噪联合训练的方式和其他两种方式相比,较好地实现了语音唤醒鲁棒性的增强。3、通过对语音助手系统的功能需求分析、数据分析、过程建模,设计并实现语音助手系统。该系统主要包括语音唤醒模块和智能对话模块,其中智能对话模块包括三个子模块:语音识别模块(ASR)、自然语言处理模块(NLP)、语音合成模块(TTS),文中分析了各个模块组成结构和数据流程,并设计了数据结构,完成了语音助手系统的搭建。本文介绍了语音唤醒技术在语音助手系统上的应用架构,经过实验证明,实现了语音唤醒技术的应用。通过验证语音唤醒技术在语音助手系统的应用,在智能终端设备(手机端和电视端)上进行了多场景的测试,基本能够完成语音唤醒任务。在智能电视终端不断进行压力测试,大约1小时可以生成1000条数据,最终达到了唤醒率95.58%,,误唤醒大约为0.6次/24小时。
其他文献
木薯是世界上8亿人口赖以生存的主要粮食作物,也是我国重要的能源作物。为推进木薯机械化种植,近年来,国内多家单位开发了实时切种式木薯种植机,这种机型具有开沟、实时切种、下种、施肥、覆土、镇压联合作业的功能。但由于需依靠人工辅助喂送种杆,存在因操作人员喂送种杆不及时引起的漏播问题。实时切种式木薯种植机作业时不便于直接观测种植质量,无法及时获取漏播信息,导致在木薯种植机覆土作业完成后无法及时进行补种,严
目的本研究旨在探讨基于MOOC的翻转课堂教学模式在护理人文课程中的应用效果,并通过与传统课堂对比,分别评估学生对教学方法的满意度,考试成绩及自主学习情况,为更好的优化护理人文课程的教学方案提供依据和支撑。方法采用整群抽样的方法选取某大学2016级本科护理学专业120人作为研究对象,将他们分成两组,每组60名学生。实验组和对照组分别采用翻转课堂和传统教学模式,教学结束后对比两组考试成绩,进行问卷调查
目的多形性胶质母细胞瘤(Glioblastoma Multiforme,GBM),是恶性原发性脑肿瘤的最常见,最具侵袭性的形式,由于其高度弥漫浸润性,,因此患者的存活率很低。尽管近年来手术技术和术后辅助治疗取得了较大进步,但GBM患者的预后仍然很差,平均存活时间很少超过16个月。起着中枢神经系统半透性保护膜作用的血脑屏障(Blood Brain Barrier,BBB)极大地阻碍了大脑中药物的传递
随着女性从业年龄的增加,职业女性尤其是已婚女性普遍面临着家庭角色和社会角色的冲突,女性退休年龄问题成为许多专家、学者共同研究的对象,并做了大量的调查研究。我国退休
目的:对于种植材料而言,具有骨结构仿生特点的微/纳米分级表面形貌具有更好的生物活性,能够促进细胞的成骨向分化,抑制其成脂向分化,有利于种植体表面新骨形成。然而,细胞对微/纳米分级表面形貌的机械响应过程和潜在的应答机制目前并不清楚。本研究的目的在于探讨机械信号响应分子TAZ在该过程中的作用及其活化机制。对该问题的深入探讨,有助于理解种植体表面微/纳米分级形貌对细胞生物学行为的调控作用,并为针对性开展
在刑事诉讼活动中,我们不仅要在程序运作的过程及其最终结果中寻求实现正义的要求,而且应力求通过尽可能少的司法资源投入以此获得良好效果。简言之,作为刑事诉讼所追求的两大价值目标——公正与效率理应贯穿于认罪认罚从宽制度中,并在实践中有所应用与体现。而如今,两者却在认罪认罚案件被告人的上诉问题中发生了种种的矛盾与冲突。毋庸置疑,在维护当事人合法权益中上诉权显得至关重要,对维护司法公正有着重要意义。另一方面
本文是基于翻译《文明的困惑——藏族教育之路》(节选)而写成的翻译实践报告。该书是教育学者巴登尼玛关于中国藏区教育状况和发展的专著,也是一部关于藏族文化研究的著作。
本报告的翻译文本来源于中国藏族当代教育家巴登尼玛所著的《文明的困惑—藏族教育之路》(Confusion of Civilization:The Way Out for Tibetan Education)。在本书中,巴登尼
尽管学界已明确指出对经典文本进行改写是“走出去”的一个有效方案,但是至今仍未提出应怎样进行改写。以《水浒传》为例,其多个英文译本在西方图书市场传播情况并不如人意,
近年来,沿海城市经济发展较为迅速,但复杂的海洋环境使得海工混凝土墩柱的承载力急剧退化,严重影响上部结构的安全,因此开展海工混凝土墩柱承载力试验研究具有一定的现实意义。本文在国家自然基金项目波浪作用下海工混凝土结构动态损伤试验研究(51508234)的资助下,开展了相关试验研究,主要内容如下:(1)基于莫里森方程,当波长、波高、建筑前水深、基床上水深均满足一定的限定条件下时,波浪荷载可近似简化成正弦