具有有限词汇语音识别能力的说话人确认系统实现研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:wanghai19881016
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文主要工作是力图将语音识别和说话人识别结合在一起,实现具有"有限词汇"语音识别和的说话人确认系统.针对不同的应用背景,文中提出了"显式"和"隐式"两处方式来实现语音识别和说话人确认的结合.在显式系统中,说话人确认对于用户而言是一个明显的执行过程,只有当用户通过了身份确认过程,系统在识别出用户语音的同时,完成对其身份的确认.表面看来,用户感觉不到明显的说话人确认模块的存在.由于小词汇量的孤立词语音识别技术已经很成熟,该文研究的重点在于说话人确认部分.在对比了DTW和隐马尔 可夫过程(Hidden Markov Model HMM)的性能之后,选择了HMM进行说话人确认.针对说话人确认阈值,建立全局说话人模型进行判决等等.这些方法与人为预先设定阈值相比,自适应能力强,使用方便,而且性能也有很大提高.在这些研究基础之上,作者实现了两个实时演示系统,其中显式系统主要针对计算机安全进入和家用电器安全控制的应用,隐式系统主要针对语音数字拨号的应用.
其他文献
学位
在流程工业的生产中,存在一些过程参数,由于技术或经济的原因,这些过程参数无法直接在线测量,或测量不准确,但这些过程参数对保证产品质量起到至关重要的作用。为实现对这些过程参
随着国际互联网的发展,网络多媒体应用成为了一个重要的方向.该论文在设计和实现音频和白板点播服务系统中对网络带宽的限制和传输随机延时的影响从系统结构,网络传输,同步技
本文主要对HSPA+异构网系统进行了研究,重点对上行HSPA+异构网中的E-DCH解耦技术和分布式干扰协调技术这两种关键技术进行了理论研究及仿真实现。首先为理论知识背景的介绍,
论文首先就ITU-T以及ATM Forum中关于ATM连接的要求,业务量合约定义,基于业务管理的业务分类,ATM网络中的业务量控制框架等几方面的内容进行了说明,明确了ATM网络的业务量管
该文从TCP拥塞控制机制着手研究了TCP/IP网络中支持弹性业务的服务质量分级和保证的资源分配算法及其公平性.该文着眼于在传输层上对流量的控制,结论适用于所有在传输层上支
该文系统地研究了超高速FFT芯片版图设计的过程及要点.首先对于标准单元库及其建立做了简略的回顾.在对自顶而下的ASIC设计方法学较深理解的前提下,完成了超高速FFT芯片网表
该文的第一章主要研究了CATV网的发展现状及几种重要的宽带接入网,重点解决HFC网络的基本结构、频谱规划、传输速率、业务等级等内容,说明了HFC是目前最有发展前途的宽带接入
车牌识别系统是智能交通系统的重要基础,它能够快速准确地采集车辆的车牌信息,为现代化的车辆管理带来了便捷。针对车牌识别的研究越来越多,其应用也日益广泛。车牌识别的关键技
该文所做工作主要包括以下几个方面:对已存在的一些亚网格算法进行了分析和模拟计算,发现了存在的主要问题是不稳定性;独立地提出了一种新的性能优异的亚网格算法;发了亚网格