基于矢量量化的语音识别及全文检索研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:sailordong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的不断进步,在人口中占有相当比例的残疾群体的权益保障越来越得到各国政府的重视,“平等地获取信息”作为基本人权越来越得到政府的保护,信息无障碍及其国际化进程已经成为社会文明进步的标志。在我国,政府已经开始意识到信息无障碍的意义和重要性,并着手开展信息无障碍相关政策、法规、标准的探索和研究。一些信息产业的领导者,例如IBM也开始在其产品和服务中制定并贯彻信息无障碍的理念和标准。与此同时,网络信息高速发展的时代,残疾人对信息的需求越来越广泛,网络已成为扩展知识,认识世界的重要途径之一。然而,由于残疾人生理和心理缺陷造成信息收集与知识学习方面的困难,其必影响残疾人的学习,就业,影响社会稳定与和谐。因此如何在信息收集与查询中实现无障碍服务显得尤为重要。本论文提出基于矢量量化技术(Vector Quantization,简称VQ)与Lucene索引/检索技术的语音搜索三层原型系统,旨在结合两种技术设计并开发一种自由/开源的,模块化的,可扩展的辅助信息收集查询原型系统。使残疾人可以通过语音完成信息的收集与查阅,实现信息的无障碍。论文主要工作有:①首先对目前语音搜索现状进行了综述,对当前主要的语音识别技术,搜索引擎技术进行探讨,分析实现关键技术及其原理;②其次提出一种改进的VQ语音识别算法,即在一定范围内动态的,随机的产生阈值来改进初始码本形成策略,并结合差分倒谱参数建立说话人识别系统。最终,用Matlab仿真实验表明该方法在识别率得到一定改善的前提下,系统的训练时间及识别时间得到了明显改善;③在此基础上,分析设计基于VQ语音识别技术与Lucene全文索引/检索技术的三层原型系统,阐述系统的总体设计方案,对系统模块进行划分,并对各个模块功能进行详细设计与实现。④在分析设计Lucene全文索引/检索模块时,通过实验测试索引的性能,并对索引建立与优化作了分析。
其他文献
随着计算机技术的发展与3C产品的融合,数字家庭为人们提供了方便、智能、高效的数字化生活,成为人们关注的焦点。城市公交覆盖面广、经济快捷,目前是大多数出行者的首选方式。在
随着经济全球化的快速发展,航运业在全球化贸易运输中的地位越来越重要,已成为国家经济发展中一个重要的行业,对于保证经济的繁荣、促进国际贸易的发展起着举足轻重的作用。
随着计算机网络和语音编码技术的飞速发展,语音通信技术获得了突破性的进展和非常广泛的应用。为了保证呼叫控制的安全性及语音数据的安全性,在通信开始时,一般采用身份认证
本文通过设计一种用于教学工作的激光笔轨迹识别系统,为授课者提供更方便的教学手段,为提高学习质量和效率提供有力的帮助。本课题是E-Learning实验室的Standard Natural Cla
剩余油分布的预测有很高的收益,因此引起世界各国对剩余油分布进行研究的重视。经过多年的开发,目前地下油水关系变得日趋复杂,有必要进行剩余油分布规律的研究。   本文分析
时间是信息的重要属性。随着数据库与信息技术的迅猛发展,时态信息的应用和处理已在各行各业成为必不可少的一部分,特别是在电子政务、电子商务、数据仓库、决策支持系统等信息
本文对信息检索原理和Agent技术进行了研究,对三种信息检索模型和四种信息检索方法进行了探讨。针对勘探与生产分公司对门户信息检索需求,在分析勘探生产门户的体系结构、组成
学位
数据挖掘就是从大量的数据中抽取以前未知并具有潜在可用的模式。而关联规则挖掘是近年来发展十分迅速而且非常活跃的研究领域,是数据挖掘的一个重要研究内容。它主要应用于
针对石油钻井企业钻具管理中因钻具库存量大、种类多、价值高而导致的管理难度大、成本高的现状,指出石油钻井企业实施钻具需求计划系统的必要性。通过制造业物料需求计划理论