论文部分内容阅读
随着社会的不断进步,在人口中占有相当比例的残疾群体的权益保障越来越得到各国政府的重视,“平等地获取信息”作为基本人权越来越得到政府的保护,信息无障碍及其国际化进程已经成为社会文明进步的标志。在我国,政府已经开始意识到信息无障碍的意义和重要性,并着手开展信息无障碍相关政策、法规、标准的探索和研究。一些信息产业的领导者,例如IBM也开始在其产品和服务中制定并贯彻信息无障碍的理念和标准。与此同时,网络信息高速发展的时代,残疾人对信息的需求越来越广泛,网络已成为扩展知识,认识世界的重要途径之一。然而,由于残疾人生理和心理缺陷造成信息收集与知识学习方面的困难,其必影响残疾人的学习,就业,影响社会稳定与和谐。因此如何在信息收集与查询中实现无障碍服务显得尤为重要。本论文提出基于矢量量化技术(Vector Quantization,简称VQ)与Lucene索引/检索技术的语音搜索三层原型系统,旨在结合两种技术设计并开发一种自由/开源的,模块化的,可扩展的辅助信息收集查询原型系统。使残疾人可以通过语音完成信息的收集与查阅,实现信息的无障碍。论文主要工作有:①首先对目前语音搜索现状进行了综述,对当前主要的语音识别技术,搜索引擎技术进行探讨,分析实现关键技术及其原理;②其次提出一种改进的VQ语音识别算法,即在一定范围内动态的,随机的产生阈值来改进初始码本形成策略,并结合差分倒谱参数建立说话人识别系统。最终,用Matlab仿真实验表明该方法在识别率得到一定改善的前提下,系统的训练时间及识别时间得到了明显改善;③在此基础上,分析设计基于VQ语音识别技术与Lucene全文索引/检索技术的三层原型系统,阐述系统的总体设计方案,对系统模块进行划分,并对各个模块功能进行详细设计与实现。④在分析设计Lucene全文索引/检索模块时,通过实验测试索引的性能,并对索引建立与优化作了分析。