【摘 要】
:
目前,语音识别研究进入连续语音识别的高级阶段,而大词汇量连续语音识别系统精确度不高,得到高识别率的语音识别结果的方法是用统计模型技术。本文用统计模型的方法设计语音识别
论文部分内容阅读
目前,语音识别研究进入连续语音识别的高级阶段,而大词汇量连续语音识别系统精确度不高,得到高识别率的语音识别结果的方法是用统计模型技术。本文用统计模型的方法设计语音识别的声学分析,研究了基于HMM模型的维吾尔语连续数字语音识别的语音库建立、声学模型建立和语言模型建立等关键技术,并利用HTK(HMM ToolKit)工具实现了维吾尔语连续数字语音识别系统。本文的具体工作如下:(1)建立了一个适合于维吾尔语连续数字识别的小型语音语料库。按照语音语料库评价规范建立了相关语音库和文本库信息。(2)利用HTK工具建立了维吾尔语连续数字语音声学模型(隐马尔可夫模型),并对模型进行了改进和优化。引入了上下文相关的三音素模型,解决了维吾尔语的音联和协同发音问题。使用了中间树、三音子绑定、修补哑音、高斯混合分量的增加等算法,不断地调整系统模板参数,使HMM模型参数向最佳状态逼近。(3)建立了基于规则的语言模型,使语法、语义知识和语音识别过程有效的结合。用广度优先算法搜索词节点网络,在识别率相似或相近的情况下,用语言模型排除掉不符合语义结构的可能句子,提高了识别率和减少搜索范围,这也是本文的主要创新之处。(4)用Visual C++的进行二次开发,修改语音识别器,使其可以脱离CMD命令的方式而独立运行,改单线程为多线程,增加对内存的管理,生成人机对话的应用程序。(5)最后使用编译好的语音识别器,进行了实验。实验分三种:不同识别基元、增加高斯混合分量的数目、建立上下文相关和无关的语言模型对系统识别率影响的比较。通过实验结果分析、验证了系统提出的单音素和三音素建模技术,和上下文相关的语言模型的组织框架的可实施性。系统对维吾尔语连续数字短语识别率达到80.00%,词识别率达到91.19%。
其他文献
根据那仁宝力格地区主要铜多金属矿床成矿规律,利用GIS平台提取地、物、化、遥等多元地质找矿信息,在MRAS系统中开展了基于18个成、控矿要素的铜多金属矿成矿预测与评价。根
客观诉的合并制度是民事诉讼中一项重要的诉讼制度,现代主要法治国家的民事诉讼立法对此都有明确规定。然而,我国客观诉的合并的规定却不健全。在立法上表现为,对客观诉的合并的
本课题以大豆分离蛋白为原料,以面包为研究对象,用嗜酸乳杆菌发酵大豆分离蛋白,并将改性后的大豆分离蛋白应用于面包制作工艺中。主要研究结果如下:(1)通过用嗜酸乳杆菌发酵
消费是社会再生产中的一个重要环节。在社会再生产的四个环节中,生产是起点,分配、交换是中间环节,消费是终点。由于社会再生产是一个不断运动、发展、循环的过程,因此,消费既是第
<正>靶样含铁血黄素沉积性血管瘤(targetoid hemosiderotic hemangioma,THH)由Santa Cruzt和Aronberg[1]首先报告,认为本病是一种累及真皮浅、中层血管的良性肿瘤。笔者近来诊
隐喻(Metaphor)是英语常用的一种修辞格,是语言中最重要的表达手段之一。运用隐喻,能形象而概括地说明问题,使语言生动、鲜明、富有表现力与感染力。通过对英汉两种语言中隐喻概念
目前国外已经开发出比较成熟的贾卡经编针织物CAD系统,此类系统在发达国家的纺织行业已经基本上普及了。随着近年来国内经编企业的不断增多,各企业开始加大经编针织物的设计,
我国很多北方的孩子对于撑撬都并不陌生,可以说撑撬运动使得他们具有了一个美好的童年。撑撬运动有着属于我国北方的特色,也显示了我国人民的智慧结晶。随着撑撬不断地发展,
独立学院作为具有中国特色高等教育形式,其独特的办学模式和管理体制,使其预算管理与其他公办高校既有共性,又有其自身特点。本文从预算编制的角度出发,浅析独立学院预算编制
随着人们保健意识的提高,菊粉成为国内外关注的焦点,科学家们为了获得更高更纯的低聚果糖和高果糖浆,把研究的重点放在菊粉酶以及产菊粉酶的微生物上,这也是本文的目的所在。