面向哈萨克语LVCSR的语言模型构建方法研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:Moke_jlsf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一个好的语言模型不仅可以压缩语音识别过程中的搜索空间,而且还可以提高识别准确率。N-gram统计语言模型是目前广泛使用的语言模型之一。从文本的收集和处理开始,介绍了哈萨克语语言模型的构建相关技术,并以此为基础实现了一个哈萨克语连续语音识别基线系统。分别训练了基于单词和基于音节的3-gram语言模型,并通过困惑度及连续语言实验结果对两种语言模型进行了评价。
其他文献
大蒜素是一种绿色环保药物和环保型绿色饲料添加剂,在畜禽养殖中应用十分广泛.文章论述了大蒜素的化学成分和理化特性、功能特点及其在畜禽养殖中的应用情况,并对其应用前景
【正】重庆一三六地质队在对外新闻宣传工作上狠抓全队通讯员队伍的培养建设,不断增强通讯员的写稿能力,2007年全队在市级报刊发表各类稿件突破百篇,在全国各大煤炭、地质新
【正】百姓有事,找巷子记者。重庆城区那些高低曲折的巷子里,闪现着重庆晚报社区记者忙碌的身影。他们的身份很特别,因为他们不仅是记者,他们还是社区的"编外干部"、居民的贴
针对实际的工业过程建模中存在的多工况和采样延时这两大重要数据特征,首先利用LPV模型拟合多工况过程,选取线性ARX模型作为LPV的局部模型;同时将采样延时和数据的工况归属作为E
动态实体模型是虚拟场景的重要组成部分,骨骼动画是表达虚拟场景中动态实体行为的主要技术。提出了一种虚拟场景中三维模型骨骼动画渲染的策略,即采用第三方软件建立三维动画模型,基于Cal3D动画控制机制,使用OSG三维图形渲染引擎对虚拟场景中运动的三维模型进行模拟。在Vis Forest软件的基础上,集成了骨骼动画渲染方法,解决了动物在虚拟地表上"踏空"的问题,扩展了动态实体在虚拟环境中的行为模拟。以梅花
针对二进制指数退避算法(BEB)中退避窗口调整机制的不足以及在各个节点传输数据时公平性差的问题,提出了周期性采样的两步指数退避算法(PTEB)。PTEB算法首先引入了采样周期的概念,
作者于1990年12月至1995年12月间手术治疗胆道良性疾病1924例,其中再次手术186例(9.67%),男79例,女117例。本组资料显示:胆道残留及再生结石、胆管狭窄是胆道再次手术的主要原因。作者认为,在首次手术前充分了解胆
我院自1995年至2000年拔除T管发生胆汁漏10例,就其原因和防治措施进行探讨.
火麻仁(Fmctus Cannabis)为一年生桑科植物大麻的成熟果实,又名麻子、大麻仁。现代药理学研究证明,火麻仁富含脂肪油、蛋白质、胆碱、挥发油、毒蕈碱以及维生素B1等。畜牧生产实