一种词义与词的混合语言模型及其应用

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:liongliong596
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种基于词和词义混合的统计语言模型,研究了这个模型在词义标注和汉语普通话语音识别中的性能,并且与传统的词义模型和基于词的语言模型进行了对比.这个模型比传统词义模型更准确地描述了词义和词的关系,在词义标注中具有较小的混淆度;在汉语普通话连续音识别中,这个词义模型的性能优于基于词的三元文法模型,并且需要较小的存储空间.
其他文献
随着新课改的全面实施和不断深入,小学数学课堂教学也面临着诸多的挑战。如何才能优化课堂教学效果、提升学生的学习效率,已经成为当前小学数学老师亟待解决的问题。小学数学
随着光学字符识别能力的提高 ,处理日渐复杂的版面成为文件处理系统中的关键部分。针对中文版面的特点 ,在基于组件的版面分析方法基础上 ,本文提出了一种具有自适应能力的基于数学形态学中膨胀变换的版面分析方法。该方法对基于组件版面分析的核心部分 -文字合并进行了自适应扩展 ,使其具有对不同字体大小、间距等样张更大范围的适应能力
学生良好的学习习惯,是学习知识、培养自学能力、提高学生素质的重要条件。良好的学习习惯不仅有利于激发学生学习的积极性和主动性;还有利于形成学习策略,提高学习效率;使学生终身受益。下面谈谈几点看法。  一、存在的主要问题  经过调查发现目前中学生在学习中,存在着许多不良习惯。如一些学生书写歪七扭八,字迹潦草很难让别人看懂;添字、漏字、错字,漏掉符号、点错符,也常有发生。有些学生做题粗心大意,经常出错,
未登录词的识别是汉语自动分词中的主要问题。本文以对中国人名,中国地名和外国译名进行整体识别为目标,采用分解处理策略降低了整体处理难度,并使用动态规划方法实现了最佳路径
针对CJKOutline字体在存储量上存在的不足 ,本文提出一种结构式压缩算法。算法对CJK字体进行集合变换 ,得到笔划集合元素 ;并利用聚类算法得到模板笔划 ;对相似数据进行统一存储与调用。同时 ,本文还提出了一种基于笔划段的笔划抽取算法 ,从图论角度实现了集合变换。结果显示 ,算法取得了较好的效果 ,而且适用于多种字体