一种词义与词的混合语言模型及其应用

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：liongliong596

【摘要】

：

本文提出了一种基于词和词义混合的统计语言模型,研究了这个模型在词义标注和汉语普通话语音识别中的性能,并且与传统的词义模型和基于词的语言模型进行了对比.这个模型比传

【作者】

：

侯珺王作英

【机构】

：

清华大学电子工程系

【出处】

：

中文信息学报

【发表日期】

：

2001年6期

【关键词】

：

统计语言模型词义模型词义标注语音识别混淆度存储空间混合模型 statistical language model semantic and word

【基金项目】

：

国家重大项目

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文提出了一种基于词和词义混合的统计语言模型,研究了这个模型在词义标注和汉语普通话语音识别中的性能,并且与传统的词义模型和基于词的语言模型进行了对比.这个模型比传统词义模型更准确地描述了词义和词的关系,在词义标注中具有较小的混淆度;在汉语普通话连续音识别中,这个词义模型的性能优于基于词的三元文法模型,并且需要较小的存储空间.

其他文献

小学数学课堂教学总结的重要性及常用方法分析

随着新课改的全面实施和不断深入,小学数学课堂教学也面临着诸多的挑战。如何才能优化课堂教学效果、提升学生的学习效率,已经成为当前小学数学老师亟待解决的问题。小学数学

期刊

小学数学课堂教学总结重要性

基于数学形态学的自适应文字版面分析方法

随着光学字符识别能力的提高 ,处理日渐复杂的版面成为文件处理系统中的关键部分。针对中文版面的特点 ,在基于组件的版面分析方法基础上 ,本文提出了一种具有自适应能力的基于数学形态学中膨胀变换的版面分析方法。该方法对基于组件版面分析的核心部分 -文字合并进行了自适应扩展 ,使其具有对不同字体大小、间距等样张更大范围的适应能力

期刊

数学形态学膨胀变换组件版面分析字符识别自适应分析自动文件处理MorphologyInflate transformComponentLayo

如何培养学生良好的学习习惯

学生良好的学习习惯，是学习知识、培养自学能力、提高学生素质的重要条件。良好的学习习惯不仅有利于激发学生学习的积极性和主动性；还有利于形成学习策略，提高学习效率；使学生终身受益。下面谈谈几点看法。　　一、存在的主要问题　　经过调查发现目前中学生在学习中，存在着许多不良习惯。如一些学生书写歪七扭八，字迹潦草很难让别人看懂；添字、漏字、错字，漏掉符号、点错符，也常有发生。有些学生做题粗心大意，经常出错，

期刊

学生素质学习习惯培养学习知识自学能力学习策略学习效率终身受益

基于分解与动态规划策略的汉语未登录词识别

未登录词的识别是汉语自动分词中的主要问题。本文以对中国人名，中国地名和外国译名进行整体识别为目标，采用分解处理策略降低了整体处理难度，并使用动态规划方法实现了最佳路径

期刊

未登录词识别分解处理动态规划汉语自动分词路径搜索整体识别unknown word resolutionleveled strategydynam

Outline字体结构式压缩算法及其实现

针对CJKOutline字体在存储量上存在的不足 ,本文提出一种结构式压缩算法。算法对CJK字体进行集合变换 ,得到笔划集合元素 ;并利用聚类算法得到模板笔划 ;对相似数据进行统一存储与调用。同时 ,本文还提出了一种基于笔划段的笔划抽取算法 ,从图论角度实现了集合变换。结果显示 ,算法取得了较好的效果 ,而且适用于多种字体

期刊

Outline字体结构式压缩算法字体压缩笔划抽取算集合变换压缩原理CJK字符Structural Outline fontfont data c

一种词义与词的混合语言模型及其应用

其他学术论文