基于分解与动态规划策略的汉语未登录词识别

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:Louis027
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
未登录词的识别是汉语自动分词中的主要问题。本文以对中国人名,中国地名和外国译名进行整体识别为目标,采用分解处理策略降低了整体处理难度,并使用动态规划方法实现了最佳路径的搜索,较好地解决了未登录词之间的冲突问题。通过对真实语料识别的测试,证明该方法可以全面提高未登录词识别的正确率和召回率。
其他文献
<正>具有有源功率因数校正、安全保护和预热启动功能的高可靠和高效率荧光灯电子镇流器电路如图1。只要适当调整输出级LC串联谐振电路中扼流圈L2的电感值,则可配接40W到60W荧
"启导—探究—综合训练"教学模式是以教师启导、提出任务为前提,以学生主题探究、合作学习为主线,将教学内容贯穿起来,最终对学生进行综合训练.让学生真正成为学习的主体,充分
随着新课改的全面实施和不断深入,小学数学课堂教学也面临着诸多的挑战。如何才能优化课堂教学效果、提升学生的学习效率,已经成为当前小学数学老师亟待解决的问题。小学数学
<正>太电牌TD—8602型电冰箱全自动保护器,由于其随机说明书上没有附电路原理图,给维修带来极大不便,笔者在维修过程中按照实物对其电路原理图进行了测绘(见图1),图2是印刷电
目前的IECQ体系是在ISO9000系列认证之后再进行质量认证和能力认证,本文介绍了IECQ体系发展的一个新动向:在质量认证和能力认证的基础上再加技术认证和工艺过程认证。
随着光学字符识别能力的提高 ,处理日渐复杂的版面成为文件处理系统中的关键部分。针对中文版面的特点 ,在基于组件的版面分析方法基础上 ,本文提出了一种具有自适应能力的基于数学形态学中膨胀变换的版面分析方法。该方法对基于组件版面分析的核心部分 -文字合并进行了自适应扩展 ,使其具有对不同字体大小、间距等样张更大范围的适应能力
本文提出一种以DOP技术作为基本框架,同时利用基于相似的概率评估技术,实现汉语句法分析的方法。其中,对于输入语句,首先需要经过词汇层与词性层两层初选。然后,基于已构建知识源,获取
学生良好的学习习惯,是学习知识、培养自学能力、提高学生素质的重要条件。良好的学习习惯不仅有利于激发学生学习的积极性和主动性;还有利于形成学习策略,提高学习效率;使学生终身受益。下面谈谈几点看法。  一、存在的主要问题  经过调查发现目前中学生在学习中,存在着许多不良习惯。如一些学生书写歪七扭八,字迹潦草很难让别人看懂;添字、漏字、错字,漏掉符号、点错符,也常有发生。有些学生做题粗心大意,经常出错,
质量与效益并不是孤立的两个概念,企业只有提高质量才能获得长久的效益。
作者根据所在企业的质量教育(培训)工作实践和作者从事质量工作的体会,对质量教育的作用,质量教育的主要环节:职责、规划(计划)、教育内容(方案)、教材和教员、组织实施、成效考核等工