一种基于规则的中文分词算法

来源 :第七届中文信息处理国际会议 | 被引量 : 0次 | 上传用户:lixianhua021389
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种基于词库的结合词频、词性、中文文法规则和未登录词识别规则的分词算法,该算法首先通过采用基于词库的跨度为1的前向最大匹配分词算法获得初步的分词结果,然后依据中文文法规则和词条筛选规则对初步结果进行再次划分,得到优化的分词结果,最后通过未登录词识别规则对分词结果进行检查,将满足未登录词条件的新词加入词库.该分词算法能够在很大程度上消除歧义划分,提高未登录词的识别概率。实验结果表明,该分词算法的准确率能达到97%以上,在效率上也具有很大优势。
其他文献
针对农业环境信息数据获取的实际应用需要,本文提出了一种无线远程监控系统设计方案。采用无线移动通信网络(GPRS/CDMA)与互联网(INTERNET)的对接技术,将监控现场数据(field
随着农业信息化进程的开展,很多新兴的信息技术在农业领域都得到了广泛的应用。Zigbee技术是一种应用于短距离、低传输速率下的各种电子设备之间的无线通信技术,该技术致力于
会议
在党中央和国务院“关于教育工作的指示”里,已经明确指出必须对儿童进行共产主义教育。但对学龄前儿童能不能进行共产主义教育这一问题在幼教工作者中却还存在着不同的看法。
期刊
期刊
本文利用农业生产知识、计算机和网络技术,研制开发了行之有效的多媒体玉米病虫草害诊治专家系统,将数据库、人工智能、管理信息系统、决策支持系统、网络技术以及信息集成技
根据LF炉生产、工艺、设备的特点,建立了适合柳钢实际的LF炉生产模式;对LF炉的生产设备进行了整改,使得其更好的服务于生产;为了能够更好的实现LF炉的升温、脱氧、去夹杂的功能
一九五二年,张瑾瑶从人民解放军转业回到故乡山西平定县,当了山区小学教师。他根据党的教育方针,在神峪口办起了小学,艰苦办校十二年,培养了一百二十三个初小毕业生,开展业
作为一种政府公共资源,准确评价科技经费的投入绩效,是提高政府投入效率、规避政府投入风险的需要,也是世界各国的普遍做法.通过对科技投入效益进行全面而准确的评价,对增加
《工业企业设计卫生标准》TJ36-79,要求对油汽蒸汽生产中产生的可燃性气体进行回收利用,这就需要研制与开发出既经济又实效的VOC回收装置,装置应具有工艺流程简单、设备少、
会议