基于分词与词性标注的汉语逗号自动分类

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:onewxf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,标点符号作为篇章的重要部分逐渐引起研究者的关注。然而,针对汉语逗号的研究才刚刚展开,采用的方法也大多都是在句法分析的基础上,尚不存在利用汉语句子的表层信息开展逗号自动分类的研究。提出了一种基于汉语句子的分词与词性标注信息做逗号自动分类的方法,并采用了两种有监督的机器学习分类器,即最大熵分类器和CRF分类器,来完成逗号的自动分类。在CTB 6.0语料上的实验表明,CRF的总体结果比最大熵的要好,而这两种分类器的分类精度都非常接近基于句法分析方法的分类精度。由此说明,基于词与词性做逗号分类的方法是可行
其他文献
中国人口增长和群众生活改善,对粮食和其他农产品的数量需求和质量要求逐步提高,给农业现代化提出了新的挑战,给农业机械化也提出了更高的要求。据预测,到2020年我国农业机械化水
《中华人民共和国国民经济和社会发展第十一个五年规划纲要》(以下简称《十一·五纲要》)明确提出,要大力发展循环经济,建设资源节约型、环境友好型社会。《中华人民共和国循
泪道阻塞是眼科常见病,阻塞部位可以分别或合并发生在如下4个部位[1]:(1)泪小点;(2)泪小管同泪囊的连接处;(3)泪囊和鼻泪管,特别是两者之间的连接部分;(4)鼻泪管出口处。笔者近年来应
化学实验是获取知识技能、感知科学规律、启迪思维创新的重要途径.它对于培养学生的探究精神和科学研究态度有重要的意义,也是培养学生化学学习兴趣的有效策略之一,有利于学