基于语料库的名词短语识别方法

来源 :济南大学学报(自然科学版) | 被引量 : 0次 | 上传用户:caiaikai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
名词短语识别是自然语言处理领域的非常重要的子任务。利用最大熵法(ME)、支持向量机法(SVM)和隐马尔可夫模型(HMM)3种有代表性的统计方法对汉语文本进行名词短语识别,并对实验结果进行比较分析。结果表明HMM法在封闭测试中优势明显,SVM法在小样本模式的开放测试中表现良好,而最大熵方法在两种测试中的识别结果均比较理想。分析表明,HMM方法侧重应用在与线性序列相关的现象上;SVM方法适用于有限的汉语带标信息的分类问题;而最大熵方法特别适用于把不受限的文本特征加入统计模型中的情况。
其他文献
学生党支部是高校最基层的党组织,是高校党建工作十分重要的内容,是党联系广大青年学生的重要桥梁,是不断为中国共产党培养新生力量的过程。本文针对目前高校学生党支部建设
<正> 直至十五世纪末期,俄罗斯的家具才开始分门别类。形成自己的结构特点。在以后的年代里,受建筑用具风格的影响,俄
牛的繁殖障碍性疾病是让养殖户们最为头疼的疾病,因为其早期不易被发现,给广养殖户造成了较大的经济损失。本文选择了几种常见病的诊断和治疗进行分析。其中包括:牛布鲁氏杆
报纸
<正>【作家介绍】埃克多·马洛(1830~1907),法国著名的小说家,以写情节剧小说(即以情节取胜的小说)载入法国近代文学史史册的作家之一。马洛出生于法国的一个公证人家庭,身为
在这个竞争激烈的社会,每家企业都面临着机遇、挑战、竞争等不同的压力。想要在这个残酷的现实社会中立足和生存,不仅要做好对过去的经营业务的总结归纳,和做好当下的经营活
<正>金融衍生品在金融市场上既具备分散风险的功能,又有放大风险的可能性。在一定的情况下,金融衍生品的投机风险会出现连锁反应,从而引起金融危机。也就是说,金融衍生品的风
<正>建构主义学习理论认为,学习者在接近真实的语言学习环境中能更好激活自身的学习思维感知,增强认知体验。根据建构主义特征,尝试运用游戏方式优化教学,能有效丰富学习资源
<正>地处四川宜宾江安县夕佳山镇的夕佳山民居,以其丰富的文化底蕴、巧妙的设计以及幽雅清新的自然景观为世人所关注。本文拟以有三百多年历史的黄氏家族住宅为代表,从三个方
<正>移动支付在我国呈现出了区域不平衡的特征:大城市加速发展,中小城镇以及农村地区相对滞后。事实上,后者有着不可忽视的巨大发展潜力。经过近十年的酝酿,我国的移动支付产
黄山梅(Kirengeshom a palm ate Yatabe)的小孢子发生和雄配子体发育过程基本正常。孢原细胞一造孢细胞一小孢子母细胞(经减数分裂)—四分孢子—小孢子—(经有丝分裂)—2-细