先秦汉语词义消歧研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:pxghq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词义消歧一直是自然语言处理中的热点和难点问题,有着重要的理论和实践意义,诸多学者已在现代汉语方面展开了一定研究,而在古代汉语领域,相关研究却很少有人涉足,我们所做的工作就是在古代汉语的词义消歧方面进行一些探索。   本文调研了现代汉语领域的词义消歧研究现状,分析了目前词义消歧所采用的相关技术,考察了古代汉语和现代汉语词义消歧方面的异同,在古代汉语词义特点的基础上,确定出面向古代汉语信息处理的词语义项区分应该遵循的原则和方法。然后在现有的词义消歧理论和技术的基础上,采用机器学习的方法,选择合适的特征,使用广泛应用于信息处理的高效率的CRF分类模型,将统计模型和语言学知识有机结合起来,对“如”、“将”、“我”、“信”、“同”、“之”、“能”等古代汉语高频、典型词进行了单分类器的词义消歧实验,效果达到86.45%。最后基于NaiveBayes、KNN、RFR_SUM、CRF、Maxent模型进行了古代汉语词义消歧实验,根据单分类器消歧性能,运用乘法法则、均值法则、最大值法则、投票法则等集成法则进行了分类器集成消歧实验。实验表明按照乘法法则得到的集成结果F值最高,达87.17%;各个词的具体实验F值分别为86.59%、87.33%、88.07%、65.31%、92.93%、84.02%、94.33%,分别比其Baseline提高了35.75%,13.7%,46.02%,16.33%,2.02%,48.97%,4.26%,效果显著,可见分类器的集成对古代汉语词义消歧效果良好。   此外,本文在基于单分类器词义消歧结果集成基础上,开发了一个人机交互式半自动词义标校平台,提高了人工标注的效率,减轻了词义标注的负担,保证了标注的一致性。
其他文献
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
提出一种有界波电磁脉冲(EMP)模拟器地面场的测量方法.它具有简便、无源、不受输入电压限制、频带宽的特点.特别适用于比较复杂的电磁环境中电场的测试,可实现信号大幅度传输
分析了王家岭新井中央变电所深井软岩大断面硐室支护失效的机理,得出原岩应力、围岩岩性、支护强度和应力叠加是导致其断面收缩率高达40%的主要原因。通过现场试验,对比分析
在艺术上孜孜不已地追求,数十年如一曰,终于炉火纯青,出神入化,奠定了一代陶艺家的地位。这或许就是宋定国最简练的人生写照。作为资深的艺术家,宋定国先后从事湘绣和釉下五
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
本文通过对荣华二采区10
该文以研究物联网的体系结构为基础,从虚拟网络世界与现实物理世界融合角度提出一个基于RFID技术的物联网的概念模型,研究射频识别技术在游乐场的应用,构建一个智能互动游乐
由中国畜产品加工研究会和全国畜牧兽医总站共同主办的2005第三届中国畜产品加工业发展年会,在农业部畜牧业司和农业部农产品加工领导小组办公室的大力支持下,经过几个月的认
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊