基于领域本体的汉语共指消解及相关技术研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:bbaiing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
共指是自然语言篇章和对话中普遍存在的现象。共指使篇章主题更加突出,表述更加连贯与简洁;但它也给自然语言处理带来了不确定性。共指消解是消除这种指代形式带来的不确定性的过程。随着基于篇章真实文本处理需求的大量涌现,共指消解显示出了前所未有的重要性,成为自然语言处理领域的研究热点。本文旨在围绕汉语共指消解及相关命名实体识别任务,考察领域本体对其提供具体支持的方式与作用,并结合机器学习方法进行验证。本文研究侧重于方法论探索与实证分析相结合的路线,提出了一套基于领域本体结合机器学习模型的方法,主要工作如下:1.提出了一种构建领域本体的TPSU方法,该方法将本体构建分成两个阶段,六个处理层次。在具体生成本体过程中,提出了TMR三模型化准则,有效解决了单一树型上下位结构向多元网状关系结构的过渡问题,通过创建实例,丰富和完善了领域本体的知识结构。上述方法与原则具体直观,可以运用于其他同类本体构建,操作性强。2.构建了一个包含12类核心概念、78种属性特征、13种概念、属性关系、4,392条实例的移动电话领域本体MPO。目前尚无此类本体文库。MPO中大多数核心概念可以直接复用,具有推广和实用价值,有效发挥了本体知识可共享的特性。3.将命名实体分成常规实体和领域实体(DNE)两类。在领域命名实体识别(DNER)中,重点考察了领域本体对汉语命名实体识别的支持方式,提出了一种基于领域本体形式化实例获取词性规则模板的方法,结合统计机器学习模型有效实现了领域命名实体的识别,F值达到92.36%。对比实验也表明上述模板能够有效提高识别准确率且性能稳定,在领域实体边界和特殊形式实体识别中作用明显。4.探讨了领域本体对汉语共指消解的作用,提出了一种基于领域本体获取语义类特征的方法,通过特征的自动标注,获取作为候选先行语的名词短语的语义类特征,结合机器学习方法进行领域命名实体基础上的共指消解处理,F值达到86.49%。实验表明领域语义类特征有效提高了共指消解准确性指标,使F值最终提高了7.36%。5.针对目前汉语零形回指研究主要集中在语言学和心理学角度的现状,立足于本文现有成果,提出了一种包含三个具有实际操作性算法的汉语零形共指消解模型。在定义的共指片断内部,通过将零形代词先行语识别出来,填补到缺省位置,完成零形共指消解。
其他文献
人力资源管理与企业社会责任密不可分,在社会日新月异的背景下,小微企业的人力资源管理面临着一次巨大挑战,对于人力资源管理的扩展和逐渐优化应当放在企业改革的首要位置。
李宗智教授是贵州省名老中医,从事中医眼科临床、科研、教学工作40余年,积累了丰富的经验,其对青光眼的治疗有其独到之处,在治疗中善于辨证,抓住重点,做到标本兼治,本人有幸
空间数据集可视化是当前计算机图形学领域的热门研究课题,它通过分析、抽象和处理表示各种物体和场景的海量数据,实现了在计算机中真实模拟现实世界的目的,因此在医学、地球
李宗智教授为贵州省名老中医,长期从事中医眼科的临床、科研和教学工作,积累了丰富的经验,尤其对于角膜炎一病,善于辨证施治,用药精当,疗效显著,现介绍如下.
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
世界上第一件防弹衣诞生在英国,是纯钢制的,重达10千克,十分沉重,灵活性极差,看上去就像欧洲中世纪武士的铁甲,只能抵挡住低速的流弹和碎弹片.在朝鲜战争中,一些美国士兵开始
公司企业会计核算不良行为的影响范围和危害程度要远远大于其他单位。正因为如此 ,如何提高公司、企业核算和会计处理的质量成为全社会关注的问题。本文从五个方面提出了如何
目的:探讨跟骨高压症针刀钻孔减压的可行性。方法:1.Ⅱ型汉章牌小针刀对人体干燥跟骨、尸体湿性跟骨、新鲜猪髌骨、猪股骨关节端,骨锤敲击钻孔;2.将骨科跟骨侧方钻孔改为跟骨底部梅
光学成像条码定位是一种基于条码识别技术和机器视觉测量的光电自动化测量方法,具有广泛的应用领域。在条码识别技术发展日趋成熟的今天,有关条码定位,特别是测量距离可变的大量