基于双向搜索的ILP算法构建汉语语义自动切分系统

来源 :安徽大学 | 被引量 : 0次 | 上传用户:languihe71
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言理解主要有两种途径。一种是利用各种语言规则对自然语句进行分析,得到句中各组成成分间的关系结构。另一种是基于数据分析方法,被称为自然语言理解中的“经验主义”,或称实证方法,它主要是利用大规模的语料库,采用概率的方法得到各语言现象共存的概率,在分析新语料时以共存概率的大小来确定语言成分之间的关系。基于规则的理性方法,本质是一种确定性的演绎推理方法。其优点在于根据上下文对确定事件的定性描述,能够充分利用现有的语言学成果。缺点是对一些不确定的事件则无能为力,同时规则的相容性和适应性也存在着限制。基于统计的方法是一种经验主义的方法,其优势在于它的全部知识都是通过对大规模的语料库加工分析而得到的,可以获得很好的一致性和覆盖性。基于统计的方法是一种非确定性的定量分析方法,这种定量分析是基于概率的,因此必然会掩盖小概率事件的发生。本文考察一种新的实证途径,采用结构化的知识表示,应用ILP方法解决自然语言语句切分分析器的获取问题。 自然语言语义结构的分析是自然语言理解的基础,可分为二个层次,其一是研究能充分表达自然语句内各成份间语义关系的表示方法;其二是研究如何将自然语句转换成某种期望的语义表示形式,即在自然语言语句和其对应的语义表示间建立正确的映射,完成这种映射也称为自然语言语句的语义切分分析,这也是本文研究的重点之一,本文给出了一种基于ILP算法的自动语义切分器的构建系统ICASP,并通过一个切分示例来说明ICASP构建的切分器将自然语句映射成论旨角色语义表示的方法途径。论旨角色语义分析的基本思想是:在句中起中心作用的动词,同参与动作的各个成分个体一起构成句子的“语义格”框架,以此描述自然语句中各组成成分间的深层语义关系,表达施事(谁做的)、受事(对谁做的)、工具(用什么工具)等概念所表示的语法语义关系。 “切分”一词常用来表达将句子转换成能够明确描述句子语法关系的一种层次结构,依据某一上下文无关文法,自然语句可能可被切分为由句子成分加入适当的标注组成的层次结构,然而局限在语法结构上的切分只是自然语言语句理解
其他文献
本文旨在诠释高职计算机应用的分层教学法的实施方法,在分层教学法的实施原则基础上,详细阐述了学生基础分层、教学目标分层、教学方法分层和辅导方法分层等方面,最终提升所有高
无论是二维动画还是三维动画前期的流程都是一样的,先创建剧本,再根据剧本制作文字分镜或画面分镜,以及角色设计、场景设计、道具设计。除了最后的后期合成同样都要用到视频编辑软件以外,二维其它部分的制作都需要在二维软件中或是手绘直接完成的,在三维动画制作的过程中,其他的部分都需要在三维软件中完成。
目的分析高龄老年患者经皮内镜下胃造口术(percutaneous endoscople gastrostomy,PEG)/经皮内镜下空肠造口术(percutaneous endoscopic jejunostomy,PEJ)术后并发症的特点、
乡村旅游已成为农村实现产业融合的新型产业形态,为探求其开发和发展的空间结构,以山东省193个乡村旅游景点为研究样本,运用最近邻指数、多距离空间聚类分析和核密度分析等GI
无论任何数的平方数,均具备一个特点,就是个位、十位……都是同数。根据这个特点、无论用何种计算方法,均是较为简便的。现将首数或尾数为6两位数的平方数,比较简单的几种计算方
热交换器传热管材质为2级纯钛,工作时管内通海水,累计使用4个月时部分管子发生泄漏。通过理化试验和综合分析后认为,海水中沉积的泥砂和管内橡胶残片集结成一体,对传热管形成
人被誉为“万物之灵”,是因为人具有高度发达的大脑,以及在大脑支配下的各种复杂行为。借助高分辨率的医学成像手段获取脑的结构信息,并与功能信息相融合实现无创伤地研究脑的行
程序理解可以看作是从源码中提取系统设计概念的过程。程序理解活动贯穿整个软件生命周期,软件维护占用了大量系统成本和花费(35~80%),其中30~90%的维护工作是程序理解,包括程序维护
随着各种空间光调制器和高分辨率CCD器件的迅速改进和广泛应用,光电混合模式识别系统日益受到重视。电子系统的灵活性和可编程性使许多非线性技术能够很容易的被应用于光学模
随着市场经济的日益发展,相对而来的各种挑战也接踵而致。档案的规范化管理是办公室档案工作效率的提升,是对办公室工作的一种肯定。电子信息技术的广泛应用,使得传统的档案管理