领域本体半自动化建模研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:lishuangjie2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本体是一种用来描述概念以及概念之间关系的模型。本体技术在计算机的许多领域得到了广泛的应用,如知识工程,数字图书馆,软件复用,信息检索和web上异构信息的处理,语义web等。本体构建的好坏,直接影响这些应用过程。因此,如何方便,快速构建本体是当今研究的热点问题。   从目前本体构建的现状来看,领域本体的构建很大程度上依赖于手工,半自动化与自动化构建领域本体的方法远远没有达到成熟的应用。由于手工方法存在工程复杂,专家依赖性强,本体构建速度慢等缺陷,这极大的限制了本体的发展。随着本体应用面的扩展和辅助资源的增加,出现了一些与人工智能领域相结合的利用辅助资源来半自动化或自动化构建本体的方法,其使用的核心技术就是本体学习--利用知识发现技术从数据源中获取知识,从而实现本体的半自动化或自动化建模。   本体学习技术是当今研究的热点,它的主要目标是从web文档中自动获取领域术语及其相互关系,采用信息抽取技术来确定概念对之间的语义关系,在获取的概念及其相互关系的基础上构建本体。本体学习的任务包括概念的获取、概念间关系(包括分类关系和非分类关系)的获取和公理的获取。   本文将统计自然语言处理和文本挖掘等相关技术应用到领域本体的构建过程中,进行了领域本体的半自动化构建的研究。本文提出的领域本体半自动化建模方法通过从大量中文的领域文献中自动提取领域概念以及领域概念间关系实现。   通过对领域相关语料文本进行分词处理,词语的组合搭配处理提取候选合成词语,接着对候选合成词语进行互信息以及上下文依赖分析判断候选合成词语是否完整的合成词语,最后对合成词语以及领域常用词语进行领域相关度分析获得候选领域概念。得到的候选领域概念需要人工校验挑出领域概念。   利用从领域语料文本中提取的领域概念,设计了提取领域概念间关系的相关算法。考虑领域概念间的关系有分类关系以及非分类关系。分类关系是指概念之间的层次关系,本文从词形与词义两个方面着手设计提取分类关系的方法。从词形上看,具有分类关系的合成词语往往具有相同的后缀,采用广义后缀树方法提取了这部分分类关系;从词义上看,具有分类关系的词语往往可以使用在相似的上下文环境中,采用对词空间向量聚类的方法提取这部分的分类关系。非分类关系种类繁多,本文采用基于关联规则挖掘获取相关概念对的方法获取非分类关系,需要人工编辑相关概念对之间的非分类关系。   本文的研究丰富了本体的理论和应用研究,一定程度上加速了本体的构建,但仍然有许多不足,后续要进行的工作还有很多。
其他文献
无线Mesh网络是一种多跳、高速率、高容量的新型无线网络,它融合了无线局域网和Adhoc网络两种网络特征,是网络“最后一公里”宽带接入的关键技术之一。作为一种分布式网络,多
学位
随着三维模型在众多领域的深入应用,模型的展示特别是基于B/S架构的模型展示成为三维模型应用环节中不可缺少的一环。而三维建模技术的发展使得出现了一大批拥有十万面片和百
随着移动通信技术的迅速发展和移动终端的智能化,基于移动网络和终端的增值业务越来越受到人们的关注。特别随着移动通信的发展,基于位置的服务,一个继通话服务、短信服务后又一
无线传感器网络(Wireless Sensor Network,简称WSN)是由部署在监测区域内数以万计的廉价的微型传感器节点组成,这些传感器节点通过无线通信方式形成了一个多跳的自组织网络,
近年来随着计算机图形学及多媒体技术的飞速发展,具有高度真实感的可视语音动画已成为计算机领域的研究热点,它在聋哑人教学、电子商务、影视特效、人机接口、医学手术等方面
访问控制列表(Access Control List,ACL)是一种网络安全保障技术,提供了网络流量过滤功能。然而,在传统网络中实现ACL技术存在着一些弊端,如网络设备成本较高,对ACL的设计、
通过相机的运动,计算机获得实时的二维图像,从而通过相关算法得到相机的运动参数。分析相机运动参数属于计算机视觉的范畴,三维模型加载则属于计算机图形学。相机运动在计算
随着经济和技术的发展,复杂性研究已经深入到社会的各个领域,包括生物系统、工程系统、社会系统、经济系统。社会系统是一个复杂系统,社会系统中的群体及个体会受到多种因素
目前,随着IPTV业务的广泛开展及IPTV用户群的不断扩大,IPTV运营商与IPTV用户间的交互显得日益重要,运营商需要一种平台来实现IPTV运营商与IPTV用户之间的互动业务。本文首先
随着Web2.0技术的广泛传播,构建安全、高性能、稳定的Web应用系统受到了广大用户的青睐。如何高效地开发满足用户需求的应用系统成为开发人员必须认真探讨的课题。在各大开源