中文领域本体构建方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:jerrylearnsVC
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着领域本体的作用受到越来越多的领域的认可,本体技术在知识管理和语义网中扮演着愈加重要的角色,但是领域本体真正被运用到实际应用领域还有几个问题需要克服。其中一个关键问题就是概念、关系识别,尤其在大型复杂的应用领域,概念及关系的识别变得更加耗时耗力,而且由于不同的人对概念的理解不同使得对概念的定义引起一定的争议。为了减少本体构建的耗费,各界提出了领域本体自动、半自动构建,主要是利用机器学习技术、统计方法或是自然语言处理技术从相关的数据源中自动、半自动的进行概念、关系抽取,从而完成领域本体的自动、半自动构建。通过参考相关叙词表和领域文档,提出一种运用相关技术进行概念、概念间关系抽取来完成航空领域本体的半自动构建机制。实现自动化本体构建的关键技术包括概念的抽取、概念间等级关系及非等级关系的抽取方法在文中都有涉及。概念的获取,主要参考相关的叙词表获得核心概念集合。关于概念间等级关系的获取,主要基于现有领域相关叙词表的分类体系作为基础,参考叙词表并利用改进的层次聚类算法提取概念间的等级关系,对原有等级分类体系进行丰富扩充。概念间非等级关系的获取,采用关联规则和模板相结合的方法提取非等级关系,利用支持度、置信度等度量,对经过分词、文档向量提取的文档获取相关概念,利用汉语句法特点和制定好的规则模板,获取概念关系。这样不单减少统计方法缺乏语义逻辑的不足,也降低了概念间语义关系过分依赖语言处理的弊端。最后通过Jena的API对提取的概念关系进行本体结构化等各项操作生成OWL本体,并使用斯坦福大学的Protégé工具进行OWL本体的可视化管理。
其他文献
随着智能互联网时代的到来,人们迫切需要一些技术手段从海量数据中自动快速地找到符合用户感兴趣的数据,个性化推荐技术就此诞生。协同过滤(Collaborative filtering,CF)算法是推荐技术中最成熟的技术之一。在面对日益增长的大规模用户和项目时,由于用户评分的有限性以及新用户和新项目的增加,CF算法还存在着一些问题亟需解决。针对CF算法自身存在的缺陷及现有问题解决方法的不足,本文对其进行
学位
作为数据挖掘领域中一项重要的技术,分类技术在许多方面有着广泛的应用,目前存在着很多的分类技术,如决策树、支持向量机等。为了达到比较好的预测效果,传统的操作中,常常通
双目立体视觉通过模拟人类视觉机理可以获取图像的深度信息最终实现物体的三维重建,是计算机视觉中一个重要的研究方向。面对数码相机拥有率不断提高的今天,普通用户如何利用
现实世界的很多复杂系统可以用网络的形式来表达,比如在社会网络和生物网络中,网络中的点表示系统中的实体,网络中的边来表示实体间的关系。随着研究的不断深入,学者们发现实
随着大数据时代的到来,终端设备的广泛普及使各种各样数据的收集、存储得以实现。同时体量巨大、维度高、数据类型复杂、价值密度低特性已经成为当前大数据的主要特点[1-2]。
本次论文研究以HGML为主要研究对象,开发基于G/S模式的地学浏览器平台,并通过数字旅游项目(以“数字九寨沟”为主)展示地学浏览器平台在处理、展示地理空间信息数据上的特性
语言和图像是人类传递信息的主要媒介。在人类接收的信息中,视觉信息大约占到80%,因此图像是传递信息的最重要媒体。由于目前的图像视频采集系统多是由PC和图像视频采集卡所构
Zachman提出的企业架构理论是表述大型组织(比如政府)信息基础设施的一个直观模型,为组织现在的以及未来的信息基础设施建设提供了蓝图和架构。联邦企业架构(FEA)是美国联邦
本文在对国内相关科研院所以及现代化矿井做了广泛调研的基础上,应用计算机软硬件、信息采集处理、无线数据传输、网络数据通讯、自动控制等技术,提出了基于传感网技术的井下
随着计算机网络技术特别是Internet技术的发展,网络安全日益受到人们的重视。Internet构建在TCP/IP协议上,而TCP/IP协议并未提供任何安全措施,针对Internet存在的安全问题,人