基于数据集成中本体自动构建的研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:nancyloveme
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的飞速发展,信息技术在各行各业的广泛应用,人们迫切需要将大量异构的数据集成为一个整体以进行分析处理。数据集成的目的正是用于解决数据源异构这一问题。 当前,制约数据集成的一个主要问题是数据源的语义异构问题。ontology是共享概念模型的形式化规范说明,对解决数据集成中的语义异构问题具有重要的作用。目前本体的构建都是由领域专家手工编辑而成,其存在工程复杂、过分依赖专家、构建速度慢、术语表达不精确等缺点。如何进行自动或半自动的本体构建,减少对专家的依赖性,加快本体构建速度,成为当前本体研究的热点。 本文首先介绍了数据集成中存在的问题和本体的相关知识,总结了现有的基于本体的数据集成方法。然后,作者分析了现实中本体构建过程中的难点问题。在对本体自动构建的三种方法进行分析比较之后,作者提出了一种基于词典的本体自动构建方案,其包括基于词典的概念发现、基于词典的关系发现和基于词典的术语描述三个过程。针对中南大学信息港数据集成项目背景,作者设计并开发了一个本体半自动构建的系统原型,其以知识挖掘为手段,通过本体引用、本体抽取、本体净化、本体提炼四个步骤,不断循环,螺旋上升,逐步实现领域本体的自动完善。实验结果表明,基于词典的本体自动构建模型对概念发现、关系发现、术语描述方面具有较好的功能效果,自动构建出的本体与经专家修正后构建的本体误差比较小。 论文最后对原型系统实现过程中的研究与开发工作进行了总结,并阐述了将来进一步对该系统进行扩充与完善的一些工作。
其他文献
作为一种典型的攻击方式,缓冲区溢出攻击由于能够获取系统的最高控制权,危害巨大。为此,操作系统不断引入新的安全防护机制,如数据执行保护(DEP)和地址空间分布随机化(ASLR)
网上购书是利用现代化信息网络进行商务活动的一种重要手段之一,用户通过流览器登陆到系统进行在线购书,整个过程方便、快捷,与传统店面书店相比,网上购书的市场规模和经营模式突
随着多核技术的迅猛发展和多核处理器的迅速普及,计算机的并行处理能力日益增强。为了充分利用硬件效能,程序设计者已经把多线程程序设计作为主要编程范型。线程间同步以及线程
图像分类是计算机视觉研究的重要分支,其目的是根据图像包含的视觉信息,将图像划分到其所属的特定语义类别。图像分类研究能够实现对图像内容的自动理解,是实现图像语义内容自动
视频监控作为人类视觉的延伸,广泛应用于安全防范、公共场所的安全监控等。随着高速公路的迅速发展,人们对于高速公路的有效管理提出了更高的要求,为了顺应这一要求,视频监控技术
  IRL是当前嵌入式系统倡导的一种新的设计理念,其核心是通过Internet对远程设备的硬件进行升级、重构、调试和监控。IRL技术的出现,使远程升级和维护硬件成为可能,基于该技术
近年来,随着Web服务技术的广泛应用,互联网上出现了大量的Web服务,这些服务通过Web平台为消费者提供各种功能,构成了大规模面向服务计算的基础。由于服务开发者众多,具有相同
随着数字技术和Internet技术的不断发展,数字多媒体作品的应用已经达到了前所未有的深度和广度。例如视频点播、收费电视节目、以及视频会议等,这些应用对于多媒体数据的安全
在数据集成过程中,元数据为整个系统中的数据提供一张完整的数据地图。通过元数据,我们可以了解到系统中的数据结构、数据来源、数据去向以及系统中的一些业务处理规则等。在
随着有线网络应用局限性的日益明显以及无线网络技术的成熟,无线网络的应用日益广泛,尤其是移动Ad hoc网络,在军事、紧急情况应急处理、临时办公和会议、移动通信、传感器网