本体在XML关联规则挖掘中的应用研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:yxzxyzxz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们拥有和积累的数据越来越多。数据挖掘在最近几年里已被数据库界广泛研究和应用,而关联规则的挖掘在其中占有很重要的地位,其在商务决策的制定方面的应用很有前景,而由于XML文档结构上的特殊性,对X2ML文档的关联规则挖掘的研究还存在很多问题,而且想要产生多层次的挖掘结果也很难。因此,本文提出一种将领域本体引入到XML文档挖掘过程中的算法——基于本体的XML关联规则挖掘算法。首先,本文介绍了数据挖掘、XML和本体论的基本知识及相关技术。其次,分析了XML在数据挖掘中的应用,介绍了面向XML文档的数据挖掘技术,提出了将领域本体知识引入到数据挖掘中以得到更多层次的数据挖掘结果,给出了基于本体的XML关联规则挖掘算法。该算法的优点在于:引入领域本体知识,使关联规则的挖掘可以在更多层次上进行;将XML文档解析后存入哈希表,可以提高扫描XML文档的速度;根据用户的要求将领域本体解析后存入哈希表,不需要在每次查找领域知识时都到读取硬盘。最后,对算法进行了理论上的分析,并且通过对给定数据的实验,验证了算法的挖掘效果,论述了该算法的优点和不足。
其他文献
本文以手持终端为研究背景,采用基于GPRS网络和实时操作系统μC/OS-II的嵌入式解决方案,论述了基于GPRS网络和实时操作系统的嵌入式手持终端的设计、实现及功能扩展。文章详
随着门户网站的快速发展,越来越多的业务系统集成到统一门户下。安全性成为门户网站开发中的重要组成部分。门户网站安全性主要有成员服务、身份认证、授权和单点登录等几个方
本文将介绍一种在Linux虚拟实验系统中的基于Applet方式的SSH仿真终端的研究和设计。文章首先分析了终端及仿真终端的演进过程,指出早期的TELNET仿真终端的功能和缺陷。接下来
在企业信息系统软件的开发中,为了提高开发效率、增强软件的可复用性和可移植性等性能,越来越多的软件开发都采用模型驱动架构(Model Driven Architecture, MDA)方法学。但是
Peer-to-Peer(P2P)系统的开放结构使其具有如下特性:适应性、自组织性及可扩展性,并能通过大量副本实现高可用性。因此,基于P2P环境的电子商务系统发展十分迅速。但是,P2P电子商
近年来,随着网络技术的迅速发展和J2EE平台的广泛应用,基于B/S的多层Web体系结构逐渐发展成熟起来。与此同时,这也促进了e-Learning平台的研究与发展。 本文在分析e-Learning
网格是继万维网之后出现的一种新型网络计算平台,是为用户提供全面共享各种资源的基础设施。由于网格中的资源具有分布、动态、异构、大规模、多组织等特征,因此网格资源的组织
信息战已成为未来高技术局部战争的主要作战样式,制信息权和制空权、制海权一样,成为战争胜负的关键。导航战是信息战的重要组成部分,现代战争精确快速的定位和导航是提高军事武
随着Internet技术的发展,加强实验环境的建设,利用模拟(Simulation)技术辅助解决网络的鲁棒性、可维护性和传输可靠性等问题是当前研究的一个热点。网络模拟是进行计算机网络
随着互连网的迅猛发展,越来越丰富的信息展现在人们面前,但是面对海量的互联网资源,人们感兴趣的往往只是某一领域的专门信息。如何从纷繁芜杂的网络信息中快速准确地找到人