论文部分内容阅读
随着语义Web的发展,在线的语义数据越来越丰富。面对庞大的由语义对象和它们之间的语义关联构成的数据之网,帮助用户挖掘到数据之网中的语义关联模式进而能够快速有效地构建用户的语义数据是当前语义Web研究领域的热点。本文的主要工作是研究和实现一个语义关联模式挖掘系统。
语义关联通常被定义为语义对象在RDF图中的关联。本文中,语义关联表示为概念框架和实例信息的综合。概念框架指的是语义数据中多个语义对象背后共有的术语与术语之间的关联,在本文中称为语义关联模式;实例信息指的是语义对象信息和语义对象之间的关联。可见,语义关联包含语义关联模式,语义关联模式从属于语义关联的概念框架。
本文引入概念框架和实例信息相结合的语义关联表示,通过语义对象之间的关联找到语义关联模式,并在挖掘语义关联模式过程中,采用频繁子图的挖掘方法发现用户所需要的语义关联模式。另外,针对海量语义数据集,通过RDF文档聚类、采用多线程、设定约束条件等方法进行语义关联模式挖掘。同时,实现一个语义关联模式查询接口,用户通过关键词查询需要的语义关联模式。实验表明,本文所采用的基于改进的gSpan算法的语义关联模式挖掘方法对海量语义数据中语义关联模式挖掘具有一定的可行性。
本文工作为语义数据中的语义关联发现研究提供了一个新的思路和方法,对语义数据处理研究具有一定的参考价值。