基于关键词的RDF数据图查询模型研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:ahzhangxz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RDF数据查询作为从海量RDF数据中发现有用知识的技术,在数据管理领域占有重要地位。然而,现有的数据查询研究仍存在一些缺陷:传统方法主要集中在基于关键字的查询,而忽视了关键字本身的语义信息及数据之间的结构信息,因此结果冗余与偏离等问题普遍存在;在海量数据的应用背景下,如何有效的排序输出查询结果这一问题同样亟待解决。因此为解决现有RDF数据查询方法在实际应用中存在的问题,本文着重在以下几个方面进行研究和探讨:第一,针对现存的基于关键词查询的RDF数据检索系统存在的不足,提出了一种基于RDF数据图的关键词检索模型,该模型首先对RDF数据进行预处理,作为结果排序阶段的排序依据;然后经过图查询阶段,生成结果子图;最后在结果排序阶段,进行综合评分并以Top-K方式降序输出。第二,在图查询算法的研究中,将基于迭代的网络社团探测算法引入到图查询算法中,提出一种基于迭代的RDF数据图查询算法ISGR,该算法与传统的图查询算法相比,算法的执行效率有了较大提升。第三,为解决RDF数据图的查询结果冗余与偏离等问题,提出一种新的结果子图相似度计算方法SimLM,同时考虑到数据本身的语义信息及结构信息,根据关键词图与结果子图之间的结构信息,利用统计语言模型,能够输出较为理想的结果序列。最后,通过实验对所提出的SimLM图相似度计算方法的有效性进行了验证。通过对比实验结果表明,提出的查询模型及排序方法在一致性和相关性方面的性能优于传统模型。
其他文献
随着计算机技术、网络技术和电子商务技术的广泛应用,工作流技术得到了飞速的发展。同时,由于企业业务过程重组的不断深入,对流程适应业务需求的动态变化也提出了更高的要求
CT断层图像三维重建是指通过医学诊断仪获取连续的二维切面图像,然后将这些二维图像之间的位置和灰度信息输入计算机,在计算机上进行相应的组合和处理,最后在显示器上再现人
在互联网及其普及的今天,内容的分发和共享已经成为人们获取信息越来越主要的方式。同时网络上拷贝的盗版也日益猖獗,损害了作者和内容出版商的利益,挫伤了积极性。应运而生的DR
传感器技术和移动互联网的发展使得基于位置的信息服务成为可能,基于位置的信息服务已经成为人们日常生活中不可缺少的一部分,然而它们也带来了一些潜在的威胁。匿名化则可以
电子邮件作为一种高效、经济的现代通信技术手段,已成为互联网最大的应用之一,然而,日益泛滥的垃圾邮件严重影响了个人和组织的工作效率。传统的黑名单、关键词、邮件路由等
本文主要研究了一个支持多平台的C语言编译器,它可以在Windows主机上运行,可编译和反编译运行在Intel 80486实模式、无操作系统目标机下的可执行程序,优化性能卓越,编译目标
随着计算机科学技术的快速发展,软件的应用领域逐步扩大,开发规模与开发成本逐渐增加,软件质量问题已经日益成为人们关注的焦点。虽然由美困卡内基梅隆大学软件工程研究所提
随着生命科学研究的不断深入,生物信息学所涉及的研究范畴也在不断地扩展。微阵列(microarray)技术作为生物信息学中极具发展前景的技术之一,得到了学者们的关注和普及,该技术
随着分子生物学和全基因组测序技术的快速发展,产生了大量的基因数据,这使得对基因家族分子进化的研究成为可能。重建基因家族进化史对解决许多基本生物学问题起着非常关键的
概念格是形式概念分析所用到的核心数据结构,已经越来越广泛地被应用到人工智能或者是数据分析等诸多领域之中。而一般的形式概念分析是基于精确的形式背景,但是在现实世界中