基于本体的XML近似查询方法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:joeyifeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着XML文档蕴含信息量的逐渐增加,基于大量异构XML文档的查询系统很难提供给用户最为相关的查询结果,从而导致查询结果的查准率和查全率都不能令人满意,可能会出现极端的情况:将不符合用户查询意图的数据包含到查询结果集合中,导致查询结果过多,有效信息湮没其中;没有检索到应该纳入符合要求的数据,查询结果信息过少;错误理解了用户查询的侧重点,结果与用户预期有较大偏差,导致查询无效。出现“空结果”问题的原因主要分为以下几个方面:查询路径和XML文档内部数据的组织结构的不匹配;查询路径中节点元素的命名和XML文档中节点的命名规则的不同;查询条件过紧,从而导致满足条件的数据过少;由于用户对XML文档领域知识没有共同的理解,导致符合用户查询倾向的信息无法反馈给用户。解决空结果的方法很多,引入领域本体知识是其中之一。为了解决因对语义扩展到因素考虑不足而产生空结果的问题,引入领域本体知识来表示语义,利用本体聚类和本体映射的方法,实现查询的扩展。要实现明确的语义,需要两类语义数据的支持:描述一个专业领域知识,提供共享词汇支持的本体;包含明确语义信息的文档实例,即本体描述的本体实例。从XML文档中抽取隐含语义信息,构建描述XML文档的形式化语义描述的本体,即可以将XML描述的信息从语法层提升到语义层。基于上述需求,本文提出基于本体的XML近似查询。整个方法主要分成三部分:首先,通过对XML的解析,将文档中的元素、属性以及值等分离出来,提取各种概念以及概念之间的关系,映射为本体的概念、属性和关系,构建标准的领域本体中,全面的体现XML文档中的语义信息。其次,针对不同方法所构建多个异构的冲突的本体,通过基于相似度计算的本体映射,进行查询条件的语义扩展;然后对XML查询的结构和条件进行扩展,在条件松弛处理的过程中,首先将条件拆分成多个元素,依重要程度选取用于松弛的元素,到本体中进行基于语义相似度的查询松弛,最后基于相关度来选取松弛后的结果。
其他文献
疵点是影响织物成品质量的重要因素之一,如何高效、快速的判定疵点织物以及如何准确的标记出疵点位置是一项具有实际意义的课题。本文从实际应用角度出发,首先讨论了与织物疵
多核处理器因其高性能、低功耗的显著特点在嵌入式实时系统中的得到越来越广泛的应用。多核处理器虽然能够提供更好的平均性能,但是多核系统中大量存在共享资源,位于不同核心
进入21世纪以来,随着信息技术的迅速发展,我国家庭的信息化水平不断提高。用户对家庭产品的需求日趋明显,例如住房和家人的安全、家人之间的沟通互动、家庭的多样化娱乐等。
在全球化、社会化商品经济的浪潮中,企业为了保持竞争优势,提高自身核心竞争力,这就需要需要新的开发方法来加速信息系统的开发、交付周期,提高系统应对变化的能力。业务规则
随着通信技术和信息应用的发展,电信业务需求正在向固定与移动融合、语音与互联网应用相结合的综合信息服务转变,传统运营商面临与互联网应用提供商的激烈竞争。当前QQ、MSN
基于机器学习的异常入侵检测方法,在网络入侵检测界,正在得到越来越多的重视,这是因为它固有的发现新型入侵的能力。随着新型入侵的不断增加,这种能力已经变得很重要。然而,
随着网络技术的快速发展,人们的生活发生了巨大的变化。未来的网络中,网络的业务呈多样化,网络的构成呈异构化。传统的网络结构已经不能满足这种需求,新型网络体系结构的研究