基于本体方法的改进VSM语义检索模型

来源 :第二十四届中国数据库学术会议 | 被引量 : 0次 | 上传用户:mamao844661
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本研究提出了一个新的检索模型—基于本体的改进VSM的语义信息检索模型OB-VSM。该模型将传统的基于词汇的文档/查询表达方式变成基于本体的文档/查询表示方式,利用本体在表达语义方面的优越性来描述文档/查询的语义,因此可以更准确地反映文档的准确含义,并实现了基于语义的信息检索。
其他文献
在Deep Web(深度网)中,只能通过查询接口获得大量信息,所以一个关键问题就是查询接口的集成.目的是构造一个设计良好的查询接口,以统一访问不同的相关资源。用户在全局查询接口中填写查找需求,所有的相关数据源的查询接口都将被自动填充和搜索.查询接口的集成包括2个方面:查询接口匹配和查询接口融合.在接口匹配过程中,采用聚类技术作为接口匹配技术,并通过引入领域本体的概念映射技术发现Web接口属性间的语
提出应用领域本体知识库自动填充Deep Web入口表单的方法。首先利用通用本体和自然语言处理技术构建领域本体知识库;然后应用DOM和一个启发式规则操作HTML文档提取表单标签,并且对表单标签和领域本体知识库属性进行标准化;最后,使用语义相似度寻找与表单标签相匹配的领域本体知识库属性,用属性的值填入表单控件,完成填充.应用领域本体知识库自动填充Deep Web入口,极大地提高了Web信息检索的精度.
本文提出一种基于Arnold变换的新的关系数据水印算法。该算法针对数值型关系数据进行操作,可以将一副水印图像置乱后嵌人到关系数据中去。通过借用图像置乱技术,结合人的视觉特征,保证了一定数量的连续水印信息提取丢失不会影响到原有水印图像内容的正确识别,有效提高了关系水印的鲁棒性。
本文提出了一种基于加权网格的动态边缘聚类挖掘算法,通过加权值将数据对象的非空间属性映射到数据空间中,根据网格的加权统计信息,将数据空间划分为非稠密非边缘区域、稠密区域和边缘区域,并利用边缘区域的各种特性高效地对聚类结果进行调整和维护,该算法可在需要时以不同的空间粒度离线输出高精度的聚类结果。
本文提出了一种分布式空间信息服务聚合方法,将分布式环境下的对等结点抽象成分布式流程模型中子流程模型的载体,通过子流程模型在其载体结点上灵活、动态、实时的部署和合并等来适应空间信息服务聚合运行时的环境,从而提升了系统性能。
Incremental learning algorithm of SVMs is designed to deal with data streams mining problems. The paper presents dynamic training algorithm of incremental SVMs which is suitable to mine on data stream
本文提出了一种使用小波变换与傅立叶梅林变换相结合的数字水印算法。经过对多幅图像,分别进行几何变换、JPEG压缩、裁剪和滤波等攻击测试。结果表明,本算法对于几何攻击以及其他攻击都具有较好的鲁棒性。
本文基于语义网中本体的思想,提出了一种针对大数据集结点关系确定从而抽取出社会网络的算法Ontology-Scalability,对本体采用树状结构进行存储,利用现有的权威ODP数据集进行本体构建。由于本体过滤运算的高效率使需要在搜索引擎中进行搜索的关键字数目明显减少,结点关系计算速度较大提高,同时也提高了存储效率。
本文对基于移动Agent的蚁群算法在移动数据库中的应用进行了介绍。移动数据库中,处理多个移动客户机之间的协调关系。这里建立起来的模型可以将每个移动Agent看作是分工不同的蚂蚁。移动Agent的移动性,路线轨迹不确定性等都需要掌握,如何使移动客户机找到最优的路径是研究的突破点。模型具有可用性,结合了移动Agent自身的特点,利用了蚁群算法所能提供出的寻找最优路径。
本研究从数据挖掘的角度处理基于网络或主机的审计数据,阐述了应用数据挖掘算法构建入侵特征并生成规则模型的基本思想。基于数据挖掘的异常入侵检测系统已经得到了越来越广泛的关注,是未来IDS发展的一个主要方向。