实体匹配相关论文
实体匹配可以判断两个数据集中的记录是否指向同一现实世界实体,对于大数据集成、社交网络分析、网络语义数据管理等任务不可或缺.......
近年来,知识图谱规模迅速扩大,实体数量飞速增长,不同知识图谱之间实体匹配的重要性日益体现。实体匹配的质量依赖于知识图谱中实......
一个端到端的数据融合系统在如下几个阶段需要用户的反馈,包括为实体匹配收集训练数据的阶段,对计算出来的实体聚类进行纠错的阶段......
跨语种的实体匹配被定义为找到不同语种内描述同一实体(对象)的实体连接。跨语种的实体匹配不仅扩展了不同语种的知识共享,更是对现今......
在当今信息时代,依托于互联网的迅猛发展以及Web数据量爆炸式的增长,通过分析数据能够获得更多有价值的信息,进行Web数据分析之前......
随着信息技术的高速发展,各领域数据的量级呈现爆炸式增长,伴随而来的数据质量问题,如数据失真、数据过期、数据缺失、数据表达不......
模式匹配和实体匹配是多源数据融合的俩个核心问题和主要步骤。其中模式匹配旨在统一异源数据集的不同模式;而实体匹配旨在发现异......
实体匹配旨在找出多个数据源中表示同一实体的记录。实体匹配是数据有效使用的前提和关键,广泛应用于数据清洗、数据冗余检测、数......
为了全面查实查清全国土地的使用状况,及时掌握真实准确的土地基础数据信息,建立并完善土地统计、登记制度,实现土地数据资源信息......
空间、属性和时间是地理空间数据三个基本特征,也是GIS数据库的三种基本数据组成。传统的地理信息系统只能静态描述空间实体的空间......
提出一种基于BP神经网络的二步检查法实体匹配新算法,将基于学习的思想引入到异构数据库实体匹配领域中,避开了传统方法计算属性权......
本文探讨了地图合并技术的研究内容、研究范畴、一般流程;讨论了地图合并的概念、方法;论述了地图合并的主要内容;重点综述了地图......
采用移动窗口阅读技术深入探讨实体和初级关系(FOR)匹配的分离与结合对故事类比通达的影响,对表面特征和结构特征在类比通达中的作......
提出了一种结合自适应字符串距离度量的记录相似度学习方法,用于多源Web数据集成中的重复记录检测.该方法首先使用最大熵分类器标注......
如何找出异构数据库间相同的实体,特别是当现实生活中的同一实体在不同的应用环境中用不同的标识符表示时,如何根据已知描述实体的......
实体同一性检测问题,即实体识别问题,是数据质量领域一个比较热门的研究问题.利用运行在两个实体上的实体匹配算法求解实体识别问......
实体匹配也叫记录匹配,是数据集成与数据清洗过程中的一项关键技术.其典型用例包括不同网站之间的商品匹配以及DBLP(Digital Biblio......
提出了一种广义的空间实体对比匹配算法──基于概率及复合指标的矢量数据对比算法。该算法由传统匹配单个指标扩展到多个指标,综......
针对权重边剪枝(WEP)方法在准确率和匹配效率等方面的不足,通过引入自匹配和归并概念,提出一种基于二次归并的Deep Web实体匹配方法......
实体匹配旨在找出不同数据源中指代同一实体的实例.已有的实体匹配方法大都基于实体主属性值的相似度进行匹配,而很少有工作考虑到......
随着中国民航业的蓬勃发展,越来越多的旅客选择乘飞机出行,各大航空公司以及旅行网站每天都在产生海量的民航旅客服务数据。但是这......
传统的实体关系抽取方法主要针对语义信息较为完整的文本,基于抽取模式抽取文本中的实体关系,并采用启发式算法或者概率模型来选择......
基础地理信息数据通常是分幅、分层记录和存储的,分幅采集和处理过程中地理实体可能会在图幅边界产生缝隙。本文结合地图拼接理论,......
地图合并技术是空间数据集成中的核心技术之一。讨论了地图合并技术的概念、功能、主要方法及典型应用,论述了地图合并技术研究的主......
随着"互联网+"行动计划的推进,各行各业的信息化程度越来越高,这些互联网平台都成为感知用户行为的"社会传感器"。综合各个"社会传......
在大数据时代,企业实现数据共享,可以减少数据采集、资料收集等重复劳动和相应费用。但在共享并使用数据的道路上,我们必须面对的一个......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
在物联网、互联网和云计算深度融合的背景下,半结构化、非结构化的Web数据暴增。用户在进行信息检索时,很容易迷航在海量异构的碎......
同一地区不同来源地图数据库同名面实体的识别或匹配对空间数据库的集成与信息共享非常有意义。该文研究了城市地图数据库同名面实......
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清......
针对以往同名实体匹配技术的缺陷,在构建地理本体和封装本体属性的基础上,提出一种通过属性相似度进行同名实体匹配的方法。通过实......
空间目标匹配是空间数据库增量更新的第一步,也是关键一步.研究了基于空间目标匹配的变化信息的获取算法.通过研究空间数据中存在......
近年来,针对多源异构数据的实体匹配问题,已经有诸多学者提出不同的解决方法。然而,这些方法几乎都集中在RDFS或OWL等语义框架下进......
真实环境中,相同的物理实体通常会有多种在逻辑上的描述。当物理实体描述为酒店数据时,这种现象特别明显。本论文基于酒店实体数据匹......
实体是指社会经济运行过程中有经济活动能力个体或组织,在征信系统中它可以指称个人、家庭、企业、企业集团等。实体匹配就是判定......
近年来,随着移动互联网、GPS定位技术的快速发展和VGI(Volunteered Geographic Information,志愿者地理信息)的兴起,使得普通大众......
信息技术的迅猛发展和Internet 技术的广泛应用,给人们的生活、工作和学习带来了极大的方便。但随着人们对信息综合利用需求的进一......
语义万维网通过赋予信息明确的结构和语义,使得机器不仅可以显示这些信息,更能够理解、处理和整合它们。近年来,随着链接开放数据......
结合河南·天地图省市节点数据资源整合实际,对天地图数据融合的技术流程及节点路网非重复要素筛选、道路网结构模式匹配等数据融......
针对众源地理数据中的同名点实体之间存在距离、方向等非一致性偏差,导致匹配困难的问题,该文提出了基于泰森多边形的点实体匹配算......
互联网、物联网和云计算技术的不断融合,使得各行各业信息化程度越来越高,但同时也带来了数据碎片化的问题.数据碎片化的海量性、......
在复杂电网环境下,电能质量监测系统检测到的扰动事件与设备动作之间可能具有关联特性。为分析挖掘扰动事件的关联特性,基于电能质......
在复杂电网环境下,电能质量监测系统检测到的扰动事件与设备动作之间可能具有关联特性。现提出一种基于数据融合技术的电能质量扰......