基于聚类汇总的记录匹配算法

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:yellue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
记录匹配算法在异构数据的集成和数据开采等领域应用广泛,其主要任务是找出来自不同数据源中代表同一对象实体的记录,这些记录具备相似的属性和属性值.为避免组合爆炸问题,现有的记录匹配算法不再对数据库中的记录数两两匹配,而是结合排序策略和静态聚类匹配方法实现,但这种静态方法不适应数据的动态变化.因此,本文提出基于聚类汇总的记录匹配算法,该算法可以解决静态方法导致的匹配记录丢失问题,同时能够减少计算量,提高匹配记录搜索效率.
其他文献
VIA定义了一种低延迟、高带宽的数据传输模型,成为集群系统通讯技术的工业标准.本文介绍VIA的产生背景和结构特征,详细阐述了清华大学在Myrinet L ANai 9硬件上实现的VIA原型
本文首先对IPSec协议体系进行了复杂性和安全性分析,在此基础上讨论了若干改进措施,这些改进不仅简化了某些繁琐概念,也更有效地增强了该协议的安全性能.
图象内容的检索需要确定图象之间的相似性。本文给出了一个基于颜色直方图相似性的匹配模型,然后描述了基于颜色直方图匹配方法的实现,讨论了这个方法在图象相似性上的度量性能。
本文运用统一建模语言,对移动计费数据采集子系统的逻辑结构和物理实现进行了介绍.首先,利用类图和顺序视图对系统中对象的静态结构和动态行为进行了详细分析,然后运用物理视
[摘 要]空间中两直线的位置关系——垂直和平行,是学生的学习难点。对比分析了“垂直与平行”的各种教学方式,得出空间观念的形成是要建立在灵活的空间想象能力上的,而空间想象能力的培养需要借助空间到平面投影的实验操作,进而给出行之有效的教学方法。  [关键词]垂直与平行;分析;改进; 尝试  [中图分类号] G623.5 [文献标识码] A [文章编号] 1007-9068(2019)08-0021