高效的实体匹配结果消解算法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:fzy321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实体同一性检测问题,即实体识别问题,是数据质量领域一个比较热门的研究问题.利用运行在两个实体上的实体匹配算法求解实体识别问题是目前研究工作中最主要的一个思路.然而,实体匹配算法的输出结果中可能有"歧义",使得算法的输出很难直接转化为实体识别问题的结果.考虑如何利用额外的知识来消去这种"歧义",形式化定义了实体匹配结果消解问题.该问题被证明是NP-完全问题.一个基于线性规划的近似算法Round被给出,它的近似比是O(log n),针对特殊情况,一个随机近似算法Kwik
其他文献
在近日于圣地亚哥举行的美国细胞生物学协会年会上,科学家们宣布了一个抗击诸如甲型H1N1流感和H5N1型禽流感等流感的新方法.这种方法主要是利用大规模的计算能力来模拟以前从未
在向下一代互联网络演进的过程中,一个重要的趋势是IP网络将成为语音、视频等应用的主要承载.VoIP是一个重要的语音应用.然而,IP网络的丢包造成了VoIP的服务质量不能得到保证,并且
【正】吾家有女初长成,芳龄五周岁,现就读于一所较为有名的公立幼儿园大班。在女儿的心目中,她将自己所认识的老师排了个队,很有意思,我摘录如下:她最喜欢的老师——巨老师(其
从高校图书馆期刊管理面临的新形势出发,分析了期刊文献管理模式的变化特点,提出了优化高校图书馆期刊管理的构想。
分级存储系统通过将数据在不同性能设备间动态迁移以达到高性能.已有分级存储系统未能充分利用负载信息导致数据迁移严重影响应用性能.提出了一种分级存储系统中的数据自动迁移
【正】新一轮的基础教育改革起点高、前瞻性强,它强调从根本上转变课程的功能,建构新的课程理念。新的教学内容,改变传统的学习方式,改革评价模式,建立三级课程管理体系。课
联盟形成是多agent系统中的一个关键问题,找到最优的联盟结构是NP-完全的.Sandholm和Larson等人已经证明,要建立最坏情况下的限界k,搜索联盟结构图的最底两层是必要且是充分的.在
【正】又到了小组合作的环节,课堂上书声琅琅,议论纷纷。我穿梭于各组之间,倾听着同学们的各抒己见。当我走到最后一个小组时,希炜同学偷偷地递给我一块长方体的约10厘米长的