【摘 要】
:
随着关联数据应用的不断深入,已有众多的数据集发布在网上,但目前已发布的关联数据集之间关联很少,为数据的共享使用带来不便。本研究提出一种基于统计学习方法进行关联数据
【基金项目】
:
国家社会科学基金一般项目“基于关联数据的知识创造中知识外化和融合机制研究”(编号:12BTQ039)的研究成果之一~~
论文部分内容阅读
随着关联数据应用的不断深入,已有众多的数据集发布在网上,但目前已发布的关联数据集之间关联很少,为数据的共享使用带来不便。本研究提出一种基于统计学习方法进行关联数据集间实体识别及链接构建的方法。首先进行数据集间的实体匹配,采用基于K中心点聚类算法实现属性的聚合及关系发现,对具有高相关度的属性进行匹配关系描述,降低实体匹配时的属性匹配计算次数;其次对已匹配的属性进行实体属性值的相似度比较计算,实现实体间相似度的比较,在SILK框架下实现实体的链接构建工作,以达到实体链接发现的目的;最后通过实验验证,这一方法能降低数据集间实体匹配计算次数,提高实体链接的正确率,具有可行性及实用性。
其他文献
目的观察介入治疗胰十二指肠切除术后晚期出血的效果。方法回顾性分析50例胰十二指肠切除术后晚期出血患者,其中42例接受血管造影检查,之后28例接受单纯介入治疗、14例经介入
现实与问题近年来,以移动互联网、云计算、基因工程、新能源、大数据及人工智能等为代表的新一代信息技术飞速发展,带动经济社会结构升级换代,引发生产生活方式颠覆性变革。
<正>为确保党委理论中心组学习真正取得实效,国网浙江省电力有限公司苍南县供电公司积极探索党委理论中心组学习新途径、新方法,引入项目化管理理念,建立了立项审核、管理监
以过硫酸钾-亚硫酸氢钠为引发嗣体系,遥过丙烯酸(AA)和丙烯酰胺(AM)进行水溶液共聚,合成了亲水涂料用P(AA—co—AM)树脂。研究了引发剂用量,反应温度,反应时间,单体配比等条件对共聚反应
目的:探讨中药敷脐治疗良性前列腺增生症的临床疗效。方法:选取本院住院的良性前列腺增生患者62例,随机分为治疗组32例与对照组30例,治疗组口服非那雄胺片配合中药敷脐,对照
作为一个多元种族社会,新加坡的国民教育价值观是:国家至上,社会为先,家庭为根,社会为本,关怀扶持,尊重个人,求同存异,协商共识,种族和谐,宗教宽容。那么,如何把这些抽象的理
设计了一个研究型化学实验,用壳聚糖对模拟废水中的微量重金属离子Cu的吸附进行研究,确定最佳吸附条件。在实验教学过程中引入前沿热点重金属离子的治理,不仅可以让学生掌握
最短路径是交通路线导航系统的关键问题,使用Dijkstra算法可以有效解决简单有向网络图中任意两个顶点之间的最短路径问题。应用开源计算机视觉库(OpenCV)开发了模拟城市交通导航