Spark环境下基于频繁边的大规模单图采样算法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:yangmingli1213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络的流行,对其进行频繁子图挖掘的需求越来越强烈.大数据时代的到来,社交网络规模不断扩大,频繁子图挖掘工作变得愈发困难.在实际应用中,往往并不需要精确地挖掘出频繁子图,采样的方法在保证一定准确率的前提下能够显著提高频繁子图挖掘的效率.现有采样算法大多是根据节点的度进行采样,不适用于频繁子图挖掘.提出了一种基于频繁边的采样算法DIMSARI(distributed Monte Carlo sampling algorithm based on random jump and graph induct
其他文献
随着我国人口红利期的结束,劳动力开始短缺,劳动报酬开始飞涨;在早期粗略的开发使用之后,水泥、砂石、钢筋等必须材料也紧张起来;另外随着社会的发展,人们对建筑业的要求也越
高层建筑外墙外保温技术应用不断宽泛,采用在高层建筑结构件外立面上粘贴保温材料的方法,可以有效保护高层建筑物的外墙墙体,实现对高层建筑的保温隔热,减少外界环境对高层建
亨利兜兰野生植株数量十分稀少,已濒临灭绝,其传统繁殖方式繁殖系数低、速度慢,难以满足保护和开发的需求。黔西南州通过对野生植株人工侧芽诱导与分化增殖壮苗后种植到专门
随着具有结点属性信息的网络图数据的增加,结点属性及结点链接关系越来越复杂,这对复杂网络的链接预测任务带来了一系列的挑战.这些不同来源的原始数据之间存在着不一致性,即