Web社区紧密核的抽取方法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:yukitolee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对采用紧密二分图来抽取社区核的(α,β)密度方法和γ-dense密度方法进行了分析,指出了存在的问题. 提出紧密二分图块的概念和采用2步骤构造二分图的方法,减少不必要节点和边的扩展. 提出最大紧密二分图块的概念和抽取算法. 新算法在4个Web爬虫爬取的数据集下进行了测试并抽取了大量的社区核,人工验证这些社区核,80%均为有效的社区. 同时针对Dourisboure等人的方法进行了不同规模数据集的测试,证明了里面包含大量的割点. 实验结果的分析表明,新算法是可行的和有效的.
其他文献
目的探讨高血糖患者皮质醇的分泌情况。方法对222例高血糖患者行75g OGTT,并计算ISI、稳态模型评估胰岛素抵抗指数(HOMA-IR)、葡萄糖及胰岛素曲线下面积(AUCG,AUCI),同时检测
随着世界政治格局的演变和经济重心的转移,澳大利亚的对外经济策略发生了重大改变,因此,必须制订出新的经济发展战略.澳大利亚推行亚太经济策略,是由其国内、国际经济特点所
我国建筑节能市场发展迟滞源自有效制度供给不足。制度供给层次失衡、权力中心的偏好和有限理性、路径依赖及其累计效应、技术进步、成本约束等多种因素制约着有效制度的供给
在传统土地集约利用内涵的基础上,从农用地集约利用的相对性、动态性和可持续性3方面,对农用地集约利用内涵的界定问题进行了探讨.
销售瓶颈限制了直销员业绩的提高。文章认为,运用六西格玛改进法可以帮助直销员突破销售瓶颈。并进一步阐述了六西格玛改进法的具体构想,即提出了五大步骤:定义、测量、分析
调度大屏输电网潮流图布线阶段除了考虑线路的走线外,还要考虑线路名称、断路器、实时潮流量以及显示各类设备状态挂牌等局部布置,从而突出其可读性.文中介绍了顺序走线、优
通过梳理国外相关文献,总结归纳工作场所暴力评估工具以及几种相关理论模型。通过对工作场所暴力理论进行评述旨在对医院暴力理论研究提供一些启示。
采用水雾化Fe_(74)Cr_2Mo_2Sn_2P_(10)C_2Si_4B_4非晶磁粉制备出了高频特性较好的磁粉芯.研究了样品的形貌、相组成和磁性能.研究结果表明,非晶磁粉芯压制后的去应力退火处理
导线脱冰会引起导线的剧烈运动,使导线跳跃上下摆动,将导致导地线间或导线档中空气间隙的减小,严重时引起闪络;特高压线路由于导线分裂根数较多,截面较大,其脱冰跳跃问题更为
采用溶胶-凝胶法制备了β″-Al2O3前驱体粉体,将该前驱体在850℃焙烧1h的产物作为水基流延浆料的陶瓷粉体,以去离子水为溶剂,加入适量的S464表面活性剂、WB4101粘结剂和PL005