论文部分内容阅读
随着通信技术的高速发展,手机越来越普及,电信用户数趋于饱和,在发展新客户和挽留老客户以及寻求新的业务增长点方面,各个电信运营商间的竞争日趋激烈。另外,移动互联网飞速发展,许多互联网巨头推出了具有文字和通话功能的移动网络应用产品,例如微信和QQ,这些应用抢占了部分电信运营商的市场,给运营商带了了不小的冲击力。在如此激烈的竞争之下,运营商们必须更加深入的了解客户,改变营销策略,提供个性化的服务。从海量的历史数据中挖掘用户的关系圈,以此来了解用户的行为习惯,已经受到很多大型运营商的关注。社团,即复杂网络中的节点构成的子集,社团内部的节点间连接紧密,而各个社团间的连接相对比较稀疏。社团发现技术就是运用相关的算法挖掘出复杂网络中的社团结构,对社会性质的复杂网络来说,社团就是同类用户组成的关系圈。经典的社团发现算法有层次聚类算法、谱分析法和基于标号传播的方法等,早期的算法大多是非重叠社团发现算法,2005年,Palla提出了第一个重叠社团发现算法CPM,后来又出现了基于局部扩展算法和边聚类社团发现等一系列重叠社团发现算法。现有的社团发现算法大多是基于网络结构信息的算法,忽略了节点间的关系强度信息,不能很好的应用于更符合实际系统的带权网络。本文从这一点切入,将节点的关系强度信息引入到CPM算法中,提出了适用于带权网络的重叠社团发现算法—SR_CPM算法。针对电信用户通话关系网络,本文提出了一种电信用户关系强度的计算方法,该方法综合了用户固有属性、通话记录信息和短信记录三方面的信息。最后,将SR_CPM算法应用于真实电信数据集,结果表明,在模块度Q和平均簇内标准差评测指标下,本文算法在带权网络中的社团划分质量优于传统的CPM算法。