社会网络中的链接分析与预测研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:lan2009908
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0的发展,Twitter、FaceBook等基于社区的社会网络服务得到了广泛的普及,网络用户的数量也取得了快速的增长。与此同时,网络的链接关系也渐趋复杂化,链接挖掘成为了一个研究热点。尤其是链接挖掘的一个重要分支——链接预测的重要性也日益凸显。在网络社区中用户拓展社交圈、寻找兴趣话题等多种活动都需要链接预测技术的支持。但现有的社会网络链接预测方法存在着很多问题,例如对节点属性信息和网络拓扑信息难以综合考虑,预测结果的准确度也亟待提高。针对这一问题,本文提出了基于用户属性特征和基于网络拓扑特征的两种社会网络链接预测方法,并通过监督学习框架,把这两种方法组成联合预测模型,力图达到综合考虑社会网络的多重信息,进而提高链接预测准确度的目的。本文的具体工作主要包括以下几方面:首先,本文对现有的社会网络链接预测方法进行了分析,总结了各方法的优缺点,找出了现存链接预测模型的局限性。其次,针对现有算法缺乏对用户属性信息语义关系的挖掘的问题,提出了基于用户属性特征的社会网络链接预测方法。该方法引入了LDA模型来对用户兴趣信息进行建模,提取用户兴趣特征,并将该特征输入分类器,通过训练分类器,得到链接预测结果。然后,分析了网络拓扑信息对链接预测准确度的贡献,提出了基于网络拓扑特征的社会网络链接预测方法。该方法首次引入了物理网络中的PropFlow算法来提取社会网络拓扑信息特征,并将该特征输入分类器,通过训练分类器,得到链接预测的准确度。另外,还在上述两种社会网络链接预测方法基础上提出了一种综合的社会网络联合预测方法。该方法通过构造分类器,利用监督学习框架,将上述两种方法提取的用户兴趣主题特征和网络拓扑结构特征同时输入分类器,构造联合预测模型。将链接预测问题转化为分类问题,通过训练分类器,进而得到链接预测的准确度。最后,设计和实现了实验,验证了上述提出方法的正确性和可行性。实验中采用了由北京理工大学网络搜索挖掘与安全实验室发布的NLPIR微博语料库作为实验数据。将本文所提出的方法与CN方法、AA系数法等其它计算方法进行了实验对比分析和讨论,并且使用了AUC值作为算法的评估标准。实验结果证明了本文所提出的模型能够有效的提升链接预测的准确率,具有可行性。
其他文献
近年来,我国城市轨道交通事业尤其是地铁运输系统迅猛发展,为市民的出行带来了许多便利,但同时也使电能消耗迅速增加。现代经济的迅速发展必须依靠能源,而我国又是一个能源相对比
Web组合服务是将组件服务通过服务组合而成的,对于组合服务而言,每个组件服务是透明的,加之网络环境的复杂性和动态性,Web组合服务的执行效率成为一大难题。由于目前大多数的Web
伴随着互联网的高速发展,网络信息呈指数级增长。在如此海量的信息当中需要搜索引擎定位所需的信息。虽然通用搜索引擎在一定程度上能解决资源定位问题,但是其效果并不理想,
三维模型的应用涉及到各行各业,各个领域对三维模型的需求也与日俱增,因此,三维模型的数量一直在飞速地增长。创建逼真度较高的三维模型需要花费大量的时间和精力,如何从已有
由于当代信息技术的高速发展,现代的人类难以离开互联网带来的便利生活。新浪微博、微信公众号、博客等等手机App的发达使得人类也在不断地制造各种各样的网络信息,与此同时,
随着传感器网络的广泛应用,如何获得传感器网络的性能参数成为研究的重点。网络拓扑是传感器网络的重要参数之一,也是测量其它一些性能参数的基础。网络层析成像技术由于其无须
WSN是一个分布式的网络,由大量微型化的传感器节点组成,其节点不仅具有无线通信能力,而且还具备计算能力。由于传感器节点具有微小性、广泛分布性等特点,它在节点能量、通信能力
面向服务架构因其很好的适应分布式环境和跨平台等特点,已经被广泛应用于基础软件和大型信息系统的研发。但是由于SOA应用下资源共享程度的不断提升,保障资源安全变的越来越重
近年来随着我国物流行业的迅速发展,人们对物流运送的时效性以及运输车辆的实时跟踪要求越来越高。本文针对这一问题,设计开发了一个物流路径规划与跟踪系统,可以为物流企业车辆
随着信息的爆炸式增长,推荐系统的出现提供了一种有效解决信息过载问题的手段,它能够帮助用户从互联网产生的海量信息中提取有用的信息内容。首先,它通过分析用户在互联网中