基于用户行为分析的社区发现技术研究

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:ziyoushenghuozhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在当前网络化,信息化的大背景下,社交网络成为研究人们的社交规律,兴趣爱好,行为特点等方面的重要研究对象。近年来,社区发现问题引起了国内外众多学者的广泛研究,并有了可观的成果。但由于社交网络结构的复杂性,内容的多元化,传统社区发现算法难以综合多项信息准确划分社交网络。针对社交网络的特性,本文研究基于用户行为分析的社区发现,提出了一种针对异质社交网络,融合各类信息的社区发现算法(unified link and content,ULC)。ULC算法能够有效分析社交网络中的用户行为信息,将其转化为用户相似度的度量表示,并结合网络拓扑结构来得到最终的社区发现结果。相比于传统仅仅使用图拓扑或仅使用节点内容信息的社区发现算法,ULC算法能够完整利用社交网络中的信息,有效提高了社区划分的准确度。并且ULC算法中的抽样步骤,减小了算法时间复杂度。在豆瓣电影社交网络数据集上的实验表明,相比其他几种已有算法,F-score值指标上均有所提升;相比其他融合内容和链接的社区发现算法,消耗时间有所减少。本文针对社交网络中的社区发现进行了深入研究,提出了一种综合考虑社交网络拓扑结构和网络中用户行为偏好来进行社区划分的算法,具体主要工作如下:1.多数传统基于图结构的社区发现算法都仅仅关注点与点之间的直接链接关系,但基于图的连通性,没有直接边相连的点之间也可能存在一定的联系。本文在处理图的拓扑结构时,借鉴随机游走的思想,使用邻域随机游走距离来衡量节点之间的紧密度。这种方法可以有效度量结点之间的间接关系,能够更加充分利用网络拓扑中蕴含的信息,所得结果更加科学合理。2.结合社交网络的异质信息特点,本文提出了一种评估用户关系强度的方法:分析基于用户显性关系的拓扑结构,得到用户节点紧密度;社交平台上用户行为带来用户与其他组件的连接,利用LDA主题模型和标签相结合的方式分析非用户组件信息,使用KL距离衡量基于用户行为偏好的用户相似度。二者加权求和来评估用户关系强度,为后续社区发现提供基础。3.根据融合链接和用户行为信息的用户关系强度,经过边抽样之后构成一个新的网络,该网络与原社交网络用户节点相同,但边较少。因此许多传统的社区发现算法可以应用于此框架,使得算法具有很强的灵活性,时间复杂度也较低。本文将使用一种充分考虑图节点之间交互影响的算法来进行社区划分。
其他文献
自1909年卢瑟福第一次估计原子核的大小以来,原子核的尺寸和形变一直是原子核物理的一个重要研究问题。传统原子结构计算中,原子核常常被近似描述为没有几何构型的点电荷模型
基于主题的发布/订阅系统作为一种分布式消息传输中间件,对消息按照其特征进行了分类,实现了消息发送端(发布者)和消息接收端(订阅者)的解耦。而SDN网络具有集中控制的特性,
进气道式喷油器作为电控喷油器重要种类之一,是发动机燃油供给系统的核心部分,其性能的优劣对发动机的产热效率,环保性等有着重要的影响。而电气特性作为喷油器最主要性能,从
目前,水污染和水资源短缺已经成为影响人类生存的重要难题,如何处理水污染成为人们关注的焦点。作为解决水污染的措施之一,水处理技术得到了迅速的发展。水处理已经成为产业用纺织品最广泛的应用领域之一,用于水处理的传统纺织过滤材料过滤效率较低,而很多新型纤维膜材料具有优异的分离效能。但目前应用较多的纤维膜材料如聚砜、聚四氟乙烯等,本身固有的疏水性导致抗污染能力差,极大地限制了应用,表面亲水改性虽然提高了膜的
政府社会资本作为社会资本的核心部分,是宏观层面的社会资本,它强调以道德为基础,以一种互信、互动和互惠的良性关系对个体行为进行约束,政府若能对这一资源进行适当的培育,
品种是烟叶发展的基础,也是评价烟草品质的重要因素,世界先进烟草大国都十分注重新品种的选育。富川烟区是广西重要的产烟区,常年种植烟叶4000 hm~2左右,近年来,随着主栽品种
互联网的快速发展催生了数量庞大的网络新应用,网络用户数量急剧增加,网络规模不断扩大,以TCP/IP为基础的传统自治网络由于其复杂性和难扩展性已无法适应时代的需求,网络架构
多花黄精Polygonatum cyrtonema Hua.为百合科药用植物,以根茎入药。本文以多花黄精种子和种茎为试验材料,自种子采收到出苗和种茎采收下种到芽头出苗,对种子和种茎的形态、营养物质含量及与萌发出苗相关的酶活性和激素含量进行动态监测,以探究多花黄精种子和种茎出苗过程中形态及生理变化。主要研究结果如下:1.多花黄精种子萌发出苗过程可以分为:后熟休眠期、萌发期、小球茎形成期、胚芽形成期、
镉(Cadmium,Cd)是一种危害性极强的有毒重金属元素,能通过土壤-水稻食物链系统进入人体,对人体造成潜在危害。在中国、韩国、日本等以水稻为主食的国家,稻米是人体Cd摄入的最主
载能离子与表面间的相互作用在等离子体物理、材料科学、化学、表面科学等多个领域均具有非常重要的意义。电荷交换作为离子-表面相互作用的一个重要分支,无论是在基础科研方