多异构社交网络用户关联研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:jicck321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多异构社交网络用户匹配就是根据不同社会网络及其网络用户发布的信息,将用户关联起来,发现同一用户,在兴趣推荐、社区发现、特殊人员监控领域有着重要价值,并可以使社交网络的研究更进一步。本文面向中国社交网络的两个典型代表-新浪微博和百度贴吧,开展社交网络用户的关联研究。具体的研究内容包括如下三个方面:(1)根据微博以及贴吧的特点,构建多异构社交网络关联研究所需的属性模型,包括基于用户背景属性、基于用户用户名属性、基于用户兴趣属性以及基于用户网络结构属性。通过发现可以用来计算相似度的属性,更好的计算不同社交网络中用户的相似性。(2)其次,针对不同的用户属性,本文构建基于属性特征的属性关联方法。基于背景属性的方法中,本文选择性别、年龄、所在地、教育背景四个属性来计算相似性。基于用户名属性的方法中,本文选择用户名长度特征、用户名特殊字符特征、用户名数字特征、用户名字符组合模式特征、用户名更改模式特征、用户名特殊性特征、用户名拼音特征七个特征来计算相似性。基于用户兴趣属性的方法中,本文提出了APW(All position weighted similarity)方法来计算用户发表内容兴趣相似度,相比于传统的文本相似计算方法,可以有效的计算用户兴趣相似度。基于用户网络结构的方法中,本文使用LDA(Latent Dirichlet Allocation)算法计算用户关注粉丝及贴吧的兴趣相似性,可以有效的对兴趣进行分类,通过计算用户所属兴趣分类的相似性来计算用户网络结构相似性。(3)最后,综合运用用户的多种属性,为了计算出更准确的关联结果,本文使用了层次分析法以及主成分分析法两种综合属性相似度权重计算方法。通过实验比较发现更好的更准确的权重分配。本文针对多异构社交网络用户关联研究,设计了一种基于多属性的用户相似性计算模型,实现了对两个社交网络上的用户进行关联分析的功能,通过用户关联准确率实验,针对采集的新浪微博与百度贴吧用户数据所构建的数据集,改善并提高了多异构社交网络用户关联准确率。
其他文献
本文作者通过研究OTA与航空企业纵向一体化的案例,发现OTA企业实施纵向一体化可以绕开市场中的种种壁垒,规避市场风险。同时,实施纵向一体化策略会使OTA企业获益良多,能够帮
从《孤岛》到《平原》,作家毕飞宇的文革书写一直不曾放弃。作为文革的亲历者与“伤痕”、“反思”文学的阅读者,毕飞宇一直坚持用“朴素的现实主义”的写作方式重写日常化的
文章在指出通常意义上的“安全”概念和学术界流行的“安全”概念所存在的缺陷的基础上,借鉴一些其他“安全”定义的合理成分,探索性地把“安全”概念修正为权利的取得和实现
目的探讨3种常见内镜对大肠癌异常隐窝灶的诊断结果.方法采用前瞻性研究方法筛选肠镜检查患者共600例,随机分组后分别采用常规内镜、染色内镜、窄带内镜进行肠镜检查,并进行
台湾地区为化解家事审判案件持续增长的压力,历经十余年激烈论争,于2012年颁行"家事事件法"。该法案的主要内容是综合运用诉讼和非讼法理,创新家事争议解决程序。其主要特点
在幼儿实践教育过程中,一直坚持开展幼儿科学教学活动,新时代的幼儿年龄增长与智力增长速度较快,这些孩子们渴望去探索更多新奇的事物。针对如何开展幼儿科学活动展开分析,让幼儿
产业园作为亦庄开发区内一种特殊的(类)工业用地使用方式,其空间生产过程与城市规划管理现状存在多重矛盾。应对产业园转型发展中的空间再生产需求,有必要研究城市规划管理在
人教版高中地理教材目前已经在全国范围内推广应用,其内容包括必修三个部分、选修七个部分,整体内容相比原教材没有太大变化,但是对于部分内容的学习要求做出了一些调整。必
随着社会的发展,互联网金融在我国迅速发展,改变了金融业的格局。互联网金融的发展,不断地改变着人们的生活,也改变了传统的金融行业。本文作者通过对传统银行和互联网金融的
飞机APU外部件指的是辅助动力装置,英文名称为Asist Power Unit,主要由离心涡轮发动机及发电机装置构成。飞机APU部件起到独立提供电源及压缩空气的作用,即便飞机发动机遭遇