用户属性信息推断方法的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:panmandy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,随着互联网、移动互联网的发展,以微博、微信等社交平台为代表的社交媒体也迅速发展起来。社交媒体促进了用户之间的沟通和交流,方便了用户信息的获取,正在成为人们日常生活中不可或缺的一部分。用户在社交媒体上的行为产生了大量的社会网络数据,其中就包括用户的属性信息数据。然而,由于用户不愿意暴露隐私信息等原因,用户的属性信息存在着缺失、不完整的现象,这给人们对于在线社会网络的研究带来了困难。因此一些研究者开始研究社会网络中的用户属性信息推断问题,来增补和还原用户属性信息中缺失和不完整的部分。然而目前的属性推断方法主要是根据无权网络来解决属性推断问题,没有考虑到用户节点之间关系的强弱,在属性推断问题上,关系强的邻居节点应当比关系弱的邻居节点起到更大的作用。本课题在微博用户构成的社会网络中进行了属性推断的研究。首先,本文介绍了几种传统的属性推断算法,并考察了传统属性推断方法在实验数据集上的属性推断效果。然后,本文采用两种方法来判别社会网络中的强关系和弱关系,一种是设定相似性阈值的方法,另一种是基于社区发现的方法。在判别了强弱关系的社会网络中,使用强关系邻居加权投票的方法来完成属性信息的推断任务,其中强关系邻居指的是与未知节点具有强关系的邻居节点并且该邻居节点属性已知。另外,本课题通过Node2vec算法在网络数据上训练每个节点的向量表示,将属性推断问题看作节点分类问题,将节点表示向量作为节点的特征训练分类器,通过分类的方法来解决属性推断问题。进一步地,本课题在节点特征中增加强关系邻居属性信息这一特征,重新训练分类器并对节点进行分类。实验发现,基于强关系的加权投票和强关系邻居属性信息特征的增加对于属性信息的推断均产生了积极的影响,验证了强关系邻居应当在未知节点的属性推断问题上起到更大作用这一命题的合理性。
其他文献
一一般意义上来讲,新生代小说家泛指20世纪60年代以后出生,在90年代激情理想主义消退之时走上文坛的一批作家,如邱华栋、韩东、朱文、鲁羊、刁斗、李冯等。他们的成长环境是
《明朝那些事儿》这部文学作品,最早从网络发布和传播,曾一时成为点击量最高的网络文学作品,后又应读者要求印刷出版,兴起了一阵明史热潮。作者当年明月原是一名草根作家,也
目的:观察活血药配西药治疗偏头痛的疗效.方法:采用血塞通片主要成份三七合用尼莫地平片治疗偏头痛38例.结果:总有效率92.1%.提示中西医结合治疗本病疗效满意.
<正>山东,地处"丝绸之路经济带"和"21世纪海上丝绸之路"交汇区域。近年来,山东实施更加积极主动的开放举措,发挥山东由南向北扩大开放、由东向西梯度发展战略节点作用,在构建
织物的阻燃性已越来越成为人们选择纺织品的重要指标.本文介绍了纤维制品的燃烧过程及其阻燃性的衡量标准、各种阻燃加工的方法以及典型的阻燃织物品种.
检测实验室如何对新实施的标准检测方法、非标准方法、实验室设计(制定)的方法、扩充和修改过的标准方法在使用前或变更后进行的确认;通过验证确认提供客观证据,以证实该方法适合
再生制动是电动车辆最常见的制动方式。然而,在没有大容量蓄电池吸收能量的情况下,再生制动将产生很高的泵升电压,给系统工作带来不利。文中通过对再生制动过程的分析,提出了通过
此次央行上调存款准备金率是针对新年刚开始银行体系信贷大量投放的。也是中央银行明确提示市场的一个信号:市场流动性不可以像2009年一季度那样“过度”。此次央行上调存款准
我国科学技术的发展使得各行各业的生产活动越来越便捷,在技术的革新下,PLC和单片机之间的串行通信技术也得到了进一步的发展,并且应用越来越广泛,本文结合大量的理论研究背
<正>"Do re mi fa so la si……"初见毛轶葳这个孩子,发现她身材瘦削,面色白皙的脸上还有点婴儿肥,樱桃小嘴在圆圆的脸上瘦陷下去,形成了阴影;她的头发棕黄,颜色像秋后霜草丛