基于信任度评估的社交网络用户相似性研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:zhangliao19
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息时代里的社交媒体服务掀起了二十一世纪初期的一场科技革命,层出不穷的社交媒体应用和其巨大的市场潜力引发创业狂潮。这些应用让生活在地球不同角落的人们通过互联网联系在一起,交际成本从几万公尺缩短到分秒之间。让用户可以在茫茫人海中找到志同道合的人,并且能够准确、高效地寻觅到他感兴趣的信息是很必要的。现有的社交网络用户相似度算法通常涉及发布内容、用户信息以及用户间交互关系等多个因素,但大都忽略了用户之间的信任程度对所得相似用户价值的影响。本文对社交网络中用户信任情况提出RI-Rrust模型,从初始信任度以及熟悉性信任度两个维度对用户之间的信任关系进行评估,使用0到1的连续值描述用户之间的信任程度,并引入声誉信任度来处理冷启动问题。在用户相似度的分析中,对文本相似度这一重要指标提出基于关键词相似度的交叉匹配的策略,对文本进行去噪、分词及去除停用词的预处理后,使用TF-IDF将文本映射到向量空间,采用基于同义词词林的语义分析法对分词后的关键词进行交叉计算相似度,该方法能够忽略微博文本中词序、句法和整体语义的影响,可以更高效地分析博文之间的相似程度。使用层次分析法对多个相似度指标进行权重分析并综合评价。最后,提出基于信任度评估的用户相似性算法,通过在相似度计算中引入信任因子,提高了用户相似度的可靠性,筛选掉大量沉默用户及垃圾用户,获得更加有推荐价值的相似用户。我们使用社交网站真实用户数据设计实验,系统性地对比了基于信任度评估的用户相似性计算方法与改进前的算法的准确率、召回率和F1度量值,从实验结果可以看出:引入了信任因子的相似用户算法得出的用户相似度的F1度量值与传统的相似用户算法相比提高了36.8%,说明了基于信任度评估的用户相似性算法的优越性。
其他文献
大庆油田地区是C4、C5资源的富集区,仅轻烃中含有的C4、C5资源约为30多万吨。其中C5在我国的综合利用率目前还不到20%,如何利用这一宝贵的资源,是一项具有重大意义的项目。C4
海水小瓜虫病是养殖大黄鱼(Larimichthys crocea)和数十种海水鱼类较难控制的主要疾病,它是由刺激隐核虫(Cryptography irritans)感染引发,严重威胁鱼类养殖产业的健康发展。
<正> 谈到中成药,人们马上就能想起丸、散、膏、丹等多种剂型,但若要谈茶剂,恐怕能立刻想起的人不是很多了。为了使茶剂得以继承并进一步完善及更好地运用于临床,在此不揣浅
目的掌握双硫仑样反应的机制与双硫仑样反应的症状和救治。方法对我院7年来观察到的16例双硫仑样反应病例进行回顾性分析。结果16例病例中,注射头孢菌素类药物引起者11例,口
为缓解停车难问题,让司机快速、有效、方便的找到停车位,本文开发了基于微信的停车场车位查询管理系统。该系统向用户提供了用户管理、地图显示、车位查询、自动寻路等功能,
选择几种具有杀虫功效的中草药或中草药提取物开展对刺激隐核虫幼虫的防治效果试验,结果表明:苦参、鹤芽草、鸦胆子、荜澄茄、使君子、苦楝皮浓度25~800 mg/L作用4 h内均无杀
1912-1928年,战火频仍的北洋政府时期是一个难得的宪政时刻,诸多宪政因子的生长,为走向宪政奠定了基础:政治上共和政体逐步稳定,政治民主化有了一定的发展,分权制衡的权力格
<正>"遵守或解释"是以公司治理准则推动上市公司实际改进其公司治理情况的核心原则,已在英国上市公司报告中实行了25年,并被其他国家广泛模仿。中国也制定了公司治理准则,但
数据库是信息系统的核心部分,Oracle数据库在数据库领域一直处于领先地位,是世界上运用最广和功能最强大的关系数据库系统之一。Oracle数据库凭借其卓越的性能、强大的功能和
目的:探讨髂骨前缘拉力螺钉结合重建钢板治疗单纯型真骨盆缘完整的髋臼前柱高位骨折方法及临床疗效。方法:自2007年8月~2013年3月采用髋臼前缘拉力螺钉结合重建钢板治疗15例