融合社交信息的Top-N推荐算法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:charset
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网和信息技术的快速发展,人们已经进入了一个信息爆炸的时代。用户在享受网络生活的快捷和便利的同时,还伴随着“信息过载”问题。基于协同过滤的推荐算法由于其简单且高效的原理而成为了网络平台解决信息过载问题的有效解决方法之一。然而该类算法在遇到数据稀疏和冷启动问题时却无法得到准确的推荐。为了解决以上问题,相关学者尝试将社交信息引入矩阵分解技术,有效提高了推荐性能。然而一些社交信息同样存在数据稀疏等问题,导致推荐效果并不理想,因此有必要考虑充分挖掘社交信息来更好地改进传统推荐算法的不足。本文通过对现有社交信任以及用户影响力的度量方法进行优化改进,力求充分利用社交信任和用户影响力改善推荐性能。主要研究内容包括以下几个部分:(1)从隐式信任的角度出发,提出了一种基于用户偏好的信任度量模型。该模型在分析了传统用户偏好计算方法的多处不足后,考虑将知识图谱的实体特征作为辅助信息补充原始项目特征,挖掘用户对项目的潜在偏好,最终根据用户偏好的反馈结合初始信任度构建信任矩阵,以缓解用户历史评分数据存在的冷启动问题从而充分挖掘社交信任关系。(2)考虑到社交网络拓扑结构的相关特性,提出了一种改进的结构洞算法MSH(Modified Structural Hole)度量社交网络中用户的影响力。该算法利用信任网络作为社交网络,根据其特性求得邻居用户信息扩散贡献能力,最终结合邻居用户的信息扩散贡献值以及节点间相关重要性度量社交网络中节点的用户影响力。在多种大规模网络中的实验结果显示,MSH在信息传播模型(SI)中取得了更快的传播速度,证明了MSH能够有效识别社交网络中影响力用户。(3)融合社交信息的Top-N推荐算法研究。为了充分利用社交信息以缓解传统协同过滤算法存在的不足,提出了基于社交信任的社会化算法FSTA(Factored similarity models for Social Trust Ameliorated),该算法考虑到用户间信任关系存在差异,分别从信任者和被信任者的角度,将它们融合进矩阵分解技术的研究中;为了充分利用社交信息,接着在FSTA算法的基础上融入影响力用户并提出了基于社交信任和用户影响力的社会化算法FSTI(Factored similarity models with Social Trust and Influence),最终完成Top-N推荐排名过程。为了验证两种算法的有效性,在Movie Lens-1M和Book-crossing两个真实世界数据集上进行了广泛的实验,实验结果证明了FSTA和FSTI相比同类基准算法具有更高的推荐性能,其中FSTI表现的最好。同时冷启动实验表明,即使用户-项目间的交互稀疏,所提出两种算法仍可以保持良好的性能。
其他文献
语文课程标准提出:学生要具有独立阅读的能力,学会运用多种阅读方法。预测作为一种重要的阅读策略,能够促进学生进行积极的深入的思考。在预测策略的教学中,要重视学生的预测
近些年来,随着智能终端和移动通信网络的普及,各类视频社交娱乐软件大幅兴起,伴随而来的是海量繁杂的视频数据。如何智能化处理这些信息数据,利用计算机对大规模视频数据进行智能化的分析和理解就显得尤为重要。在各类视频中,人类动作往往包含了视频数据的主要信息,对行为的识别以及基于行为识别的动作检测也是视频理解中最重要的研究课题,本文的研究重点是视频理解中的时序动作检测任务。本文主要基于深度学习技术,从上下文
在含能领域,粘合剂的发展在朝着高能、安全稳定、力学性能优良、低特征信号和绿色环保的方向前进。为了适应粘合剂的发展要求,制备了一种优良的粘合剂。首先,通过化学改性的方法,合成了一种端炔基聚环氧丙烷-四氢呋喃无规共聚物(PT(P-co-T)),并利用红外光谱法(FT-IR)和核磁共振氢谱(1H NMR)进行了表征,证实了合成的产物为PT(P-co-T)。其次,使用了GAPE(端酯基聚叠氮缩水甘油醚)和
近年来,伴随着人工智能的发展,越来越多基于深度学习的智能产品正在不断走进人们的日常生活,移动端智能软件无疑是人工智能工业化的一个重要发展方向。本文的实物分类系统是一款在移动端离线运行,可以对现实场景中的实物进行分类,并实时反馈出实物对应英文名称的应用软件。本文主要通过对系统的需求分析、系统的设计与实现、系统的测试及分析等工作的描述,介绍了实物分类系统的开发过程。在系统的需求分析过程中,首先根据需求
随着互联网不断发展,将互联网作为手段和工具的网络恐怖主义形式越来越受到恐怖组织重视,其中Twitter等社交网络尤为受到恐怖组织青睐。ISIS等恐怖组织通过Twitter构建线上支
我国经济水平的不断发展在给人民生活水平带来巨大提升的同时,也为旅游业带来了许多新的需求与挑战。随着个人收入的提高,我国每年的旅游人数也在不断的增长,人多、车多造成旅游城市景区人满为患停车困难,成了影响旅游业健康发展的问题。同时,传统包车调度模式无法平衡旅游城市淡旺季客运需求的巨大差异,给旅游运输企业的车辆运营成本造成了巨大的挑战。因此,需要新的调度方法来平衡运力与需求,这不但能够降低旅游运输企业成
煤是我国主要的能源消耗来源,近年来煤利用过程中产生的有毒污染气体和硫/氮氧化物等对大气环境造成的污染问题备受社会各界学者关注,开发一种高效经济的煤炭转化利用技术很有必要,煤化学链气化技术是一项能源利用的新型技术,具有提高能源利用效率、清洁环境的特点,煤中硒元素经气化过程释放到大气环境中带来的污染对清洁空气是一项很大的挑战。本研究通过流化床实验与热力学模拟结合的方法,系统地考察了煤化学链气化过程中硒
隐私政策(privacy policy)是组织或企业声明其收集、使用、共享用户个人信息的一类文本。随着近两年数据安全与个人信息保护不断的被重视,APP隐私合规成为了热议的焦点话题。当前国内监管机构开展的APP隐私政策人工评估工作耗时耗力,因此运用人工智能技术驱动分析隐私政策成为APP合规评估一项亟待研究的新课题。其中,隐私政策的命名实体识别(Named Entity Recognition,NER
视频信息采集与处理系统是指通过摄像头捕捉图像信息,再通过人工或机器来对捕捉到的图像进行解析,并存储的过程,常用在视频监控,视频异常行为分析上。在采集到的视频信息中,行人信息是比较重要的一种。利用行人信息中的面部信息,可以快速确定行人身份,确保特定场合的安全等。而在传统信息采集与处理系统中,绝大部分行人信息依赖于人工筛选提取,不仅费时而且费力。一旦行人面部发生遮挡,人工便难以对信息进行整合,降低整个
随着不同行业与技术的快速发展,网络授时已经成为不仅对于科学研究而且对于工业网络的挑战。对于新兴的关键基础设施,网络授时的需求一直在快速增长,并且越来越多的行业和应用对网络授时的要求也在不断提高;除了同步精度上的要求,在构建授时系统时需要综合考量授时网络搭建的成本,网络设备的复杂程度以及同步算法的实现难易程度等,这毫无疑问对现有的授时网络提出了严峻的挑战。现有的网络授时方案中存在精度受限、网络结构不