结合社交网络分析和协同过滤技术的推荐算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:zhaoyu_hit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近些年来互联网的飞速发展,互联网上的信息越来越多,已经远超过个人能够接受、处理或利用的有效范围,这也就是经常被提到的互联网信息过载问题。推荐系统一直是解决信息过载的重要技术,许多关于推荐系统的算法也不断的被提出,其中很多算法已经在互联网个性化服务、电子商务、计算广告等方面取得了不错的效果。虽然各种各样的算法被提出,但推荐系统依然面临着一些难题,像难以处理大规模数据的问题、预测准确性不高的问题、数据稀疏的问题以及冷启动的问题等等。在另一方面,随着过去几年中互联网社交网络的出现,越来越多的用户社交网络信息可以利用。在有的互联网社交网络上,利用用户的社交网络信息,一些推荐策略获得了显著的效果,然而,这些信息在当前的推荐系统上并未利用好。本文首先介绍了推荐系统的研究现状,分析和总结了当前已有的一些协同过滤推荐算法的优点和不足。同时,本文还介绍了社交网络分析中节点相似度计算的一些方法,分析和总结了它们的原理和应用场景。在相关成果的基础之上,针对当前协同过滤技术在互联网社交网络上面临的问题,深入研究了将社交网络分析和协同过滤技术结合起来的方法,并给出了一些有效的解决方案。本文的工作内容包括如下三个方面:(1)针对用户在社交网络上的社交关系信息,本文中先进行社交网络的建模,然后提出一种利用机器学习的方式进行社交网络上节点相似度计算的方法。该方法利用节点自身的信息、传统的节点相似度计算方法计算出的结果、一些的辅助信息等作为机器学习的训练特征,以节点对之间是否存在边作为标注信息,然后利用Logistic回归模型作为训练模型计算节点的相似度。在计算出节点相似度后,本文还提出一种根据节点相似度信息和用户评分信息预测用户评分的算法,本文中统一称这种算法预测出的用户评分为用户信任评分。(2)针对传统的协同过滤推荐算法在大规模用户的推荐系统中面临的如时间空间开销过大、无法给新用户进行推荐等问题,本文提出了一种改进的协同过滤推荐算法,该算法先构建“用户特征-项目”的评分矩阵,然后利用潜语义模型求解矩阵,最后根据求解后的矩阵和用户的特征信息,采用线性加权的方式预测用户对项目的评分,本文中统一称这种算法预测出的用户评分为用户偏好评分。(3)在计算出用户的信任评分和用户偏好评分后,需要有一种好的方法将两者进行融合以形成最终的用户对项目的评分。本文提出了一种利用机器学习融合用户信任评分和用户偏好评分的算法,该算法利用用户信任评分、用户偏好评分、用户社交网络上邻居数量、用户的特征数量等作为训练特征,以用户实际的评分为标注信息,然后利用Fisher线性判别为训练模型预测用户对项目的评分,该算法预测出的评分即为最终的用户对项目的评分。
其他文献
运动员文化教育问题一直是世界各国都非常关注的话题。在新的历史时期,为适应社会的快速发展和竞技体育的可持续发展,我国运动员文化教育问题也被提到了国家议事日程上来,可
基于伯努利能量方程推导出饱水路面在车载作用下路面动水压力分布计算公式,基于恒定总流的动量方程推导出路面裂缝内水压的分布计算公式,并对影响水压分布的因素进行分析。研
现今社会科技的进步与飞速发展,计算机在其中起到了不可替代的左右,并且已经渗透到生产和生活中的各个方向。人们利用计算机进行工作、娱乐、学习、生活、交流、获取信息等,
复杂复合地基优化设计缺乏明确可靠的沉降计算公式,很难建立有明确表达式的优化设计数学模型,若直接基于数值模拟来建立模型,则计算工作量巨大。为此,提出一种基于支持向量机
采用AutoPoreIV9500全自动压汞仪和智能型多功能混凝土耐久性综合试验仪,分别研究负温(-3℃)及标准养护条件下,引气混凝土净浆孔结构特性和混凝土电通量随龄期增长的变化规律.
中国是一个自然灾害频发的国家,灾害种类多、分布地域广,近几年多次发生地震、台风、雪灾等重大自然灾害。这些突发的自然灾害往往会造成相当巨大的人员伤亡和财产损失,对人类
期刊
基于上海太阳能热水系统建筑应用的政策、标准,分析中高层住宅及宿舍、酒店与医院等公共建筑、别墅等低层建筑、太阳能幕墙与太阳能热泵热水系统的应用情况。特别是在调研了4
水蒸气蒸馏法提取香樟精油,气相色谱-质谱连用仪分析可挥发性成分及含量;采用对倍稀释法检测香樟精油对大肠杆菌、枯草芽孢杆菌、热带假丝酵母、苹果斑点落叶病、油菜黑斑病