基于协同过滤的推荐算法研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:shipeicheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展以及移动设备的成熟,网络服务和交易等网上业务也越来越普及,网络信息也呈现出了几何级增长的态势。而用户除了是信息生产者之外同样也是信息的消费者,越来越严重的“信息过载”问题正是他们所必须面对的。而推荐系统可以发现用户的偏好,提供极具个性化的服务,使得用户真正从海量数据中解放出来,轻松应对爆炸式的信息。作为目前推荐系统中个性化推荐技术的热点——协同过滤技术,一直受到国内外研究学者的高度关注。本文通过对国内外研究现状的分析,在前人研究工作的基础上对协同过滤推荐技术进行更深一步的研究,主要研究工作如下:
  1、本文对基于内存的协同过滤算法中存在的可扩展性问题以及稀疏性问题进行研究,提出了一种先聚类后填充的混合协同过滤算法。该算法首先以用户属性特征作为聚类依据,利用基于最小生成树 K-means 聚类算法对用户进行聚类分析,生成 K个相似用户集合;其次在聚类分析的基础上利用Slope One算法预测填充生成的相似用户集下的用户评分矩阵;最后采用混合协同过滤算法对填充后的用户评分矩阵进行最近邻搜索从而得到预测评分,产生推荐结果。对比实验结果表明,提出的算法显著提高了推荐的精度、有效缓解了稀疏性问题及具有良好的可扩展性。
  2、针对评分数据稀疏性问题,从大多数推荐算法中常忽略的文本信息出发,提出了一个结合用户评论文本内容和评分的推荐模型。该模型首先利用带偏置的矩阵分解算法挖掘用户评分矩阵信息,同时使用主题模型技术寻找在用户评论文本中的隐藏主题。接着通过设计一种转换函数将项目和用户潜在的向量转换为主题分布参数来结合评分数据中的潜在因子和用户评论文本中的主题。通过在Amazon网上商城的真实数据集上的实验,证明了该模型在结合评论文本与用户评分后进行推荐的有效性,并且从另一方面缓解了评分数据稀疏性的问题。
其他文献
2006年至今,我国宏观环境发生了激烈的变革,使得我国商业银行的盈利空间不断被挤压。而同业业务以其低成本高回报且监管较少的优点得到了诸多商业银行的青睐,由此开启了我国同业业务快速增长的新篇章。但同业业务快速发展的同时,相关监管问题也开始出现在大家的视野之中。其中,以2013年度的“钱荒”事件以及2016年度的“买入返售”事件为典型代表,在相关银行遭到巨大损失的同时,使大家开始认识到了同业业务快速发
学位
在股票市场上,股票投资者如何判断一只股票是否被低估呢?其中非常重要的一个指标就是账面市值比。因此,投资者往往将高账面市值比作为“股票买入”的一个信号。国内外有很多学者已经用实证分析证明了账面市值比效应的存在性。但是据美国学者的最新研究发现,账面市值比作为价值投资的信号已经过时了,而留存收益市值比能更加有效地预测未来股价。  本文参考国外学者的研究方法,把权益的账面价值分解为两部分:留存收益和发行资
学位
从2014年11月17日沪港通正式启动到2018年3月份,沪港通已经平稳运行了三年多,深港通自2016年12月5日开通至今也超过一年。两地互联互通使资金和成交量互相补充与活化,内地市场也受到港股市场的投资理念影响。为了增加股票的流动性或缓解信息不对称,扩展融资渠道等,越来越多公司选择交叉上市,交叉上市的公司都存在一个“同股同权而不同价”的现象。一般来说,同公司的A股相对外资股表现为折价,但是A股相
学位
安信证券构建的高管增持事件驱动投资策略从2009年1月至2016年12月能够实现20.08%的年化收益,同一时期HS300收益率仅有4.37%,策略相比于大盘优势明显。银河证券、中信建投等券商的研究也有类似结论。目前国内跟随高管增持事件构建的策略普遍假设管理者的增持是理性行为。然而从心理学和行为金融学的研究来看,管理者并不能做到完全理性,甚至容易出现过度自信等非理性行为。本文试图从管理者过度自信的
学位
冥婚习俗在嵩县地区流传已久,嵩县所在的河洛文化板块内考古资料显示,东汉时期就有冥婚的记载,至今有两千年的历史。这一风俗流传千年,至今在民间仍有流行。嵩县当代的冥婚习俗是一种地域性很强的风俗,与当地社会文化紧密结合,体现了民众信鬼好巫的思想观念,同时在民众生活中发挥着心理学和实际的作用,是俗民生活的重要组成部分。本文将运用民俗学、社会学和人类学的方法,研究冥婚习俗与当代社会的关系,解释冥婚习俗传承千
学位
人祖伏羲和女娲信仰是我国一种古老的民间信仰,地处中原的淮阳是人祖信仰比较流行的区域。淮阳的人祖信仰主要以神庙祭祀、仪式活动、会社组织、民间文艺等多种形式存在。淮阳地区的人祖信仰之所以长期兴盛不衰,与淮阳太昊陵的存在直接相关。由于太昊陵的祭祀历代不衰,形成了强大的文化惯性,从古代一直延续至今。  淮阳人祖信仰的信众主要由农民构成,具有明显的性别和年龄特征。人祖信仰是在民间自发成立的香会组织的领导下统
学位
目的:(1)构建我国大学生职业兴趣理论模型;(2)编制适合中国大学生的职业兴趣测验;(3)探讨中国大学生的职业兴趣类型及其结构。  方法:通过文献和理论构建,结合网络搜集、开放式问卷、内容分析、专家评定和讨论等多种方法,构建了14个大学生职业兴趣类型,并根据层面理论形成职业兴趣项目库。(1)首先通过对职业兴趣项目库的评估筛选,形成了包含235个项目的初始问卷,通过对大学生小样本的初步探索,验证了包
学位
阅读理解是英语教学研究的重要课题,许多语言研究者和英语教师从不同侧面对此展开了调查和研究。而近年来,心理语言学家们的研究成果使我们对阅读的过程有了新的理解:阅读过程实际上是一个多种语言知识,包括文字、词汇、句法和语义等的复杂的相互作用过程,这个过程有不同的层次。按照Barrett(1972)的分类:1.字面理解层; 2.推断性理解层;3.评价性理解层;4.创造性理解层。本文作者选择了1995-20
学位
现有的光传送网已无法满足通信运营商对经济性和高效性的要求、不能充分利用网络资源、业务提供能力有限且升级复杂,极大阻碍了通信事业的发展。在激烈的市场竞争、技术发展及面向以数据业务为中心的业务驱动下,人们提出了智能光网络的概念,其中自动交换光网络(ASON)代表了智能光网络的主流方向。本文对ASON的生存性技术,特别是共享恢复路由选择算法进行了深入的研究。本文的第一章首先介绍了智能光网络主要是自动交换
可调谐TEACO2激光器在许多领域有着广泛的应用。本文针对光栅调谐TEACO2激光谐振腔开展了自动调整技术和稳定性研究,其中涉及到激光谐振腔、激光探测、数字图像处理和计算机控制等方面技术。本文在研究了激光谐振腔自动调整技术相关理论和前人的工作之后,针对大能量光栅调谐TEACO2激光谐振腔,选择非制冷焦平面红外热像仪作为探测器件,建立了可调谐TEACO2激光采样系统。在该系统的基础上,从分析光斑质量