推荐引擎中的稀疏性问题研究

被引量 : 0次 | 上传用户:hua50776007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐引擎通过为用户推送感兴趣的信息,应用机器学习知识为用户提供个性化推荐。在推荐引擎中,协同过滤是一种最为常见的个性化推荐技术,在推荐领域中应用比较广泛,已经成为了该领域非常重要的方法。然而现有的协同过滤算法普遍存在着一个很显著的问题:数据稀疏性。由于在应用推荐引擎的场景中,用户进行评价的项目信息一般来说常常达不到场景中项目总量的1%,导致建立起来的用户与项目之间的信息矩阵存在很大的稀疏性,而用户与项目的信息矩阵是协同过滤技术进行推荐的数据信息基础,所以数据稀疏性问题的解决就显得尤为重要。本文主要是针对协同过滤中存在的稀疏性问题进行探讨。首先分析了推荐引擎的国内外研究现状,接着详细介绍了协同过滤技术,进而针对协同过滤技术具有的数据稀疏性问题,介绍了目前的几种解决方案及其问题,从两个方面提出了改进方法:一是改进现有的相似性度量方法,以找到更优的邻居集合。该方法在朴素贝叶斯度量方法的基础上,添加了项目的流行度作为惩罚因子,该度量方法经实验数据验证能够更好的反应邻居之间的相似性;二是通过奇异值分解实现降维的方法,使得原始的计算信息矩阵更为稠密。因此本文针对数据稀疏性问题提出一种改进算法,即BAS算法:该方法首先利用传统的基于奇异值分解的方法来填充稀疏的评分矩阵,并得到预测的评分数据,然后采用这些预测评分来获得活跃用户的邻居,最后利用改进后的相似性度量方法得到最终提供给用户的预测值。并对改进的算法进行了相应的理论分析,在选定数据集上进行了与原有的传统方法对比的实验,实验结果表明,该方法在所用数据集上能够有效缓解数据稀疏性问题,及其带来的推荐精度不够准确,一定程度上提高了推荐引擎的推荐质量。
其他文献
尼采是19世纪著名的哲学家,在他短短的一生中,为人类贡献了卓著的思想成果。尼采对传统的价值观念进行批判,提出了“重估一切价值”的命题,对传统的一切道德学说进行反思,并且在这
程序化交易作为一种重要的交易手段,在国际市场上已经得到了广泛的应用。但是我国的程序化交易仍然处于一个比较初级的阶段。沪深300股指期货的出现,为我国的程序化交易的发展
在中华文化五千年的历史长河中,服饰文化和伦理文化都有着紧密的联系,服饰在每个时期的发展、表现、变化中都离不开当时社会伦理思想这一内在因素的影响,伦理道德在人们的穿着打
贵州由于地理位置原因,文化教育一直处于落后状态。民国时期,军阀混战,民不聊生。周西成主政时期对贵州教育进行近代化改革,他整顿教育行政机关、扩建中小学、任用知名人士改
1.斑节对虾幼虾对蛋白质需要量的研究选用鱼粉、豆粕和大豆浓缩蛋白为主要蛋白源,配置6个蛋白质水平梯度(36%,38%,40%,42%,44%和46%)的饲料,对斑节对虾(Penaeusmonodon)幼虾(1.03±0
随着我国农村经济社会的快速发展,作为村民自治下的权力行使者,村官掌握有越来越多的生产要素,由权力寻租带来的村官腐败现象也屡屡发生。这不仅直接的侵害了广大农民群众的切身
地理信息服务是在地理信息系统和互联网技术迅猛发展的背景下产生的,它能够为互联网用户提供实时的、丰富的位置信息相关服务。公众地理信息服务系统是地理信息服务社会化发展
文化差异问题在社会工作的发展中似乎很少被人关注,但却是社会工作普及过程中越来越不可忽视的一个重要方面。随着社会工作在我国的发展,文化已经成为社会工作研究和实践中不可
<正>"大灰狼医生"的眼中,没有"病",没有"人",只有"肉"。医生吃药品回扣已经是公开的秘密,每个人的吃法都很有讲究,吃相也不尽相同。笔者在反复与全国的医药代表访谈之后,把吃
我国医疗服务机构的主体为公立医院,它承担着公共卫生服务的责任,公立医院是带有一定福利性和公益性的社会公益事业。我国现在的公立医院管理体制是从计划经济体制下发展来的,随