基于分步的混合协同过滤推荐算法的研究

来源 :北京理工大学 | 被引量 : 0次 | 上传用户:niklausxiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息时代下随着数据量的激增,人们获取信息的方式逐渐经历了从门户网站、搜索引擎,到如今发展的迅猛的推荐系统等多种方式并存的演变,相比之下,推荐系统更加适用于海量数据背景下用户需求较为模糊和不明确、被动获取的场景。近年来,推荐系统在研究领域和应用领域都取得了突飞猛进的进展,对提高用户活跃度和销售业绩起到越来越重要的作用。推荐系统主要包括评分预测和Top-n推荐两个研究方向,在推荐系统兴起初期,学术上的研究主要集中在评分预测问题上,但是随着人们深入研究发现,Top-n问题更具有实际应用价值,用户更关心的是推荐系统向其推荐的物品是否能满足其需要,而并不关心系统预测其会给物品评多少分。虽然推荐系统在过去十几年中发展迅猛,随着数据量的增长,推荐系统面临着数据稀疏性等问题;目前的推荐系统对于数据的分析层次仍然主要停留在评分信息上而忽略了评分行为对于发掘用户兴趣的意义;评判推荐系统推荐准确度的标准仍然有进一步完善的可能。本文将主要研究Top-n推荐问题的优化,并针对以上的问题提出解决方案,主要工作如下:(1)针对数据稀疏性问题,采用一种新的数据结构用于表示稀疏矩阵,节约存储空间,优化矩阵运算过程。(2)提出“分步”的用户行为模式和基于分步的混合协同过滤推荐算法,将评分行为分解为用户选择物品、用户给物品评分两个步骤。算法具体包括基于分步的KNN协同过滤推荐算法、基于分步的模型混合推荐算法、基于分步的KNN-模型混合推荐算法。(3)对于排序准确度的评价,在NDCG的基础上提出了适用范围更广、可体现算法整体准确度的宏观指标NDCG+。(4)对基于分步的混合协同过滤推荐算法进行优化,包括改进相似度、引入权重的分步算法等,并通过实验验证优化结果。
其他文献
随着光纤通信技术的迅速发展,大容量、长距离、超高速通信系统成为限制其发展的重要瓶颈。信号在光纤的传输过程中,受到光纤损耗、色散以及各种非线性效应的影响。光纤损耗造
水声通信已成为近年来研究的焦点,然而水声信道恶劣的传输特性使得实现高速、远距离、高可靠性的信息传输极具挑战性。水声信道的多途扩展导致传输信号在接收端产生严重的码
随着互联网的蓬勃发展,Web成为全球最大的信息源,且其数据规模仍呈指数级别暴增趋势、数据形式也更显多样化、网页间的时间跨度巨大。用户在不同时间对信息的关注度会发生变
中国成功加入WTO的十余年来,随着全球经济一体化进程的加快和我国国民经济的高速发展,人力成本不断提高,市场竞争的进一步激烈。国内企业对自动化,信息化的转型升级要求迫切,
我们正处于大数据时代,数据的增长速率已经远远超出了单机计算能力的提升速率。怎样有效提高分类算法分析处理海量数据的能力是目前亟待解决的问题。在分类算法领域,SVM算法
基于工业4.0与云制造2.0对信息安全的要求,SQL注入成为影响企业运营且具有破坏性的漏洞之一。它会泄露保存在应用程序数据库中的敏感信息。所以了解SQL产生、检测和注入原理
随着软件行业的迅速发展,软件已经成为了人们日常的生活和工作中不可缺少的一部分,因此软件安全不可忽视。内存破坏漏洞是软件安全漏洞中最古老的一类漏洞,使用了C/C++、汇编
随着流媒体等新业务在互联网流量中所占比重不断增加,以及云计算、物联网、社交网络等新型网络应用的出现,使得互联网应用从以面向主机的端到端通信模式为主转向以用户驱动的
会计稳健性是关于会计盈余确认和计量的一项重要原则,对会计信息质量有重要影响。随着资本市场的快速发展,这种影响不断加深,会计稳健性也逐渐引起学术界与实务界的关注。迄
网络技术的发展推动世界进入信息化时代。网络通信逐渐在世界范围内普及起来。由于网络的开放性,网络通信普遍存在敏感信息泄露的安全问题。针对以上安全问题,本课题结合理论