基于最优化邻居的协同过滤推荐算法的研究

来源 :陕西师范大学 | 被引量 : 0次 | 上传用户:liangdd1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和互联网的发展,尤其是电子商务系统的崛起,人们的生活开始受到越来越多的电子信息冲击,爆炸式增长的信息资源开始给人们造成信息选择困扰。此时,推荐系统作为一种有效的信息过滤技术开始出现。推荐系统采用知识发现技术,解决人们进行生活中的信息、商品和服务等个性化推荐问题。由于协同过滤技术能够基于一些复杂的概念和难以进行机器自动分析内容的信息进行过滤,而且推荐比较新颖性,所以协同过滤推荐也是目前应用最广泛和最成功的个性化推荐技术之一。然而,传统的协同过滤技术面临着数据稀疏性、冷启动、扩展性、实时性和相似性度量等方面的挑战,影响了推荐系统的准确性。本文针对传统协同过滤推荐算法中存在的数据稀疏性和相似度量难等问题,提出了一种基于最优化邻居的协同过滤算法。在改进的推荐算法中,首先,该算法根据用户对项目的评分进行相似度计算,在邻居集合选取过程中采用动态选取策略。动态选取策略使得不同的用户能够根据其自身相似用户的相似度值确定邻居集的大小,而避免人为设定相似度阈值时应用场景的局限性和无法满足不同目标用户之间差异性等问题。该策略能有效提高邻居集中相似用户的质量,使得推荐精度得到很大的提升。然后,在目标用户相似邻居集上,通过构建用户信任模型的方法,计算邻居用户对目标用户的信任度值,根据相似用户对目标用户的信任度值,同样采取动态选取策略选取信任度值高的用户构建最优邻居集。信任度值是邻居用户对目标用户已评分项目进行预测评分的准确率,如果预测评分值与真实评分值差值小于给定阈值即为准确预测。从而有效避免邻居用户与目标用户共同评分项目过少,但相似度值较高的偶然性,能够充分选择对目标用户有推荐能力的用户参与预测评分。最后,在预测评分过程中,基于最优邻居集合,同时将信任度值代替相似度值进行预测评分。预测评分采用基于用户和基于项目相结合的方法,根据目标用户和目标项目的邻居集的信任度值大小,确定其在预测过程中所占比重。这样在有效提高推荐精度的同时缓解了矩阵稀疏性问题。如果目标用户邻居集过少或邻居集推荐能力过低,那么目标项目的邻居集在预测过程中比重增加,降低了由于目标用户评分稀疏对推荐精度的影响。实验表明,该算法能够显著地提高协同过滤推荐算法的推荐精度。
其他文献
目的:研究中西医结合治疗泌尿系结石的疗效及安全性。方法:选择泌尿系结石患者98例,用西药抗感染、止血、解痉、镇痛、补液、利尿1~6天,口服中药,每天1剂,6天为1个疗程,1~3个疗
摘要:中国加入WTO后,众多国外服装企业纷纷入驻,国内服装行业硝烟四起,企业间的竞争已经从单一的产品竞争转移到盈利模式的竞争,有效的盈利模式可以有效提高核心竞争力,帮助企
数字时代带来了信息高速传播的生活,而图片、画面也因为其特有的信息表现张力成为人们喜闻乐见的信息传播载体,动画作为动态画面由于其动态信息传播的特质越来越多地受到人们
中日农产品贸易规模的不断扩大,贸易层次的不断提高,不可避免地加剧了中日之间的农产品贸易摩擦。通过回顾中日农产品贸易历史,分析引起中日农产品贸易摩擦的深层次原因,并结
<正>一、藕田选择藕田应选择避风、向阳、土质疏松、肥沃、富含有机质(含量宜在1.5%以上,若在3%~4%则更好)、p H值适宜、保水保肥能力强、灌溉和排水都比较方便的田块进行栽
癌症是导致人类死亡的重要原因之一,发病率逐年上升,其中以化疗为主的综合治疗手段是当前治疗癌症的主要方式。而肿瘤化疗失败的主要原因就是肿瘤多药耐药(multidrug resista
将数字全息粒子图像测速(DHPIV)技术应用于旋转流场的三维空间速度测量当中。提出了一种新的焦平面定位方法,即综合灰度梯度法,对数字全息中粒子的焦平面进行精确定位,获得了
<正>“小学语文合作学习”是指在学习语文的过程中将班级学生分成若干小组,小组成员间互相配合,在教师的参与、点拨、引导下,通过学生自主探究的、互助性的学习活动来实现合
摘要:大型移动设备或储能电站对锂离子电池的比能量提出了更高的要求,因此高能量密度锂离子电池成为近年来的研究热点。提高正极材料的充电电压能有效提高能量密度,然而传统电
销售物流是物流产业链上的重要环节,在这一环节,很多企业不仅仅面临着运营成本居高不下的问题而且也有客户服务水平比较低的问题。这两方面的问题,影响着企业的市场竞争力和