论文部分内容阅读
个性化推荐技术是实现互联网企业将用户感兴趣资源主动推送给用户的有效解决方案。个性化推荐技术通过研究用户的兴趣偏好,主动并且及时地将最可能符合用户兴趣的资源推荐给用户,帮助用户准确和快速地定位到所需要的资源。基于协同过滤算法构建的个性化推荐技术是当前最为成功、使用最为广泛的个性化推荐技术之一,已经成功应用于个性化推荐的各个领域。但是基于协同过滤算法构建的个性化推荐系统也面临诸多问题,如冷启动,用户评价恶意欺诈,可扩展性和高性能等。而由于用户反馈行为不确定性等因素造成的用户评价数据稀疏问题,则会严重降低个性化推荐的推荐准确度,并对基于协同过滤构建的个性化推荐系统整体构建,系统性能以及扩展性造成严重的影响。本文在研究和学习个性化推荐技术以及协同过滤算法的基础上,针对协同过滤个性化推荐中用户评价数据稀疏问题,提出了一种混合加权预测填充算法,从用户访问的资源特征以及该资源在整个用户群体中被访问的热度出发,对用户访过但未给出评价的数据进行预测并填充,旨在降低由于用户反馈行为不确定性等因素所造成的评价矩阵稀疏度,提高推荐准确度。与此同时,由于该算法不与在线的推荐系统构成计算、存储等资源冲突,可以线下进行模型确定和计算,具有较好的可扩展性。在MoiveLense数据集上实验结果表明,与传统的直接使用协同过滤算法构建的个性化推荐相比,本文所提出的混合加权预测填充算法能够明显的降低用户评价数据稀疏程度,提高推荐准确度并且能够改善推荐系统的可扩展性。并且本文提出的算法能够直接用于采用协同过滤算法构建的个性化推荐系统中,对用户数据进行预测填充,因此本文的研究成果具有一定的价值和普遍意义。