论文部分内容阅读
随着互联网的飞速发展,网上信息大量增加,面对海量信息,用户要从网上查找到感兴趣的内容变得越来越困难。传统搜索引擎能为人们过滤一部分无关信息,但网上具有相同关键字的信息太多,从搜索结果中发现感兴趣的内容仍是一件费时费力的事情,在百度搜索“推荐系统”,找到的相关结果有1亿个。而且,传统搜索方式只会找到具有搜索关键字的内容,却不能发现与之关系紧密,又没有类似关键字的信息。音乐是人们生活中不可或缺的一项娱乐内容,网络的便捷性让在线音乐快速发展,音乐推荐成了个性化推荐系统中一个重要组成部分,国内外各式各样的在线音乐服务不断涌现,国内近年来兴起的YY语音、网易云音乐、Jing.fm等都是此类代表。网络状况的改善,让用户越来越习惯于随听随播的收听方式,主动发现音乐的动力在减弱。个性化音乐推荐是现今在线音乐服务必备的内容,也是实现音乐长尾推荐的方法。用户收听音乐的行为,如反复收听、收听过程中跳过一首歌曲、收藏一个专辑等行为,都反映了用户对音乐的喜好倾向。因此,本文根据用户收听音乐产生的日志数据,统计每个用户收听了哪些歌手,分别收听的次数,把次数转换成评分,利用个性化推荐指纹给用户推荐可能感兴趣的歌手。协同过滤推荐方法是最早提出的推荐方法,能够对机器难以进行内容过滤的信息进行过滤,在推荐系统中得到了大量应用,在商业应用上取得了不错的成绩。随着研究的深入和实际应用的需要,协同过滤与其它方法相结合,衍生出许多不同的具体算法,Slope One算法和SVD算法便是近些年兴起的著名算法。本文的研究也主要基于协同过滤推荐算法进行。本文对Last.fm数据集作了一个简要分析,得出用户收听音乐的特征,为系统的设计和算法实验提供依据。探讨了隐性反馈数据转换为评分的方法,对个性化音乐推荐系统作了个设计,并实现了部分功能,在数据集上进行了推荐实验。