论文部分内容阅读
随着互联网和Web2.0的蓬勃发展,在线音乐的数量呈爆炸式增长,用户很难从海量歌曲中找到自己真正感兴趣的歌曲。音乐推荐技术可以从根本上解决这一问题,因此受到国内外音乐信息检索领域研究者的关注。 目前,基于协同过滤的方法和基于内容过滤的方法是两种主流的推荐方式。其中,基于协同过滤的方法取得了较好的性能,但存在冷启动和长尾问题;基于内容过滤的方法可以弥补基于协同过滤的方法的固有缺陷,但是由于存在低级声学特征和高层次音乐理解之间的语义鸿沟,因此无法达到理想的推荐效果。为了结合两种方法的优势,本文主要研究了结合内容分析和协同过滤的混合音乐推荐模型。 首先,研究了基于深度学习的音乐内容特征提取算法,并在此基础上构建了音乐自动标注模型。该模型从原始音频中提取出音级轮廓特征并对其进行PCA白化降维处理后,采用深度学习中的降噪自动编码器算法对降维后的特征进行无监督学习,并聚合成“词袋”形式特征向量,最后通过多层感知机监督学习来实现特征向量到标签的映射。基于Magatagatune库的对比实验表明,该模型的AUC-T160和AUC-C分别达到0.881和0.954,而top-3和top-6也相应提高2%,而其中AUC-T50达到0.8965,基于GTZAN库的实验表明,平均准确度也提高到0.8852。从而验证了基于深度学习后的特征可更好地表征歌曲的乐理特性,且该特征与社会化标签存在着更强的关联性。基于音乐自动标注模型的研究为混合音乐推荐模型奠定了研究基础。 其次,我们研究了结合音乐内容分析和协同过滤的混合音乐推荐模型。该模型有效融合了基于音乐内容的深度特征学习模型和基于矩阵分解的协同过滤模型。该模型首先利用受限玻尔兹曼机对预处理后的音色特征进行无监督学习,然后将学习后的特征聚合成特征向量,最后通过权重矩阵来实现特征向量和基于加权矩阵分解的协同过滤算法相结合,以此实现针对隐式反馈数据的混合音乐推荐。基于百万音乐库的实验结果显示我们提出的基于受限玻尔兹曼机的混合音乐推荐模型比经典的协同过滤算法具有更好推荐性能,在召回率上提升了0.3%,NDCG参数也提高了0.8%,从而证明了该模型可有效提高音乐推荐的正确率。