论文部分内容阅读
近年来,随着互联网技术的迅猛发展与普及,用户从网络中获取数据的同时,也生成了海量的数据信息。在旅游行业,随着网络上景点数据井喷式地增长,一方面能够使用户获取到更加丰富的景点信息,而另一方面,当用户面对触目皆是的旅游信息时,用户则需要耗费大量的时间来检索真正有价值的信息。“信息过载”问题越来越严重,传统的旅游景点推荐系统已经无法满足用户的需求。因此,一种能够满足用户需求的旅游景点推荐系统受到了用户的推崇,即旅游景点个性化推荐系统。但是,推荐系统普遍存在冷启动、数据稀疏和准确率低三大问题,因此本文针对这些问题,引入迁移学习和深度学习算法,进行了基于域适应的旅游景点个性化推荐和基于深度迁移的旅游景点个性化推荐研究。论文的主要研究内容如下:(1)研究了基于域适应的旅游景点个性化推荐算法。针对推荐系统中普遍存在的问题,提出基于域适应的旅游景点个性化推荐算法。在旅游景点个性化推荐领域,目标任务中的目标域数据绝大多数是未标记数据,无法对模型进行训练,但是存在与目标域数据相关的源域数据且都是已完全标记的,因此考虑引入源域数据集来辅助目标域数据集进行模型训练。首先,准备实验辅助数据集,即源域数据集,从网络上爬取与目标域数据集相关的已标记数据作为源域数据集;其次,提取目标域数据集与源域数据集的图像特征,提取特征方法采用视觉词袋模型(Bag-of-Visual-Words model,BoVW);然后,由于目标域数据集与源域数据集之间存在数据分布差异,提取特征后不能直接进行训练,因此通过域适应技术来减小目标域数据集和源域数据集之间的分布差异,再通过支持向量机(Support Vector Machine,SVM)分类器分类得到用户感兴趣的景点,最后通过分析目标用户与不同用户之间的关系,以此来实现基于域适应的旅游景点个性化推荐。(2)研究了基于深度迁移的旅游景点个性化推荐算法。为了得到推荐性能更好的旅游景点个性化推荐系统,引入了深度学习算法,提出基于深度迁移的旅游景点个性化推荐算法。相较于传统的机器学习算法,深度学习算法的优势在于能够提取得到具有高鲁棒性和判别性的图像特征,然后更加精确地获得用户的兴趣景点,进而提升个性化推荐算法性能。为了解决冷启动和数据稀疏难题,借助于源域数据来辅助目标域数据,由于目标域数据与源域数据之间存在的分布差异,于是在卷积神经网络中加入了自适应层,通过自适应层得到数据之间的分布差异,即域损失,再最小化域损失从而实现深度特征迁移,进而实现对模型进行训练得到用户感兴趣的景点,最后通过分析目标用户与其他用户之间的关系,以此来实现基于深度迁移的旅游景点个性化推荐。(3)通过实验验证所提算法的推荐性能,实验结果表明,基于域适应的旅游景点个性化推荐算法能够很好地解决冷启动和数据稀疏难题,推荐性能良好。并且,基于深度迁移的旅游景点个性化推荐算法不仅仅解决数据稀疏等问题,推荐性能也取得了显著提升。