论文部分内容阅读
旅游人数的迅速增加使得旅游服务的提供者推出了很多相关的旅游服务,游客通过使用这些应用能够实时地进行签到,发表看法或者评论。通过分析大量游客行为特征的信息,可以得到游客的行为特征模式。本文对旅游活动发现与游客行为挖掘进行了研究,完成的主要工作如下:(1)旅游活动偏向识别。使用卷积网络对旅游活动数据进行偏向分类识别,利用卷积层抽取ngram语言模型特征,加入inception结构,引入预先聚类后的文本主题特征,对截断的文本进行信息补充。实验结果表明改进的卷积模型对旅游活动偏向识别的准确率较高。(2)旅游活动发现与挖掘。提出了一种基于主题模型的二部图景点相似度度量方法,利用主题模型发现数据相关的旅游活动主题,得到了不同旅游主题与不同旅游景点之间以及旅游主题之间和旅游景点之间的相似度。提出了一种利用FP-growth算法对旅行目的地不同的游客签到内容中的旅游线路、旅游时间和旅游主题分别进行关联规则挖掘的方法。实验结果表明了上述方法的有效性。(3)游客行为挖掘与旅游评论分类挖掘。提出了一种基于情感主题特征的景点评价数据分类方法,通过构建的情感词典从文本中抽取情感特征,利用主题模型抽取文本潜在的主题特征,对数据进行分类。提出了平衡权重评价主题模型BWCTM,利用主题模型对负向评论及其相关的评价类别信息进行分析,并对聚类后的结果进行分析,实验结果表明该模型相较其它文本聚类模型对负向景点评论在聚类结果的评价指标上有着更好的性能。(4)设计并实现了旅游活动发现与游客行为挖掘系统,包含旅游活动偏向识别模块、景点相似度计算模块、多特征挖掘模块和负向评论数据聚类分析模块。完成了系统的需求分析、数据获取、体系结构设计、数据库设计、功能模块的设计,并进行了测试。本文设计开发的旅游活动发现与游客行为挖掘系统,可以发现游客的旅游活动,对景点评价进行分类识别,对游客的行为特征进行挖掘和分析,可为游客提供更好的旅游信息服务。