基于群智感知的游客行为挖掘和旅游活动识别研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:mumuww
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展和智能终端的普及,互联网逐渐融入旅游业,改变着传统旅游商业模式和游客的旅游行为习惯。旅游行为和旅游活动不仅直接体现了游客的旅游特征,同时反应了旅游景点的情况。在互联网大数据背景下,利用群智感知技术根据交互信息对游客行为和旅游活动进行挖掘和识别,发现游客的潜在需求,已经成为旅游大数据技术与应用的新方向。本文主要完成了以下工作:(1)在游客行为特征挖掘方面,采用了基于HITS(Hyperlink-Induced Topic Search)模型的算法挖掘出游客的兴趣景点。提出了卡方检验和信息增益结合的特征选择方法(CI),对旅游主题进行分类,分类的准确率与单一特征选择方法相比平均提高了 3.8%。提出了游客行为模式挖掘算法(HCPFS),根据游客的路径轨迹和访问时间相似性进行层次聚类,识别游客行为模式,提高了行为模式挖掘的准确性。(2)提出了一种基于改进的知网语义相似度计算与点互信息计算融合的词语情感值计算算法(HP),解决了知网未登录词极性难以判断和本地语料库中词频低的问题,相比单一情感分析方法正面情感准确率平均提升了 6%,负面情感准确率平均提升了 5.3%。提出了基于游客特征的重游行为预测算法(RTBF_LA),根据游客的特征建立重游行为预测模型,克服了 Logistic过拟合问题,与Logistic相比预测准确率提升了近8%。(3)提出了基于微博的热点事件挖掘算法(LVCS),将文本语义相似度和特征词相似度相结合,采用谱聚类方法对文本进行聚类,可以有效识别歧义句。该算法与传统的基于特征词相似性的挖掘算法相比,耗费代价平均降低了 28.1%。提出了基于热点事件的旅游活动识别算法(TAR_KA),对景点附近热点事件微博文本进行分类,识别旅游热点活动。该算法的平均准确率和平均F1值比KNN算法分别提高了 13.5%和9.2%,提高了有效特征词识别的准确度。(4)设计和开发了基于群智感知的游客行为挖掘和旅游活动识别系统。包括游客行为挖掘模块、游客重游行为预测模块、旅游活动识别模块等。该系统具有较好的容错性和准确性,能够基本满足游客行为挖掘与旅游活动识别的要求。
其他文献
本文概要介绍了高密度光记录技术、光盘标准化情况和光盘产品的发展动向。
青藏高原水系众多,水文站点稀疏,观测资料匮乏,通过水文分区可以将相似流域归为一类,实现其有限测站水文资料向无资料区移用以及达到站网优化设置的目标。以雅鲁藏布江流域(
在教学办案实践中 ,要注意对螺形斗与绞形斗 ,曲形斗与双箕斗、囊形斗与其它纹型指纹细致分辨 ,便于为技术鉴定工作服务。
本文介绍了作者能过实践考虑到光纤-同轴网的特点,对国标中主要技术指标提出了调整建议;确定了系统指标分配值,对前端系统载噪比、反向系统前端载噪比进行了较详细地讨论。
<正>一、德国企业并购的基本情况德国是当今世界工业化水平非常高的国家,也是当今世界最重要的并购场所,并购规模居世界前列。在德国历史上,企业间并购的现象由来已久。并购
<正>地形特征知识在中学地理教学中具有重要地位和作用。地形特征的知识在初中教材中采用单独列出或者与区域地理相结合的形式出现,不同的教材对其处理的方式不同,不同教师的
老年人泌尿系感染是男科的常见病,常反复发作,严重影响老年人的生活质量,症状因个体而有较大差异,治疗多用抗生素为主。曾庆琪教授长期从事中西结合男科临床工作,对本病有较
CATV邻频调制器线路分析戴志朗,周昌林(江苏江都电视台)邻频调制器是有线电视系统关键设备之一。其内部线路结构也是各有线电视台(站)的工作人员希望了解的问题。在此我们介绍一种KD956’型
<正> 现代舆论学研究中的“舆论监督”是一个主谓结构的词组,指的是公众通过舆论这种集合性意见形态,对各种权力组织和其工作人员,以及社会公众人物(包括著名记者)自由表达看