论文部分内容阅读
大数据时代的到来,变革着人们的社会生活形态,微博快速的走进了人们的生活,发展为人们日常的娱乐、交友、信息传播工具,是一种新型的社交媒体平台,为旅游行为研究、旅游规划带来了新的发展契机。带有位置信息的微博数据使得虚拟的网络空间与现实地理空间关联起来,位置信息所涵盖的用户行为偏好、日常行为轨迹等被越来越受关注,但关联考虑微博文本提到的位置与地理定位的研究却很少,评价二者一致性的更少,因此本文以九寨沟微博数据为数据源,研究微博文本语义位置与签到位置的一致性。具体研究方法和结果分析如下:
(1)数据处理。对2012年到2017年的九寨沟微博数据以文本内容进行分类,筛选出景点微博、景线微博,并标明微博的景点名称、景线名称,方便分析。
(2)景点与景线的空间范围确定。对于景点,按谷歌地球测量出的景点半径分为三类后取每一类的平均值,再加上200米定位误差作为景点半径,建立缓冲区形成景点空间范围;对于景线,以融合景点泰森多边形范围形成景线范围的方法确定了四条线路的空间范围。
(3)空间尺度下计算景点与景线的微博文本语义位置与签到位置一致度,并在ArcGIS中直观地展示。景点上,除五彩池、长海外,珍珠滩瀑布、五花海、诺日朗瀑布、树正群海等微博文本位置与签到位置的一致度较高的景点同时也是景区知名度高的景点;景线上,一致度大小为日则沟>树正沟>则查洼沟,日则沟是景点漂亮且最密集同时一致度也最大的一条景线。
(4)时间尺度下计算景点与景线的微博文本语义位置与签到位置一致度,以统计图的方式直观展示。年尺度下,景点上:2013年-2017年微博文本位置与签到位置的一致性逐年降低,2017年的位置一致度甚至不足20%;景线上:微博文本位置与签到位置的一致度在2014年急剧下降,2014年到2017年一致度稳定。月尺度下,景点与景线的一致性变化规律基本一致,6月的一致度最高,2月、3月的最低,1到6月的一致度波动较大,6到12月的一致度波动不大,此外景点上9月的一致度较高,而景线上9月的一致度较低;时尺度下,景点与景线的一致度呈现出以9-12时段为塔尖的“金字塔”型结构,均是9-12时段一致度最高,21-24时段一致度最低。
(5)时空尺度下计算景点与景线的微博文本语义位置与签到位置一致度,以景点一致度分级地图、景线一致度柱状图的方式直观展示,并计算年间、季节间、时段间的变化率。景点上:2012-2017年每个景点在当年的一致度级别都在变化,2016到2017年一致度级别波动最大。不同景点的一致性四季差异比较明显,冬季一致度总体较低,树正沟的景点总体上秋季的一致度高,日则沟的景点总体上春夏季的一致度高于秋季,则查洼沟的景点四季一致度均不高且差异较小;整体上秋季到冬季景点的一致度变化率最大,季节变化所带来景色的差异的大小与季节一致度变化率直接相关。8-12时段、12-16时段日则沟的景点一致度高,16-20时段树正沟的景点一致度高,这种一致性规律的形成与游客在景区的游览顺序有关,一定程度上反映了旅游者行为模式,变化率上不同时段景点一致度变化的快慢不同,12-16时段到16-20时段的一致度变化剧烈。景线上:三条景线四季的微博文本语义位置与签到位置的一致度差异不太明显;树正沟的秋冬季一致度变化率最大,日则沟与则查洼沟的春夏季一致度变化率最大。景线年间一致度变化率差异较为明显,2016-2017年的景线一致度变化率明显小于2012-2104年、2014-2016年的变化率。
(6)分别以总微博数据、位置一致的单景点微博数据、位置一致的景线微博数据进行热点分析,对比冷热点区域的不同,可以发现微博文本位置与签到位置一致点的热点区域与知名景点一致度较高。
(7)游客性别、认证类型、注册地、情感值等对一致度也有一定的影响,负面情绪高可能会使到一致度偏低,列联分析结果表明景线、时与微博点文本语义位置与签到位置一致度的关联性比较强。
(1)数据处理。对2012年到2017年的九寨沟微博数据以文本内容进行分类,筛选出景点微博、景线微博,并标明微博的景点名称、景线名称,方便分析。
(2)景点与景线的空间范围确定。对于景点,按谷歌地球测量出的景点半径分为三类后取每一类的平均值,再加上200米定位误差作为景点半径,建立缓冲区形成景点空间范围;对于景线,以融合景点泰森多边形范围形成景线范围的方法确定了四条线路的空间范围。
(3)空间尺度下计算景点与景线的微博文本语义位置与签到位置一致度,并在ArcGIS中直观地展示。景点上,除五彩池、长海外,珍珠滩瀑布、五花海、诺日朗瀑布、树正群海等微博文本位置与签到位置的一致度较高的景点同时也是景区知名度高的景点;景线上,一致度大小为日则沟>树正沟>则查洼沟,日则沟是景点漂亮且最密集同时一致度也最大的一条景线。
(4)时间尺度下计算景点与景线的微博文本语义位置与签到位置一致度,以统计图的方式直观展示。年尺度下,景点上:2013年-2017年微博文本位置与签到位置的一致性逐年降低,2017年的位置一致度甚至不足20%;景线上:微博文本位置与签到位置的一致度在2014年急剧下降,2014年到2017年一致度稳定。月尺度下,景点与景线的一致性变化规律基本一致,6月的一致度最高,2月、3月的最低,1到6月的一致度波动较大,6到12月的一致度波动不大,此外景点上9月的一致度较高,而景线上9月的一致度较低;时尺度下,景点与景线的一致度呈现出以9-12时段为塔尖的“金字塔”型结构,均是9-12时段一致度最高,21-24时段一致度最低。
(5)时空尺度下计算景点与景线的微博文本语义位置与签到位置一致度,以景点一致度分级地图、景线一致度柱状图的方式直观展示,并计算年间、季节间、时段间的变化率。景点上:2012-2017年每个景点在当年的一致度级别都在变化,2016到2017年一致度级别波动最大。不同景点的一致性四季差异比较明显,冬季一致度总体较低,树正沟的景点总体上秋季的一致度高,日则沟的景点总体上春夏季的一致度高于秋季,则查洼沟的景点四季一致度均不高且差异较小;整体上秋季到冬季景点的一致度变化率最大,季节变化所带来景色的差异的大小与季节一致度变化率直接相关。8-12时段、12-16时段日则沟的景点一致度高,16-20时段树正沟的景点一致度高,这种一致性规律的形成与游客在景区的游览顺序有关,一定程度上反映了旅游者行为模式,变化率上不同时段景点一致度变化的快慢不同,12-16时段到16-20时段的一致度变化剧烈。景线上:三条景线四季的微博文本语义位置与签到位置的一致度差异不太明显;树正沟的秋冬季一致度变化率最大,日则沟与则查洼沟的春夏季一致度变化率最大。景线年间一致度变化率差异较为明显,2016-2017年的景线一致度变化率明显小于2012-2104年、2014-2016年的变化率。
(6)分别以总微博数据、位置一致的单景点微博数据、位置一致的景线微博数据进行热点分析,对比冷热点区域的不同,可以发现微博文本位置与签到位置一致点的热点区域与知名景点一致度较高。
(7)游客性别、认证类型、注册地、情感值等对一致度也有一定的影响,负面情绪高可能会使到一致度偏低,列联分析结果表明景线、时与微博点文本语义位置与签到位置一致度的关联性比较强。