基于时空关联规则的标绘数据挖掘研究——以旅游标绘数据挖掘为例

来源 :杭州师范大学 | 被引量 : 0次 | 上传用户:smeie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着移动互联网技术的发展和智能移动终端的普及,人们越来越习惯于通过智能移动终端上的应用随时随地获取或分享信息。研究中形象地将这些由人们标注而产生的含有地理位置信息的数据称为标绘数据。人们在使用此类应用的过程中,产生了海量的含有地理位置信息的标绘数据,这些数据的规模呈爆炸性增长并且与人们的生活越来越紧密相关。标绘数据大规模的增长出现,为许多研究领域带来了新的机遇和挑战,吸引了研究人员的兴趣和广泛关注。  与其他数据相比,标绘数据具有独特性质,它不仅仅具有地理位置,同时具有时间属性,在科技的发展与推动下,标绘数据同时还具有数据量巨大,增长速度快,数据结构多样,质量高低不一等特点。此外,标绘数据蕴含的信息丰富,很有挖掘价值,通过数据挖掘手段发现其隐藏的知识,能够更好的提供支持决策服务。  首先本文研究了Web数据获取方法,实现了封装HTTP请求的标绘数据抓取中间件;根据标绘数据的特性及其关联特征,利用空间数据库PostGIS实现了海量标绘数据的存储。然后利用已获取的标绘数据的空间位置特征、用户信息以及位置POI类别信息等,对海量标绘数据进行了初步的清洗和筛选;利用中文分词将标绘数据中的非结构化的文本信息转换为文本特征向量,并通过关系数据库的关键词筛选手段对标绘数据进行深层次的清洗,实现了面向主题的标绘数据提取。最后基于K-means算法、核密度估计法和Apriori算法,将其运用于标绘数据热点挖掘和时空关联规则发现,计算标绘数据在空间上的热点分布区域,分析标绘数据蕴含的空间事件共现等关联模式。  基于上述提出的标绘数据热点挖掘与时空关联规则发现方法,本文以新浪位置微博为例,获取了我国五一、十一假期间旅游标绘数据,运用热点挖掘方法,分析了我国五一、十一假期间旅游热点分布和热力态势情况,运用时空关联规则挖掘方法,研究了旅游目的地与目的地之间的关联规则,客源地与客源地之间的关联规则以及旅游时间与旅游目的与客源地的空间关系之间的关联规则。  结果表明,标绘数据的时空属性特征可应用于数据挖掘研究中,本文形成的标绘数据挖掘思路及方法可发现标绘数据热点与关联规则,将其应用于旅游中,有效的挖掘了旅游标绘数据的热点及时空关联规则。通过热点挖掘,反映了我国假期旅游的热门地区及热力分布,通过时空关联规则挖掘,发现了假期游客景点选择之间、旅客来源地之间及游客出行时间与出行目的地与客源地的空间关系之间的关联关系,为旅游出行决策提供了信息。
其他文献
2016年10月,久保田博二来到北京,参加自己在中国的个展“观之物语”的开幕式。作为马格南图片社当代唯一的日本摄影师,以及继土门拳之后日本当代纪实摄影的代表人物,他的影像作品有自己独特的风格,朴实而又夹杂着一种难以言说的温度。  久保田博二1939年出生于日本东京神田,上大学时,他开始用父亲的相机记录日本的学生抗议活动,由此对摄影产生了浓厚兴趣。1961年,三位马格南摄影师——勒内·布里(René
光学奇偶交错复用器(Interleaver)作为密集波分复用系统中的重要器件,其技术正在迅猛发展,但是如果将其用于传播40Gb/s的光信号时却会造成带宽资源的浪费。为了能够在对整个
硼酸铝一维纳米材料由于其具有优异的力学性质,高温化学稳定性,低的热胀系数以及与传统增强材料碳化硅相比低廉得多的生产成本,成为物理、化学和材料等领域争相研究的热点材料。
课堂教学是教学的最基本形式,是学生得以进步的重要渠道之一,小学语文课堂教学时间为四十分钟,但仅在二十分钟之内孩子能真正集中注意力学习.因此要实现小学语文课堂教学效益
课堂教学是一门艺术,课堂则是教师和学生互动产生艺术效果的场所.营造开放的学习氛围,提供全方位综合运用英语的途径,激发学生的求知欲,调动学生的主观能动性,才能有效地培养
随着计算机技术、光学和光电子技术的迅速发展,物体三维面形测量成为现代光学计量的一个重要分支,极大的改变了传统的光学计量技术。三维测量技术的不断发展,满足了人们对三维面
应试教育的硬伤是一种灌输式的教育方式,学生只有听从老师的灌输,不能很好的表达自己的想法.师生互动教学是新课程实施的重要体现,也是目前世界上许多国家普遍采用的一种富有
农村留守儿童处于身心成长的关键时期,却无法享受正常家庭的抚养教育,留守儿童心理健康问题已经成为农村学校不容忽视的问题之一.随着我国城乡经济体制改革的深入红和现代化
那么怎样才能激发学生的学习兴趣呢?我认为首先要让学生对教师感兴趣,学生才能对这个学科感兴趣,所谓“亲其师,信其道”也.这就要求教师要有足够的“魅力”,不光是外表让人感
本文以研究超宽带光导脉冲源的核心光导开关的工作原理和实际应用为目的,模拟了光导开关在线性工作模式下的输出电脉冲,研究了光导开关的线性模式,对非线性模式进行了分析,并结合