基于带地理标签的Twitter数据的本地事件探测系统的设计与实现

被引量 : 0次 | 上传用户:lonely
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生活中居住在节奏很快的城市生活中的人们总会在各种地方遇到各种计划或未计划到的事件,人们很可能被没有预见的事件延误或耽搁。本地事件探测成为了一种生活需求。随着社交网络的发展和智能手机的普及,带地理位置标签的数据也使得这种本地事件探测系统可以提供给人们一些准确的正在发生的事件信息。本文将主要讨论一个基于带地理标签的Twitter数据的本地事件探测系统的设计与实现。该系统可以自动根据社交网络Twitter中的实时数据来探测相应地理位置区域内的本地事件。探测结束后,本地事件结果会以地图标注的形式显示给用户。为了达到更高的探测精度,本文中的本地事件探测系统采用了一定的数据挖掘策略,首先抓取源数据信息并对候选事件进行提取,其次根据候选事件的特征将本地事件筛选出来。第一种策略采用聚类的方式,第二种策略是通过对本地事件特征的训练来进行分类。事件探测的准确性会在这两种策略的支持下提升。本文的另一个关键点是对于DBSCAN聚类算法和逻辑回归分类算法的实现。传统的两种算法都是在单机上运行的,而为了应对社交网络中所可能产生的大量无结构数据,两种算法都是在MapReduce框架上的设计和实现。从而使系统可以应对社交大数据,并能有更好的表现本文详细描述了对基于带地理标签的Twitter数据的本地事件探测系统的开发周期:需求分析,系统设计,系统实现以及系统的测试和部署。并在技术要点中详细介绍了本地事件探测算法,DBSCAN聚类算法以及逻辑回归分类算法的设计与实现。
其他文献
<正>"老羞成怒"与"恼羞成怒",这两个词在书写上只有一字之差,并且都有因羞愧而发怒的意思,是一对近义词,但这两个词的意义和用法还是有区别的。且看下面的几个句子:(1)这只乌
期刊
《优秀课例与教学设计点评(初中部分)》《优秀课例与教学设计点评(高中部分)》《感悟与超越》两年一届的“全国思想品德和思想政治优质课观摩与展示”活动是全国中学政治课堂
在兼顾充电站运营者和电动汽车用户双方利益的前提下,提出了一种基于全社会成本最小化的充电站规划布局的优选模型。在充分考虑路网结构、车流信息和用户路程损耗等影响因素
以马铃薯蛋白替代部分奶粉,生产低脂高蛋白营养型乳饮料。以产品的稳定性和感官评分作为考察指标,通过单因素试验及正交试验研究确定马铃薯蛋白乳饮料的最佳工艺配方。表明马
<正>"过去孩子回家作业做到十点多种,遇到难题皱眉苦思到十一二点,而且孩子也特别讨厌老师布置很多的课外作业,每次都会遇到很多不懂的问题,可现在孩子回家完成作业的速
目的探讨后腹腔镜治疗肾癌手术后淋巴漏的发生、诊断、治疗和预防措施。方法回顾性分析行后腹腔镜。肾癌根治手术发生淋巴漏的12例患者的临床资料。结果12例患者临床表现为术
以花生和木瓜为原料,利用木瓜中含有的蛋白水解酶将花生中的蛋白质水解成功能性多肽,再经调配制得木瓜花生多肽饮料。考察了木瓜花生配比、p H、温度、时间等水解因素对多肽
近年来,人工智能开始越来越多的出现在不同的场景当中,无人车平台的交通广播音频信息检索系统就是其中的一个应用。交通广播音频信息检索系统是基于语音识别、自然语言处理等技
传统空分技术生产运行压力高、电耗大、能耗高,采用LNG冷能为空分工艺提供冷源,已成为节约资源、减少能耗的有效方式之一。然而,现有的LNG冷能空分技术仍存在空分余冷利用不充分
在互联网的带动下,农产品冷链物流需求越来越大,而成本一直是制约冷链物流发展的关键因素,如何有效降低冷链物流成本成为国家、企业和消费者共同关注的热点话题。与此同时,冷