面向“一带一路”的社交网络舆情空间语义关联分析

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:zxhdbd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代,如何快速、高效的对海量的多源数据进行分析并建立舆情监控和引导机制从而为管理者提供决策支持是当前研究的热点和难点。随着空间数据采集、存储和分析处理等现代技术手段的迅速发展,一方面,空间数据量急剧膨胀,复杂性显著增大;另一方面,空间数据库存在的大量空间数据及其相关的非空间数据中隐藏的许多重要的信息未得到充分利用,尤其对于网络舆情数据分析方面发展缓慢。新浪微博在我国拥有上千万的用户量,每天产生大量的用户信息,分析和挖掘新浪微博舆情数据具有很高的应用价值。本文针对目前研究新浪微博网络舆情较少的前提下,以面向“一带一路”的社交网络舆情空间语义关联分析为研究方向,利用新浪微博网络舆情数据,通过自然语言处理和空间分析等方法,主要完成了以下内容:(1)通过分析关于“一带一路”话题的新浪微博网络舆情数据,设定用于数据获取的关键词,并通过数据爬虫技术和新浪微博开放平台提供的数据接口两种方法获取到新浪微博网络舆情数据。(2)对获取得到的新浪微博网络舆情数据进行分析,设计网络舆情数据存储类型和数据组织形式,并使用MySQL网络数据库对数据进行存储,构建主键和数据库引擎,使数据的检索等操作更为便捷。(3)选择了合适的获取地理空间数据方法,包括博文文本自带的地址数据、IP地址解析等,通过百度地图地址解析API得到百度地图坐标系的经纬度坐标,并通过坐标系转换获取图块坐标。通过中文文本分词技术对博文文本进行分词处理,统计了博文热词词频,得出了高频热词,并通过分析新浪微博话题表现形式,结合高频热词总结出了热门话题。(4)构建文本语义相似度分类模型,实现了对未知博文文本自动分为对应的主题类别。通过构建语义树,计算了基于主题的语义关联度,得到了语义树各个节点之间的关联度,为信息检索提供了支持。对网络舆情进行了时空特征分析,总结了网络舆情按照时间和空间上的变化规律和分布状况。针对百度地图瓦片服务,实现了基于瓦片图块的空间语义聚类分析。(5)结合WebGIS相关技术,利用Vue、Laravel等开发框架,构建了基于B/S的面向“一带一路”的社交网络舆情空间语义关联分析可视化平台。
其他文献
为贯彻乡村振兴战略,落实质量兴农、绿色兴农、品牌强农和"农业质量年"行动的有关要求,3月15日,农业部农业机械试验鉴定总站(中国消费者协会农机质量投诉监督站)联合天津、黑龙江
采用搅拌摩擦焊对5mm厚7050铝合金板进行焊接,对焊核区洋葱环的宏观形貌、微观组织进行分析,并研究洋葱环对接头性能的影响.结果表明:焊核区出现的洋葱环组织实际是由粗晶带与
相邻环境权是环境权与相邻权的权能互相结合的结果。我国相邻环境权的法律渊源是《中华人民共和国物权法》第90条。由于《中华人民共和国民法通则》中规定的相邻关系处理原则
期刊
本文论述了高职院校把计算机基础课程和全球IC3计算机综合应用能力国际认证考核标准相结合,引入IC3模块化教学方式,采用国际化、全球标准测评平台训练学生的做法,突出了学历教育
随着我国经济的飞速发展,工程建设项目规模不断扩大,在工程施工过程中,变电设备的维护工作不容小视。我国在学术范围内也对变电运行设备的维护工作进行准们研究并取得一定进展,有
1.选药和用量要因人而异,不要听别人的推荐选药,要按自己的特点选药,要听从你的主治医的指导,合理用药。
本文作者根据现代心理学,语言学研究成果,对学习第二语言的个体差异和教学对策,进行了具体分析和推理论证,认为造成差异的原因是多方面的,其中年龄差异、动机差异,态度因素、
本文得到了函数exp(q)的含n个自由参数的p阶(n,n)有理逼近的系数公式,这里P≥n≥1。得到了这类有理逼近为A-可接受的充要条件。作为特例,给出了exp(q)的含4个自由参数的不低于4阶的
自保是企业风险管理的自主意识的行为,已越发成为国际上企业转移风险的有效手段。自保形式分为自保基金和自保公司。自保在中国主要以自保基金的形式存在,但整体上是数量少,规模