社交网络内容关系建模方法与可视化系统研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:q398197371
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的不断发展,社交网络平台也随之蓬勃发展。社交网络是信息获取和传播的主要平台,用户可依托平台对各种事件自由地表达观点并交流,但是这些海量的信息错综复杂的交织在一起,无法直观获取潜在价值,因此研究社交网络中的内容具有重大意义。通过研究内容进而分析用户行为,可以有效的进行舆情监控,为用户提供个性化推荐等。热点事件的出现均伴随众多的参与者,用户表达的观点复杂多样,若不能及时做出舆论引导或将导致严重的损失。本文研究基于社交网络内容展开。针对海量推文信息难以处理、不易发现热点事件的问题,首先基于统计学方法在时间维度分析推文的传播规律,并在海量推文内容中分析热点话题,挖掘用户感兴趣的热点事件,分析热点事件的持续时间并反向验证推文的传播规律;针对难以发现推文内容间存在的隐含关系问题,生成基于热点事件的内容关系网络模型并以关系图的形式展示,可更直观地挖掘影响力较大的推文及用户;针对未能对用户推文所表达观点做出有效分类的问题,提出针对热点话题的观点分类模型,可对推文内容做出有效分类。最终将上述工作内容设计并实现可视化系统,通过该系统可及时对热点事件做出舆论应对及管控措施。本文的主要研究工作如下:(1)提出了基于当日最大关键词热度的热点事件发现方法。使用基于前缀字典的无监督分词算法对推文内容做分词处理,统计分词结果进一步完善停用词字典,综合停用词字典与当日最大关键词热度对分词结果做双重过滤,将实验结果在时间维度上生成事件热度图,通过验证,实验结果与现实事件相吻合。(2)提出针对社交数据文本观点分类的BERT-CNN模型。由于BERT模型提取文本局部特征信息能力较弱,CNN网络多卷积核结构可很好地弥补BERT的不足。故在词嵌入层BERT末端引入CNN网络,构建BERT-CNN模型,在真实数据集下与多个分类模型对比实验,进而验证BERT-CNN模型在该数据集下表现最优。(3)提出了一种内容关系网络的生成模型。将推文作为可视化节点,推文关系与关键词关系作为节点连线,在关键词关系的基础上计算推文之间文本内容相似度,用内容相似度衡量推文之间内容关系强弱,并在可视化图像上有所展示,为内容关系网络可视化提供了一种思路。(4)独立设计并开发B/S结构的前后端分离可视化系统。对推特社交数据做了数据库设计,同时对数据表进行优化,大大降低检索时间,前端提供响应式页面,并在Echarts基础上二次开发,新增可视化结果支持人机交互功能。系统提供众多可视化接口,集成实验室多名同学的研究成果,提供可视化服务。
其他文献
中医理论和药理研究与现代先进计算机技术手段相结合的方案为中药药性理论提供了有力的科学支撑,帮助人们进一步地探究药性规律。中药药性理论包含四气五味、功能主治、归经和升降沉浮等,为临床合理用药提供了指导。植物药在中药中占有较大比重,由于植物生长环境、生长季节等不同,中药各有各的药性特征,这些特征可通过植物的形态学特征反映。现有研究表明植物药的科属亲缘、物象和药性之间可能存在联系,但是目前研究主要采用频
拟除虫菊酯类杀虫剂开发于上世纪70年代,是目前中国最常用的农药之一。研究发现拟除虫菊酯类杀虫剂与儿童脑瘤、白血病、青少年听力下降等疾病存在正相关性关系,并已证实在中国的水,沉积物和空气以及人群的尿液、母乳中均存在拟除虫菊酯类杀虫剂的残留,这已经引起了学术界和公众的关注。当前的研究对不同介质中拟除虫菊酯类杀虫剂的残留均有报道,但对该杀虫剂在海洋表层水的分布状况和风险缺乏研究。本研究主要以东海表层水为
读完沈从文先生的《边城》,总觉得像是渡了无数次的河,每次渡河的感觉都不尽相同。全文围绕着那条湘西小河展开,又在这条河上收尾。合上小说,我的心依旧在这河上漂,没有目的和终点。《边城》是一部乡村人物的过渡史。一切的转机都托付给了渡河这一具有象征意义的动作。翠翠从一个自然可爱、有着一对清明如水晶般眸子的女孩,变成了时常脸红、羞涩地跑上山去的青春少女。
期刊
随着信息化科技的快速发展,物联网技术应运而生,应用到各种场景中,实现万物互联、人机互通的智慧化建设,是当今和未来科技发展的重要趋势,无线通信作为信息化建设的关键技术,为物联网建设提供了解决方案。泛在电力物联网是物联网在电力场景应用的一部分,将电力系统各环节连接起来,通过无线通信技术实现具有全面状态感知的智慧系统。变电站作为电力系统中的核心,其无线网络覆盖必不可少,与普通场景不同,该场景中存在大量的
场景文本检测是计算机视觉领域中一个非常重要的研究课题。场景文本作为一种重要的信息载体,其检测技术已经广泛应用于图像/视频理解、视觉搜索、产品识别、自动驾驶、目标定位等领域。因此,场景文本检测技术的研究受到了很多学者的广泛关注。早期针对场景文本检测的研究,大多都选择使用文本框回归进行检测,该方法检测效率较高,但局限于检测矩形文本。最近,很多学者选择使用基于像素级分割的网络来检测不规则文本,并取得了很
在自然图像中,阴影的存在既可以给我们提供关于场景和光照条件的信息,也可以帮助我们了解图像中的场景情况,但与此同时也给图像处理在技术上增加了难度。在图像处理领域对于阴影的处理通常是将其去除,而去除之前先要对其进行准确的检测定位。随着深度学习的发展,给图像阴影的研究开辟出一条新的道路。但在该领域仍然存在着诸多研究瓶颈,例如在阴影检测方面,阴影边界不明显、细节处理粗糙等;在阴影去除方面,恢复的无阴影图像
在国家“互联网+”智慧城市战略的指导下,全国掀起了建设政务大数据服务系统的热潮。然而政务大数据服务系统在海量数据压力下容易出现性能瓶颈,如果不能及时定位原因及采取解决措施,将存在系统崩溃的风险,可能会造成严重后果,因此亟需设计一个高效的性能测试平台。本文围绕大数据系统性能测试关键技术展开研究,并进一步构建政务大数据服务系统性能测试平台,此研究成果将直接为政务大数据服务系统的测试验证与调优提供强有力
当前企业逐步追求高质量、高效率发展,实施精细化管理理念,进一步提升经营水平。对于一些大型制造企业和有大量物资存储,对接众多供应商的企业来说,更多的将其物流和仓储业务转移至第三方物流公司,以将精力转移至核心业务。但是对于第三方物流企业来说,难以完全掌握需求方和多个供方的物资数据信息,而多家厂商提供的物资存在名称不统一,信息不全面的问题,且供应商名录和其供应的物资都是不断变化的,这使得第三方物流企业难
磁粉密封具有耐压能力强、可耐高温、可耐低温、结构简单可靠、无污染等特点,在解决摆动喷管阴阳球头的密封问题上极具研究价值。本文从理论、有限元分析和实验三大方面对磁粉旋转密封的理论和密封性能进行研究,为解决磁粉密封问题奠定了基础。(1)在理论上提出了各极齿处的磁感应强度梯度的和是衡量磁粉密封装置耐压能力的重要参数,研究了多孔介质的连续性方程、质量守恒方程以及可压缩与不可压缩介质在多孔介质中的渗流控制方
目前我国城市轨道交通车辆控制系统电压分为DC24V以及DC110V两种。在车辆正常行驶过程中,车辆辅助逆变系统通过充电机为蓄电池充电,再由蓄电池为控制系统供电。若蓄电池出现故障,则会导致车辆控制系统断电。因此需要设置应急启动电源。为使得城轨车辆在蓄电池溃电情况下,可通过控制系统启动,并为蓄电池充电。本文通过DC-DC开关变换器,将接触网上电压降压至控制系统供电电压,实现控制系统应急启动。本文根据城