微博舆情的算法分析与系统实现

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:annhongmay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络的快速发展使得人们越来越方便的查看各种各样的社交平台,与此同时,每天所产生的数据量也相当可观,如何好好的利用这些数据也成为了学者的研究热点。而在众多社交平台中,微博因为其更自由、更快捷的优势,渐渐成为了国内最流行的社交平台之一。本文结合基于文本的多种分析方法,设计并实现了构建于B/S之上的微博舆情分析系统。该系统可以快速展现微博平台舆情动态,明显提高监控和了解目标舆情发展走向的时效性和便捷性。详细工作内容主要为以下几个方面:(1)数据采集层面。针对系统的数据采集,本文设计了一种分布式网络爬虫,用于收集每条微博信息下用户所发表的言论,其次,针对数据反爬机制和增量爬取,进行了改进,使得采集效率大大的提高;(2)系统业务逻辑层,共使用两种机器学习方法,即SVM算法、朴素贝叶斯算法,和四种深度学习方法,即CNN、LSTM、CNN+LSTM、BiLSTM算法,对用户发布的舆论文本进行了情感极性分析,并在此基础上实现了基于TextRank算法的关键词提取和文本摘要,DBSCAN算法聚类和目标舆情预警等功能;(3)系统实现层面。微博舆情分析系统共设计了四个层次,分别为数据采集层、数据存储层、分析层和呈现层。本系统与传统的舆情分析系统相比较来说,结构更加的清晰,功能划分也更加明了,易懂;(4)在系统保障层面,从系统功能、性能和可用性三个方面,验证了系统功能完整性和有效性,保证了系统的高效率和稳定性。
其他文献
相比传统人脸检测方法,运用深度学习理念的人脸检测算法在检测精确度上有很大优势,它拥有深层次的主干网络,能够提取到图像中更抽象的特征值,模型结构更加复杂,候选框等参数
在磁惯性聚变的套筒压缩磁化等离子体内爆过程中,真空和套筒界面、套筒和燃料界面由于MRT不稳定性导致扰动剧烈发展,影响聚变等离子体品质。MRT发展程度及其调控是影响磁惯性
随着智能制造时代的到来,机器人技术的发展受到了人们的广泛关注。智能移动机器人可应用于工业和服务业,节约大量的经济与人力成本以及丰富人们的生活。在智能移动机器人执行
随着大数据时代的到来,政府数据开放运动在全球范围内开展起来,各国政府将开放政府数据上升到国家战略的高度,这说明各国政府已经认识到开放政府数据的重要性。我国政府也不例外,近年来,政府部门积极开展政府数据开放工作,挖掘政府数据的潜在价值,充分意识到政府数据开放的重要意义。本文通过文献调查法对国内外政府数据开放相关研究进行整理分析发现,目前国内学者对于政府数据开放与公众服务等方面研究较少,而开放政府数据
为了更好地胜任不同行业的口译工作,口译员不仅需要掌握必要的语言知识,还应当广泛涉猎,增加言外知识储备。国内外学者的研究表明,言外知识对口译的各个环节都有着重要的影响,与口译成效正相关。本文首先从前人的相关研究切入,对言外知识进行界定并概括其对口译的普遍影响;之后以笔者参与的第二届“一带一路”国际合作高峰论坛普京记者会俄汉交传模拟会议为探讨案例,分析口译过程中言外知识带来的积极影响及言外知识不足引起
实验作为加深学生对理论知识的理解,培养学生动手实践能力的重要手段,近年来正在得到各大高校的重视。远程虚拟实验是一种高效灵活的实验方式,不仅解决了传统实验模式存在的
近年来,多标签学习在文本分类、图像识别以及生物信息学等多个领域受到广泛关注。目前多标签学习关注的主要问题包括标签关联性以及标签复杂度,而分类器链方法是一种兼顾标签
目标跟踪来源于人类生活中常见的注视行为,它是计算机视觉中最基础且重要的任务之一,被广泛应用在军事、安防、人机交互、医学临床诊断等领域。当前研究比较火热的目标跟踪算
21世纪是海洋的世纪,随着世界人口不断增加,资源短缺等问题日益严峻,世界各国竞相将目光投向海洋,加快对海洋的研究和海洋资源的开发利用。我国是海洋大国,海洋经济发展前途
回指是指用代词或其他简略的语言表达式来代替上文中提到的另一语言表达式的依存关系。它有两种形式:受句法限制的表层回指和受语用支配的深层回指。在表层回指中,只有语篇内