【摘 要】
:
随着我国互联网技术的快速发展,人们逐渐使用电子设备通过网络通道来进行日常的工作和交流,广大网民成为了网络舆情信息传播的主要介质,网络中的舆情信息爆发式增多。冗长的
论文部分内容阅读
随着我国互联网技术的快速发展,人们逐渐使用电子设备通过网络通道来进行日常的工作和交流,广大网民成为了网络舆情信息传播的主要介质,网络中的舆情信息爆发式增多。冗长的舆情数据不仅严重浪费舆情信息分析人员的时间和精力,而且其内容中的不良言论也会给社会稳定带来影响。此外,在海量鱼龙混杂的网络数据中存在大量对相关部门有价值的舆情信息,如何获取并高效地分析这些数据从而帮助有关部门更好的了解社情民意是一个亟待解决的问题。基于以上问题,本文对网络舆情信息识别与分析中所涉及到的文本摘要技术和文本分类技术进行了相关研究与探索。本文的主要工作包括:1、针对舆情信息文本过长以及信息中存在主观情感内容的问题,基于带注意力机制的Seq2Seq模型实现了文本摘要模型,为每条舆情信息生成一个简短的摘要信息,将舆情信息简洁化,并使用Coverage机制解决模型生成过多重复词语的问题。2、针对目前生成式文本摘要模型对于文本主题信息利用较少的问题,使用一种有监督算法提取出文本的关键词信息,并利用此关键词信息对注意力机制进行改进,使模型对文本主题信息更加敏感,从而使得模型的效果得到提升。3、针对目前大多数生成式文本摘要模型都是从词级别或者字符级别对原文进行编码的问题,提出了一种双编码器文本摘要模型,同时从词级别和子句级别对原文进行编码,使得解码器所使用的语义向量包含的信息更加丰富,模型生成的摘要更加准确。4、针对文本摘要模型编码器输入序列过长,RNN编码器在编码的过程中逐渐丢失原文中靠前位置编码信息的问题,提出了一种双阶段式文本摘要模型。首先利用有监督算法将原文中与文本主题更为相似且含有更多文本关键词的子句挑选出来,然后将其作为生成式摘要模型的输入进行第二阶段的训练,在减少网络时空开销的同时提升了模型效果。5、针对舆情信息过于零散和杂乱,难以从中获得高层次有价值信息的问题,使用文本分类技术将信息结构化。并以成都地区网络警情信息为例进行分析,根据其数据特点基于CNN设计并实现了一种新颖的文本分类模型SPCNN,其分类效果优于其他对比模型。
其他文献
软件定义网络(Software-Defined Networking,SDN)将传统网络设备的控制面和数据面分离,让网络设备只保留分组转发等数据面的功能,而将控制面的功能放到一个集中式的控制器中。这种分离使数据面和控制面可以独立地发展,有利于网络功能的创新。在SDN的架构中,管控网络的功能由控制器中安装的应用来实现,因此可以灵活地处理网络中发生的事件(如新流到来或链路故障等),还能在控制器运行时动
由于温室效应和能源短缺等世界性问题日趋严重,采用高强轻质合金代替传统钢材以实现汽车轻量化是大势所趋。6061铝合金因其具有较低密度、中等强度、良好的塑性和耐腐蚀性而
本文研究了新视界第一定律是否仍然适用于f(R)引力。在广义相对论中,由新视界第一定律,可以得到静态球对称黑洞的熵和能量。推广到f(R)引力,考虑物质的最小耦合,对作用量作变分,得到引力场方程。在静态球对称时空下,假设视界上的状态方程形式,把f(R)引力的径向场方程写成两部分的组合,其中一部分包含温度项,另一部分则不包含温度项。在视界上,假设视界半径微小的变化,可以得到新视界第一定律的微分形式,进而
随着光伏接入电网的比例不断增加,其随机波动性对于电网供需平衡及安全稳定的影响也愈发严重,直接影响到电能质量以及光伏能源的有效消纳。通过对光伏功率输出量进行预测,对电能供应提前进行调度,可以保证供电侧与负荷侧的功率平衡,减小光伏发电波动对电力系统稳定运行的影响。目前,神经网络仍是最为常用的光伏功率预测方法之一,但传统的神经网络预测模型主要使用离线学习模式,依赖离线历史数据训练的模型投入在线运行后不再
近年来存储与计算能力出现的爆发式增长让人们相比以往能够更全面、更实时的获取信息数据。提供更便捷、高效的服务的同时也生成了数量庞大的数据信息。将海量数据转化为业务需求的极高的困难性,对各个领域造成巨大的冲击性。在安全领域更是带来更大的变革,传统的网络安全防护需要依靠安全专家自身知识领域的广度与深度。但随着安全漏洞层出不穷、攻击利用方式多种多样,依赖于专业人才的安全防护方式已经不能满足需求,人们开始着
Schr(?)dinger方程是揭示微观物理世界物质运动的基本规律的方程,1925年,由奥地利物理学家Schr(?)dinger建立的,它是量子力学的基本方程.本文主要考察两类初值条件的分数阶导数的
非线性偏微分方程在描述非线性现象中具有重要的作用,目前已在力学、物理化学、工程技术及大气科学等领域中广泛应用.由于非线性项的存在,使得非线性问题的解析解难以得到或
微博已经成为一种信息获取的重要途径和信息传播的载体,微博上的虚假信息的大量传播可能会造成恐慌,因此有必要对微博中相关的舆论话题进行监管。准确地预测微博的传播趋势有助于提前对舆论进行干预,并采取合理的管控措施,使其朝着积极的方向发展,使微博更好的服务大众。传播趋势预测在舆论监管、政府宣传、广告投放、票房预测、热点推送和企业营销等领域有着广泛应用。一方面,传统的微博传播趋势预测方法通常只关注微博自身内
扶新隆起带泉三段杨大城子油层是吉林油田下一阶段重点勘探开发的层系之一,具有良好的开发潜力。但其一直是泉四段兼探层位,前人投入的工作量和研究资料都较少,对整个扶新隆
“十二五”以后,我国经济发展进入一种新常态。在提质增效特征下的经济“新常态”,我国的经济发展的主要任务:一是深化改革,二是产业结构调整升级。在产业结构演进过程中可能会对财政收入产生相应的影响,进而对财政支出规模与支出结构产生相应的影响。宏观税负体现了一国的整体税收负担水平,它反应了国民经济的整体宏观调控能力,为一国制定合理的税收政策提供了依据。从以往研究来看,国内外学者普遍关注经济增长对税收增长的