深度词汇网络学习舆情监测关键技术的研究

来源 :北京化工大学 | 被引量 : 5次 | 上传用户:Monkeysct
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网以及通讯技术的飞速发展,以互联网为基础的新型舆情传播媒体逐渐代替传统媒体,成为人们获取与传播舆情信息的主体。由于互联网的实时性、高效性,舆情信息往往呈爆炸式增长,采用传统方式进行人工舆情分析预警难以满足当前需求,因此研究网络舆情监测相关技术,构建监测系统进行自动分析预警,成为当前研究热点。本文研究了舆情监测和分析中的关键技术,主要内容如下:(1)研究舆情监测中的特征提取技术,提出了一种基于词汇网络的文本特征提取方法。该方法中,通过提取文本特征词频、文本特征相关性及特征语义相似度等结构性信息,将文本数据以图的形式表示,采用网络关键节点发现技术,抽取图中关键节点作为文本特征。实验证明,通过该方法获得的文本特征向量具有更好的聚类特性。(2)研究了特征编码技术,利用组稀疏深度学习对高维文本特征向量降维。并改进Single-Pass曾量聚类模型,以覆盖率作为特征相似度计算方法,并在话题权值计算中提出备选特征向量,使其适用于深度学习降维后的特征向量。(3)设计并实现了网络舆情监测系统原型,系统基于以上研究结果,实现网络热点话题的发现与跟踪,分析话题中参与者的情感,以及实现话题传播预警。本文通过研究舆情监测关键技术,针对舆情监测中文本非结构化引起的特征提取不准确以及热点分析中特征向量高维稀疏带来的高复杂度问题,提出了词汇网络特征提取及基于深度学习网络降维的增量聚类方法,设计并实现一个网络舆情监测系统原型。
其他文献
随着三维扫描与建模技术的发展以及计算机硬件环境的改善,三维模型已经逐渐结合到诸多应用领域中,如:地质研究、文物与遗迹保护、游戏娱乐等。而三维模型的建模与绘制是这些
随着烟草行业体制改革的推进,烟草公司将逐步实现生产管理、市场营销、技术研发、物资供应“四统一”,这就对卷烟物资管理提出了更高的要求。建设烟草行业物资管理信息平台,
计算机网络性能是衡量计算机网络运行状态的各项指标的综合。计算机网络因其发展的高速度和各自为政的研究体制,以及兼容性等诸多问题,出现了一些和总体发展趋势及未来需求不
日益泛滥的垃圾邮件,既浪费用户时间、消耗了网络传输资源以及邮件服务器存储空间,也是病毒、僵尸网络等恶意代码的策源地。目前,应对垃圾邮件的主要方法和技术手段有很多,其
随着信息技术和电子产品的发展,嵌入式Linux系统已经广泛用于生产生活的各个方面,许多基于嵌入式Linux的硬件设备均需要一个高效率、可扩展的GUI。嵌入式Linux环境下,GUI的整
随着电信技术、IP网络的发展,人们对于新业务的需求的增加,使得传统PSTN(Public Switched Telephone Network,公告交换电话网)网络呈现出网络结构复杂,与IP网络难以融合,新业
电子政务是政府信息化建设的重点工程,在我国的电子政务建设规划中明确指出要加大力度进行政府门户网站建设。目前我国电子政务门户网站建设还没有统一的技术标准和构建平台,
网络技术的高速发展,使网络应用渗透到了国民生产及国家安全的关键领域,但是在网络通信的同时,出现了大量的网络攻击,对信息系统造成了巨大破坏,使网络安全技术成为了各国政府和研