基于海量新闻数据的重大事件趋势预测研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:twffhvknnh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
重大事件趋势预测是指对影响国家或地区和平稳定的时政或军事事件演化规律的预测,是国际关系领域的一个热点研究问题。大数据时代的来临以及人工智能技术的发展,使得基于公开新闻数据的重大事件趋势预测成为可能。本文借鉴国际关系研究领域“事件数据分析法”的量化思想,为满足现有研究方法存在的特征指标构建以及事件趋势因果溯源上的需求,针对朝鲜核行为的趋势预测,南海争端中的征候事件检测与预测两方面开展研究。基于网络爬虫技术获取海量事件专题新闻数据,利用自然语言处理(Nature Language Processing,NLP)、机器学习等技术进行处理,构建预测模型并进行实验结果分析。论文主要内容如下:首先,由于当前基于海量新闻数据的重大事件趋势预测方法在特征指标构建方面严重依赖专家知识,这极大制约了相关方法的普适性与时效性。针对这一问题,本文提出一种融合语义与事件特征的重大事件趋势预测方法。分别利用潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)模型与基于模式匹配规则的事件抽取技术从语义及事件两方面进行相关特征指标的自动化构建,针对LDA主题模型在特征词提取上存在偏向性的问题,提出一种改进模型IDFLDA;对两类特征指标的互补性进行实验分析,验证了融合特征相比于单一特征的优越性;以朝鲜核行为趋势预测为例进行方法验证,提出方法的全时间段最佳预测准确率为86.2%,优于基于专家知识构建特征指标的传统方法预测结果。其次,为从事理层面对重大事件趋势预测结果进行合理性解释,本文对影响南海争端发展趋势中的征候事件检测与预测方法展开研究。将征候事件检测问题看作命名实体识别(Named Entity Recognition,NER)问题,提出一种基于Bi-LSTM-CNN-CRF的征候事件检测模型;将提出的检测模型作为数据标注模块,设计了一种基于LDA与多标签逻辑回归的征候事件预测方法;基于整理的南海专题新闻数据进行了征候事件检测与预测模型构建,对提出方法进行了验证。最后,对本文工作进行了总结与展望。
其他文献
本文试图在生命周期假说的框架下解释Gourinchas&Jeanne(2013)所提出的"配置之谜",即在发展中国家当中,增长率越高的国家越倾向于输出资本,而不是像经典理论所预测的那样,吸
<正>~~
会议
目的:构建大鼠正畸牙移动(OTM)模型,研究不同正畸力作用下大鼠牙周组织中Survivin、Caspase-3及ICAM-1的表达情况,探讨正畸牙移动的分子机制,为临床正畸提供一定的理论依据。
某化工厂碳酸钡车间工人孙某、张某值夜班时 ,吩咐一临时工提开水 ,该临时工很不满 ,将碳酸钡投入热水瓶中作为报复 ,孙、张二人饮用热水过程中发现瓶底有白色沉淀 ,产生疑问
[目的]探讨厂矿企业职工近期乙肝痫毒(HBV)感染状况,以使加强厂矿企业职工的健康管理。[方法]2005年8月至2004年7月,对阳西县88家厂矿企业的职工4442人进行血清HIV感染指标的检测
本文简要描述了在村通工程中风光互补供电系统及其应用示范情况,以一个典型的实例分析了系统运行情况。经过1年的运行证明,该系统设计合理,能够满足边远地区卫星通信工程中的用
<正>经皮冠状动脉支架植入术(PCI)具有微创、治疗效果好、局部并发症少、恢复快等优点而成为目前常规治疗冠心病的重要手段[1],但由于PCI不能消除引起冠状动脉粥样硬化的潜在