论文部分内容阅读
重大事件趋势预测是指对影响国家或地区和平稳定的时政或军事事件演化规律的预测,是国际关系领域的一个热点研究问题。大数据时代的来临以及人工智能技术的发展,使得基于公开新闻数据的重大事件趋势预测成为可能。本文借鉴国际关系研究领域“事件数据分析法”的量化思想,为满足现有研究方法存在的特征指标构建以及事件趋势因果溯源上的需求,针对朝鲜核行为的趋势预测,南海争端中的征候事件检测与预测两方面开展研究。基于网络爬虫技术获取海量事件专题新闻数据,利用自然语言处理(Nature Language Processing,NLP)、机器学习等技术进行处理,构建预测模型并进行实验结果分析。论文主要内容如下:首先,由于当前基于海量新闻数据的重大事件趋势预测方法在特征指标构建方面严重依赖专家知识,这极大制约了相关方法的普适性与时效性。针对这一问题,本文提出一种融合语义与事件特征的重大事件趋势预测方法。分别利用潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)模型与基于模式匹配规则的事件抽取技术从语义及事件两方面进行相关特征指标的自动化构建,针对LDA主题模型在特征词提取上存在偏向性的问题,提出一种改进模型IDFLDA;对两类特征指标的互补性进行实验分析,验证了融合特征相比于单一特征的优越性;以朝鲜核行为趋势预测为例进行方法验证,提出方法的全时间段最佳预测准确率为86.2%,优于基于专家知识构建特征指标的传统方法预测结果。其次,为从事理层面对重大事件趋势预测结果进行合理性解释,本文对影响南海争端发展趋势中的征候事件检测与预测方法展开研究。将征候事件检测问题看作命名实体识别(Named Entity Recognition,NER)问题,提出一种基于Bi-LSTM-CNN-CRF的征候事件检测模型;将提出的检测模型作为数据标注模块,设计了一种基于LDA与多标签逻辑回归的征候事件预测方法;基于整理的南海专题新闻数据进行了征候事件检测与预测模型构建,对提出方法进行了验证。最后,对本文工作进行了总结与展望。