基于事理图谱的事件分析方法研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:frkzhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,网络媒体发生了翻天覆地的变化。人们获取新闻的方式从最初的纸质媒介,例如报纸、图书、期刊等,转为互联网媒介。随着网络媒体规模不断增大,网络上的新闻数量也呈指数式增长。面对铺天盖地的各式各样的新闻报道,用户很难掌握事件脉络,并从海量新闻报道中发现自己想要看到的话题,以及掌握当前的热点话题事件。为了方便用户在短时间内快速地掌握到当前的网络媒体新闻,捋清各种事件关系,就需要对新闻数据进行深入分析和挖掘,从各种新闻数据中提取出隐藏信息。本课题对网络媒体中的新闻数据进行深度分析和挖掘,方便用户对网络信息的快速提取和丰富获取。基于这一目标,进行了以下内容的研究:1)提出一种融合句法依存关系的事理图谱构建算法。在事件关系的抽取模块,本课题基于句法依存分析树提出一种新颖的结构:事件依存图,并基于事件依存图设计了一种将事件因果关系、时序关系联合抽取的BEGC模型。该方法强调句子中各元事件的依赖关系,且模型在新闻语料库上进行实验评估,表现优异。2)提出一种基于事理图谱的主题事件检测模型。将事理图谱和GCN结合,设计了 Evolutionary Graph-GCN模型,利用事理图谱的结构以及文本词之间的关系,对文本特征进行提取,对新闻文本表示进行学习。该方法融合图谱结构特征以及文本、词之间(文本和词、词和词)的关系特征学习文本表示向量,进行事件发现任务,在数据集上的大量实验表明,我们的模型在F1和NMI两个指标上优于主流模型。3)提出一种基于方面的热点事件检测算法。考虑新闻的方面特性,归一化计算新闻事件的热度值指标,选择出各领域中的热点事件,给兴趣范围各不相同的用户提供不一样的筛选结果。在数据集上的实验结果表明,我们的模型在保证准确率和召回率的前提下,可以使实验结果均衡地分布在各领域,满足兴趣点各不相同的用户,在数量标准差这一指标上表现优异。4)设计开发了基于事理图谱的一体化新闻事件分析系统。集成了多个算法组件,并提供友好的交互界面。可以支持用户通过关键词搜索相关新闻以及查看相关新闻的元事件、查看相关新闻数据所生成的事理图谱、以及查看相关新闻的主题事件和某领域一段时间内的热点事件。
其他文献
为了了解不同类型墩柱的40m T桥在施工及成桥阶段桥梁的稳定状态,文章采用Midas有限元软件建立模型,首先研究了30 ~ 80m墩高下圆柱墩、矩形墩、空心墩各阶段桥梁失稳状态,然后分析了墩梁连接形式对桥梁整体稳定性的影响;最后针对不同联长(3、4、5跨一联)的上部结构对桥梁整体稳定性进行分析.结果 表明,随着施工的推进,桥梁整体稳定性逐渐降低;成桥阶段,墩梁固结能够大大提高桥梁稳定性,墩高大于30m时建议墩梁固结;联长对墩梁不固结桥梁整体稳定性基本无影响,对于墩梁固结桥梁,联长越长,成桥阶段桥梁整体稳定