基于词扩展LDA的铁路事故致因分析方法研究

来源 :北京交通大学 | 被引量 : 7次 | 上传用户:budd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
铁路系统的自动化、智能化和集成化程度日益提高导致人机交互的难度也随之加大。因此,人和组织因素已成为引发铁路事故发生的重要原因。为防止类似的事故再次发生,可通过对铁路事故报告的细致分析,确定导致事故发生的源头和传播机理,从而有针对性采取相应的安全策略。本文提出了基于文本挖掘的铁路事故致因分析方法,针对铁路事故文本特点,设计特征提取算法提取事故中人和组织因素并对其进行定性定量分析,论文主要工作如下:(1)为从事故报告中提取导致事故的人因和组织因素,提出了词扩展-隐含狄利克雷分布(EW-LDA)主题模型,利用TextRank算法确定词的重要性,结合词分布和文档分布之间的语义相似度对主题词进行扩展。仿真结果表明,与传统LDA模型相比,本文提出的EW-LDA主题模型能够提取出更多和事故致因相关的特征。(2)基于提取的事故文本特征设计了 HFACS-RAs的改进模型并构建了结构化事故数据集。按照人和组织不同层面对事故原因进行详细分类,将不安全行为的前提条件进行进一步细分为任务条件、环境条件和个人条件,每一个层次根据提取的事故文本特征进一步划分至更具体的因素。考虑到改进的HFACS-RAs中具有父类和子类两级事故致因,利用支持向量机(SVM)将事故报告按照事故致因进行两级分类,构建了结构化的事故数据集。(3)为了找出引发事故的最关键致因,使用改进贝叶斯网络(BN)构建定量分析模型,设计了基于改进卡方检验的贝叶斯网络结构优化算法。以改进的HFACS-RAs模型中上层与下层因素间的关系确定节点间弧的方向,以文本特征提取和分类处理得到事故数据集(AD)为基础,结合无约束0/1优化的卡方检验构建全局因果关系度量,从而实现最优网络结构。针对铁路事故数据特点,设计了基于Logistic回归的条件概率参数学习算法,实现了贝叶斯网络中条件概率参数的估计。(4)将建立的改进贝叶斯网络模型应用于实际案例,验证了模型的有效性,使用贝叶斯网络推理分析了事故的因果关系,同时通过敏感性分析识别了导致事故发生的最关键因素。
其他文献
本文以赴日留学生为对象,对影响留学选择的诸多因素,特别是文化因素进行了实证分析。借鉴过往大量文献的研究方法,本文的理论模型采用以引力模型为基础的留学生移动模型;分析
目的探讨应用水胶体敷料对糖尿病患者指尖血糖监测后手指疼痛,感染的护理。方法选择112例门诊、住院患者,血糖监测频率每日≥5次。针刺指尖后感觉指尖疼痛93例,针刺部位红肿1
发展日新月异,宣传突破创新。党的十八大以来,我市党风廉政建设宣传工作突出重点、注重创新,加强沟通、务求实效,着力构建反腐倡廉宣教大格局,为我市党风廉政建设和反腐败工作创造
报纸
在5万t/a短纤维装置上,通过选择合适聚酯熔体添加剂,合理分配纺丝速度和拉伸倍率,优化集束穿丝及分丝方式等措施,成功开发出了1.33 dtex×38 mm缝纫线用超有光涤纶短纤维。
自上世纪80年代生物信息学成为一门新的交叉学科以来,受到科学界的高度重视,其中最引人注目的是结构生物学。它的发展使得运筹学受到了建立数学模型分析复杂生物规律和从海量生
为了解决传统DC-DC变换器存在的能量损耗大、效率低、输出纹波大等问题,以LM5117芯片和CSD 18532KCS MOS场效应管为核心器件,实现了16 V到5 V的直流电压降压转换。文中先通过
随着材料科学的发展,有机半导体材料因其结构可调和可制备柔性器件等众多优势得到了广泛的关注。苝酰亚胺及其衍生物作为一个电子传输型(《-型)有机半导体材料,在彩色液晶显
矩阵理论和矩阵分析作为数学研究的重要组成部分,在数学及其他许多学科领域都有广泛的应用,诸如计算数学、物理学、经济学、生物学、管理科学与工程、图像处理等。作为矩阵理论
开展了下一代GRACE Follow-On卫星重力反演的研究论证.第一,基于6点Lagrange和Taylor星间速度插值法,利用轨道参数(轨道高度250 km、星间距离50 km、轨道倾角89°、轨道离
蓝靛果作为新兴小浆果树种在东北地区广泛分布,蓝靛果的果实中含有非常丰富的生物活性物质,具有较高的保健及药用价值,越来越受到人们的关注。但由于其野生资源分布分散、采摘困难及果实的变异大等特点,远远不能满足消费者的需求。因此,目前大量进行人工栽培,但对授粉亲和性方面的相关研究较少。本论文为了解决生产中因盲目栽植而导致的座果率低,产量低等问题,以长白山野生蓝靛果优良单株为试材,探讨了蓝靛果花粉萌发的培养