基于特征选择的高铁接触网数据集成归约研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:oliver777
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
接触网作为高速铁路牵引供电系统中重要的组成部分,其沿线路布置,易受雨雪、大风、沙尘等气象因素影响,在弓网运行过程中,容易引起几何参数异常、零部件松动、断裂等缺陷,影响牵引供电系统的安全稳定。因此需要对接触网状态信息进行检测监测,分析检测监测数据后对接触网故障进行智能维护。采集到的原始数据信息存在多种特点,如数据类型繁多,包括表征几何参数的数值数据、表示零部件状态的叙述性语句,表达方式缺乏一致性,难以进行数据间的对比分析,使得大数据流得不到充分利用;数据间存在冗余,过高的数据维度导致学习分析的时间以及空间成本过高,甚至不能直接进行分析。为解决上述问题,本文设计了一套严谨规范的高速铁路接触网数据字典,使原本复杂无序的数据变为规范有序的数据,并通过特征选择算法对其进行集成归约,去除数据间的冗余性,降低数据维度,便于后续进行数据挖掘,获取有价值的知识。本文基于数据字典以及多维结构模型提出了高铁接触网数据字典的基本框架。建立了该模型下的高铁接触网数据字典体系并对各项目进行分类。针对高铁接触网数据字典表达的规范化、标准化问题,在多层次结构下确定每一层级的属性表达原则,对相关属性进行了信息化编码。确定了高铁接触网数据字典的表现形式,对其编码格式、参数设置进行了详细地定义。并基于该数据字典对实际的高铁接触网数据运用数据识别等集成技术,实现接触网数据内容与格式的规范化,为后续的分析研究奠定数据基础。采用特征选择算法对识别后的高速铁路接触网故障数据进行集成归约。对接触网故障数据结构进行分析,高速铁路接触网故障数据均为无类别划分的数据即无监督数据,且不适用于现今普遍使用的无监督特征选择算法,本文采用AGNES层次聚类方法将接触网数据样本进行聚类,并赋予相应类别的标签。对比各特征选择算法的性能表现后,采用Relief F算法进行特征选择,并针对算法中存在的冗余性、重复抽样等缺陷提出改进措施。在保证随机抽样的基础上,基于分层抽样的思想,将样本类别视为层级,以此来控制各类样本在整体抽样中被抽中的次数;对于常用的皮尔逊相似度计算方法引入杰卡德系数作为修正因子,以此评估并去除冗余特征。将聚类和特征选择算法相结合后,提出了一种适用于无监督的接触网故障数据的特征选择方法,将其应用于实际铁路局的高铁接触网故障数据中。基于实际铁路局数据与常用的特征选择算法进行对比,验证了本文方法对于接触网故障数据集成归约的准确性。
其他文献
本文分析了城市快速路瓶颈处交通流的运行特征,探究了换道行为对瓶颈处交通流失效的影响,并据此建立了考虑换道行为的瓶颈处交通流失效概率预测模型。基于移动瓶颈模型分析了换道车辆对目标车道车辆运行的影响。认为当换道车辆速度小于目标车道车辆的运行速度时,换道车辆换至目标车道后将成为慢行车,形成移动瓶颈,影响目标车道其他车辆的通行。通过全速度差模型对简化后的换道行为进行了仿真分析。研究发现,存在换道慢行车时,
在打击拦截任务的末制导阶段,飞行器速度快,弹-目相对距离近,制导回路与控制回路之间耦合变强,分开设计两回路会造成控制的滞后以及精度降低。本文主要针对末制导阶段的打击拦截任务,采用终端滑模结合误差观测器以及终端滑模结合双层自适应的制导控制一体化进行了研究,主要包括以下内容:1、在考虑目标加速度不确定性,以及飞行器姿态运动建模中的不确定性的情况下,建立了飞行的弹-目相对运动模型,在假设滚转稳定的前提下
硕士研究生入学考试公共课采取统一命题形式,毫无疑义。而硕士研究生入学考试专业课到底采用统一命题还是自主命题却存在争议,这也是一块尚待开垦的处女地。本文试图以教育学
在当今的社会生活中,人人都缺少不了图像信息的获取,图像也是人与人之间,人与机器之间相互交流的媒介。所以,在获取图像信息并对图像进行分析与处理操作必不可少。图像分割是
In the industrial processes of manufacturing and assembling,metal welding is often carried out.Hence,the distortion in the output product is inevitable.These distortions are formed as a result of the
随着人口老龄化的加剧,养老问题成为当前我国亟待解决的社会问题之一。集养老、护理、医疗、娱乐于一体的养老机构,将成为众多老年人的养老选择。体育活动在增强体质、预防疾
Si3N4陶瓷具有高硬度、高熔点和良好的高温性能等优点,但氮化硅陶瓷本身的韧性低、脆性大限制了其进一步的发展和应用。本文采用颗粒、晶须增韧的方法改善氮化硅基陶瓷刀具材料的断裂韧性。根据氮化硅复合陶瓷刀具材料的设计原则,选择合适的颗粒、晶须来提高Si3N4陶瓷材料的综合性能。根据复合陶瓷刀具材料的增韧补强机理、烧结机理,采用液相热压烧结,制备了以TiC颗粒和TiC晶须为添加相,Si3N4为基体相,Y
有机发光二极管(OLED)因其巨大的应用潜力而备受关注,它可以应用于智能手机、固体照明、大面积显示屏和穿戴设备中,发展前景广阔。鉴于OLED的性能与所应用的材料息息相关,为了
目前,随着无线通信技术方面的研究越来越深入,多天线系统即多输入多输出(MIMO)系统越来越成为发展的关键点。MIMO系统与以前的单一天线系统的优势在于在占用频带带宽不变的情
随着信息技术的发展,大量数据得以存储积累,人们进入信息爆炸时代。在大数据世界里,知识就是力量,从这种新的知识中提取规则对传统的机器学习算法来说具有很大的挑战,一方面