动车组故障数据控掘的关键技术研究

被引量 : 5次 | 上传用户:GGGFFFAA1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,我国已掌握了包括牵引技术、制动技术、转向架技术等在内的高速列车核心技术,也已借助先进的传感器技术、数据采集设备和计算机存储设备积累了海量的高速列车故障数据。这些数据以TB数量级增长,传统的数据挖掘解决方案已经无法胜任这种急速增长数据集的分析任务。云计算的出现,因其强大的计算能力和海量的存储能力等特点,已经成为数据挖掘领域重要的研究方向。Hadoop是一个相对成熟的开源云计算框架,具有高可靠性、可伸缩、分布式等特点,用户使用简单的编程模型就可以在计算机集群上对大规模数据做分布式计算。如今,Hadoop已经被各领域广泛地使用在大数据处理的场景之中。本论文根据Hadoop分布式的特点,以经典的Apriori数据挖掘算法为例,设计并实现了一套基于Hadoop的数据挖掘方案,并对该方案的进行了详细的阐述。本文的具体内容包括:(1)分析了Hadoop的核心技术及其运行原理,分布式计算框架MapReduce和分布式文件系统HDFS。(2)提出了基于Hadoop的数据挖掘系统的基本架构,阐述该系统的各个模块功能。(3)在Hadoop平台上,对Apriori算法的实现了并行化改进,在Hadoop平台的MapReduce编程模型上给出改进算法的执行流程。(4)分析采集到的动车组复杂装备海量数据,通过挖掘结果分析动车组故障发生时的各种条件极其关联度。(5)利用动车组故障数据集,在Hadoop平台上对改进后的算法进行单机测试和集群测试,从算法的效率及扩展性方面进行了对比分析。实验结果表明,改进后的算法具有较高的执行效率,良好的加速比和可移植性,论文设计的数据挖掘系统满足了特定的要求,实现了大数据规模下的数据挖掘。本文的研究为数据挖掘算法的不断完善与改进提供了参考,并对动车组的主动维护技术、提高安全性和运行效率、降低维护成本提供了重要而实用的理论价值和经济价值。
其他文献
近年来发展起来的复杂网络理论是研究复杂系统的一套有效方法。采用复杂网络理论,将现实生活中的复杂系统抽象为节点和边组成的网络,对这些网络的拓扑结构以及网络上的各种动
近年来,高新技术产业在全球范围内得到了快速的发展,日益成为经济发展中的支柱产业,是世界各国增强综合国力的新引擎。因此重视拥有核心自主知识产权高新技术企业的发展是把握未
<正> 日本爱华公司自1992年初推出NSX-330家用台式组合音响以它小巧玲珑的造型,独特的BBE及T-BASS功能,技压群雄,荣登畅销音响之榜首。 AIWA NSX-330由5个单元组成:FM/AM数字
随着互联网技术在全球范围内的快速普及,国际间的电子商务活动发展迅猛,进而也推动了国际贸易的不断发展。与此同时,我国外贸企业在开展电子商务过程中却存在着相对的不足。
财务分析是评价企业财务状况及经营业绩的重要依据,是企业财务管理不可或缺的一个重要环节。然而许多企业在财务分析中存在诸多问题,使财务分析未能充分发挥应有的作用。本文
互联网金融是传统金融行业与互联网精神相结合的新兴领域。互联网金融不是互联网和金融业的简单结合,而是在实现安全、移动等网络技术水平上,被用户熟悉接受后,尤其是对电子
摘要:作为一种新型“绿色溶剂”、“软”功能材料,离子液体与传统的有机溶剂相比,具有蒸气压低、热稳定安全性好、环境友好、可设计性等特点,应用到锂离子二次电池作为电解液
针对目前采用敲击法检测飞机复合材料存在可靠性差,检测灵敏度低等缺陷,本文采用激光剪切散斑检测系统对飞机复合材料进行检测,并应用该系统对含损伤的多层粘接复合材料及双
在长久以来,陶瓷以其精美的外观、极高的实用性,成为我国对外贸易的主要商品,被世人所广泛推崇,当饱含传统文化的陶瓷与3D打印技术相交融,在新时期下碰撞出新的火花,原本工艺
目的观察姜黄素在治疗糖尿病及其并发症过程中对整合素β3、白细胞抑制因子(leukemia inhibitory factor,LIF)表达水平的影响。方法将雌性SD大鼠30只随机分为3组进行灌胃治疗