论文部分内容阅读
随着核电领域设备技术和人因研究技术的快速发展,给核能人因数据的采集、存储、分析和处理提出了挑战,具体表现为数据量大、异构、价值密度低等问题。因此必须使用目前先进的计算机技术才能解决人因数据问题,才能将问题和挑战转变为机遇,更好地运用人因数据这个重大基础资源和战略资源,真正将海量、异构、多来源的数据转化为有效的人因安全信息和知识。数据挖掘(Data Mining,DM)是一类深层次的数据分析方法,它因为能够从大量的数据中挖掘出人们感兴趣的知识,而被认为是解决“数据爆炸知识贫乏”的有效方法之一。关联规则挖掘由于能够较好的捕捉数据间的重要关系,并且所发现的规则的表示方法简洁易于理解,已经成为数据挖掘领域的一个研究热点。世界核电厂营运者联合会(The World Association of Nuclear Operators,WANO)的数据是人因数据重要的组成部分和来源。它是核能研究领域宝贵的经验数据来源,在核能安全人因研究方面具有重大的研究意义。而数据挖掘技术是研究以WANO数据为代表的人因数据的重要方法。本文以面向Apriori算法挖掘技术在人因WANO数据中的应用为研究对象,结合人因研究工作的要求和实际需要,为了实现把“人因数据转化为人因知识”,本文作了以下工作:(1)分析了目前人因数据的多样化需求,进行需求分析。分析和指出了人因数据的潜在价值和使用大数据技术和数据挖掘技术解决核能安全人因数据采集、分析与处理等问题的必要性。进而探讨了对人因数据的多样化需求所可能带来的问题和挑战,提出了本文的研究内容和需要解决的问题。(2)使用大数据技术,根据人因数据采集与处理的特点,建立了WANO人因数据采集与处理系统框架。该系统框架由数据源层、数据预处理、人因数据处理中心、人机交互系统等部分组成。(3)针对本研究建立的WANO人因数据采集与处理系统框架,重点研究了人因数据处理技术中的数据挖掘部分,探讨了关联规则挖掘的常用算法,建立了人因数据采集与处理平台。选取了Apriori关联规则算法为主要的数据挖掘算法,并结合人因数据平台的特点提出了适合该框架的Apriori关联规则算法。最后在人因数据采集与处理平台上使用该算法挖掘和提取WANO人因数据中可能存在的关联规则。