交通事故数据挖掘的多维关联规则研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:squllwu20090907
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着车速提高、交通量增长,道路交通事故已日益引起各有关部门的重视。交通事故的发生受多种因素的影响,能否对已发生事故做出正确的分析将直接影响到能否对未来类似事故的成功避免。随着社会的发展,交通事故的复杂性也在逐渐增强,传统的分析、预防方法已呈现其局限性。本文提出一种利用数据挖掘领域中的多维关联规则技术从记录交通事故的海量数据中寻找有用信息的方法,通过找出可能导致交通事故发生的频繁因素组合来发现某些事故诱因之间联系的内在规律。如果根据事故诱因之间的联系规律,进行人为控制和干预,使事故发生条件缺失,可以降低交通事故发生的概率。   数据挖掘(Data Mining)是一个从海量有噪声、不完整数据中挖掘出有意义知识模式的过程。数据挖掘方法的提出,让人们有能力发现海量数据中蕴藏的有用信息。关联规则是数据挖掘的主要方法,反映一个事物与其它事物之间的相互依存性和关联性[1],是指在数据集中支持度和置信度分别满足给定阈值的规则。关联规则挖掘的经典Apriori算法就是根据有关频繁项集特性的先验知识而命名的,算法中蕴含的一条基本性质是一个频繁项集的任一子集均应是频繁的。借助一定的专业领域知识,关联规则可以直接用于分析数据的因果关系,进一步探索,做出规则预测。从大量的数据中发现其关联关系对于决策分析是极为有用的。   本文针对道路交通事故这一实际问题,对经典单维单层的Apriori算法进行改进,实现挖掘多维多数据类型关联规则的新算法;给出了道路交通事故属性的定义,并且采取全星型连接数据模型对道路交通事故属性的数据组织建模;将大量杂乱无章的交通事故数据组织为可进行数据挖掘的属性信息,用于分析各种相关因素间的复杂关系;通过数据挖掘的关联规则技术处理交通事故数据,提取和分析了道路交通事故的规律;重点分析、阐述了车辆事故属性数据关联规则提取的算法,然后对该算法进行了验证。   用本文的方法对交通事故数据进行提取、分析得到关联规则,展现了关联规则提取技术的使用价值。对于本文建立的道路交通事故属性的数据模型,可以进一步细化,以便能够包含更多的信息,而进行更详细的数据关联规则分析。
其他文献
信号分析是对信号基本性质的研究,在理论研究和实际工程应用中不可或缺的部分。经验模态分解(EMD)方法是近年来出现的一种分析非线性、非平稳信号的新方法。它能有效解决傅里
随着3G技术的广泛应用,FemtOcell的概念迅速兴起。Femtocell,即“家庭基站”,已成为增强室内通信覆盖,提高楼宇内通信质量的一种有效解决方案。另外,近几年出现的一种新的多
随着卫星遥感技术的不断发展,应用需求的增加,应用范围也越来越广泛。单纯的对单时相的卫星遥感技术研究已经达不到人们的需求。因此,对于地物分类来说,由于单时相卫星影像空间分辨率比较低,而且所含的光谱信息一般也比较少,分类结果一般会出现椒盐现象,不能很好的满足应用需求。本文从多时相卫星影像数据的特点出发,旨在深入挖掘多时相卫星影像信息,提高卫星影像数据应用能力。首先对卫星影像进行了预处理,接着研究了基于
随着视频点播、高清电视、网络电话(VoIP)等业务的迅速发展,人们对宽带接入网的要求越来越高,而传统的数字用户线(xDSL)接入方式不能满足这些新型业务的需求,迫切需要新的技
在电信网与互联网互相融合的过程中,分布式IMS网络作为未来移动互联网的发展方向,具有网络结构灵活、易于引入新业务等优势。由于分布式IMS网络的思想刚刚起步,因此其中存在
2009年1月7日下午2:30,工业和信息化部正式发出3G牌照。此举标志着我国正式进入3G时代。随着第三代移动通信系统(3G)逐步由研发阶段进入实际的商业运营阶段,3G的技术标准成为
现今无线通信技术飞速发展,新兴应用不断涌现,无线设备数量不断增多,需要处理的数据量剧增,低频段频谱已经无法满足需求。而毫米波频段拥有大量的空闲频谱,足以支持更高速率