地震数据挖掘中的粗糙集模型及属性约简算法研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:layueee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论文从地震数据的特点和约简需求出发,分析传统的粗糙集和基于优势关系的粗糙集在约简算法方面存在的问题,对经典粗糙集算法作出改进,提出一个基于优势关系的粗糙集模型,并把它集成到地震数据挖掘平台PDMPS中。 论文首先介绍Pawlak粗糙集模型以及决策表、可辨识矩阵和约简等基本概念,然后结合地震数据的特点,引入启发式属性约简算法对海量地震数据进行预处理。根据属性重要性的判定方式,论文结合实际应用对三种典型的属性约简算法进行了研究和改进。(1)相对可辨识矩阵的属性约简是以相对可辨识矩阵为基础的,把对可辨识矩阵进行逻辑运算的计算转化成代数运算,从而在一定程度上简化了计算,提高了约简效率。(2)基于信息嫡的相对属性约简算法,把条件属性和决策属性之间的互信息用信息熵表示出来,并以此判定属性的重要性。(3)基于灰色关联度的属性约简算法。论文把灰色关联度研究因素之间关联性的特性引入到属性约简算法中,根据条件属性与决策属性的条件.决策关联系数和条件.决策关联度来判定属性重要性。 在讨论经典的基于不可分辨关系的粗糙集理论及其约简算法的基础上,进一步探讨了应用于多准则决策分析的基于优势关系的粗糙集扩展模型。首先针对现有约简算法中存在的缺点,提出了一个新的优势区分矩阵的定义,在该定义的基础上给出了相应的求核和求约简算法以及规则提取算法。随后,给出了一个应用实例,对全国小震目录数据利用基于优势关系的粗糙集理论进行分类挖掘,最终从44381条样本数据中得出272条确定性规则。 最后,对本课题小组实现的一个地震数据挖掘平台PDMPS进行了简要的介绍。此平台基于自强2000高性能集群系统构造,由数据挖掘引擎和算法库、数据仓库、数据预处理部件、并行数据管理中间件、领域知识库及用户接口等几大部分组成。
其他文献
增强现实(Augmented reality)技术是一种将真实场景同虚拟场景融合的技术,它的目标是解决真实场景和虚拟场景之间无缝合成的问题。目前AR系统主要的研究工作集中在跟踪、注册
本文在分析现有第四方物流的国内外研究现状的基础上,结合第四方物流的特点和具体的中国农副产品交易平台的“统一市场”项目,提出了“分布式物流”的概念,指出了农副产品交易平台分布式物流服务中的不足——缺乏必要的决策,并由此引出本文主题:统一市场下分布式物流决策支持系统的研究与实现。首先,提出了一个基于多Agent结构的分布式物流信息系统结构和决策支持系统的框架,并分析了其中各个代理的基本功能。其次,对决
当前,网络管理正从集中式向分布式方向发展,多Agent系统以其在解决分布智能问题方面所具有的优势而成为构造下一代网络管理系统的一条全新思路。然而,目前基于多Agent系统的网络
近年来,在自然语言处理的研究和开发中,双语翻译对(包括句子,短语,词汇)的作用日益突显出来,它为跨语言检索和机器翻译等自然语言处理应用提供基础资源。大量的双语翻译对可
随着网络技术和计算机技术的快速发展,计算机监控系统在社会生活中应用越来越广泛,包括电力、电信、能源、交通、环保等领域。在广播电视领域,管理操作和节目播出的自动化要求越
课题在调研了热量表的研究背景、意义和国内外研究现状的基础上,按照中华人民共和国城镇建设行业标准-热量表(CJl28—2000),以TI公司的16位低功耗Soc芯片MSP430F435,使用配对PT1000热电阻温度传感器和低功耗的无磁流量计,开发一个嵌入式户用热量计量表,且该热量表预留低压电力线载波模块的通信接口。论文就热量表的原理进行了简单论述,通过把工程热力学中的能量平衡方程应用到热量表中,得
匿名通信技术是一项重要的网络安全技术,旨在保证通信双方之间通信关系的隐蔽性。为了破坏匿名系统的匿名性,攻击者通过实施各种匿名攻击,达到揭露“谁和谁”正在进行通信的目的
随着当前互联网的高速发展,软件更新换代速度极快,互联网界兴起了敏捷开发的概念,其中持续集成是其中一重要原则。但是随着软件产品规模的扩大,编译任务量也随之增大,在有限的编译
随着Web服务技术的广泛应用,如何更好地按照用户需要发现、返回最优服务已成为急待解决的问题。目前对该问题的研究主要集中在基于语义的 Web服务功能匹配,但在实际应用中非功
随着计算机网络和应用的迅速发展,网络安全问题也日益突出。曾经作为最主要的安全防范手段的防火墙和入侵检测系统(Intrusion Detection System,IDS),已经不能满足人们对网络安