基于粗糙集理论的数据挖掘研究

被引量 : 0次 | 上传用户:milamiya2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机、网络和通讯等信息技术的高速发展,信息的增长呈现超指数上升。信息量的急剧增长,使传统数据库的检索查询机制和统计分析方法已远远不能满足现实的需要,许多数据来不及分析就过时了;也有许多数据因其数据量极大而难以分析数据间的关系。如何从大规模的数据中挖掘深层次的知识和信息,而不仅仅是数据表面的信息,已经成为众多领域的研究热点。在这样的背景下,新的数据处理技术——知识发现便应运而生。 知识发现是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。数据挖掘是知识发现过程中的核心步骤,是目前相当活跃的研究领域。 粗糙集理论是波兰数学家Pawlak Z于1982年提出的一种分析模糊和不确定知识的强有力的数学工具。粗糙集理论作为人工智能领域的一个新的研究热点,它能够有效地处理不完整、不确定知识的表达和推理。这个特点使得粗糙集理论非常适合应用于数据挖掘。目前,基于粗糙集理论的数据挖掘方法已经成为主要的数据挖掘方法之一。研究基于粗糙集理论的数据挖掘具有极大的理论意义和现实意义。 介绍了粗糙集和数据挖掘的相关理论。在深入研究经典粗糙集理论的一些不足后,我们提出了一种粗糙集的拓广模型,即带隶属度及权重的粗糙集模型。在这种模型中,我们给出了带隶属度及权重的信息系统,进行了噪音的处理、近似空间的划分、决策属性对条件属性的依赖度的计算、属性的约简、关联规则挖掘步骤的建立等方面的研究,并用算例验证了该模型是可行的。这种粗糙集的拓广模型克服了经典粗糙集分类过于严格、对噪音过于敏感、某些隐藏在边界中的规则丢失等缺陷。它完全继承了粗糙集的性质,拥有粗糙集的所有优点。该模型提供了一种数理统计中常用的在一个给定错误率的条件下将尽可能多的对象进行分类的方法。该模型将在信息系统分析、人工智能及应用、决策支持系统、知识发现、模式识别、分类以及故障诊断等方面取得较好的应用。 今后的工作是开发基于这种粗糙集模型的实用软件系统和理论上的深入研究。
其他文献
分子对接是药物发现和设计中一种非常重要的方法,也是国内外前沿研究课题,具有交叉学科的研究特点。它利用计算机模式识别和优化技术,在三维结构数据库中搜索能与特定药物作用靶
保险代理公司是专门从事保险代理业务的中介服务机构,在我国保险行业还属于新生事物,处在萌芽阶段,还没有成功的营销模式。在保险市场上,保险公司拥有自己强大的销售队伍,与之相比
制备明矾注射液,考察其稳定性、安全性、抗氰效果及在家兔体内的药物代谢情况。 1. 按输液剂生产工艺规程配制明矾注射液,其渗透压是410.10 mmol/L,为高渗溶液,注射液配制中应维
建筑外墙面砖贴法用于室外的外墙釉面砖、无釉面砖表面应光洁、质地坚固、尺寸、色泽一致,不得有暗痕和裂纹,其性能指标应符合现行国家标准的规定。吸水率不得大于10%,外墙贴面砖进
文化是民族的灵魂,是维系国家统一和民族团结的精神纽带。根植于当代伟大实践的中国特色社会主义文化,是中华民族身份的象征,是最广泛团结全国人民乃至全球华人的旗帜,是鼓励各族
选取云南省农业科学院甘蔗研究所研制的微晶速溶糖(粒状及方糖)和市场采购的6个咖啡调味糖包(条)产品、5个方糖产品,从外观、颜色、理化性质(蔗糖分、还原糖分、电导灰分、色
目的:有针对性地对糖尿病患者实施具体的健康教育,从根本上保证了健康教育的有效性。方法:将183例患者随机分为两组,即健康教育组与对照组,健康教育组由主治医师、责任护士、
为探讨丙型肝炎血清中IL-1α、IL-6、TNF-α、IFN-γ的含量及与临床关系,应用ELISA法对33例各型丙肝患者检测血清中IL-1α、IL-6、TNF-α并与健康人群对照,结果发现:丙型肝炎临床各型患者血清中IL-1α、IL-6、TNF-α含量显著高
目的探讨通心络对急诊PCI患者再灌注心肌损伤的保护机制。方法选自山东大学齐鲁医院急诊科收治的ST段抬高的AMI,并成功实施经皮冠状动脉介入治疗(PCI)的住院患者。随机分成试