基于粗糙集的数据挖掘属性约简算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:wq123sd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
粗糙集理论是由波兰数学家Z.Pawlak在1982年提出的,是继概率论、模糊数学、证据理论之后又一种处理不确定性的有效数学工具。该理论的特点是不需要任何先验知识,或任何附加信息,就能有效地分析和处理不精确、不完整和不一致的信息。并从中发现隐含的知识,揭示潜在的规律。数据挖掘和知识发现是从现存的数据库、数据仓库或其它信息库中挖掘有价值的知识的过程。粗糙集理论是一种新的数据挖掘技术。 本文就粗糙集理论及其在数据挖掘中的应用方法进行了较为深入系统地研究。重点研究了扩展粗糙集模型:基于连续属性的粗糙集模型及其约简算法;不完备信息系统下粗糙集模型及其约简算法;以及更一般的集值信息系统及其约简算法。主要研究工作包括: 1.对近年来粗糙集理论及其相关的数据挖掘方法进行了综述。 2.深入研究了各种常见的粗糙集模型及其性质;针对信息系统的多样性,给出了基于粗糙集的刻画方式。 3.属性约简是粗糙集理论研究的核心问题之一,现已证明,寻找信息系统的最小约简是NP-hard问题。目前已经提出了一些有效的算法,然而其算法复杂度都比较高,因此还需要进一步研究属性约简的有效算法,本文就常见粗糙集模型,给出了一般形式的基于代数或信息论下的改进属性约简算法。 4.研究了不完备信息系统粗糙集模型,并提出了基于限制容差关系的属性约简算法;提出了集值信息系统及基于其上的属性约简算法;研究了连续属性的信息系统及属性约简算法。并且针对以上提出的模型及算法,给出了完整的实例,进一步验证了其应用于实际系统的有效性和实用性。
其他文献
1957年Hadwiger提出了有关凸体覆盖的Hadwiger猜想(下文简记为H-猜想)。虽然许多数学家围绕着此猜想做了不少重要的工作,且H-猜想也被多篇综述与多本专著反复提及,但直到今天,人们
我国的金融行业在信息化与数据化发展的影响与带动下,大数据化的特征越来越明显。大数据已经成为现代金融行业中最为关键的资产内容。信息技术已经广泛运用到金融行业,金融企
学位
本文在模糊自动机理论的基础上,讨论了模糊自动机的最小化问题。首先,介绍了经典模糊集、自动机和模糊自动机的一些相关基础理论。其次,重新定义了Mealy型模糊有限自动机中状
公道正派是我们党的优良传统,是组工干部职业道德和组织部门自身建设的核心内容,也是检验组工干部政治品质、思想作风和人格力量的重要标准。在现实条件下,强化组工干部公道
本学位论文讨论了生物模型的概周期解问题,利用不同的研究方法获得了几种生物系统概周期解存在的充分条件.全文共分为四章.  第一章介绍了本课题产生的历史背景以及本文的主
笔刷的模拟是计算机图形学领域的一个研究热点。本工作结合绘图板和GPU开发了一套实时动态笔刷绘制系统。该系统把人工交互端的输入放在绘图工具数位板上,利用数位板接收的位
学位
随着世界经济文化和科学技术的不断发展,聚类分析在许多行业中得到了广泛的应用,尤其是医疗行业。由于医疗器械的现代化,使得人们获取数据资料变得越来越便利,对数据的研究也
为深入贯彻落实教育部实施《体育、艺术2+1项目》的要求,以特色促学校发展,全面提升学校艺术教育水平,积累学生的文化艺术底蕴,学校把口琴校本课程作为一个突破口,使学生与琴结缘,