粗糙集连续属性离散化的k均值方法

来源 :辽宁工程技术大学学报(自然科学版) | 被引量 : 0次 | 上传用户:oldfly2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为在应用粗糙集理论处理数据时,对连续属性进行离散化预处理,采用k均值算法对连续属性进行离散化的方法,将属性无监督聚类成两类.通过在UCI数据库上选取的4组数据进行实验,首先离散化,再通过粗糙集约简,最后使用k NN(k=10)分类器,并和其他两种离散化方法进行对比.研究结果表明:该方法能够提高离散化的效率,降低实验的复杂度,并有效减少断点数. In order to process continuous attributes discretely by using rough set theory and discretization of continuous attributes by k-means algorithm, unsupervised clustering of attributes into two types is carried out.With the selection of 4 Firstly, the data is discretized, and then reduced by rough sets, and then the k NN (k = 10) classifier is used to compare with the other two discretization methods.The results show that this method can improve the efficiency of discretization , Reduce the complexity of the experiment, and effectively reduce the number of breakpoints.
其他文献
伴随着信息社会的飞速发展,人们需处理记录的信息量与日俱增,硬盘作为最主要的磁记录介质在其中发挥了重要作用,但随着记录密度的不断提高一些不利于纵向记录模式的存储密度
干旱是指在长期无降水或降水异常偏少的气候背景下,由于水分的收支或供求不平衡形成的水分短缺现象。干旱灾害也始终是危害我国农业生产的一种主要自然灾害,同时也是我国影响面