基于信息熵降维的混合属性数据流聚类算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:vbpro
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有的数据流聚类算法无法处理高维混合属性的数据流。针对该问题,对HPStream算法的脱机聚类和联机聚类过程进行改进,利用频度矩阵处理名词属性,通过基于信息熵的名词属性选择方法降低数据维度。实验结果表明,该算法能有效处理混合属性和维度较高的数据集,与HPStream算法相比,聚类精度有5%~15%的提高。
其他文献
随着工业自动化水平的提高以及计算机技术的广泛应用,人们对工业自动化领域控制软件的通用性和灵活性提出了更高的要求。人们越来越重视系统软件的组态和配置功能。工控组态软
随着电力行业信息化的不断发展,信息安全面临日益严峻的考验。文章从适应新形势下电力调度系统发展和电力市场需要的角度出发,分析了电力信息网络的主要分类和特点,着重从技术和
随着人类正加快步入信息时代,使得计算机技术得到了飞速发展。计算机技术的广泛应用,使人们越来越多地开始将将先进的计算机技术应用到我们捕捉到的图像上,并希望通过计算机图像
本文利用GPIB总线建立起了数字多用表的自动测试系统,通过它可以方便的自动多次测量交流电压、直流电压等量值,无需人工进行参与,可自动完成测试。
教学中,我们经常会有课堂教学效果差,学生们听课不积极等问题,究其原因,是对教与学的主体认识不到位造成的。新课标所倡导的教学理念是以学生为主体,一切的教学手段、教学方