基于二进制数计算相似度的高属性维稀疏数据聚类方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:shagen_gw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对一种特定类型高属性维数据——区间变量型高属性维稀疏数据聚类问题,提出高属性维稀疏信息系统,稀疏特征编码,基于二进制数计算相似度概念,给出一种新的基于二进制数计算相似度的高属性雏稀疏数据聚类算法,由于计算属性稀疏特征相似度所采用的是二进制数布尔AND运算,因此,相比目前人们所使用的聚类算法,它是一种计算简单、精度高、聚类质量较高的聚类算法。该算法在高属性维稀疏数据挖掘及聚类分析中有着重要的应用。通过数值算例分析表明该聚类方法有效。
其他文献
目的:吸烟诱导的肺上皮细胞氧化失衡是COPD的重要发病机制之一,细胞内活性氧生成增多引起线粒体氧化损伤、线粒体膜电位下降、ATP合成减少,细胞启动凋亡。促细胞凋亡信号如C6-py
将虚拟现实技术用于农业生产,利用农作物生长模型并结合计算机多媒体技术将作物形象地显示出来,是实现虚拟农作物实验平台的一个核心部分。该文介绍了一个虚拟农作物平台的知识
文章基于LINUX环境,利用NS2仿真工具,对链路数据流的混沌特性进行了实验验证,并对关联维数、Lyapunov指数等重要的混沌参数进行了定量分析。