C4S2-473:基于稀疏指数排序的高维数据并行聚类算法

来源 :第二届中国云计算与SaaS大会 | 被引量 : 0次 | 上传用户:kingofking1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高维数据聚类是数据挖掘领域的重要研究课题,大规模高维数据聚类研究非常具有挑战性.针对高效的CABOSFV高维数据聚类算法,采用并行计算模式提高其大规模数据的处理能力,提出基于稀疏指数排序的高维数据并行聚类算法P_CABOSFV.该算法根据高维数据稀疏指数排序进行分割点选择实现数据划分,将数据分配到多个计算节点同时处理聚类任务,再基于集合稀疏特征差异度聚类结果合并策略将各计算节点的聚类结果合并得到最终聚类结果.采用UCI数据集和计算机合成数据集进行实验表明,高维数据并行聚类算法P_CABOSFV聚类质量良好,具有很强的数据规模和数据维度可扩展性,是有效可行的.
其他文献
通过剖析知识服务的内涵和特征,梳理知识服务中存在的问题,结合云计算的特性,给出共享学习模式下知识服务的新模式.构建了知识服务云平台体系结构,设计了知识资源层、知识融
在我们白酒勾调研发过程中,常常需要同时考察3个或3个以上的试验因素,若进行全面试验,则试验的规模将很大,往往因试验条件的限制而难于实施.正交设计是安排多因素试验、寻求
目的:宫颈尖锐湿疣(CA)生长部位隐蔽,临床漏诊率较高,这成为复发和蔓延的原因,早期诊断彻底治疗宫颈尖锐湿疣有助于降低宫颈癌的发生.普遍认为人乳头状瘤病毒(HPV)与宫颈尖锐
本文提出基于星型模型扁平化编码方法的百分点聚集函数的并行算法.通过星型模型扁平化编码方法,把星型模型中维表上和查询相关的维度层次信息编码到事实表里,使得经过改写的
为了提高不平衡数据集分类中少数类的分类精度,提出了基于特征选择的过抽样算法.该算法考虑了不同的特征列对分类性能的作用是不一样的,首先对训练集进行特征选择,选出一组特
“谁都喜欢买打折商品,而网上购物能真正实现薄利多销,这也是当初我做当当网的根本原因。”俞渝的目标是——把当当网做成网上家乐福。华尔街就像一个高压锅俞渝说着标准的北
无线传感器网络的内在特性,使得在资源受限的环境下检测恶意节点变得十分困难.为此,提出了一种新型的面向无线传感器网络的入侵检测算法.该方法利用对称密钥进行传感数据加密
总统们来来去去,而她知道他们所有的一切。她曾经是个异常羞涩的小女孩,是男人背后的家庭妇女,是4个孩子的母亲,但一个偶然的机会改变了这一切。事实证明,女性拥有无限的潜力
多品种变批量大规模定制生产线的机床设备选择具有可变性.为解决利用数学模型求解难于调整修改的问题,构建图模型通过对问题的定性分析,提出一种基于模糊图论的选择方法,利用