一种面向大数据处理的高效分布式数据库聚类算法

被引量 : 0次 | 上传用户:shi123abc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,数据将成为各行各业不可或缺的核心资源。越来越多的大型企业开始拥有分散在不同地点的各类数据,通常需要对这些数据采用分布式解决方案进行管理。但是由于缺少统一的管理和通信机制,导致对这些数据的管理容易发生混乱。对这些分散的数据进行聚类和管理,对整个分布式系统管理效率的提升具有很大的意义。因此提出一种基于深度神经网络的分布式数据聚类技术,首先将分布式数据库中的每条记录作为一个输入矢量,提取其特征并输入深度神经网络的输入层,对深度神经网络节点间的连接权重采用BP算法进行训练,通过对权重的调整实现对深度神经网络输出的训练,最后根据输出层输出的当前矢量对应不同数据类的相似程度判断数据聚类结果。基于小规模分布式系统的实验表明,相比于传统的k-means等聚类方法,该方法具有更好的测试集准确率,更适合于进行分布式环境下的大数据聚类。
其他文献
<正>职业认同是指个体对于所从事职业的目标、社会价值及其他因素的看法[1]。它既指一种过程,也指一种状态。"过程"是指职业人从自己的经历中逐渐发展、确认自己职业角色的过
[目的]探讨2型糖尿病病人心理一致感与应对方式现状及两者相关性。[方法]采用一般资料问卷、心理一致感量表(SOC-13)和医学应对方式问卷对某三级甲等医院508例2型糖尿病病人
目的明确心肌梗死后大量心包积液的病因诊断,以进一步治疗。方法回顾诊断急性心肌梗死后合并大量心包积液的临床资料,分析心包积液产生的原因。结果 3例心肌梗死后合并心包积
通过羧基酰氯酯化法合成了硬脂酸十六烷酯固—液相变材料,并使用傅立叶红外光谱仪(FT-IR)、广角X-射线衍射仪(WAXD)、示差扫描量热仪(DSC)、热重分析仪(TG)等测试手段研究了材料的结
十届全国人大常委会第二十四次会议对人民法院组织法作出修改,第十三条修改为“:死刑除依法由最高人民法院判决的以外,应当报请最高人民法院核准。”全国人大法律委员会主任
2015年,唐县深化拓展"强乡固村、以乡带村"工程,在党建示范区建设、助力扶贫、落实基层党建责任制等方面大胆创新,取得了新成效。
[目的]探讨中医药膳配合耳穴埋豆辅助治疗肿瘤化疗病人恶心呕吐的临床疗效。[方法]将100例首次入院接受含铂类化疗药物治疗的肿瘤病人按住院号的单双号分为对照组和试验组,对
蔗糖晶体的粒度是衡量其质量的重要指标之一。研究蔗糖结晶过程的晶体粒度分布对提高蔗糖质量和蔗糖连续结晶的实践具有明显的指导意义。本论文通过对晶体粒度的计量及结晶过
对含砂低液限粘土、含砂低液限粉土与低液限粘土3种土样采用重型击实试验的方法进行了土的干密度与剪切波速的对比试验。大量试验结果表明,路基土干密度与剪切波速存在显著的
<正>经外周静脉穿刺置入中心静脉导管(PICC)可以为病人提供长期静脉营养支持、输液、化疗用药的方便、安全、有效的静脉通路,可避免反复的外周静脉或中心静脉穿刺。有文献报