【摘 要】
:
针对传统数据挖掘过程中聚类结果波动较大、聚类纯度低的问题,提出了基于改进K-means算法的大数据精准挖掘技术。先将提取到的数据模型转换为数学语言,采用自动编码器优化数
【机 构】
:
安徽省电子信息职业技术学院信息与智能工程系
【基金项目】
:
安徽省质量工程教学研究项目(2018jyxm0920),安徽省高校人文社会科学研究项目(SK2019A0920),安徽省质量工程教学研究项目(2019mooc5030),安徽省教育厅重点研究项目(KJ2018A0779)
论文部分内容阅读
针对传统数据挖掘过程中聚类结果波动较大、聚类纯度低的问题,提出了基于改进K-means算法的大数据精准挖掘技术。先将提取到的数据模型转换为数学语言,采用自动编码器优化数据特征,再计算数据集的相似程度,然后选择度量公式,指定聚类数量,经多次计算得出最优解。利用改进K-means算法,获取数据集中局部密度值最大的点作为聚类中心点。计算出数据样本的欧氏距离后,经过多次迭代得到聚类结果。比较改进K-means算法与3种传统算法在数据挖掘中的应用效果。实验结果表明,改进K-means算法的结果曲线波动幅度小,聚类纯
其他文献
本文详细介绍时钟芯片DS1302底层程序编写方法,DS1302时序图运用注意事项。程序代码已优化,作为子程序及函数可供直接调用。
目的观察和营清热方(HF)及主要单体抑制糖基化终末产物(AGEs)合成作用,探讨中医药治疗糖尿病视网膜病变的作用机制。方法体外构建以葡萄糖和果糖为基底合成AGEs模型,予不同浓
本文以移动电子商务为切入点,分析了移动广告发展过程中面临的问题,并针对这些问题提出了发展策略。
根据PLC课程教学的特点,为切实提高学生对PLC课程的学习效果,探讨将实践教学方法引入到PLC课程教学之中。从而实现理论与实践的完美结合。本文结合此门课程教学特点,对实践教学