动态k-均值算法的R树索引构建

来源 :兰州大学 | 被引量 : 2次 | 上传用户:silvercup
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的——在目前的研究中,基于k-均值聚类算法来构建R树存在着一定的缺陷,一方面是对于k-均值算法中k值的确定以及各个属性所携带信息的差异性,另一方面是构建R树时如何维持R树的合法性以及结构的良好性。为了解决上述两方面的问题,本文从改进k-均值算法以及R树构建过程中数据间的距离测度、数据分配方面入手,提高R树构建过程的构建效率以及检索等功能的效率。方法——在k-均值算法的基础之上,通过结合最近邻理论、信息熵理论和概率统计等理论,从初始中心点的选取与确定、数据间结合实际情况的距离加权以及多余数据的划分三个方面对R树构建算法进行优化。研究结果——首先,通过初始中心点的选取以及各个属性的加权两方面对于传统k-均值算法进行了改进,通过实验验证在迭代次数以及准确度方面均有提高;其次,从动态确定聚类个数k值方面进行扩展,提出了基于近邻模型动态确定k值的属性加权k-均值算法,得到较为理想的聚类个数;最后,利用提出的基于近邻模型动态确定k值的属性加权k-均值算法以及基于空间数据的面积、周长确定的权值,通过数据分配原则构建一个结构良好的R树结构。研究的局限性——(1)对于噪声数据的定义;(2)R树节点中数据的动态分配。实际影响——通过动态k-均值算法的提出,能够合理高效的给出某一数据集的最优聚类个数,并且应用在R树结构的构建上,提高了R树结构的构建效率以及检索效率。独创性——利用近邻数据以及信息熵属性加权,提出了动态k-均值算法,可以有效的获取聚类个数;将空间数据的面积、周长以权重的方式加入到空间数据间的距离中,所得距离受空间数据形状影响,更加符合现实情况。
其他文献
<正>政协机关是政协的综合办事机构,是政协工作的枢纽,对内担负着参谋、助手、协调、服务作用;对外发挥着窗口作用,影响着政协形象。因
农民工市民化是"提高城镇化质量"的关键,其根本问题在于使农民工能享有与城镇户籍人口均等的公共服务待遇。基于此,本文对四川、重庆、成都、乐山四省(市)农民工市民化成本进
土地是农民的生存保障,具备就业、经济收益、社会保障的功能。农民失去土地,也就失去了与土地相连的一系列权益。本文从失地农民流失的权益入手,分析了失地农民权益保障缺失
以新时期的田汉纪念馆为例,对爱国人士田汉为主体形象的红色革命人物纪念馆开展设计研究分析。旨在探究革命人物纪念馆的总体特征及陈列展示内容、展示方式,并运用多媒体技术
<正>近期在京观看了"2018年全国基层院团戏曲会演"的众多剧目,深有体会。会演剧目共计40台,其中32台大戏中有现代戏26台,占比81%,关注现实是一大特色。在这些现代戏中,山东省
目的:探讨MRI在结核性关节炎与化脓性关节炎鉴别诊断中的作用。方法:回顾性总结经细菌培养或组织学病理检查证实的结核性关节炎10例、化脓性关节炎13例的MRI影像表现,分析两
<正>随着人口老龄化的加剧,心血管疾病越来越成为影响人类生命健康的杀手,已成为我国最重要的公共卫生问题,作为一种与生活方式高度相关的疾病,心血管科的护士在全民健康中的
<正> 口服液剂型的制剂中,有相当多的品种属于中草药浸取药液辅以一定浓度的蜂蜜、蜂王浆等经混合精炼,再经过一系列工艺过程,分装包装而成为成品。
党的十八大以来,以习近平为总书记的党中央对当前和今后一个时期的干部教育培训进行了全面部署。这是我们党科学分析新形势新任务、准确把握干部教育培训工作新要求做出的战
地效翼船是介于船与飞机之间的一种新船型 ,是近年来国际船舶发展的热点。本文系统阐述了地效翼船总体性能设计中应考虑的基本问题 ,提出了一套基本设计要素和相应的确定原则