空间聚类分析的研究

被引量 : 0次 | 上传用户:wori147258
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析技术作为数据挖掘领域中的一个重要分支,在识别数据内在结果方面扮演着极其重要的角色。聚类分析技术是一种无监督的学习过程,其主要目的是将没有标记的空间样本数据划分为有意义的组或簇。在某一组中,所有空间样本数据在某种意义上彼此相似;而不同组之间的空间样本数据差异较大。通过聚类分析技术能够快速有效发现空间样本的聚集情况,并能提取出空间样本的群体空间结构特征,对揭示空间样本的分布规律,预测空间样本对象的发展趋势有着重要的作用。对于数据挖掘领域中的聚类分析技术,本文的主要研究内容分为如下几个部分:首先,从传统的划分式聚类算法入手,分析了传统K-均值聚类算法的不足,针对传统K-均值算法对初始聚类中心点敏感的不足,提出了基于密度期望的初始聚类中心点选取方案。该方案将处于密度期望区间内相距最远的k个样本作为初始聚类中心,可有效降低K-均值算法对初始中心点的依赖,从而提高聚类结果的质量。其次,划分式聚类算法中,针对有效聚类划分数事先很难明确的不足。对于传统K-均值算法,在基于密度期望选取初始聚类中心点的基础上,结合聚类有效性指标函数分析不同划分数下的聚类结果,可有效确定最佳聚类数。再次,利用人工蜂群算法的良好全局寻优能力,并通过适应度排序选择策略提高原有人工蜂群算法的性能。将优化后的人工蜂群算法对模糊C-均值算法进行优化,以克服传统模糊C-均值算法对初始聚类中心点敏感的不足。最后,空间不确定数据的数据挖掘和知识发现由于更加符合客观实际而逐渐成为近年研究热点。考虑到现实世界中样本对象的不确定性及样本对象间界限划分的模糊性,本文给出了面向空间不确定数据的模糊聚类分析方法,通过模糊聚类将空间不确定数据进行组织分析,并给出相应的研究实验结果。
其他文献
目的:探讨技能评估与再培训在口腔护理实践中的应用。方法:对2010级66名护生进行口腔护理操作评估与再培训。结果:再培训前护生口腔护理操作平均得分为69.9±11.2,无一人合格
从云南省中医临床专业学位研究生教育现状出发,采用定量分析方法,对云南中医学院中医临床专业学位研究生、导师、带教教师、管理人员进行问卷调查,分析专业学位研究生培养过
近几年,中国东部地区多次出现雾霾天气,个别城市一年内重度污染天数甚至超过一半。根据相关部门统计,引起雾霾天气的主要因素为以PM2.5为代表的微粒,而这些微粒的三分之一来
无人驾驶车(UGV)是在无驾驶员参与的情况下,自主获取环境信息识别可行驶区域并规划最优路线的一类典型的智能移动机器人,无人驾驶技术融合了多门学科尖端科技,综合利用各种传
“铁肩担道义,妙手著文章”、“无冕之王”、“为百姓鼓与呼”……这是很长时期以来社会对于记者的普遍印象。但另一方面,近年来,通过新闻传播而引发的新闻侵权案件层出不穷,已经
随着消费信贷规模的不断扩大,消费信贷风险逐渐暴露出来,已严重阻碍了消费借贷的健康发展。消费信贷风险产生的主要原因是:个人征信系统不完善,房价和车价的下降致使部分消费者“
劳务派遣,是改革开放后在我国社会主义市场经济建立和完善的过程中,逐步发展起来的一种新型用工方式。它在我国起步晚、发展时间短、速度快,三十多年来,几乎涉及了我国不同的行业
<正>(2012年11月15日)党的十八大是在我国进入全面建成小康社会决定性阶段召开的一次十分重要的大会,是一次高举旗帜、继往开来、团结奋进的大会,对凝聚党心军心民心、推动党
本文针对中等职业学校学生的厌学行为,进行了深入调查,从学生自身因素、家庭因素、学校因素、社会因素四个方面进行了分析,并提出了相应的解决对策。
随着人们生活水平的提高,空调器逐渐成为生活的必需品,随之而来的空调器噪声也越来越受到人们的重视。振动小噪声低是评价家用空调器舒适性、产品品质的重要指标。若能够在家