基于KD标记点的谱聚类算法研究

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:qqqq_eeqg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于标记点的谱聚类算法降低了谱聚类算法的计算复杂度,避免了传统谱聚类算法计算时间长的应用局限。但是,使用聚类准确性和标准化互信息衡量聚类有效性,基于标记点的谱聚类算法的聚类有效性较低。如何平衡聚类有效性和聚类时间成为了基于标记点的谱聚类算法面对的难题。针对此问题,提出了一种基于KD标记点的谱聚类算法。首先,提出一种KD标记点选取方法,该方法使用超平面将样本空间不均等划分为p个子块,超平面垂直于样本空间中方差最大的前i个维度,划分后的每个子块中数据点的数量基本相等,计算各子块中数据点的平均值作为中心点,中心点的集合即为选取的标记点;然后,在KD标记点的基础上使用一种近邻点有效分配法计算标记点与样本点之间的相似矩阵,将结果推广到样本点中构造相似图;最后,使用奇异值分解代替了传统的特征分解过程以加快算法的速度,并在右奇异向量上进行k-means聚类得到最终结果,提高了聚类有效性。在仿真实验中采用MNIST、Seismic、LetterRec和USPS四个不同规模的大数据集,将本文算法与经典谱聚类算法和四种有代表性的基于标记点的谱聚类算法进行对比,结果表明本文算法在聚类有效性和聚类时间两方面优于现有的基于标记点的谱聚类算法,在处理大规模数据时,平衡了聚类有效性和聚类时间。该论文有图23幅,表7个,参考文献51篇。
其他文献
全要素生产率(TFP,Total Factor Productivity)是衡量经济效益水平和集约化、高质量增长程度的重要指标。2017年10月,党的十九大报告作出我国经济已由高速增长阶段转向高质量发展阶段的重大判断。在这种情况下,如何持续提高全要素生产率成为影响我国经济转型和经济增长的重要问题。湖北省是我国重要的老工业基地、制造业大省,经济活动和社会财富的创造都离不开制造业的发展。新常态经济背景
“行营”是中唐至北宋初军队出征制度的专称。初时是唐中期在平叛战争时临时所设,总统诸路军队的军事指挥系统,自五代时期开始有出征行营和常设行营之分。本文选择以五代时期的北面行营这一个案为切入点,在从史料中爬梳出北面行营建制的基础上,主要探讨五代时期北面行营的作用、建制变迁以及对五代政权递嬗的影响。首先结合史料,作表复原了北面行营每一阶段的具体使职、所任将领和其当时的兼任职务。将后梁、后唐、后晋北面行营
在物联网时代,大量的移动设备收集了大量的个人移动数据,使得学习到人类的显性和隐性移动模式成为可能。挖掘人类的移动模式不仅可以使许多商业应用受益,还可以加速智能城市的建设。挖掘人类移动模式的两个重要方向就是轨迹用户链接问题(以下简称TUL),即如识别不同匿名用户留下的运动轨迹,和下一个兴趣点预测问题。虽然许多现存的模型都在解决上述两个问题时取得了不错的结果,但是这些模型均需要大量的有标签数据用于训练
互联网的飞速发展使图像数据也迅速增长,图像是承载信息的重要载体,图像和文本信息相比内容更加具体,信息也更加丰富,但是在庞大的图像数据中如何寻找人们想要的图像,如何找
我国第一例上市公司管理层收购事件发生在1997年,在此后的二十几年里,管理层收购在我国经历了过渡和发展的阶段,学者关于管理层收购对我国企业绩效影响的研究,经历从定性研究阶段发展到定量研究阶段。另一方面,学者关于高管政治背景对企业绩效的影响研究逐步细化,分析了不同类型和不同行业高管政治背景对企业绩效的影响,直到最近有学者提出,拥有政治背景的高管会因为股权比例的不同对企业绩效产生不同的影响,而管理层收
目标检测是智能穿戴式设备等诸多实际应用平台的基础需求任务。然而,穿戴式设备所拍摄的视频图像存在场景瞬时移动,前景和背景剧烈变化的特性(动态场景),导致传统目标检测方法在解决动态场景检测任务时存在误检和漏检的难题。为此本文针对动态场景建立了目标检测数据集,并开展了针对动态场景下的目标检测方法的研究。具体研究内容如下:1.本文研究了动态场景下目标检测数据集的建立方法。本文分析了原有数据的缺陷和不足,更
随着人类社会的发展,城镇化是人类社会发展的必然趋势,而随着村落的消失,与之相关的自然景观和文化都在逐步缺少。在这一背景下,作为村落传统文化的组成部分,将面临着传承和
如何通过恰当的宏观财政手段,实现提升农地利用效率、农村经济发展水平和农民收入的目的,是急需研究的关键问题。近年来,农业补贴政策已经成为中央政府强农惠农政策的最重要
以往的决策研究关注的大多是个体如何在可选项间立即做出选择,却忽略了决策领域另一个普遍现象——延迟选择。近年来,有关延迟选择的研究得到了广泛的关注。已有的研究分别从认知、情绪和个体差异特征的角度探究延迟选择的影响因素。此外,有研究表明决策风格这一个体差异特征在决策中发挥着重要的作用。而关于最优化、满意型决策风格和延迟选择的关系,目前少有研究。因此,本研究重点探究最优化、满意型决策风格和延迟选择的关系
中国的煤炭产量占世界总煤炭产量的近45%,而且煤炭开采破坏大量土地产生巨大的碳排放,所以低碳减排已成为中国等世界采煤大国的责任和共识。科学研究表明土地利用优化能在很大程度上增加碳汇,对促进区域乃至全球低碳减排具有重要意义。但是目前国内外对井工煤矿区低碳土地利用优化的研究很少,也缺乏响应的理论来指导井工煤矿区低碳土地利用的规划和实践。本文以晋煤集团大型煤炭基地内的集中连片井工煤矿区为研究对象,首先以