聚类分析的新方法研究

来源 :云南师范大学 | 被引量 : 0次 | 上传用户:ujrcji54937
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是一种无监督学习,旨在根据特定的准则将数据集划分成若干个互不相交的簇(或“类”),从而发掘数据中的内在结构信息。本文研究内容主要集中于:(1)为提高聚类鲁棒性,提出了一种改进的模糊C-Means算法;(2)提出一种新的半监督避开鞍点的聚类方法。对提出的两个新聚类方法,通过实验结果对比,说明了它们的有效性。“一种鲁棒的模糊聚类方法”:模糊C-Means聚类(Fuzzy C-Means,FCM)未考虑噪音和野值点对聚类的影响,故FCM是欠鲁棒的。为了增强鲁棒性,将FCM中的光滑距离度量改变为非光滑距离度量。由此提出了一种鲁棒的模糊聚类方法(Robust FCM,RFCM)。为了求解RFCM对应的非光滑优化问题,本文采用了MM(Majorization-Minimization,MM)框架。通过在多个数据集上的实验,将RFCM与传统FCM算法进行对比,表明RFCM比FCM具有更好的聚类效果。“一种新的半监督避开鞍点聚类方法”:将成对约束作为弱半监督信息引入谱聚类模型中,由此提出了一种新的半监督避开鞍点聚类方法(Semi-Supervised Negative Curvature Clustering,SSNC)。可利用(加速)梯度下降法求解SSNC对应的最优化问题,然而由于该模型的目标函数是非凸的,故梯度法有可能收敛到鞍点而不是局部最小值点。为了避免鞍点问题,本文借助Xu等人[44]提出的随机扰动负曲率方向法(Negative-curvature-Originated-from-Noise,NEON)来逃避鞍点。在多个数据集上的实验表明,相较于基于核学习的谱聚类方法[46],本文提出的SSNC在多少情况下更有效。
其他文献
奶牛在围产期常发生营养代谢性疾病,特别是在集约化牛场中的高产奶牛,给集约化牛场造成巨大的经济损失。本试验旨在调查东北地区集约化牛场高产奶牛产后不同时期营养代谢与健康状况、奶牛脂肪肝、酮病、钙磷代谢障碍以及亚临床维生素E缺乏等主要疾病的保健效果和相关疾病的风险预警建立,为集约化规模牛场日后更有效的监控和预防奶牛产后营养代谢性疾病奠定理论和实际基础。本研究在东三省六个集约化牛场随机选取围产期奶牛(n=
伴随着生产的长足发展中国的市场化和全球化进程也在不断加快,在此开放环境下国际竞争力研究成为世界性热点问题。在品牌主导市场发展的二十一世纪中,山西省餐饮市场早已将竞
监控图像分类是计算机视觉领域的重要研究方向之一。该技术在实际生活中发挥着广泛的作用,如智能安防、智慧交通、自动驾驶等。随着计算机技术的发展和互联网的普及,人们的生活以及工作中出现了大量监控图像数据,面对数量如此巨大的图像信息,传统的图像分类方法和技术表现出诸多不足,对监控系统的“智能化”要求也就愈发提高。卷积神经网络的诸多特点不仅减少了网络的参数量、简化了网络模型、还进一步提高了网络模型的训练效率
近年来,计算机视觉中的识别任务,图像分类、目标物体定位、图像语义分割等,在有监督机器学习框架中取得具有前景的效果。然而,这样的机器学习系统要能在实际任务中被广泛使用
箱匣盒是古代存放小型物件的家具,并非登堂入室的重器,但与人们的生活息息相关,历史悠久、品种繁多。因而以小见大,有非常重要的研究价值。本文从材料、用途和开启方式等方面
江华是以瑶族为主的民族自治县,有瑶、汉、壮、苗等24个民族,少数民族人口30.6万人,其中瑶族人口28.6万人,占全县总人口的60%,是全国瑶族人口最多、地域最广、聚居最集中的瑶族自治县
<正> 人们对于《红与黑》的写作情况了解得不多。据作者自己宣称,最初的创作意图始于十月二十五到二十六日的夜间。那时他突然有了这样一个灵感:写一部名叫“朱利安”(另译于
"科学与人生观"论战是中国现代思想史上一场重要的论战。张君劢作为"人生观"一派的代表,其提倡的"玄学"价值观具有长远的意义。本文试图通过对张君劢论战时言论的分析,以明晰
从当前我国国情路情来看,全面深化铁路改革亟需一个统筹考虑、全面解决一系列深层次问题的综合改革方案。本文探讨综合改革方案中铁路路网与运营的关系、投融资体制改革、混
本文以江浙沪三地的25个地级市(含上海)的大气污染物排放量与经济发展水平的关系为研究对象,考察当前这些城市的二氧化硫和烟尘排放量与人均GDP之间的关系。在已有研究的基础