【摘 要】
:
聚类在数据挖掘领域中可以用来发现潜在的数据分布和隐含模式。模糊C-均值聚类,作为简单高效的聚类算法,已广泛应用于各种领域。然而随着大数据的蓬勃发展,数据呈现出非线性、高维等复杂特点,利用传统的模糊C-均值算法难以得到满意的划分结果。子空间聚类方法可以发现数据潜在的子空间信息,从而聚类高维数据,但仍无法高效处理非线性数据聚类。而核聚类算法的提出能发现隐藏在数据中的复杂非线性结构,但此类方法有三个明显
论文部分内容阅读
聚类在数据挖掘领域中可以用来发现潜在的数据分布和隐含模式。模糊C-均值聚类,作为简单高效的聚类算法,已广泛应用于各种领域。然而随着大数据的蓬勃发展,数据呈现出非线性、高维等复杂特点,利用传统的模糊C-均值算法难以得到满意的划分结果。子空间聚类方法可以发现数据潜在的子空间信息,从而聚类高维数据,但仍无法高效处理非线性数据聚类。而核聚类算法的提出能发现隐藏在数据中的复杂非线性结构,但此类方法有三个明显的缺点:(1)忽略了原始数据中包含的局部图结构信息,未考虑样本之间的亲和度关系;(2)高计算复杂度使得它们无法用于大规模数据集;(3)核函数和核参数难以选择。为解决上述问题,本文将图嵌入的思想用于核模糊聚类中,提出了一系列的改进算法。首先,针对传统核聚类算法未有效利用数据之间的亲和度信息,提出基于图嵌入的单核模糊聚类算法,借鉴图嵌入思想,充分利用样本之间的局部结构信息,并挖掘隐藏在数据中的潜在非线性结构。进一步,为处理高维数据,提出基于图嵌入的单核属性加权模糊聚类算法,引入属性熵加权策略,对属性的权值进行优化,进一步提高算法效率。实验结果表明,与传统的核模糊聚类算法相比,所提算法展现出更好的聚类性能。其次,针对核聚类算法时间复杂度高、核空间特征不可表示的问题,提出基于图嵌入的准蒙特卡洛特征映射单核模糊聚类算法,用随机特征映射逼近核函数,使特征可显示表达,降低时间复杂度。进一步,为处理高维数据,提出基于图嵌入的准蒙特卡洛特征映射单核属性加权模糊聚类算法,引入属性熵加权策略来优化属性权重,进一步改善聚类性能。实验结果表明,采用随机特征的方法大大缩短了运行时间,提高了计算效率。最后,针对单核聚类算法核函数与核参数选取困难的问题,提出基于图嵌入的准蒙特卡洛特征映射多核属性加权模糊聚类算法,引入多核属性加权策略,通过调节核权重因子,灵活加权多核属性,从而解决单核局限性的问题,改善算法的泛化性能。实验结果表明,与单核聚类算法相比,所提算法对核参数的选取不敏感,聚类准确度得到进一步提升。
其他文献
[目的]了解系统性红斑狼疮相关肺动脉高压(Pulmonary arterial hypertension associated with systemic lupus erythematosus,SLE-PAH)患者的临床特征,探讨SLE患者并发肺动脉高压(PAH)的危险因素,并通过研究SLE-PAH患者与HLA-B、DR基因多态性的关系,探讨SLE-PAH的易感基因及保护基因。[方法]本研究纳入
[目 的]回顾调查近5年我院住院早产儿产前糖皮质激素(ACS)的应用情况,分析标准方案及不同剂量和不同疗程ACS干预对双胎早产儿临床结局的影响,为制定并优化双胎妊娠ACS干预方案提供科学依据。[方法]研究选取2017年1月至2021年12月昆明医科大学第一附属医院新生儿病房,符合纳入标准的胎龄24~34周早产儿为研究对象,收集孕母临床资料和新生儿病例资料。采用回顾性队列研究,将研究分为两个部分:1
保障性安居工程作为一项保障和促进我国人民群众利益的标准化工程,被认为是我国重点关注的工程项目之一。2021年3月2日,国务院办公厅郑重出台了促进保障性安居工程项目管理体系建设的相关指导意见,认为要想加速经济发展以及促进环境的改善和维护社会利益,需要做出的重大举措之一便是积极推动保障性安居工程项目管理体系建设,为了全面推进保障性安居工程项目建设,进一步加强保障性住房管理规范,加快解决中低收入家庭存在
随着经济社会的发展,环境问题日益显露,可持续发展的观念逐渐深入人心。国家加大对环境保护和生态修复的人力、物力、财力投入,有关环境保护的政策措施也不断出台,资源环境的保护工作得到了愈来愈多的关注。作为国家环境监督体系的组成部分,资源环境审计越来越被重视。在新形势下,资源环境审计肩负着国家环境治理现代化的时代要求、审计全覆盖的目标要求、保障公众生态权益的使命要求、加强审计队伍建设的职责要求等,因而注重
[目 的]探讨红细胞比容与白蛋白差值对小儿脓毒性休克和失血性休克的诊断价值及其预后评估的可行性。[方 法]本研究病例分为三个组,A组选取我院儿保科2019年-2021年入院体检的健康患儿,共选取108例,其中男73例,女35例,年龄78(55,96)月,收集体检者同期检测的红细胞比容(HCT)、白蛋白(ALB)等指标,并计算二者的差值;B组选取我院2019年-2021年第一诊断为急性失血性休克的患
[目的]探讨慢性乙型肝炎(Chronichepatitis B,CHB)患者外周血单个核细胞中辅助性T细胞17(T helper 17 cells,Th17)、调节性T细胞(Regulatory T cells,Treg)的平衡状况,以及Janus激酶1(Janus kinase 1,JAK1)、信号转导和转录激活因子 5(Signal transducers and activators of
我国十分重视生态环境的发展,制度上不断出台政策规定来推行绿色可持续发展,不断深化改革,维护人类赖以生存的环境。国家对自然资源资产的重视,是坚持人与自然和谐发展理念的体现,而森林资源资产作为自然资源资产的重要组成部分,对自然环境的发展更是起着不可替代的作用,是构建和谐生态的重要保障。然而,改革开放以来,伴随着人民物质水平的提高、社会经济的快速发展,生态环境也在日益恶化,森林资源资产由于过度开采等原因
[目 的]通过对EB病毒(Epstein-Barr virus,EBV)感染导致的传染性单核细胞增多症(Infectious mononucleosis,IM)、EBV相关噬血细胞性淋巴组织细胞增生症(Epstein-Barr virus related hemophagocytic lymphohistiocytosis,EBV-HLH)的临床流行病学特点,包括季节分布、临床表现、实验室检查、治
[目 的]探讨不同营养方式对改善高位消化道畸形患儿术后营养状况的影响。[方 法]选取自2020年6月至2022年3月间在本院新生儿重症监护病房住院并行一期肠切除吻合术的高位消化道畸形患儿24例进行前瞻性研究,根据术后不同的喂养方式,将患儿随机分为早期肠内营养组和对照组,早期肠内营养组术后48-72h内通过鼻空肠营养管早期给予肠内营养,对照组待胃肠功能恢复(即肠鸣音良好、有排气排便)后予经口喂养。比
[目 的]分析儿童EB病毒感染相关性噬血细胞综合征(Epstein-Barr virus-associated Hemophagocytic lymphohistiocytosis,EBV-HLH)的临床表现,实验室检查结果,治疗及转归,分析其影响预后的因素,为临床决策提供帮助。[方 法]回顾性收集2017年1月-2021.3月于昆明医科大学附属儿童医院确诊的96例EB病毒感染相关性噬血细胞综合征