基于置信函数理论的数据分类研究与应用

来源 :北京科技大学 | 被引量 : 0次 | 上传用户：yangke0248

【摘要】

：

数据分类是机器学习中最基础的任务之一。随着现代化计算机技术逐步覆盖材料信息、工业系统等众多领域,数据的采集获取已成为现实。通过对获取到的数据进行分类,可以揭示出研

【作者】

：

孟金桃

【出处】

：

北京科技大学

【发表日期】

：

2021年01期

【关键词】

：

数据分类置信函数理论腐蚀数据半监督分类聚类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

数据分类是机器学习中最基础的任务之一。随着现代化计算机技术逐步覆盖材料信息、工业系统等众多领域,数据的采集获取已成为现实。通过对获取到的数据进行分类,可以揭示出研究对象潜在的、本质的分布结构。然而由于实际工程及自然环境的复杂性,所获取到的数据往往具有不确定性、多特征性和不完备性等特点,具体表现在数据在特征空间分割不明确、多维特征、已标号样本量不足这三个方面,给数据分类工作造成困难。传统的数据分类方法往往出现分类准确性差甚至失效的情况。置信函数理论因其具有完备的不确定性表征能力和多源不确定信息融合能力,为此类复杂数据的分类问题提供了可行的数学框架。因此,本文在置信函数理论框架下,围绕数据分类问题,开展了以下研究:(1)针对多特征数据的数据分类问题,考虑到不同特征往往具有不同的重要性,在置信函数理论框架下,本文提出了一种基于加权特征证据融合的监督型分类模型。首先,该模型将不同特征视为支持样本类别归属问题的多源证据,并利用核密度估计方法来量化证据信息。其次,引入证据权重,并利用Pignistic概率转换设计了最小化训练集样本分类误差的优化目标来自学习该权重参数。最后,通过加权融合多个特征证据给出测试样本的置信划分,可表征出复杂样本类别归属的不确定性。该模型属于无参数分类器。公共数据集上的对比实验证明了该模型的有效性。进一步地,该模型被应用于大气腐蚀性研究这一实际工程问题,挖掘出了关键环境因素对大气腐蚀性的影响,为揭示大气腐蚀机理提供理论技术支持。(2)针对仅含有极少量已标号样本、不足以表征各类别数据真实分布的数据分类问题,在置信函数理论框架下,本文提出了一种基于软证据标签传播的半监督分类模型。首先,引入基本置信分配函数作为样本的软证据标签,以准确量化样本类别归属的不确定性及异常性。其次,设计了一种基于多源证据融合的软标签传播机制。在该机制下,未标号样本将通过吸收近邻样本的标签信息来迭代更新自身的标签,可避免人为设定信度阈值的影响。公共数据集上的对比实验表明,该模型对于多特征数据和图结构数据均能有效完成分类任务,并对模型关键参数具有较好的鲁棒性。进一步地,该模型被应用于大气腐蚀等级预测这一实际工程问题,在仅有少量已知腐蚀等级的腐蚀数据条件下,准确预测出了观测地区属于不同大气腐蚀等级的概率,为大气腐蚀程度评估提供理论技术支持。(3)针对未知类别总数且不含有任何已标号样本的数据聚类问题,在置信函数理论框架下,本文提出了一种基于信度峰的软标签传播聚类模型。该模型旨在挖掘出数据集中存在的类别总数、并给出数据集的软划分。首先,提出了一种改进的信度测度来表征样本是类簇中心样本的可能性,从而在不依赖大量近邻样本的前提下准确检测出类簇中心样本和异常样本。其次,采用软标签来表征非类簇中心样本在类别归属上的不确定性,并提出了一种新的包含距离及信度信息的近邻权重计算方法。最后,在线性软标签传播机制下,各样本将通过吸收其近邻样本的标签信息来更新自身的标签。该模型输出样本的软划分,可表征样本类别归属的不确定性。公共数据集上的对比实验证明了该模型的有效性,并对模型参数具有较好的鲁棒性。进一步地,该模型被应用于海水腐蚀性研究这一实际工程问题,揭示出了低合金钢材料的耐蚀化学成分,为新材料研发提供理论技术支持。本文工作不仅促进了置信函数理论在数据分类任务上的基础理论研究,而且推动了其与材料腐蚀学科的交叉,为腐蚀科学研究提供了一种新的研究思路与方法。

其他文献

益气养阴方合孟鲁司特钠治疗儿童咳嗽变异性哮喘30例

目的：观察益气养阴方合孟鲁司特钠治疗咳嗽变异性哮喘的临床效果。方法：将60例患儿分为两组，其中对照组采用孟鲁司特钠，治疗组在此基础上使用益气养阴方（防风、川贝母、青黛、蝉蜕

期刊

哮喘变异性/中西医结合疗法补气剂/治疗应用@益气养阴方

心脏术后患者病原菌感染分布特点及耐药性分析

目的分析心脏术后患者病原菌感染的分布特点及其耐药性,为临床预防控制心脏术后感染及合理使用抗菌药物提供科学依据.方法收集 2 0 1 4年 1 月- 2 0 1 6年 9 月心脏术后患者

期刊

心脏术后感染病原菌耐药性Aftercardiac surgery Infection Pathogenic bacteria Drug resistan

养阴活胃合剂治疗慢性萎缩性胃炎30例

目的：观察养阴活胃合剂对萎缩性胃炎的中医疗效。方法：将符合纳入标准的患者随机分为治疗组30例和对照组30例。治疗组中药合剂（芦根、茯苓、阿魏、莪术、鸡内金、乌贼骨等）,对照

期刊

胃炎萎缩性/中医药疗法健脾@养阴活胃合剂

机器人同时移动与作业的运动规划研究

移动作业将移动机器人与操作机器人相结合,可有效扩大机器人的作业范围,提升机器人的作业灵活度,是多种服务机器人、新型工业机器人以及军事航天机器人必须具备的能力。移动

学位

移动作业迭代优化逆运动学启发式随机路径混合视觉伺服眼在手上整体雅可比矩阵卡尔曼滤波任务限制动态避障模型预测控制

海上采油平台应急柴油发电机电压异常故障分析及处理

应急柴油发电机是海上采油平台关键的应急电源设备,应急时必须能够稳定可靠给平台上的电动消防泵、应急照明、应急电伴热、平台吊机等设备供电,涠洲某海上井口平台在应急发电

期刊

应急柴油发电机电压波动励磁系统调速电控板

试论思想教育的心理学原则

本文阐述了思想教育与心理学的本质联系,论述了思想教育必须遵循的三个心理学原则,以期增强思想教育的针对性和实效性,取得良好的教育效果.

期刊

思想教育心理学原则教育效果

基于置信函数理论的数据分类研究与应用

其他学术论文