基于角度的统计分类方法研究及其应用

来源 :成都理工大学 | 被引量 : 0次 | 上传用户:xfjs08jx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着科学技术及互联网的飞速发展,各行各业每天都在产生海量的数据,推动着大数据产业的繁荣.大数据裹挟而来的信息风暴正在深入变革我们的生活、工作和思维.以机器学习算法为代表的大数据分析技术助力于挖掘蕴藏在数据矿山中的知识“黄金”.模式分类是一项基础性的研究热点问题,经常出现在统计学、计算机科学、工程学、经济学、物理学、生物学等领域中.本文主要研究基于角度的统计分类方法,其中包括分类概率估计、稳健型分类器设计、加权学习等,并将其应用在精准医疗领域.本文的主要工作如下:  设计了一种仿决策树的二分类概率估计算法.加权二分类方法的理论性质良好,且易于算法实现.在此基础上,构建了高效的概率决策树.它结构简洁,不会混淆概率估计,有效弱化了正则项带来的收缩效应.数值结果表明,新方法显著提升了概率估计的精度.  提出了一种基于组合平方损失的最小二乘支持向量机.该方法利用了组合平方损失函数的特性,具有Fisher相合性,且能提供各类别的概率估计.新方法能较好地处理高维问题和类别数目较大的场景.此外,设计了高效算法来求解该问题.模拟结果和基因数据的结果表明,新方法的分类效果突出.  提出了两种稳健的统计分类方法,一种是基于截断损失函数,另一种是自适应加权学习.二者的出发点都是为了构造有界的损失函数,以控制异常点的影响.前者是一个典型的非凸优化问题,可采用Difference of Convex Algorithm(DCA)算法求解,但计算开销较大.通过引入适当的权重,后者将原问题的求解纳入到凸优化框架,亦可获得稳健的分类效果.此外,在理论上证明了二者在不动点意义下的算法等价性.数值结果表明,新提出的方法稳健性较高.  在精准医疗领域,多治疗方案的个性化定制规则的估计具有重大的现实意义.它可以归结到疗效加权的分类方法.设计了一族新型损失函数,它光滑有界,能保证对应的分类方法具有稳健性.将该损失函数应用到个性化诊疗规则的定制问题中,以获得稳健估计.基于该损失函数的新估计方法具有Fisher相合性,且能提供不同方案的理论疗效比.设计了DCA算法来求解此问题.数值结果表明,该方法的稳健性能突出,表现优于常规方法.
其他文献
文章重点通过对多媒体技术应用于小学数学课堂教学中的实践情况进行分析,论论述了将多媒体应用于小学数学教学当中的优势以及具体的使用策略,最终阐述在使用多媒体技术的过程
完美匹配层(PML)一种特殊的吸收边界层条件,最初是为了解决电磁场的波动问题。本文介绍人工边界的发展,特别是完美匹配层的发展,介绍微分形式的麦克斯韦方程组与Helmholtz方程的
为官一任,造福一方。除了数字造假者外,大多数官员追求CDP,并视之为自己在任时的政绩,不能算错;若有错,我看还得从“发展观”的误区上找找原因。论发展,就不得不睁眼看看存
该文主要做了以下工作:在括号代数方面,1、给出了合冲理想中的任意一个多项式可以被Grassmann-Plucker关系式中的最短关系式——三项式伪除为零的结论.2、构造出了括号代数的
立足语文教学的各方面培养学生的创新意识,进而提高学生的创新能力,是一个摆在所有小学语文教师面前的问题.作为一名语文老师,要在教学中实施创新灵活的教学方式,将创新理念
全文包括三大部分内容,它们是:(1)建立了群体决策偏差度分析的有关理论和群体决策选择函数的强稳定性理论,以及两种具有代表性的群体决策规则;(2)引进多目标最优化圆锥有效解
数控加工中G01代码生成的离散折线段路径使用广泛,但因其数据量庞大和拐角不连续,直接对离散折线段加工导致加工质量和加工效率不高。一个有效的解决方法为先用光滑的参数曲线
该文主要讨论如何利用并行计算机系统对大量有序数据进行排序.在综述了并行快速排序算法的现状之后,分析了RRAM模型下的一并行快速排序算法的复杂度问题,最后讨论了在NOW系统
该文对一类对偶关群——N(2,2,0)代数作了进一步的研究.首先,作为可约化半群的推广,该文引入了半群左可约化,右可约化的概念,进一步研究了N(2,2,0)代数的平移变换的性质,改进