核机器学习方法研究

被引量 : 0次 | 上传用户:ynshisss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从上世纪60年代始,人们开始研究基于数据的机器学习问题理论,直至上世纪九十年代,在Vapnik等人的努力下,基于数据的机器学习理论得到了长足的发展,形成了一门比较完善的统计学习理论,并在此基础上创建了一类全新的通用的有效的机器学习算法:支撑矢量机。统计学习理论的精髓在于引入了假设函数集容量控制的概念,学习机为了获得好的推广能力,需在假设函数集容量控制和最小化经验风险之间作一个好的折衷。在统计学习理论出现和完善之前,在机器学习中引入核函数,更广义地说就是引入非线性映射和非线性函数技术早已有之。但核函数真正在机器学习中获得成功应用始于支撑矢量机。其原因就是由于引入了非线性函数,使得学习机假设函数集太大,容易导致学习机的过拟合而降低推广能力。正是统计学习理论和核技术的结合,才触发了从上世纪九十年代中期开始的核机器的出现和快速成功的发展。目前主要的核机器技术包括支撑矢量机、核Fisher分类器和核主分量分析等。本论文的所有工作正是在上述结合点上展开,主要包括两大部份的内容:支撑矢量机算法分析和改进方面以及基于统计学习理论的新核机器算法方面。在支撑矢量机算法分析和改进方面,本论文主要作了以下四方面的工作:第一、分析了支撑矢量机的基本几何性质。我们针对模式识别和回归估计两类支撑矢量机,分别分析和证明了它们的一些基本几何性质,基于这些性质讨论了支撑矢量机对新增样本的推广能力,得到了一些非常有价值的结论。从这些结论可以看出支撑矢量机对新增样本具有良好的推广能力,并且支撑矢量机是一种可积累的学习模型。第二、提出了线性规划支撑矢量机。我们通过对统计学习理论中一些重要结论,特别是线性假设函数集VC维数的分析,得到了一类线性规划支撑矢量机。在线性规划支撑矢量机中,以对VC维数界作适当放宽为代价,从而降低支撑矢量机的求解复杂度。在该章最后对人工和实际样本的实验结果说明了线性规划支撑矢量机采用放宽VC界对学习机推广能力的影响是可以接受的,而在计算复杂度上明显优于原支撑矢量机。第三、提出了无约束规划回归估计支撑矢量机。当采用高斯损失函数时,我们提出了一种无约束支撑矢量机回归估计算法,并证明了该算法具有严格的凸性,不存在局部极小解。该算法较标准支撑矢量机而言,由于不存在线性约束,可以雷达信号处理重点实验室<WP=6>II核机器学习方法研究采用快速的多维搜索数值方法,如最陡下降法、Newton法和共轭梯度法等具有较快的优化速度,而且能够直接推广到复数域中。第四、提出了自适应支撑矢量机算法。通常无线通信信道具有时变性,要求多用户检测算法具有自适应性。我们提出了一种自适应支撑矢量机方法,并把它用于信道时变情况下的多用户检测。一方面由于支撑矢量机引入结构风险,使得支撑矢量机多用户检测的推广能力较好且对训练要求的样本数也大大下降;另一方面由于支撑矢量机的非线性特性可以比线性检测器更好地逼近最佳检测器。在新的基于统计学习理论的核机器方面,本论文主要作了以下四方面的工作。第一、提出了一种新的支撑矢量机模型选择准则。支撑矢量机模型选择由于其高度的非线性一直是一个非常困难的公开问题。我们通过对支撑矢量机推广能力的分析,提出了一种构造性的与样本分布有关的推广能力衡量准则。该准则与统计学习理论中的推广能力准则具有几何上的一致性,由样本的二阶统计量构成,比已有的完全不依赖于样本分布的推广能力上界更能反映学习过程的收敛性和收敛速率。较为重要的一点是该准则在学习过程之前是可处理的,所以它可以用作所有分类器中数据预处理的准则,同时也可以为支撑矢量机模型的选择提供依据。第二、提出了复值支撑矢量机算法。支撑矢量机由于采用了Vapnike-不敏感损失函数和数值优化算法,不能简单地推广到复数域。为了使支撑矢量机适用于复值样本的处理,我们发展了模式识别复值支撑矢量机和回归估计复值支撑矢量机。首先我们受到数字通信中相位调制方法的启示,定义了复平面上的N进制复值符号函数。然后基于所定义的复值符号函数提出并推导了复数域的二分和四分模式识别支撑矢量机。对于复数域的二分模式识别问题,我们证明了二分模式识别复值支撑矢量机与采用增维方法的实值支撑矢量机等效,因而它仅具数学意义。对于复数域的四分模式识别问题,四分模式识别复值支撑矢量机与数字通信中4-QAM解调决策完全一致,因此将具有良好的实用价值。我们进一步在模式识别复值支撑矢量机中通过引入复核函数及其对应的核函数组得到了非线性模式识别复值支撑矢量机,并讨论了几种典型的复核函数和核函数组。另一方面,严格地说复值样本的回归估计并不能简单地分解为分别对实部和虚部的回归估计。我们针对复值样本的回归估计提出了线性回归估计复值支撑矢量机,并类似模式识别复值支撑矢量机进一步通过引入复核函数以及对应的核函数组得到了非线性回归估计复值支撑?
其他文献
胶东大尹格庄金矿南部的Ⅰ号矿体受到了后期的多金属硫化物叠加成矿作用,表现强烈的银矿化,产出品位较高的银和多金属硫化物。本文以扫描电子显微镜进行矿物学研究,取得的成
椎间盘退变是腰背痛的主要原因,研究椎间盘发育、退变,结构功能以及椎间盘中各种细胞的特异性标志物有助于椎间盘疾病的治疗。近年来的研究发现,椎间盘起源于脊索,椎间盘退变
在世界经济一体化和中国加入WTO的背景下,我国摩托车企业的国际化经营问题成为发展战略中重要的组成部分。本论文在解析企业国际化经营战略理论的基础上,分析国际国内摩托车行
研究了涡旋光束经过散射介质后形成的散斑特性.运用概率统计理论和光束传输理论,模拟了不同拓扑电荷数的涡旋光束经过散射介质后形成的散斑,以及散射介质颗粒尺度对散斑特性
国网唐山市丰南区供电公司高度重视本质安全工作,通过深入开展“1136”本质安全管理,践行“自下而上、人人参与”的管理理念,切实推进了班组的风险管控。
本文分析了散装化学品的危险性和散装化学品船的特殊危险性,系统分析了散装化学品船安全管理中存在的主要问题,提出和总结了加强散装化学品船安全运输的几项措施。
因特网密钥交换(Internet Key Exchange IKE)协议是IPSec(IP Security)协议簇的重要组成部分,负责动态协商和管理安全联盟。由于IKE协议的复杂性,导致它存在很多问题。所以提出
作为快递业内的标杆之一,顺丰算是对移动互联网反应较早的企业。其变革从2014年就已经开始,一夜之间遍布大街小巷的顺丰嘿客就是这个系列变革的直接表现。去年5月,顺丰速运对其
报纸
近年以来,我国民营中小企业的不断发展壮大,为社会稳定、经济发展做出了不可忽视的贡献;但由于其自身和历史等方面的原因,在日益发展壮大的过程中急需对企业的管理加以规范。因为
轴线手法是建筑空间架构的一种方法,也是解读空间并赋予其意义的一种经典设计手法。本文从分析轴线起源、东西方建筑中的轴线特征以及现代建筑师对轴线的探索研究开始;全面论述