多核一类支持向量机方法研究

来源 :北京建筑大学 | 被引量 : 4次 | 上传用户:zqtoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
异常检测问题是现实生活中一类迫切需要解决的问题,其已成为机器学习、深度学习领域的研究热点。异常检测实质是一种类别极不平衡的单类分类问题,目前,关于单类分类方法的研究已呈现出百家争鸣的现象,其中,广受学者青睐的是基于支持向量的方法——一类支持向量机(one-class support vector machine,OCSVM)和支持向量数据描述(support vector data description,SVDD)。该方法主要通过对目标类数据学习,构造一个最优的围绕目标类的边界,达到以高精度识别异常数据的目的。随着该类方法的广泛应用,传统的一类支持向量机算法的弊端逐渐显露。一是算法中使用的核函数及其核参数难以确定,且未有一个通用的确定方法,但是算法的性能很大程度上取决于所使用的核函数及其参数,因此一类支持向量机中核函数及其参数的选择是该算法的一个核心问题。二是算法对于训练集中的离群点或者噪音相当敏感,鲁棒性差。基于上述问题,本文围绕一类支持向量机算法展开研究,主要工作及取得的成果如下:1.将多核学习与一类支持向量机相结合,提出了基于核对齐的多核一类支持向量机。该方法将传统模型中的单核函数替换为多核函数,并以优化核对齐模型的方法计算出各基本核的权重,进而构造所需的线性加权合成核,避免选择最优的核函数及其参数这一难题。仿真实验结果表明,该方法的分类表现优于传统交叉验证选参的方法,并且训练效率明显提高。2.将模糊隶属度引入到多核一类支持向量机中,提出了基于核对齐的模糊多核一类支持向量机。该方法利用训练集中样本的类别确定性不同,为每个样本赋予一个模糊隶属度,降低噪音或离群点对分类边界产生的负面影响;同时使用基于核对齐的多核模型替代单核。在人工数据集和标准数据集上与其他两种算法进行了实验比较,结果表明所提方法具有抗噪性,提高了一类支持向量机的鲁棒性,并且计算效率高。3.基于数据的局部密度,提出了一种新的样本隶属度计算方法。该方法利用核函数衡量样本间的局部相似性大小,并确定样本的局部密度信息,然后依据局部密度赋予样本不同的隶属度。与其他隶属度方法相比,在基于局部密度的隶属度的计算过程中,仅需使用目标数据,这与一类支持向量机的训练集一致。将该隶属度计算方法与模糊多核一类支持向量机模型结合,并在标准数据集上进行了仿真实验,与多核一类支持向量机、加权多核一类支持向量机、基于核对齐的模糊多核一类支持向量机相比,该方法具有更优的抗噪能力。
其他文献
近些年来,我国不少科研人员套取科研经费案件被曝光引起公众广泛关注。针对该类行为,司法实务部门和理论界学者存在两种截然不同的处理意见,第一种意见认为行为应该做非罪化处理,第二种意见认为应该进行有罪认定。科研经费的性质问题、科研人员是否具有国家工作人员身份以及科研人员在套取经费时是否存在职务便利是正确分析行为性质的争议焦点。单纯的科研活动不属于从事公务,然而纵向科研经费来源于国家或者地方财政拨款,属于
蒙古族自古以来有着立碑纪念自己的祖先以及杰出英雄的传统。留存至今的蒙古文碑刻文献不仅以独特的载体形式保存大量的书法篆刻艺术,也成为了研究当时的经济、政治、军事、文化发展的重要物证,而且对补正前贤的阙失、考订典籍的讹谬等方面有很大助益。在明代,由于佛教在蒙古地区的广泛传播,因此修建寺庙并且大量翻译佛教经典的同时出现了很多记载寺庙修建史、歌颂德高望重的活佛以及施主功德的碑刻文献。因此,本文以明代蒙古文
梁启超将中国传统学术形态按其特征依次划分为先秦诸子学、两汉经学、魏晋玄学、隋唐佛学、宋明理学以及清代考据学六个阶段。清代学术作为中国传统学术的最后形态,其风貌特质与宋明理学可谓迥异。讲求谈心论性并以形而上的主观哲理性思辨为特色的宋明理学,何以在清代被考经证史、以形而下的客观考察为究心所在的考据学所取代,引发着历代学人的思索与解释。从清末民初章太炎、梁启超提出“政治高压”说后,学界以从外缘因素分析考
气体传感器在环境监测、疾病检测、人工智能、石油化工等领域有着广泛的应用。半导体气体传感器因具有灵敏度高、稳定性好、响应速度快等特点,一直是传感器领域的研究热点之一。气敏材料的敏感特性直接影响着气体传感器的性质,目前,除掺杂、修饰等主要方法外,制作异质结也是重要的增敏方式,因而将多种材料复合形成异质结也成为了行业的热点之一。但是,现在的研究普遍集中于纳米异质结的构建,而对大面积宏观异质结的构建及气敏
随着通信和互联网技术的飞速发展,多模态数据急剧增加。海量的多模态数据在方便用户的同时,也对信息检索技术提出了新的挑战。为了更好的满足用户对模态数据检索的需求,同时使计算机具有模拟人脑对海量的多模态数据进行认知、学习以及推理决策的能力,跨模态检索技术应时而生。深度神经网络类似于多层非线性投影,拥有比浅层方法更强的映射能力,可以充分提取不同模态的多阶抽象表示。其中,生成对抗网络能有效拟合多模态数据的分
非法经营罪属于行政犯罪,空白罪状和兜底条款的立法模式使其与仅具有行政违法性的非法经营行为的界分颇有难度,进而导致此类案件行政违法和刑事犯罪衔接不畅,引发非法经营罪适用扩大化、行政规制空间被不合理压缩等问题。因而本文以行政违法与刑事犯罪的衔接问题为关注点,对非法经营案件进行研究。本文分为五个部分,除引言和结语之外共约3.1万字,主要内容概括如下:第一部分,非法经营案件行刑衔接的现实困境。非法经营案件
在当今社会,手机和个人电脑等智能终端的普及在给人们生活提供便利的同时也带来了一系列的问题。一方面,终端上出现的各种图片和视频编辑工具使得针对原始数据的篡改变得更加容易,从而导致一系列的盗版问题;另一方面,随着多媒体数据内容的多样化,针对不同类型的多媒体数据的安全保护和认证变得更加困难。其中,作为数据安全保护、认证的一项重要技术手段,数字水印技术在近十年来得到了迅速的发展,在解决版权保护、票据防伪等
《中国佬》是华裔作家汤亭亭的另一著作,讲述了汤家四代男性在美国的工作和生活经历。自出版以来,便在美国文坛取得了巨大的成功。纵观全文可见,《中国佬》无论是在语言,还是
孪生支持向量机是受广义特征值支持向量机启发而提出的一种学习算法,如今它已成为机器学习的重要研究内容之一。由于孪生支持向量机具有的良好分类性能和快速学习能力,因此,它吸引了越来越多研究人员的关注,并且对其进行了较深入的研究,提出了多种不同的孪生支持向量机算法。然而,对于提出的一些算法,为了衡量模型的优劣,它们主要采用了铰链损失(Hinge loss)函数,而此损失函数易导致噪声敏感性和重采样不稳定性
渎职犯罪因果关系突出表现了刑法因果关系理论的魅力和困难。在同一个渎职犯罪案件上,如果采取不同的因果关系学说,可能会得出不同的结论。渎职犯罪因果关系的原因力合成非常复杂。由社会公众的普遍意见来判断渎职行为对于危害结果的作用大小也存在如何调查该种普遍意见的问题和会异化成集体暴力的风险。本文采用经济分析方法,从责任分配的效率角度来研究渎职犯罪因果关系,力求在节约司法成本的情况下最优实现渎职犯罪的规范目的