基于支持向量机的多示例学习研究与应用

被引量 : 0次 | 上传用户:baidawei888888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器学习研究及应用的不断发展,很多传统领域借用机器学习来提高研究水平,应用机器学习的方法层出不穷,特别是基于机器学习的数据分析方法已成为解决复杂问题的关键技术之一,因此,当前机器学习的角色也逐渐发生了改变,由单一方向向多方向发展,一些新方法、新思想(如多示例学习、半监督学习等)逐渐被研究者相继提出,并实现从理论分析到实际应用的转变。传统的机器学习中,一个对象有一个描述,但在一些实际问题中,一个对象可能同时有多个描述,解决这种“对象:描述:类别”之间1:N:1关系的学习模型就是多示例学习。在多示例学习中,训练样本是由多个示例组成的包,包是有概念标记的,而示例没有概念标记。学习的目的是预测新包的类别。由于多示例学习具有独特的性质,被认为是一种与监督学习、非监督学习、强化学习并列的一种新的学习框架。由于多示例学习的独特性质和良好的应用前景,引起了国内外学者的广泛关注,他们提出了一些基于多示例学习问题的算法,并对这些算法分为三类:第一类是专门研究算法用来解决多示例学习问题,第二类方法试图在传统的单实例学习的目标函数中引入多示例学习的约束,第三类方法试图把多示例问题转化为一个传统的学习问题。以往的研究大多是基于前两种方法,而关于第三种方法的研究较少,因此,在第三类方法体系下,结合传统算法如支持向量机等的特性,提高多示例学习算法的性能,是一个值得研究的课题。本文的研究工作是基于支持向量机的多示例学习研究与应用。在分析以往关于多示例学习算法研究基础上,分析了多示例学习当前的应用领域,研究了现有基于支持向量机的多示例学习方法,在多示例学习第三类方法体系下,提出了三种新的基于支持向量机的多示例学习算法。论文的主要工作如下:1.关于多示例学习的研究。研究了多示例学习问题提出的背景,多示例学习问题的基本理论,多示例学习问题与传统学习算法的区别,多示例学习的分类算法。并分析了多示例学习的当前应用领域,如制药业、基于内容的图象检索、目标识别、股票选择等方面。2.关于统计理论与支持向量机的研究。主要研究统计理论与支持向量机的基本理论,支持向量机的基本原理及其改进算法的研究,支持向量机的简单应用概述等。3.基于支持向量机的多示例学习研究。研究了现有基于支持向量机的多示例学习方法:基于包的多示例学习方法(MI-SVM)和基于样本的多示例学习方法(mi-SVM),DD-SVM和MILES等。在多示例学习第三类方法体系下,提出了三种新的基于支持向量机的多示例学习方法:WEMISVM、BEMISVM和SEMISVM。通过将多示例学习问题转化为单实例问题来求解,WEMISVM方法在新包的预测中使用了集成学习投票方法中的算术平均值法,BEMISVM采用了集成学习中Boosting的方法,SEMISVM将多示例学习问题转换为单实例问题,并通过计算实例之间的算术平均值作为类标签的方法。4.实验设计与结果分析。在weka平台下设计实验,采用十折交叉验证的方法,选取分类精度、均方根误差和Kappa统计值作为评价标准。选取Eibe Frank教授提供的14组实验数据集,通过与标准多示例学习算法CitationKNN,MDD,MIDD,MIEMDD,MINND、MILR、MISMO、MISVM,三种多示例学习机制下使用传统机器学习算法NaiveBayes、J48、IBK、Logistic比较,验证算法的性能,并进行比较与分析。通过实验表明,本文提出的三种基于支持向量机的多示例学习方法具有良好的分类性能,具有良好的应用前景。
其他文献
两汉存在的历史时期与古罗马大致相同,二者分别是当时东西方世界的领头羊,在文化上都处于领先的地位。但古代世界没有哪一个民族像罗马人那样喜爱洗浴了。公共浴场在罗马日常
染料敏化太阳电池(DSC)是一种新型的化合物薄膜太阳电池,它采用纳米多孔TiO2薄膜电极替代传统的平板电极,以钌(Ⅱ)的多吡啶配合物作敏化剂, I2/I-氧化还原电对的电解质体系,
<正>0个月~9个月(体重:0公斤~13公斤)选择座椅:提篮式注意事项:一定要面向后安装推荐购买指数:★★★刚出生的婴儿,应该采用提篮式安全座椅。这种安全座椅专为0岁到1岁或体重在
在许多智能交通应用中,安装了GPS设备的车辆(简称浮动车)产生了大量的轨迹数据,分析和挖掘这些数据是当今交通及计算机等领域的一个研究热点,如计算交通路网状态、检测交通异
近年来随着西部大开发的实施,陕北沟壑区的经济水平得到了迅速的发展,但由于排水系统建设的相对落后,致使污水任意排放,使城市水体及生态环境不断恶化。因此,在沟壑区兴建城
我国水污染现象日益严重,影响着人们的日常生活和经济的发展。水污染防治与管理成为人们普遍关心的环境问题。研究污染物在水体中的输移扩散规律以及浓度分布可以为计算水体
目的:通过分析棉酚对Jurkat T细胞和小鼠淋巴细胞增殖和凋亡作用的影响,以及对二硝基氟苯(dinitrofluorobenzene,DNFB)诱导的小鼠迟发型超敏反应(delaytype hypersensitivity
目的:(1)对上胸椎(T1~T4)相关解剖数据(椎体前高、椎体后高、椎体上矢径、椎体下矢径、椎体上横径、椎体下横径、椎体最小横径、上胸椎的Cobb’s角度)进行测量。(2)探讨上胸椎
目的探讨影响膝关节前交叉韧带重建术后患者功能康复的相关因素。方法采用一般自我效能感量表和社会支持评定量表,对480例膝关节前交叉韧带重建术后患者进行调查。结果膝关节
退耕还林工程是我国最大的生态建设工程,也是世界十大重点林业生态工程之一。本文以位于长江流域的四川省洪雅县和位于黄河流域的陕西省安塞县为主要试验地,同时以其它相关省