【摘 要】
:
近年来,随着大数据和人工智能的迅速发展,标记学习成为重点研究领域之一。其中,多示例多标记学习(Multi-Instance Multi-Label Learning,MIML)作为一种新型的学习范式,拓展了多示例学习(Multi-Instance Learning,MIL)和多标记学习(Multi-Label Learning,MLL)。MIML对于现实世界中许多复杂和模糊对象具有更好的表示能力,
论文部分内容阅读
近年来,随着大数据和人工智能的迅速发展,标记学习成为重点研究领域之一。其中,多示例多标记学习(Multi-Instance Multi-Label Learning,MIML)作为一种新型的学习范式,拓展了多示例学习(Multi-Instance Learning,MIL)和多标记学习(Multi-Label Learning,MLL)。MIML对于现实世界中许多复杂和模糊对象具有更好的表示能力,同时示例的表达方式也更加契合对象所存在的多义性。因此,MIML学习框架成为模式识别与标记学习重点研究课题之一,众多学者提出了大量MIML分类算法,并在文本、图像、音频和生物信息等多领域数据分析处理中取得较大成功。本文将主要针对基于MIML框架进行多领域数据分类问题研究,通过对MIML的深入学习探究,实现对于MIML分类算法中退化策略算法、分类算法和端到端分类算法的改进,主要研究工作如下:(1)目前基于K-Medoids聚类退化MIML算法将各示例间视为相互独立,退化过程可能造成较多的信息丢失,且K-Medoids聚类需聚类簇K的先验知识,不同的K值对分类结果影响较大。针对该问题,提出了一种改进均值漂移算法的多示例多标记分类算法,通过带有权值且为非参数聚类算法的均值漂移退化MIML,考虑示例间的相关性,尽可能减少退化过程信息的丢失。实验进一步验证了算法的有效性。(2)传统神经网络算法需要较多的网络参数设置,在求解最优解时很有可能出现局部最优解,而无法得到全局最优解。而极限学习机(Extreme Learning Machine,ELM)是一种高效且具有优化学习算法的单隐层前馈神经网络,求解时只需设置隐藏层节点数,并随机初始化权值和偏置就可求解出全局最优解。但传统ELM算法需设置隐藏层节点数,并且需初始随机权值和偏置,易受随机值的影响导致计算结果并不稳定,采用核ELM则可以解决这一问题。因此,提出将回归核极限学习机作为基分类器的MIML分类算法,在保证分类精度的同时降低了分类的时间消耗。通过对比实验表明了算法了可靠性。(3)近年来随着计算机硬件的飞速发展,深度学习技术也得到了广泛的应用。但目前基于卷积神经网络(Convolutional Neural Networks,CNN)的MIML分类算法多使用Softmax函数进行分类,但此函数将类与类之间视为互斥事件,并不符合MIML学习框架。因此,提出将CNN网络中Softmax函数替换为ELM分类器,构造出一种端到端的图像分类算法。将所提CNN-ELM-MIML模型与原始CNN进行对比,表明所提算法的合理性。
其他文献
本文主要研究了在局部线性光滑问题中使用非对称核函数来估计[0,∞)上的回归曲线的问题.由于对称核函数在对未知的密度函数做估计的时候存在边界效应,即在边界处有较大的偏差,这样的现象同样出现在回归估计中,故而学者们采用非对称核来改善这一问题.本文中使用的非对称核函数是LN(Lognormal)核和BS(Birnbaum-Saunders)核,LN核和BS核有着非负的支撑集,这两种核函数在非负轴上具有灵
目的使用影像学特征联合增强CT门脉期纹理特征建立诊断模型来鉴别胰腺浆液性囊腺瘤(SCN)和黏液性囊腺瘤(MCN)。材料与方法回顾性分析2010年1月至2019年10月经病理证实的57例
背景与目的目前人类对于乳腺癌的研究已经取得了巨大的进展,但乳腺癌依旧是每个成年女性都需要警惕的健康问题之一,其发病率在最近几年有上升的趋势。截止目前,与乳腺癌相关
标记分布学习作为多标记学习的拓展研究,已成为当今机器学习的热门之一。在实际生活中,为了更好的研究标记分布学习,往往需要搜集大量样本数据。然而获得大量样本数据的同时会带来某些样本之间的相似度过高,采集样本中可能会存在噪声干扰等问题。因此如何约简冗余样本,回避样本噪声干扰,对提高标记分布学习分类精度至关重要。传统多标记学习中对此类问题研究颇多,然而少有学者拓展研究至标记分布学习,基于此,本文针对这两个
植物色彩作为植物极具观赏价值的部分,历来是园林景观设计者关注的重点,特别是近年来,叶色丰富、具有季相变化的彩叶树种,在营造优美的园林景观方面越来越得到设计者的青睐。
目的:研究熊果酸对人肺腺癌A549细胞的抑制作用及其自噬相关蛋白LC3、Beclin-1及P62表达的影响,为临床应用熊果酸改善非小细胞肺癌的治法提供实验依据。材料与方法:采用不同
我国的草原面积分布广泛,在维持生态环境平衡和保护生物多样性方面具有重要意义。草原作为内蒙古的生态主体,对维护全国的生态环境起着十分重要的作用。多年来草原蝗害在内蒙
目的:本研究采用Meta分析的方法,对近10年来国内外采用术中用雷替曲塞腹腔灌注化疗治疗有关结直肠恶性肿瘤文献进行分析,综合评价雷替曲塞治疗结直肠癌的安全性。方法:检索2019年3月前,发表于PubMed、Embase和Cochrane3个英文数据库以及中国知网、万方数据知识服务平台和中国生物医学文献数据库等中文数据库,获得所有关于结直肠癌术中行雷替曲塞腹腔灌注化疗的文献并进行分析,比较术中行雷替
目的研究MTAN及MTAN与EDTA联合应用对血链球菌、牙龈卟啉单胞菌、具核梭杆菌混合菌的抑制作用。方法在不同混合菌种菌悬液内加入不同浓度的MTAN溶液及MTAN+EDTA溶液,记录初始
目的:了解非医学类大学生慢性病相关知识、信念及行为现状;探索影响非医学类大学生慢病相关知信行的因素;通过对非医学类大学生慢性病相关的认知、信念和行为三个因素构建结