基于正则化最小二乘的安全半监督学习算法研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:houhx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半监督学习是同时利用标记和未标记数据进行学习的一种机器学习方法,其希望挖掘未标记样本的信息提升学习性能。但在某些场景中,由于未标记样本的引入,半监督学习的性能甚至不如相应监督学习的性能,因此如何安全挖掘未标记样本的信息,成为了一个研究热点。文章在总结现有安全半监督学习基础上,结合正则化最小二乘算法(RLS)和拉普拉斯正则化最小二乘算法(Lap RLS),采用对偶学习机制和风险度自适应估计策略,提出了两种安全半监督学习算法。文章具体研究内容如下:(1)提出了一种基于对偶学习的安全半监督学习算法(DALLAS)。该算法采用RLS和协同表示分类算法(CRC)分别作为原模型和对偶模型,来预测和重构未标记样本,根据重构误差计算风险度,构建基于风险度的安全半监督学习算法。对于每个未标记样本,若重构误差大,则其风险度大且其预测应该接近监督学习预测。否则,未标记样本的风险度小。最后,在医疗疾病和数字识别等标准数据集上的实验表明,DALLAS能较好地降低未标记样本的风险程度,特别是在标记样本较少的情况下,从而降低了半监督学习错误分类的风险,提升了算法的安全性。(2)提出了一种基于l1范数的安全半监督学习算法。目前的安全半监督学习方法只考虑了未标记样本的风险性,忽略了标记样本的风险性;除此之外,现有的风险度依靠人为设计评判函数,缺少自适应估计机制。该方法通过基于l1范数的损失函数,建立了安全半监督学习的优化问题,能够同时降低标记和未标记样本的风险。此外,针对优化问题提出了一种有效的迭代优化策略,可以自适应估计样本的风险度。通过在图像数据集等标准数据集上的实验,该算法达到了安全半监督学习的目的,并在Digit1数据集上取得了87.8%准确率,验证了算法的有效性。
其他文献
元素是环境空气颗粒物的重要组成成分,主要来源于煤、石油等化石燃料的燃烧,冶金、塑料等工业排放和汽车尾气排放等,易通过呼吸道进入人体,引发呼吸道和心血管疾病,甚至诱发
标准是规范人们进行各项活动不可或缺的准则,在推动行业和社会稳定向前发展方面功不可没。随着近几年图书发行行业的迅速发展,社会对图书发行行业标准的修订也越来越频繁。由
目的:目前的临床研究已经证实对于D2根治术后的胃癌患者,辅助替吉奥(S-1)单药治疗1年或卡培他滨联合奥沙利铂(XELOX)治疗6个月可显著提高患者生存。但目前,与单纯手术相比,S-1联合奥沙利铂(SOX)是否可给术后患者带来明显生存获益仍不明确。本研究回顾性评估了胃癌患者D2根治术后SOX辅助化疗的临床疗效和安全性。方法:收集2009年9月-2011年12月于国内四家医院行D2根治术的胃癌患者。
在将深度学习应用于遥感舰船识别任务中时,通常需要大量训练集数据对深层神经网络参数进行调节,但由于遥感舰船影像的获取通常需要消耗大量人力物力,因此,如何针对遥感舰船影
以醋酸镉和硫化钠为原料,采用简单的离子交换反应制备纳米硫化镉可见光催化剂。利用化学吸附法,在CdS纳米颗粒的表面吸附少量的聚氯乙烯(PVC)制备PVC/CdS纳米复合材料。在150℃的高温下,热处理PVC/CdS纳米复合材料2h,使PVC分子脱除HCl分子形成具有共轭结构的聚合物CPVC,制备CPVC/CdS纳米复合材料。采用X射线衍射仪、原子吸收光谱仪、傅立叶变换红外光谱仪、X射线光电子能谱、荧
本文通过盆栽模拟试验,研究了不同浓度的5种重金属Pb、Cd、Cu、Zn、Hg分别对油菜的单一作用,不同浓度的重金属Cu、Zn对油菜的复合作用,以及高低浓度下Se对重金属Cu污染油菜的
深度强化学习是现代人工智能领域中一个重要的研究分支,可分为两大类:无模型和模型化。其中,模型化方法有较高的样本效率,但其渐近性能通常落后于无模型方法。最近,结合贝叶
家用电器类产品是我国强制性认证产品的重要组成部分,家用电器生产企业竞争激烈,企业面临人员变动频繁、制造成本上升以及利润空间越来越小等等问题。这些问题增加了企业的一
银杏叶片具有很高的经济价值、药用价值和观赏价值,银杏叶片病虫害可导致银杏的死亡,从而带来经济损失。对晚期的患病银杏叶片已无法采取措施,因此患病银杏叶片的早期及时、
交通运输是国民经济的基础性产业,是经济和社会各项事业发展的重要支撑和保障,是保证经济活动得以正常进行和发展的前提条件。随着中国陆港型城市的交通发展水平(公路、铁路