大规模有序回归问题快速算法的研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:gaolaoshi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
有序回归问题是机器学习中一类重要的问题,它的目标是预测离散的有序类别,这导致它区别于多分类和回归问题。有序回归方法成功应用在很多现实场景中,包括年龄预测、信用评估和信息检索等重要领域。然而在大数据时代,机器学习问题通常面临数十万乃至上千万的数据规模。尽管研究者们已经提出了很多有序回归方法,但这些方法仍不能高效地处理大规模数据。本研究将在针对多分类和回归问题的大规模算法上做进一步的探讨,主要算法包括异步并行坐标下降算法,双重梯度下降算法以及深度学习算法。本文针对大规模有序回归问题进行了以下研究:(1)针对支持向量有序回归模型,本文提出了两种新的异步贪婪坐标下降求解算法。第一种算法使用活动集技术进一步加速先进的异步并行贪婪坐标下降算法。第二种特别设计的算法可以在训练过程中尽可能保持阈值的有序性,使得其可以更快获得好的预测结果。更重要的是,本文对几种并行坐标下降算法进行了时间复杂度分析。最后,在多个大规模数据集上的实验验证了提出算法的加速效果。(2)针对通用核有序回归阈值模型,本文提出一种新的双重随机梯度下降算法。由于有序回归阈值模型存在多个用来划分有序类别的阈值,目前先进的双重随机梯度下降算法及其理论分析没有办法直接应用到该模型。为了解决这个问题,本文提出新的双重随机梯度下降算法,分别更新超平面和多个阈值。理论上,本研究证明其和常见的随机梯度算法一样,具有O(1/t)的收敛率。最后,本研究设计大规模实验证实了该算法比现有的方法更加快速。(3)针对有序回归问题的特点,本文提出一种新的深度有序回归算法。有序回归问题综合了分类和回归问题的特点,然而现有的有序回归方法往往侧重其中一个问题的特点。并且大多数有序回归方法忽视了有序回归数据集中天然存在的有序噪声,使得泛化精度变差。针对这些问题,本研究提出一种新的深度有序回归目标函数,该目标函数结合了分类和回归损失函数的特点,鲁棒性更强。为了进一步加速在多类别有序回归问题上的训练速度,本文提出使用二进制编码将问题规模从O(rn)减小到O(log(r)n)。在大规模数据上,与多个深度有序回归算法相比,本文提出的方法更加快速有效。
其他文献
如今各种视觉传感技术应运而生,但是技术的专注性也决定了,为了得到契合人类视觉感官系统或者利于计算机识别应用的图像,需要统筹来自于不同成像技术的源图像的信息,这就是多源图像融合技术。本文的研究重点由红外可见光图像的融合算法展开。本文的主要内容和创新点概括如下:1.以人类的注意力机制作为引导,对视觉显著性检测进行了基础说明,同时列举了不同时期相关的算法。并且进行了两组小实验,加深对5种经典算法的认识,
近年来,随着互联网产业的快速发展以及智能手机和移动运营网络的广泛普及,大量涌现的即时通讯类软件使人与人之间的联系更加紧密,交流效率得到大大提升。随着网络建设的提速
本文从公共数据预测的研究背景入手,在现有机器学习方法的基础上,阐述了深度学习方法以及相关领域公共数据分析的研究现状,针对音乐领域和气象领域的公共大数据预测,主要开展
目前,我国中小企业发展迅猛而急速,不仅带来税收增加、就业岗位增多并呈现多样性、许多新兴行业的出现,让国家注意到了中小企业,同时针对中小企业下发了相关政策和优惠利好的
近年来,视频监控领域下的人脸识别得到了广泛关注,通过视频监控来追踪犯罪分子,大大提升了案件的侦破率。但是犯罪分子可能通过伪装,来逃避监控系统的追查。伪装人脸识别作为
本课题针对非真实感渲染算法研究中的问题,研究并提出了基于单张图像的两种风格化渲染算法——人脸卡通画风格和低模风格。对于人脸卡通画风格的非真实感渲染分为很多不同的类型,本课题针对简单线条人脸表达及夸张的风格进行模拟,旨在绘制出能够充分表现人脸特色的漫画效果。对于低模风格的渲染,我们用颜色大小各异的三角形抽象地表现参考图像,渲染的难度在于利用有限数量的三角形还原参考图像的主要内容,同时保证渲染结果的美
基于金兹堡-郎道理论的相场法(Phase Field,PF)是目前凝固组织模拟中最有潜力的有效计算技术之一,不必跟踪固-液界面,还可方便地将流动等外场引入到相场控制方程中。格子Bolt
图像分类是计算机视觉领域最基础的研究任务之一。近年来,随着人们日常生活场景需求的变更以及市场化因素,研究者们从对猫、狗、花、鸟等大尺度粗粒度图像分类任务的研究关注
作为柔性电子封装技术的关键技术之一,柔性基板技术因其具有耐用、柔性、轻质等优点,有着广阔的发展前景。随着集成电路技术的发展,对柔性基板技术也提出了更高的要求。现有
学位