任务结构利用在四种机器学习任务中的实现

来源 :南京大学 | 被引量 : 0次 | 上传用户：hao1238888

【摘要】

：

【作者】

：

周文吉

【机构】

：

南京大学

【出处】

：

南京大学

【发表日期】

：

2019年01期

【关键词】

：

机器学习数据挖掘深度学习强化学习迁移学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

机器学习旨在研究如何通过计算的手段,利用经验来改善系统自身的性能。在这个过程中,经验常常以数据的形式存在。因此机器学习主要研究的是从任务数据中产生模型的算法。在现实世界中,根据来源不同,数据的结构和特性也不相同,从而需要使用不同的任务结构进行学习。例如,维基百科中的词条可能有一个或多个标记,而标记维度成千上万,想要对每个词条进行准确的分类,我们就需要建立高维多标记学习任务对其进行学习;而对于互联网上用户产生的图像数据,虽然不包含标记信息,但是仍然蕴含着大量的用户行为信息,为了挖掘图像等高维无标记数据中的潜在信息,我们则需要建立高维无标记学习任务。此外,在一些机器学习问题,如强化学习问题中,数据在智能体与训练环境的交互过程中产生。为了有效利用复杂环境中产生的层次结构数据,我们需要建立策略分层强化学习任务;而对于一批类似环境上的强化学习,为了利用类似环境中的经验数据来加速在新的环境上训练,我们需要建立策略经验重用学习任务。如何在不同的任务结构中,有效的利用数据的特性,是改进机器学习算法的关键。本文从多种不同的任务结构出发,分析任务中的数据蕴含的结构和特性,从多个方面展开研究,取得如下成果:1.在高维多标记学习任务上,针对传统多标记学习算法面临维度灾难的问题,本文分析并利用了标记中的关联性,提出了线性二值压缩的多标记分类算法BILC,通过无梯度优化的方法,将高维标记压缩至低维二值空间,从而可以使用比回归器结构风险更低的分类器在低维空间进行预测。与现有多标记分类方法相比,在高维多标记数据上取得了更好的效果。2.在高维无标记学习任务上,针对传统混合模型聚类算法难以拟合复杂高维数据的问题,本文结合混合模型聚类和生成对抗式网络,提出了生成对抗式网络混合模型GANMM,进行端到端的高维图像数据聚类,并提出了ε-EM算法对GANMM进行有效的优化,取得了良好的效果。3.在策略分层强化学习任务上,针对现有分层强化学习仅仅利用数据的层次信息进行策略分层,对于上层策略决策频率不能进行合理控制的问题,本文提出了自适应子策略切换的分层强化学习方法TEMPLE,通过分析和利用层次数据中包含的时序信息,让网络自适应的更新上层策略的决策频率,在很多任务上表现出了比现有方法更好的效果。4.在策略经验重用学习任务上,现有经验重用的迁移强化学习方法仅仅从某一个固定的粒度上对经验数据进行提取和重用,这造成了精度的损失,限制了策略经验重用的效果。本文提出了多粒度多层次的经验提取和重用算法PRR,并且提出了自上而下的PRR网络的训练方法,在策略经验重用学习任务上取得了较好的效果。

其他文献

边缘中产阶层在新城消费空间生产中的效应及规划应对 ——以南京江宁托乐嘉商圈为例

随着我国社会经济的快速发展,我国中产阶层群体迅速发展壮大;但由于受大城市生活成本高、就业竞争激烈、户籍劣势等因素的限制,中产阶层群体中部分人群的经济资本、社会资本都不足以支撑其进入真正的“中产阶层”,他们只能勉强达到中产阶层的门槛,成为下层社会阶层向中产阶层过渡过程中的“边缘中产阶层”。而在其独特的经济资本、社会资本和文化资本的作用下,边缘中产阶层的消费需求呈现出“草根性”基本生活消费需求与“品质

学位

新城消费空间边缘中产阶层效应托乐嘉商圈

系统性金融风险治理 ——基于政策文本的分析

学位

基于深度学习的我国情报学理论方法术语识别研究

学位

民国时期政府出版物目录研究（1912-1949）

学位

中国适度普惠型高龄老人津贴制度发展研究

学位

时空约束对居民体力活动与健康效应的影响研究 ——以南京市为例

随着城市化的推进,城市建成面积不断的扩张,城市病越来越严重,并且给城市居民带来健康危机。久坐不动的生活方式,以及缺乏体力活动是导致居民超重,及高血压、高血脂、糖尿病等相关慢性病的重要原因。而大量实证研究表明建成环境与居民的体力活动有着密切的关系,通过改善建成环境来提升居民体力活动是一种干预居民健康的有效措施。西方发达国家就建成环境、体力活动、健康之间的关系已经进行了大量的实证研究,并且已经开展了一

学位

建成环境体力活动健康效应时空约束

Spark平台中Canopy和FCM聚类算法并行化的设计与实现

互联网技术的高速发展以及5G时代的来临产生了大量需要进行处理的数据,在这些巨量数据中潜藏着宝贵财富。越来越多的企业和学者开始关注和研究如何从这些巨量的数据中提取出对人们有用的信息这一问题。为了解决这一难题,人们采用集群的方式并行化地处理数据,显著加快了巨量数据地处理能力。聚类算法是处理数据时常用的算法之一,Spark平台中并行化聚类算法可以很好地解决大数据环境下的聚类问题。但Spark平台核心聚类

学位

CanopyFCM分布式计算并行化Spark

气相介质阻拦放电等离子体协同多壁碳纳米管负载TiO2催化剂去除水中布洛芬的研究

布洛芬（ibuprofen,简称IBP）作为一种常见的抗炎解热药物,是非甾体抗炎药（Non-steroidal Anti-inflammatory Drugs,NSAIDs）的典型代表。由于其广泛应用,估计每年全球IBP产量为几千吨。IBP在水生环境中具有相当高的流动性,不能完全被人体吸收,也不能被市政污水处理厂完全降解。因此水生环境中IBP含量不断富集到较高浓度,导致对人类健康和生态环境造成一定

学位

气相介质阻挡放电等离子体二氧化钛多壁碳纳米管布洛芬降解机理

基于光化学反射植被指数的光能利用率估算模型构建及其应用

陆地生态系统总初级生产力（Grossprimary prodution,GPP）作为陆地碳循环的重要组分,是量化生物圈碳收支的重要指标。准确地估算GPP对于理解生态系统对大气CO2浓度升高的响应以及相关政策的制定至关重要。论文以MODIS数据、站点通量数据和气象数据为基础,结合基于光化学反射植被指数的光能利用率估算模型（PRI-LUE model,Light use efficiency mode

学位

总初级生产力光化学反射指数光能利用率模型日导叶绿素荧光

基于灰色关联度理论的苏锡常地裂缝危险性评价

苏锡常地区是我国地裂缝灾害重灾区之一,给当地群众的生产生活造成了巨大的经济损失。地裂缝造成地表破裂、地下管道错位、水井干涸和地上房屋建筑等破坏。因此,利用已有地质调查资料对地裂缝在未来时间和空间内进行准确预测,具有非常重要的现实意义。本文以苏锡常地区为研究区域,通过地裂缝的野外调查和成因机制分析确定影响苏锡常地裂缝发育的因子,利用灰色关联度理论确定各影响因子权重,最后结合Arc-GIS平台进行苏锡

学位

苏锡常地裂缝影响因子灰色关联度预测

任务结构利用在四种机器学习任务中的实现

与本文相关的学术论文