基于模型无关元学习的材料数据预测算法研究

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:babyleah
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
元学习方法提出的初衷是为了解决标签样本量不足的问题,通过提前训练模型的初始化参数来加快模型的收敛速度。后续模型无关元学习(MAML)的出现更是显著提升了元学习思想的应用范围。一般以梯度下降法进行算法求解的模型都可以通过它来解决few-shot learning(小样本分析)问题。当前,元学习方法多应用于图片和自然语言处理场景,而化学材料数据分析也具有少样本、多任务的训练特性,属于较典型的小样本分析,但是将元学习方法应用于材料数据分析还存在很多问题。文中对MAML算法和模型的结构进行了改进使其能够适应材料数据分析。本文以电解水催化材料数据为研究对象,将元学习方法应用于材料数据分析和预测。在该应用场景中,化合物的组成将数据分成一种非金属元素与过渡金属组合的多任务训练模式,同种化合物可以采用替换非金属元素的方法划分成不同的任务。由于元素本身属性的影响,任务之间关联性不均匀并且单个任务数据特征中存在冗余和无效信息。为了解决这类问题,本文使用模型无关元学习算法(Model-Agnostic Meta-Learning)多任务训练的特点应对材料数据中数据量有限以及任务之间存在信息差的情况。并在此基础上结合了一种特殊的数据增强方式,对MAML算法进行了改进和优化。1.首先,利用数据的信息量和自编码器(encoding)实现数据特征选择和维度降低,充分利用数据已有信息。归因于数据中任务与任务之间存在类别不同的情况,针对于这种特定的数据特性对MAML进行算法改进。在算法更新参数时增加适应任务关联性的权重,通过增加的变量在算法求解过程中放大目标任务所在种类的影响因素,使模型算法更适合训练任务之间关系不均匀的数据特点,提升模型的收敛速度和预测准确率。2.其次,为了保证新任务之间依然保持很强的关联性,提出了一种数据增强方法,将数据处理过程中筛选掉的低信息量特征以及无效特征作为后续的噪声因子。控制噪声因子的添加种类和数量生成新任务,既保证任务之间存在差异又可以使同一标签下的两种任务差别不会过大。与此同时,通过LSTM思想对于模型算法的第一步更新进行优化,解决当任务序列增加时会出现的梯度消失问题。在模型角度和数据角度对于小样本分析能力有了一个较大的提升。3.最后,通过实验证实了模型在经过算法优化后,参数的变化在应对特定类别已经确定的实验数据时,预测的准确率有了明显的提升。在针对任务序列过长和多任务训练时LSTM优化后的MAML算法模型在数据增强的基础上相比较正常训练模型提升效果较大,并以此证实了模型在具体应用中具有较强的可行性。由于电解水催化材料数据分析在材料领域具有一定的代表性,所以本文实现的方法具有一定的普适性。
其他文献
随着移动机器人技术的发展,在生产生活中越来越多的工作机器人可以替代人类完成,例如导航机器人,扫地机器人,军事机器人,无人驾驶机器人等。对于一些繁重的工作和一些环境恶劣,对人类生命安全存在威胁的地方,移动机器人的到来具有更重要的现实意义。移动机器人SLAM(Simultaneous Localization And Mapping,Slam)技术作为解决机器人获取自身位置和周围环境信息的关键技术,它
随着现代通信技术和网络技术的发展,无线传感器网络因其低成本、低功耗、短时延等优点,已经被广泛应用于国防安全、工业控制、环境监测等领域,具有广阔的市场前景。由于无线传感器网络的工作环境大都无法铺设电缆,造成无线节点资源受限,不能频繁得到能量补充,只能依靠能量有限的电池供电。因此,单个节点的使用寿命对整个无线网络的生命周期影响巨大,研究降低无线节点的能量消耗方法具有重要意义。针对无线节点能量受限问题,
事件触发(Event-triggered)或事件驱动(Event-driven)策略是一种新兴的传输或采样机制,以适应新兴系统中所要求的智能与协同特性。其主要思想是在数据传输或采样前端设置一种决策或判断机制,即仅对满足事件驱动条件的信息予以传输,以减少有限网络资源的非必要消耗。面对与以往有着天渊之别的数据吞吐量,该策略能够有效缓解网络带宽压力,实现资源的有效利用。事件驱动策略已经被利用于控制领域,
本论文研究了不同维度下纳米结构(零维、一维、二维)器件对气敏响应性能的影响,在研究工作中分别对薄膜型金属氧化物三氧化钨纳米片器件和单根,交叉金属氧化物二氧化锡纳米线器件进行气敏特性的测量。对薄膜型三氧化钨纳米片器件在不同老化天数下进行5 ppm H2S气敏性能的测试,灵敏度达到8,同一批器件的重复性和稳定性良好。气体敏感响应时间达5.5 s左右,气体敏感恢复时间24 s左右。同一批器件进行累计浓度
近年来,移动机器人的应用范围不断拓宽,被广泛应用于生产车间、餐饮服务、物流管理、日常生活等多种室内场景,因此对机器人自主性的要求也在不断提升。但室内的环境往往要比室外环境复杂得多,这对移动机器人自主导航性能提出了更大的挑战。自主导航包括路径规划和轨迹跟踪两个核心部分,但目前在路径规划的距离代价方面、轨迹跟踪的准确性等方面仍有较大提升空间。故本文中针对机器人自主导航过程中涉及到的路径规划和轨迹跟踪相
无线传感网是由大量传感器节点构成的,部署于有监测需求的区域内,用来监测紧急事件,从而评估事件的急迫性,以协调工作。传感器节点受其能量、通信、计算、存储以及部署环境恶劣等影响,通常会产生错误数据,使管理者无法做出正确决策。因此,在低能耗下对节点进行精准的故障检测是目前急需解决的问题。针对无线传感网中故障率高而导致检测精度低、能耗大问题,提出了基于时间序列与邻居协作的WSN故障检测算法。本文主要的内容
多机器人系统(Multi-Robot System,MRS)具有良好的自主移动性、灵敏性和强鲁棒性,能够很好的克服单机器人作业面临的瓶颈,被广泛的应用于工业生产的各个领域。多机器人系统如何协作完成智能工厂中高实时性的数据巡检任务一直是多机器人系统研究的热点,本文对多机器人系统协作进行数据巡检的任务分配及巡检任务所在车间的路径规划问题进行研究,合理的任务分配与路径规划不仅体现了多机器人系统的存在意义
矿山微震监测系统可以采集频率几赫兹到几千赫兹的多种震动信号,其包含的信息较为复杂,准确识别煤岩破裂的微震事件对于微震的定位及其震源机制的认识是最为关键的科学问题之一。微震事件的准确识别,决定了微震监测及预警技术的及时性和准确性。传统的微震事件识别方法大都需要人工手动提取特征,无法将分类器与特征提取过程相结合,过程繁琐复杂,而且多数都是浅层结构算法,对分类问题的泛化能力不强。深度学习模型被广泛运用于
报纸