基于度量学习和随机森林的地化异常识别研究

来源 :成都理工大学 | 被引量 : 0次 | 上传用户:zhustrong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息量的与日俱增,使得对算法在分类方面的精度要求与日提升。机器学习是一门结合多个领域多个方面的交叉性融合学科,作为数据分析领域的前沿方法,在分类、信息提取等方面有着广泛的应用,从而达到获取技能、知识的目的并具有分类判断的能力。这些算法都需要度量样本之间的相似性,如何准确地度量样本之间的相似性,达到更好的分类效果是值得学习探究的方向。作为不可再生资源,矿产资源的勘查难度逐年递增。地球化学异常识别是找矿标靶的一项重要工作。这个任务可以看作是一个二元分类问题,其目的是区分异常背景。传统的地球化学异常识别方法越来越局限,更全面的方法技术成为新的研究方向。度量学习(Metric Learning,ML)使得从标记数据学习复杂分布数据的距离成为可能。本研究中,通过使用一个基于随机森林(Random Forest,RF)的分类器来支持距离函数,并将绝对位置和相对位置合并到表示中来完成。结合度量学习和随机森林,将随机森林作为度量学习的底层表示,建立更合适的距离来评价样本之间的相似性,使得分类更精确。本文利用有限训练样本中地球化学特征之间的统计信息,建立更合适的距离来评价样本之间的相似性。在此基础上,利用随机森林将地球化学异常从复杂的背景中分离出来。具体有以下几个方面工作:(1)针对单一的马氏距离不能很好地处理异构数据,用一个新的映射函数代替传统的马氏矩阵,避免了马氏距离中成对位置的限制。引入随机森林与度量学习方法相结合,构建了基于度量学习为底层框架、随机森林作为底层表示的“ML-RF”分类模型,探索样本之间的内在关系,分离异同。ML-RF方法采用随机森林作为度量学习的底层表示,避免了对先验样本敏感的缺陷。(2)收集数据集,将ITML(Information Theroy Metric Learning),LMNN(Large Margin Nearest Neighbor),Mahalanobis,以及本文提出的ML-RF模型应用到UCI数据中进行分类仿真实验,对比几种分类精度效果。(3)对研究区进行采样,收集数据,处理了39种元素的全部地球化学成分数据,利用因子分析对数据进行处理,评价与成矿过程有关的元素组合。(4)将ML-RF运用到研究区勘查地球化学数据中,识别地球化学异常,经训练与测试,对比RF的分类效果,通过ROC曲线、异常图对比表明分类效果明显提高,并绘制地球化学异常图与成矿远景区。
其他文献
近年来,重金属污染日益恶化,造成了一系列环境问题,引起了广泛的关注。重金属污染易富集且难降解,即使摄入极低浓度的量也会对人体健康带来不可挽回的伤害。离子印迹技术因其具有可预测性、高实用性和特异性等优点而受到越来越多的关注。本文旨在将离子印迹技术与不同的功能性材料相结合,充分利用各自材料的优势,制备出能快速高效、特异性识别重金属离子的新型复合材料。本文的研究内容有:1、引入荧光材料量子点,将具有良好
清代汉文涉藏诗歌是我国古典诗词的重要组成部分,是民族文学的珍贵财富。本文通过对清代汉文涉藏诗歌文献遗存的梳理,从民俗语言学视角出发,以2212首清代汉文涉藏诗歌为语料
四旋翼无人机作为微型飞行器的一种,由于其在性价比、性能以及可操作性等方面的优良表现,得到了越来越多的无人机爱好者的认可,成为了微小型无人机领域内最受欢迎的无人机。随着四旋翼无人机的不断发展,它被广泛应用在社会和生活的各个方面。与此同时四旋翼无人机的安全问题也引起了人们的广泛关注。由于四旋翼无人机系统具有非线性及耦合性强的特点,并且无人机在飞行过程中易受到气流或其它不明物体等外界环境的干扰,因此设计
在世界经济极速增长的同时汽车行业也在迅猛发展当中,汽车保有量极速增加使交通事故等成为社会焦点问题,所以行车安全问题更加引人关注,在主动安全系统中的自适应巡航控制可以更加有效的并合理的解决部分焦点难题,自适应巡航控制系统可以尽可能的减少因错误驾驶以及疲劳行车等原因所带来的交通事故,它还能够提升乘员的乘坐舒适性。本文通过理论分析以及仿真验证对自适应巡航控制系统进行研究。首先,本文以自适应巡航控制系统为
为了解决未来网络增强现实、超高清视频流等服务带来的EB级移动流量需求和站点密集部署带来的严重累积干扰,业界提出了用户为中心网络(User-Centric Network,UCN),但同时也引入了巨大的调度复杂度,给实时性应用带来了挑战。近些年来一些研究利用深度学习(Deep Learning,DL)技术来解决复杂无线资源调度的实时性问题,其基本思想是利用深度神经网络(Deep Neural Net
随着“昆山反杀案”等的发生,对于在防卫过程中,对不法状况产生误认时,如何评价后续反击行为的性质产生了争议。我国由此产生了事前与事后两种认定不法的标准。例如在昆山案中,按照传统的事后标准,防卫人后续追砍行为显然构成假想防卫。而按照新近的事前标准,防卫人则构成正当防卫。本文的核心就在于解决这种防卫误认情况下,结果的风险到底由谁承担更加合理。本文共分为六个部分,前言部分正是结合上述所提的这一风险分配难题
加强民族区域自治地方的自治立法是坚持和完善民族区域自治制度的重要举措,是依法治国、依法治省、依法治州的重要环节。自治立法的开展情况也直接影响《中华人民共和国宪法
一直以来,企业生产率的提升都是我国经济发展的焦点,对于已经是制造业大国的中国而言,微观制造企业生产率的提升成为了我国实现制造强国的关键。学术界对企业生产率的相关问
极限强度是船体强度的一个重要方面,焊接残余应力对结构极限强度有着重要影响。目前结构设计与强度校核常用的焊接残余应力模型,是基于常规板厚普通钢及部分高强度钢焊接结构研究建立的。随着船舶大型化的发展,厚板和高强度钢在船舶结构设计中的应用越来越广泛。针对此类结构,国内外学者从工艺力学的角度开展了较多的焊接数值模拟和试验研究,但相关的研究较少考虑焊接缺陷对结构强度的影响。针对上述问题,本文开展了焊接残余应
当下时代是一个互联网与社交媒体深度融合的时代,每一个社会大众都是一个自媒体。目前,自媒体平台主要包括:抖音、微信、QQ。微博、博客、百度贴吧、论坛/BBS等网络社区。基于互联网技术而迅速发展的自媒体,其信息制作和传播行为具有不同于传统媒体的显著特征:个体化、自主性、多样化、圈群化和高速性。在一定的意义上,自媒体掀起了传播领域的一场革命,正在深刻改变着人们的生活态度和生活方式,对各国的政治、经济、文