类星体测光红移的数据挖掘算法研究

来源 :三峡大学 | 被引量 : 0次 | 上传用户:mainonewf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近十年来随着国内外大型光谱和测光巡天项目的相继开展,天文数据呈指数增长。如何从海量天文数据中挖掘出有益的信息或知识是天文研究者必须面对的挑战和任务。  本文的重点是基于斯隆数字巡天(Sloan Digital Sky Survey,SDSS)的测光数据探讨类星体测光红移估测算法。应用SDSS第七次数据释放(Data Release7,DR7)的类星体测光数据,考察和对比了k近邻(k-nearest neighbors,KNN)、偏最小二乘方法(Partial Least Square,PLS)、Lasso(the Least Absolute Shrinkage and Selection operator)算法、岭回归(Ridge regression)、基于随机梯度下降(Stochastic Gradient Descent,SGD)的逻辑回归(Logistic Regression)、极端随机森林(Extremely randomized trees,Extra-Trees)在预测类星体测光红移方面的性能,结果表明KNN和Extra-Trees的性能明显优于其他四种方法。基于SDSS第十二次数据释放(Data Release12,DR12)的类星体测光数据,首次应用极端随机森林来估测类星体的测光红移。研究结果显示在单独应用SDSS参数时,Extra-Trees算法的性能优于KNN,而再增加其他波段(UKIDSS、WISE)参数时,KNN显出它的优越性。然后基于不同的数据集SDSS DR7和DR12,使用Extra-Trees预测类星体测光红移,若单从四个预测指标来看,DR7的结果优于DR12。这是由于DR12的类星体数据大部分集中在高红移区域,随着类星体的星等变暗,数据的质量下降所致。随着DR12的数据越来越完备,在DR12数据基础上,创新地使用极限学习机(Extreme Learning Machine,ELM)对类星体先分类,而后应用KNN方法进行红移估测,发现大幅度提升了红移预测的精度,远远优于单纯KNN的性能。很显然应用ELM改进KNN的方法(ELM-KNN)对类星体测光红移估测具有很大的优越性。  本文介绍了数据挖掘技术及其在天文学中的应用,并就类星体测光红移估测这一具体问题展开了详细探讨和研究。最终发现在预测类星体测光红移时,在低维空间中Extra-Tree具有明显优势,集成方法ELM-KNN比传统单方法(如:KNN、Extra-Trees)更具有竞争力。
其他文献
目前基于视频序列的运动人体跟踪和行为识别是计算机视觉领域的主要研究方向之一,在智能安防、智能导航、交通导航、导弹预警、对空监视等许多应用领域发挥重要作用。目前,国
移动互联网的普及给智能手机带来了爆炸式的增长,伴随而来的信息处理也成了人们所关心的议题,汉字输入是中文信息处理的关键,如何快速且有效的进行汉字输入,也是中外学者一直研究
在医疗信息化实践中,医疗子系统的集成是目前医疗信息系统必须要解决的问题,而医疗流程管理则是医疗信息系统当前发展的必然趋势。两者相互结合,构成了医疗信息化最重要的研
节点能量是无线传感器网络最重要的资源,它直接关系着网络的使用寿命,因此,如何节约能量,有效地延长网络的生存周期成为无线传感器网络路由协议设计的首要原则。本文阐述了无
移动自组网的英文名称为Ad Hoc Network,自组网起初是为军事领域运用而开发,经过四十多年的研发,应用目标扩大到了局域通信网络、个人无线移动通信等广大的民用领域。专家预
随着人类科技的发展,人类进入了一个全新的数字化时代,遥感技术也随之兴起。目前遥感技术已经广泛地应用到了国家和社会的方方面面,同时它所带来的数据的海量程度和复杂程度也是空前的,这些应用对数据的可靠性要求也越来越高。图像是人类认识世界和自身的重要源泉,其包含了很多重要信息,遥感图像处理是数字图像处理的一个重要分支。遥感图像在成像过程中受到诸多外界因素的干扰,从而造成几何畸变,影响了图像的使用质量,因此
自然语言自动生成三维场景可以减少手工构建所耗费的人力物力,为了减少这些消耗,国内外的很多学者对这方面进行了很多的研究,也取得了很好的成果。基于自然语言构建三维场景
在近来的几十年里,计算机软件技术得到了迅猛的发展,也在社会各方面得到了广泛的应用,而其中也产生了大量的优秀应用软件。为了拓宽它们的应用范围,延长它们的使用周期,同时也可以
在肝脏影像中进行血管分析对于肝脏的术前预案非常重要。外科医生必须对肝脏内部的血管系统有了深入的了解后,才能制定出合理的肝脏切除方案,从而避免手术中由于主血管破裂导
近20年来,无线自组网以及无线传感器网络因其具有自动组网、成本低、效率高以及对各种具有极端环境良好适应性等特点,正受到人们越来越广泛的关注。它们可应用于布线和供电困