论文部分内容阅读
行星状星云和氢二区是宇宙中一对特殊的天体,恰好是部分恒星一生的起源和归宿,是研究恒星演化、星际介质与星系化学形成历史与演化等问题的重要探针。二者都属于稀少天体,受限于样本数量,相关研究受到很大制约,扩增新的稀少天体候选体以及他们的数据样本是非常重要的工作。郭守敬巡天望远镜(LAMOST)目前已经开始了低分辨率和中分辨率交替进行的观测模式,新的巡天数据蕴含着巨大的研究价值。LAMOST中分辨率光谱覆盖的波段非常适合搜寻具有Hα6563(?)和[OⅢ]5007A发射线特征的天体,为行星状星云和氢二区的搜寻提供了绝佳的数据源。为此要设计有效算法,从海量的、复杂多样的、不均衡的数据中,高效地筛选出行星状星云和氢二区的侯选体。行星状星云和氢二区的物理性质和形成过程不同,但光谱非常相似,在中分辨率光谱数据挖掘过程中我们将二者视为同一种正样本进行天文数据挖掘。对于行星状星云和氢二区的进一步区分,仅凭光谱数据无法实现,需要结合多波段数据,如WISE、SST等红外望远镜数据,通过测光来加以区分。本文利用多个天文数据库(多源)的不同波段的数据,在LAMOSTDR7数据上对行星状星云和氢二区进行候选体挖掘以及二者的进一步区分确认,以扩增新的稀少天体候选体以及它们的数据样本。本文的主要工作及创新点如下:(1)搜集行星状星云与氢二区星表信息,获取充足的目标天体坐标信息;充分利用多源天文数据库,尽可能地交叉目标天体光谱样本以构建充足的正样本数据集,共计在LAMOST和SDSS数据库中交叉到966条目标天体光谱数据。对于低分辨率光谱,采用三次样条插值法进行数据升维进而统一数据维度,用以扩增中分辨率搜索任务的数据集。(2)搭建、设计合理的深度学习模型,引入自校准卷积提高模型的特征提取能力;在追求高召回率性能的同时兼顾模型其他性能的平衡表现,对模型进行了一系列调参。采用合理的正负训练样本比例和集成学习的方法优化样本不平衡问题。在经过模型筛选、低质量光谱剔除、人工复核后,共计搜索出2,649条光谱特征符合搜索目标的候选体。(3)利用行星状星云和氢二区在红外波段拥有不同颜色特征的特点,对候选体目标进行了红外图像的交叉匹配,通过对得到的红外图像进行孔径测光,最终确定了7个氢二区目标与31个行星状星云目标。