天体的分类在观测天文学中仍然是一个重大挑战,其中的关键问题是要清晰地区分恒星和星系。这是因为恒星和星系代表了不同的天体物理现象,这对于理解宇宙的结构和演化具有重要意义。此外,明确区分恒星和星系可以提高后续天体物理研究的准确性,无论是在理论还是观测方面。
传统的分类方法高度依赖于天文学家的专业知识和经验。然而,随着许多正在进行和即将进行的天文巡天的出现,如暗能量巡天(DES;暗能量巡天合作组2016年)、斯隆数字巡天(SDSS;York等人2000年)、罗曼空间望远镜(Spergel等人,2015年)、欧几里得(欧几里得合作组,2022年)、兹威基瞬变设施(ZTF;Bellm 2014年)、全景巡天望远镜和快速响应系统(Pan-STARSS;Chambers等人2016年)、时空遗产巡天(LSST;Ivezić等人2019年)、盖亚巡天(盖亚合作组,2016年)以及中国空间站巡天望远镜(CSST;Zhan 2018年)等,情况已经变得更加复杂。这些巡天预计将获得数百万到数十亿颗恒星和星系的成像数据,使得手动分析和分类变得不切实际。具体来说,LSST每晚将产生约15 TB的原始数据,对400亿个对象进行32万亿次观测(Ivezić等人,2019年),而CSST将绘制大约17,500平方度的天空图,获取超过10亿个星系和10亿颗恒星的光度数据(Wei等人,2026a)。因此,有必要开发出能够准确快速区分恒星和星系的方法。
目前,通常使用三种主要方法来分类天体。第一种方法是分析光谱差异(Zeraatgari等人,2024年;Moradi等人,2024年)。恒星光谱通常显示出由恒星大气中的各种元素吸收特定波长光线所引起的明显吸收线。相比之下,星系的光谱可能同时显示吸收线和发射线,尤其是在星系中有活动星系核(AGN)或大量电离气体存在的情况下。第二种方法基于形态差异。通常,恒星通过点扩散函数(PSF)来描述,而星系则表现出扩展的、弥漫的结构(Kron,1980年;Odewahn等人,2004年;Vasconcellos等人,2011年)。这种方法与光谱差异的分类方法一致(Newman等人,2013年),并在SExtractor(源提取器;Bertin 2011年)中得到广泛应用。第三种方法是根据天体在颜色-颜色图上的不同位置来分类恒星和星系(Huang等人,1997年;Baldry等人,2010年;Małek等人,2013年)。结合这些方法的方法应该能够更有效地利用可用数据(Molino等人,2014年;Soumagnac等人,2015年;Kim和Brunner,2017年)。
尽管通过光谱学识别天体类型本身并不困难,但当试图为数百万个单独的天体收集如此详细的观测数据时,这一过程变得复杂且耗时(Shawhan等人,2019年)。使用跨多波段的图像和光度目录对天体进行分类,并根据它们的颜色指数和形态结构分配标签,是一种更为快捷的方法。Chaini等人(2023年)使用了SDSS数据发布16中的5波段图像和精心挑选的光度参数,获得了98.1%的恒星-星系分类总体准确率,这比单独的模型表现得更好。最近的一些研究也采用了模态融合方法,并取得了显著的分类结果(Bhavanam等人,2024年;Feng等人,2025年)。
近年来,天文学中恒星和星系的分类采用了多种机器学习(ML)算法(Nakazono等人,2021年;Stoppa等人,2023年;Bhavanam等人,2024年)。这些算法能够识别多维特征空间中的复杂非线性行为。其中,深度学习(DL)网络在处理具有更多参数和更复杂结构的问题时表现更好,例如卷积层、池化层和全连接层,这些层可以利用天体图像中的潜在信息。
Zhang等人(2024年)提出了一种使用哈勃空间望远镜(HST)的高分辨率图像来区分恒星和星系的方法。然而,这种方法仅使用了波段图像数据,并没有结合任何多波段特征。当通量相对较弱时,星系往往更加紧凑,即使使用他们的极坐标变换方法(Fang等人,2023年),准确分类也具有挑战性。Costa-Duarte等人(2019年)将随机森林方法应用于S-PLUS 12波段目录中的恒星和星系分类,达到了95%的准确率。研究了目录中各种特征对分类结果的重要性,并得出结论,形态参数尤为重要,特别是半高全宽(FWHM)和PSF,这些可以从图像中作为形态特征提取出来。
大多数现有方法依赖于单波段目录或图像,而这些单波段目录或图像本身包含的信息量比多波段对应物要少。多波段图像数据提供了更多关于天体的信息,揭示了它们在每个波段中的形态,有助于区分恒星和星系。
在本文中,我们的目标是对CSST主巡天模拟数据中检测到的对象进行分类,这些数据覆盖了0.75范围内的7个波段。我们在这项工作中使用的DL算法是监督式的,结合了多波段图像和光度目录,以便更好地区分恒星和星系。
本文的结构如下:第2节介绍了我们研究中使用的数据集。第3节描述了应用于这些数据的预处理工作。第4节首先提出了方法的框架并介绍了其实现细节。第5节展示了网络的分类结果。进行了一些消融实验,并验证了该模型在处理暗淡天体和高红移星系情况下的有效性。第6节给出了结论。