在你的天文研究领域中,观测上有哪些常用/特别/有用/有趣的筛源方法?

举个例子,比如常见的BPT图区分HII区、Seyferts、QSOs,比如通过匹配AKARI的远红外band和SDSS的光学band数据再根据flux比初筛出红外亮的type-2 QSO候选体(Proposed by Akiyama et al.; Chen et al. in prep.),再比如通过对应红移的窄带(narrow band, NB)超出(excess)和考虑进宽带(broad band), 比如V, I band (Venemans et al, 2005)后的颜色判据来筛选高红移Lya发射体(Lya emitters, LAEs),经典又实用的check by eye来排除显…
关注者
59
被浏览
2576

4 个回答

问题很大,天体种类很多,很难一概而论。


常用 :

现在人人都在说机器学习。『筛源』本质上就是数据的聚类分析问题。你的观测数据有N维,那么也许在这个N维空间的某个投影上,你想要的天体能和其他所有天体明显区分开就好了。当然,实际操作上要考虑观测误差,要考虑False positive,要考虑完备性和效率的问题。。。一下子就复杂了。

传统上:『晒源』指的是选择已知的某种类型的天体。天体的观测得到的数据,无非是三维位置 (天球坐标;距离,视向速度,或者红移)和其时间变化 (自行,视向速度变化),与天体辐射的谱能量分布 (不同波长处的辐射能量,可以是不同波段观测的星等,可以是光谱)和其空间与时间的变化 (还可以加上一个偏振)这些。如果你知道你要挑选什么,一般已经有了一些物理认识。按照这些物理原则去挑选 (Physically motivated)一般被认为很科学。题主说的BPT图就是这样的例子,很多挑选高红移AGN和星系的方法也是如此,利用的是这些天体在某个波段上辐射的特殊性质。

现代视角看:严格的物理条件筛选方法固然好,但是也有其他天体污染的比例不好估计,依赖于观测的质量和模型的精确程度等问题。更主要的是,在现在的多波段巡天时代,一个天体从观测中往往有几十个上百个观测量,而前面的分类方法只用到了我们已知有用的几个。有可能不是最佳结果或者效率低。大数据时代,机器学习技术在天体分类筛选中大放异彩。监督机器学习方法最为常用,现在已经有很多人在做深度学习的尝试。这些方法在挑选诸如被前景星系引力放大的高红移星系和类星体上效率很高。

上图为卡内基-梅隆大学科学家利用深度学习技术从大天区测光巡天中找出的强引力透镜天体。

(文章见:arxiv.org/pdf/1703.0264)


特别 / 有趣 :

这个就更取决于具体的领域了。说一个我认为最好玩的吧:高红移类星体选择,这些由超大质量黑洞快速吸积供能的天体很稀少,但是对研究宇宙学,星系演化,黑洞形成,宇宙中中性气体电离状态等都很重要。一般来说,类星体都是通过多波段测光巡天挑选出来,但只有昂贵的后续光谱观测才能确定是不是类星体,并研究其性质。所以测光选择的效率和完备性就更为重要了。

类星体是高红移天体,所以天球位置不会在观测时间内产生变化,而恒星会有自行,所以长期测光观测中,位置不变的,长得像恒星的天体很可能是类星体;类星体辐射的谱能量分布和大多数恒星也不一样。但即便结合位置变化和谱能量分布也不能选出很『干净』的类星体样本。于是天文学家想了一个超级复杂,但想通之后会让人拍案叫绝的方案。我尝试解释一下 (具体请参考这篇文章:http://iopscience.iop.org/article/10.1088/0004-6256/138/1/19/pdf ):


1: 天体在天球上的位置是经过了大气折射的,我们看到的并不是真实位置

  • 天文学家需要利用一组参照天体的坐标进行改正,才能得到天体的真实位置。
  • 大气折射引起的位置变化随地平高度变化:地平高度越低,大气折射效应越显著,改正越大。因此改正的时候,必须考虑到参照天体和目标的地平高度。
  • 大气折射效应依赖于波长,不同波段的观测需要做不同程度的校准和改正。
  • 其次,天文观测用的波段是有宽度的。测光常用的宽波段往往能覆盖100纳米以上。在这个波段内部,不同天体的谱能量分布不一样。换句话说,同一个波段,相同条件下观测不同天体,一定地平高度的情况下,大气折射的改正量也依赖于天体的谱能量分布


(示意图:天体的大气折射效应和波长的关系)


2. 那么,未来的测光巡天,比如万众瞩目的LSST,会在几年的时间里多次,在不同的地平高度处,在不同波段上观测天体。

  • 如果一切顺利的话,LSST会依赖大量已知位置的恒星 (比如Gaia卫星的观测能提供数十亿颗恒星,不受大气折射影响的位置信息)进行细致的天体测量校准,改正这些效应。
  • 这样,所有的恒星的位置都已经不受大气折射的影响。
  • 但是,类星体的谱能量分布和恒星不一样!
  • 所以类星体依然会有残留的大气折射效应,并且根据类星体的红移不同 (决定了观测到的类星体的谱能量分布,尤其是强发射线的位置),会有独特的对观测波段和地平高度的依赖。
  • 研究显示,利用这个方法,结合颜色等信息可以给出非常好的类星体样本。


下图来自LSST项目科学家Zeljko Ivezic的报告。图中画灰色-黑色的都是恒星,橙色-红色的都是类星体。这些图是LSST能提供的天体不同波段颜色之间的相互关系。传统上,这些颜色-颜色图常被用来挑选类星体。但是可以看到,恒星的分布总是有长长的一条,和类星体混在一起。而利用了上面提供的较差大气折射 (DCR) 信息,则可以清晰滴把两类混淆的天体区分开。

@Yeoman 邀。

我目前主要有两个研究方向,一个是核塌缩型超新星,另一个是小质量恒星形成。我就分别简单介绍这两个方向在某些特定情况下的选源方法。

  • 超新星

超新星的选源很简单。对transient object,据我所知差不多都是这套路:对某些天区,我们已经有宁静的夜空的图像了。如果突然看到异常的亮点,说明那里有一次outburst,然后别的望远镜就会follow up,通过光变曲线或者光谱来确认这次outburst是什么事件。这方法原理很简单,我也不知道什么论文专门讲过,但肯定是有的(我隐约记得发现暗能量那一大堆Ia型超新星是这样找的,方便快捷导致样本量很大)。我没有实际参与过类似工作,不过下周开始到接下来的半年我会和berkeley那边合作用Subaru/HSC做类似的事,到时再补充~

  • 前主序星(Pre-main-sequence star, PMS)

PMS的选源比超新星麻烦很多,不过也有比较可靠的操作方法。

首先是粗略地找PMS,把它们和场星(field star)区分开来。这一步会用X射线波段的观测,因为一般而言PMS的X射线波段的活动会比大部分是主序星的场星活跃( {\rm log}\frac{L_{X}}{L_{\rm bol}} \sim -3 )。具体如图,这些都是X-ray luminous的源:

(ref: Walter et al. 1994, AJ, 107, 692.)

这一步之后,就可以把场星去除得差不多了。这一步是初筛,很高效,但缺点是field会很小,每次只能看一小块天区,bias很强,所以需要很多观测才能凑出一个星团/星协。对剩下的X射线源,确认是否PMS方法比较多。常用的方法是看光谱(这一步顺便可以确认光谱型),很直接,就不必多说了。


接下来介绍在已知的年轻星团(距离,年龄都基本确定)证认新的PMS的方法。在研究中,我比较关注小质量恒星(一般指质量范围是0.2 \sim 2M_{\odot} 的PMS)。如果要找这样的恒星,我们可以看Li吸收线的等效宽度:恒星活动是不会产生Li的,Li只会减少不会增多,而Li本身很容易燃烧( \sim 2.5 MK );小质量的PMS是对流相的(Hayashi track),可以把表面的Li通过对流送到核心处燃烧,导致光谱基本没什么Li,只有年轻的小质量PMS才能保存足够多的Li,因此Li的等效宽度可以"probe its youth":对确定的温度(在对流相,PMS的温度几乎不变),Li越多越年轻,因此Li的含量经常用来测PMS的年龄,而且这是最靠谱的年龄测量工具,因为这种方法几乎model independent。不过对小质量恒星(比如光谱型是M7或更晚的PMS)而言,Li吸收线的波段光谱的信噪比通常很小,导致Li的等效宽度很难确定;另外吸积会增强连续谱从而减小Li的等效宽度。因此这方法在实际应用中限制很多(我现在手上就有一个研究PMS中Li的的含量和星斑的关系的项目,实际操作中感受到了小质量恒星对Li吸收线的恶意,说多了都是泪)。

(上图是最近的工作,两颗PMS的温度分别是~2700K和~4500K,感受一下信噪比的差距...)

下图是用Li选源的一个例子:

(ref: Pecaut & Mamajek, 2016, MNRAS, 461, 794.)

这篇文章在已经研究了很久的Sco-Cen group中发现了一些新的源(正如前文所言,X射线选源要凑很久才能凑出一个星团/星协,因此即使已经研究了几十年了,去年又在Sco-Cen发现了几百个新的源,而且成员星的数量在未来肯定会继续增多)。Sco-Cen的年龄 < 20 Myr (分几个subgroup,每个年龄都不同,分别是~ 18 Myr, ~ 16 Myr 和 <10 Myr)。IC 2602的年龄大概是~ 15 Myr, Pleiades是~100 Myr。如图比较的是等效温度(通过光谱型确认)和Li的等效宽度,两条虚线分别是IC 2602和Pleiades在相似的图中的best polynomial fit。在IC 2602这条线以上的都被认为是Sco-Cen的成员;在Pleiades和IC 2602之间的则要打个问号;在Pleiades之下的就reject掉了。黑色实线是所有accept的Sco-Cen成员的best polynomial fit。这种选源方法的原理便是上文提到的PMS中Li的燃烧。


除了Li的含量以外,还有动力学选源的方法,基本依据便是同一个星团中的成员有相似的距离和相似的速度(可以有弥散,但会有一个共同的flowing velocity)。这就简单了:测距离和proper motion,把outlier都扔掉(比如 > 3\sigma 的源,或者用Bayesian方法算某个源是成员的概率然后设置一个cut off,如Rizzuto et al. 2015, MNRAS, 448, 2737)。测动力学性质的卫星(?)很多,前有Hipparcos, APASS之类的,现在还有GAIA。不过实际也没说的这么轻巧:并不是所有源都有距离的,尤其是很暗的小质量恒星。对这些源有两个选择:

1. 用proper motion测距离。这种测距方法的基本原理还是同一个星团的成员诞生于一个点(或者体积可忽略的一小块区域),然后向外运动膨胀成现在这个规模,这个点叫convergent point。对某一个天区的坐标(RA, DEC),可以通过一些神奇的变换手段求出某个成员垂直于该点和该成员的连线的速度分量(真拗口),然后对所有成员求和使残差平方和最小的点就是convergent point。找到convergent point后,再次通过某些变换手段就能通过某个成员的proper motion求出它的距离。通过这种方法测出来的距离叫dynamic distance。

下图是跑了1000次MC(red dots)最终确定出来convergent point(blue square)的一个例子。

(ref: Galli et al. 2013, A&A, 558, 77.)

顺便一提,convergent point也能拿来测年龄。基本原理是:通过proper motion可以确定velocity dispersion,通过测距和坐标可以确定星团的大小,因此可以算出从一个点膨胀到现在的大小需要的时间,这种方法测出来的年龄叫dynamic age。不过由于星团一开始不可能是一个点,所以它实际给的是一个上界估计(通常没什么用,例如对一个~10 Myr的星团,它给出的上界一般是~ 100 Myr)。


2. 对没有距离的源,只用proper motion而不用距离筛选。这显然会产生一些bias:亮源比暗源多筛了一层。不过通过实际操作,结果并没什么不同:能通过proper motion筛选的源算出来的dynamic distance一般都能通过距离筛选。我的论文便是这样操作的(虽然我算过convergent point,不过没把这部分加到论文里)。


我目前基本只接触过这几种选源方法。通过这几层筛选,基本能把年轻星团中的PMS确定下来了。近几年机器学习大热,也有一些基于机器学习的选源方法,不过我不太看得懂(也没什么兴趣),有兴趣的同学可以参考 Galli et al. 2013, A&A, 558, 77