外太空物体会以规律的周期撞击地球,间隔大约在3000万~3500万年之间。
20世纪早期,物理学家欧内斯特·卢瑟福(Lord Rutherford)以他划时代地发现原子核而闻名于世。他曾有一句名言:“科学要么是物理学,要么是集邮。”尽管这一观点有些傲慢和令人不快,但这句话的确包含了一些真理。科学不仅仅只是列举一些现象,无论这些现象是多么漂亮或卓越,而是去尝试理解这些现象。科学家们可以通过精巧和先进的方法收集事实,例如今天的生物学家们使用DNA序列和其他技术促进了数据的快速积累。但是仅仅当数据被彻底理解后,这些信息才会变成真正的科学,即最好能建立一个完备的理论来解释现有的数据,并根据这个理论给出可检验的假说和预测。
我们已经研究了在太阳系中的天体,并知道这些天体中哪些与地球发生过撞击,以及从化石记录里得知了生物灭绝的相关信息。一个好的科学研究会提炼、理解并诠释所有的数据。但是一些重大问题还是没有解决,例如“哪些现象是有联系的”“如果有,那又是如何联系的”。
一个最吸引人但非常具有猜测性的天体物理与生物灭绝的联系是:外太空物体会以规律的周期撞击地球,间隔大约在3 000万~3 500万年之间。如果这是真的,这个周期将会是一个非常重要的线索,科学家们可以根据它来研究那些安全轨道上的物体偏离轨迹的原因,并知道这些偏离了安全轨道的天体已经变成了一个潜在的危险炸弹,且有可能飞向地球。有许多“某种扰动导致了这种周期性”的猜想,但是没有哪个猜想能给出一个与已经发现的陨石坑记录吻合得很好的碰撞周期。
米兰科维奇循环
以地球物理学家、天文学家米卢廷·米兰科维奇的名字命名。是一个地球气候变动的集合影响,以10万年为主要周期,与地球绕日运动轨道的三个变化有关,即:地球公转轨道离心率的变化、地球自转轴倾斜角度的变化、地球自转轴进动的变化。
我会尝试简短地以卢瑟福的观点来评判陨石撞击事件是否展现了足够强的周期性,而这个周期性是否拥有科学的解释。我首先会指出一个不相关但已经建立得很好的关联理论:关于地球在太阳系内的周期运动和地球气候的周期性变化之间的联系。这个温度变化周期,被称为米兰科维奇循环(Milankovitch cycles),是发生在一个短得多的时标上,当然这是和我后面将要讨论的时标相比。这个是以塞尔维亚的地球物理学家、天文学家米卢廷·米兰科维奇(Milutin Milankovic)的名字命名的,他在第一次世界大战期间建立了这个理论,而当时他还是一名囚犯。
米兰科维奇研究了地球公转轨道的离心率、地球自转轴倾斜角度和地球自转轴进动的变化对气候的影响。基于这些考虑,他和后来的科学家们建立了一个以大概2万年和10万年为周期的温度变化模式,全球冰河时代的存在印证了他们的发现。在我访问西班牙巴斯克地区的苏玛亚时,当地的向导为我指出了岩石结构中清晰的层面。这些层面同样是温度变化的结果,因为温度的变化导致了沉积率随时间周期性发生了变化。
虽然有米兰科维奇循环被发现这一成功案例,但对陨石坑周期的探索(发生在一个更大的时间尺度上)必然是一项需要极大勇气的事业,而我不想过分吹嘘它。地球上几百万年前发生的事,保存到今天的证据已经十分稀少了,而且有很大不确定性,例如它们发生的确切时间。只有在极少数的情况下,这些远古的事件才会保存下些许的信息,而那些留下足够多信息、让人们能从细节上理解的的事件就更少了。然而,只要假设与发现的数据不冲突,而且能够给我们带来对世界的进一步认识,科学家们对它们的探索就是有意义的。好奇的人们不但想知道发生了什么,而且想了解背后可能的原因。
我们现在将要考虑的课题是大型的、规律的、来自空间的撞击,它们发生在几百万年的时间尺度上,并希望把这些同我们的运动轨道联系起来,当然这里的轨道指的是太阳系在银河系中的轨道,而不是地球在太阳系内的轨道。我们通过研究陨石坑来尝试着解释所观测到的数据,并期望基于这些研究更好地理解太阳系和银河系的动力学,以及它们之间的内在联系。最有趣的假说应该能给出能被检验的预言,这些假说和怀疑论者所认为的假说是两码事。虽然许多关于周期性的想法还处于猜想阶段,但本章的目的是仔细地解释什么是我们认可的,以及为了进一步研究我们还需要什么。
建立周期
马修·里斯(Matthew Reece)和我没有立刻着手研究暗物质能够解释太阳系内某些周期性现象的可能性。在介绍我们的观点之前,我们想先确认一下这些周期性现象的证据是否足够充分,并且是否值得做进一步研究。另外一个重要的考量是:我们的工作是否对指导将来的观测和分析有所帮助。
开始时,我们在我凌乱的办公室里讨论了仍然有些混乱的想法,目的是搞明白什么目前我们已知什么、下一步研究的最佳方案是什么。我们工作的第一步就是调研周期性的证据然后看看它是否可靠,或者周期性是否仅仅只是科学家们随口抛出的一个有趣说法。
我们参考了许多前人的研究。在大量文献中搜寻观点、区分出主张和真相,比想象的更具挑战性。通常一个结果之后会出现另一个结果,例如有些研究者在一些论文中找到了周期性的证据,而另外一些人在前人的结果中却发现了错误或者疏漏的地方。争议会继续,并没有实质性的解决。在我们完成了最近的论文后,那些对周期性证据持怀疑的人确实让他们的观点为人所知。幸运的是,我们没有什么私心,而只是对这个问题好奇,这使得我们更客观一些。
这个工作中的数据处理所需要的统计分析确实不简单。地质记录非常少,不可避免地有一些大的空白期。由于数据的不完整,研究者分析记录时定义精度的方式会影响其结果。脚踏实地把数据视为根本是吸引人的,但是许多解释注重如何展示和评估测量,而这种测量的统计性质却较差。
例如,数据的分组会产生差异。当科学家观察数据随时间的变化时,他们作出一些关键的选择,而这些选择能影响后面的结论。比如,应该用多少数据点,在哪个具体的时间间隔上应该放哪个数据。科学家们还需要估计这些事件持续的长短,还要理解增强的信号强度的影响,因为正是他们选择了在某段时间内的信号强度。
回应周期性证明的论文还强调了许多统计错误,它可能影响研究的结果。在德国海德堡,马克斯·普朗克天文研究所(MPIA)的科兰·贝勒-琼斯(Coryn Bailer-Jones)是这个领域的翘楚之一。他提出了很多异议,包括上面提到的那些。他还很关心“确认偏差”(confirmation bias)问题,即人们倾向于注意和报道他们认同的结果。贝勒-琼斯认为,也许有些作者过多地尝试拟合了这个结果,因为这个周期和太阳系运动周期很接近。尽管他的很多异议是正确的,但是这个周期的接近并不一定是个坏事。数值的吻合可能仅仅是巧合;或者可能暗示了某些内在的科学联系,并将会被进一步的理解。
贝勒-琼斯等人还指出了一个常见的错误:你不能拿一个假设和一对简单的矛盾模型进行比较,然后认为这是简单的二选一,而忽略所有其他选项。例如,人们总是问,数据和哪个模型拟合得更好一点?彗星周期性地撞击地球的假说或者撞击的概率是否随着时间长度的增加而变为一个常数?即使周期模型比完全随机的假说更好,数据也可能更好地遵从一个不同的模型,例如越古老的天体撞击导致的陨石坑被找到的概率就越小。换句话说,在简单的二选一情况中,更好的模型并不意味着它就是对的。幸运的是,研究者们可以扩大可对比模型的列表来避免这个错误。如果没有出现明显不同的概率,尝试多种模型并测试周期性模型是否最好,是可行的。
确认周期性的信号至今还有一些障碍。1988年,地质学家理查德·格里夫(Richard Grieve)和他的同事们指出,不精确的日期能够抹去所有的周期性信号——无论这个信号是否是真实的。1989年,普林斯顿大学的一名本科生朱莉娅·海斯勒(Julia Heisler)和当时在多伦多加拿大理论天体物理研究院工作的斯科特·特里梅因教授(Scott Tremaine,现在是普林斯顿高级研究院的主任)进一步量化了这种效应:在多大的不确定前提下依然能可靠地确定周期性现象。在1989年发表的一篇论文中,海斯勒和特里梅因认为:数据中13%的不确定性就不可能得到一个好于90%的置信度的周期性。如果不确定性达到23%,那么测得周期信号的可能性就降到了55%。这样的不确定性不会使建立可靠的周期效应变为不可能,但却会使问题变得更有挑战性。
灭绝事件的周期性
这些有警示作用的论文的焦点集中在天体物理学中的周期效应,这也是我工作的焦点。但最初引起人们研究陨石坑随时间变化的起因是一个表面上看起来不一样的题目:灭绝事件明显的周期性。普林斯顿的地质学家阿尔弗雷德·费舍尔(Alfred Fischer)和迈克尔·亚瑟(Michael Arthur)最先发现,生命似乎有规律地呈现出繁荣和衰落的迹象。1977年他们总结出,化石记录似乎符合一个3 200万年的周期。芝加哥大学的大卫·劳普和杰克·塞科斯基在1984年发表了一篇更有影响力的论文,他们展示了其对周期性灭绝的研究。一开始劳普和塞科斯基发现了一个可能的周期范围:介于2 700万~3 500万年之间。之后他们又重新分析,修正了这一估值,得到了2 600万年的周期,之后大多数科学家们也都得到了这样的结果。
任何激动人心的观点都会被不断检验,而后来的研究确实发现了支持的证据,不过时标上发生了一些变化。2005年,加州大学伯克利分校的两位物理学家罗伯特·罗德(Robert Rohde)和理查德·穆勒(Richard Muller)使用同样的化石记录,但重新校对了时标,得到了不同的周期结果,即6 200万年。有趣的是,后来的结果变来变去,但2 700万年和6 200万年却都被保留下来。近期一次细致的分析,是由堪萨斯大学天文学教授艾德里安·梅洛特(Adrian Melott)和华盛顿特区的史密森尼国家自然历史博物馆的古生物学家理查德·班巴奇(Richard Bambach)完成的。他们发现,大部分灭绝发生在2 700万年周期模版的300万年内,此外在6 200万年的框架上总是发生物种多样性的减少。这表明,这两个时间框架可能实际上都与周期撞击事件相关。所有对周期性的警告还是适用的,但支持周期性的微弱证据也的确存在。
即使化石记录的规律被证明是真的,仍然不能改变一个事实:没有一个支持周期性灭绝的学者能够解释为什么灭绝是周期性的。导致物种灭亡的因素有许多,气候变迁、火山爆发、天体撞击和板块活动等都扮演过重要的角色。流星体可能导致大范围的物种灭绝,而且白垩纪-第三纪灭绝事件肯定是流星体造成的。但是灭绝事件中任何一个被提到的周期性,都不是单一原因的结果。如果想了解这背后明确的物理机制,科学家们最好期望所得到的周期性是不同周期性现象叠加的结果;然而若是记录不够完备,叠加后的结果看起来会很像随机结果。
任何把可能的周期性灭绝和引起它们的物理过程联系起来的尝试,都比根据具体物理现象来理解周期性更具不确定性,例如只把外来天体的碰撞与周期性灭绝联系起来。研究彗星撞击已经足够有挑战性了。把它们和灭绝事件的不确定联系起来肯定是像兔子窝一样[30]。
由于这些不确定因素——除了唯一确定的彗星/白垩纪-第三纪联系,后文将会避开关于灭绝的猜测,尽管这个题目非常吸引人。取而代之,我将会把重点放在如何联系宇宙中的周期现象和那些足以留下陨石坑的大型陨石上。这些研究的好处是,陨石坑的记录是和天体物理直接联系的——不像造成灭绝的潜在因素,不受期间天气、环境和生物学等因素的影响。
天体坠落提供了一个绝佳的机会来研究地球上的现象和太阳系中发生的事件之间的联系,并可以把它们看作一个整体,这为更好地研究宇宙提供了一个独特的途径。不定期的流星体并没有什么特别的解释,而周期性的流星体则很有可能暗示了什么。如果流星体出现的时间真的是规则的,那么时域相关性则很可能反映着背后的宇宙学起因。
在第21章我将会谈到我和同事推定的一个理论,它预言的周期性已经得到了现有数据相对充分的支持,在将来,会得到更可靠的数据对其进行验证。这里我会讲述一些过去文献中的代表性结论,并不涉及精确的统计方法或者数据选择。
我们将看到,历史文献中展示出的一些支持周期性的证据,但是它们不足以给我们以确凿的结果。在有了更好的数据和更仔细的分析后,那些模糊不清的结论也许就不会存在了,又或者会变得更清楚。现在,我们需要把这些结果看成是科学家们在陨石坑的数据中寻找周期性事件的阶段性收获(也许包括一些乐观的结论),而不是什么全面的调研或结论。
陨石坑记录的周期性
无论如何,在寻找陨石坑的周期性时对数据还是有一些限制的。人们应该集中分析较大和较近期的陨石坑。那些过于久远的陨石留下的印记肯定不如近期的可靠。另外,尽管小陨石坑的数量远比大的多,但是对周期性的研究应该只专注于那些大的陨石坑。小天体随时都可能撞到地球上——除了小行星带的瀑布式碰撞,这些撞击大多数都是随机的。那些造成小陨石坑的天体的行为是无序的。我们下一章会看到,真正具有周期性的只是彗星,而且只是那些从遥远的奥尔特云飞来的彗星。
因此,在数量(陨石坑越小数量越多)和可靠性(陨石坑越大对周期现象越可靠)上要有一个取舍。最佳的选择是未知的。很多文献都使用了不同的标准,因此大家在看早期的研究结果时一定要记住这一点。在马修和我的工作中,我们最终决定选择在过去的2.5亿年落到地球上的,直径大于20公里陨石坑。我们选择的时间2.5亿年看起来足够长,统计上比较合理,但还不会太久远以至不可信;20公里也是一个比较好的取舍点,它要求陨石尺寸要达到公里量级,又不会太大而丢掉相关的统计性数据。
即使有了这些限制,从陨石坑记录中辨认可靠的周期性也是难以完成的任务。陨石坑的印记在地球历史进程中并不能被完整地保留下来,它们中只有一小部分今天还清晰可见。此外,陨石坑的时间并不总是能足够精确地推测出事件的时间特征。更麻烦的事情还有,研究者们需要使用不同的数据组。即使同样的数据,分析人员有时会使用不同的时间间隔或者以不同方式分组。如上文所述,这使得情况变得更加混乱,即使有些陨石是周期性出现的,还有一些却是随机的。这意味着最好的情况也只是在一个随机组分上叠加一个周期组分,此类叠加进一步“连累”了本来就可怜的统计记录。
尽管如此,受沃尔特·阿尔瓦雷斯提议(彗星撞击导致白垩纪-古近纪大灭绝)的启发,以及周期性灭绝的证据,科学家们继续寻找周期性天体撞击的证据。1984年,沃尔特和加州大学伯克利分校的同事、物理学家理查德·穆勒发起的这项工作,当时他们用2.5亿年前的、半径大于为5公里的陨石坑得出了2 840万年的周期。他们研究的样本只有11个陨石坑,而且没有严格考虑数据的不确定性,但是很多更全面的分析接踵而至。
1984年晚些时候,纽约大学的生物学家迈克尔·兰皮诺(Michael Rampino)与美国国家航空航天局戈达德太空研究所的理查德·斯图斯尔(Richard Stothers)合作,研究了另外一个包含41个陨石坑的样本,这些陨石坑产生于2.5亿~100万年前,他们得到了一个3 100万年的外来天体撞击周期。1996年,日本的科学家们得到了类似的结果——过去3亿年间的陨石坑有一个3 000万年的周期。2004年,京都大学的一名应用数学家薮下·新(Shin Yabushita),也是这项研究的参与者之一,进行了一项更细致的分析,使用了过去4亿年的陨石坑,并根据其大小给它们以不同的权重。由此他从一组91个陨石坑中得到了3 750万年的周期。这些分析都从陨石记录中找到了规律性的证据。但是周期的结果都不一样,不足以支持这些结果。
2005年,英国白金汉天体生物中心的教授威廉·纳皮尔(William Napier),进行了一项有趣的研究。他认为天体撞击是成组出现的,每期持续大约一两百万年,间隔2 500万~3 000万年。他的样本是2.5亿年里直径大于3 000米的40个陨石坑。他发现,最大的一组撞击发生在相对较短的间隔,而且白垩纪-第三纪大灭绝也发生在其中。这个周期性的证据比较薄弱,但他依然推断出了一个周期的长度范围——这取决于如何诠释数据,这个范围内似乎2 500万年和3 500万年占主导。
纳皮尔意识到他的证据不足以成为很强的论据。他指出:尽管已经比沃尔特开始的数据多了很多,但还是无法期望得到更强的信号或者信号会完全消失。他认为这种模糊不清的结果的一种可能解释是:他的结果是稳定的随机事件和周期性事件的叠加,所以即使增加了3倍的数据量,信号也不会清晰地出现。
纳皮尔还提出了一些有趣的建议,是关于可能的天体是彗星还是小行星的。尽管他认为在分析中排除的那些较小流星体可能源自小行星带,但他怀疑那些彗星——而不是小行星,是那些大陨石坑的主要制造者。他给出的原因是,大型小行星不足以解释轰炸时期所需要的密度,相反,太多的大型小行星与我们发现的短时标周期不符。纳皮尔还指出,不充足的陨石记录实际上支持了他的论据。如果大部分陨石坑都没有保留下来,那么撞击的数量应该比从地球上鉴别的陨石坑数量多很多。如果我们知道一些大型陨石坑集中在一个轰炸期,那么我们也应该知道发生过很多撞击,但证据已经不存在了。
纳皮尔进一步解释道,由于扰动而进入地球轨道的小行星只有不到4%撞到地球上。大部分都被甩出太阳系或掉到太阳里了。考虑这两种效应,纳皮尔从他的数据中总结出:一个至少20公里~30公里大的元行星碎裂而产生的几百个小行星到达了近地轨道。这种碎裂肯定是由于碰撞。但是这么大的小行星碰撞出这个数量的小行星的事件太不常见了。因为一两百万年的影响时间太短,而且这个时间范围对小行星的解释也不合理,所以他认为彗星更像是这个周期爆发的根源。尽管他的结论并没有得到证明,而且我们也知道一些小行星有一个一两百万年的“快速通道”,但是他们的确提出:对一些显著的撞击事件来说,彗星可能比小行星更重要,这也许是最终区分此类撞击事件的方法。
“旁视效应”
以上都是令人好奇的观测。然而,上面这些结果都没有给出统计显著性,这是最后建立周期性所需要的。当分析统计显著性时,另一个棘手的问题出现了,这个问题还解释了为什么之前的结果会互相矛盾。不过这个问题是可以解决的。
你也许认为,如果假设数据是周期性的,就可以简单地把数据匹配一个周期性函数,然后评估周期性函数的拟合情况,并用来解释观测结果。然而,这会给出一个过于乐观的估计。当你不是测试单一的假设而是许多猜测时——在这种情况下,函数会得出不同的周期。如果给出足够多的可能性,周期性函数的拟合结果几乎肯定会被证明比随机情况更好,但这并不一定正确。
这个微妙但是有些明显的(至少事后看来是这样)问题,在粒子物理学界被称作“旁视效应”(look-elsewhere effect)。当希格斯玻色子在大型强子对撞机(LHC)中被发现时,这个现象成为很多讨论的主题。[31]大型强子对撞机就是在日内瓦附近的欧洲核子研究中心(CERN)的巨型粒子加速器,科学家们试图用高能质子互相碰撞来制造新粒子,并由此可以洞察还没被发现的物理理论。这尽管不是本书的主题,但寻找希格斯玻色子的结果,阐明了一个科学家在寻找周期性时需要面对的问题。
实验人员寻找希格斯玻色子的方法是在数据中试图寻找希格斯玻色子衰变成的粒子,然后测量它们被发现的频率。因为粒子碰撞的大多数时间里是不产生希格斯玻色子的,而希格斯玻色子存在的迹象出现在数据突出的信号里,那些光滑的背景曲线则来自希格斯玻色子没有出现的那些实验事件。如果可以正确地做图,这个突出的地方应该发生在正确的希格斯玻色子质量上。所以当实验人员展示数据时,他们集中在了数据“鼓包”的区域,在那里,某种物质(希望是希格斯玻色子)贡献了高于背景很多的信号。
旁视效应
科学实验中,尤其是粒子物理学实验中统计分析的一种现象。由于参数空间的改变,会导致统计显著性偶然地明显增加。
需要提醒的一点是,统计的侥幸(技术上所谓的涨落)总是使数据上下变化。有时会有很大的涨落。尽管特定在某点的涨落是不太可能的,但是如果你分析的质量范围足够大,一个不太可能的涨落会恰好出现在某个地方。这个不太可能的事件的“信号”看上去可能和希格斯玻色子的信号一样。但这个“信号”只是背景事件中的“不可能涨落”在某一质量处的积累。
当实验人员一开始寻找时,他们并不知道希格斯玻色子的质量[32]。因为衰变产物中的能量和质量可以用来计算希格斯玻色子的质量,所以当找到了适当的证据时,他们就能够测量这个质量了。但是研究人员只能在他们看到一个“鼓包”后才能得到质量,而不是相反的过程。
当实验人员展示他们的数据,并讨论他们辨识出的每一个“鼓包”有多可能或不可能出现希格斯玻色子时,他们需要考虑其质量值的不确定。因为统计涨落可能出现在任何地方,它们中的每一个都可能被认为是一个希格斯玻色子的衰变,每个“鼓包”的统计显著性被其他什么地方更大的统计涨落削弱了。实验人员知道这一点,所以他们展示的是已经考虑到了旁视效应的显著性结果。这个旁视效应会告诉你,如果你事先已经知道了希格斯玻色子的质量,结果会更加显著。如果你不知道,那么一个“鼓包”更可能是一个涨落,因为你可能把数据中一个非常规正信号的可能性乘以了它们的发生次数。仅仅当实验产生了足以探测的希格斯玻色子并显示出统计显著的结果时——旁视效应也要考虑进去,物理学家们才能最终声明他们的发现。
当寻找陨石记录的周期性时,如果事先不知道你要找的周期,类似的考虑也适用,而天体物理学家喜欢把这个效应称作“实验因子”(the trials factor)。如果你使用了足够多的不同周期,它们中总有一个同数据的拟合结果比没有周期的结果要好,即使数据是完全随机的。原来,结合了周期性天体撞击的模型与数据符合得更好——至少比假设完全随机的撞击事件要好。但是因为没有人知道预期的周期,研究人员基于简单拟合能推测的任何统计显著性都低于他们天真的结论。如果有足够多的可能性,而每一个可能性又都具有各自的统计不确定性,最终,一些周期函数必然会看起来与数据合理吻合。
我们费了好大力气才解释了科兰·贝勒-琼斯的结果与其同事的分歧:他没有发现周期性的统计证据,而他的同事却发现了。他们各自都做了正确的分析,但是贝勒-琼斯并没有像我们一样,提前把周期因素考虑进去。没有额外输入,这个信号需要非常强才能压倒这种中和效应。但一开始这个信号并不够强。
好消息是,我们确实有额外输入,并且能够把它考虑进来。在某种程度上,我们知道星系的组成,因为天文学家已经测量了其组分和引力场。如果周期效应是由太阳系的运动造成的,我们可以把星系的性质和太阳的位置结合起来,并把预测的太阳系的运动和已知数据进行比较。在下一章,我会介绍一个周期性陨石雨的触发机制及其应用,这正是马修和我决定研究的题目。