现有证据表明,地球大约形成于45.4亿年前,起源于与新形成的太阳相关的巨大旋转尘埃和气体云。随着地球冷却,尘埃聚集形成越来越大的颗粒,在重力作用下形成了地核和地壳。地核的巨大热量导致地幔破裂并引发火山活动,释放出气体,形成了大气层和水体,进而形成了海洋;这些海洋中含有多种化学元素,这些元素之间发生了化学反应,形成了“前生物汤”[1]。前生物汤时代是一个充满各种化学反应的时期,生态系统动态多变,化学成分、温度和能量条件各不相同,同时火山活动、闪电以及频繁的含有有机物质的陨石撞击也促进了这些反应[2]、[3]。
很可能在前生物汤时代存在某种形式的自然选择,这种选择基于分子的可用性和能量来源,以及正在形成的大分子的稳定性。尽管当时存在大量相对复杂的非生物化学分子,但它们各自的数量都非常少且无法自我复制。关于非生物分子如何演变成最后一个共同祖先(LUCA)并最终产生所有生物的复杂过程,在许多综述中都有讨论[4]、[5]、[6]、[7]、[8]、[9]。这一过程中的关键步骤包括(虽然不一定按时间顺序):RNA的形成(RNA世界),使其具备催化(自我复制)和信息存储的能力;第一个共同祖先的出现,这些祖先是由能够将RNA分子翻译成肽的生物组成的集合体;前体被包裹进膜结合的细胞中;RNA转化为DNA[10];以及LUCA的出现,这是一种具有所有现存生物基本特征的自我复制细胞(详见[11]、[12])。有观点认为,RNA病毒样实体可能是这一过程中的驱动因素之一[13]。
大多数科学家认为,LUCA是一个单一的膜结合蛋白细胞,它具备了所有生物的基本特征:通用遗传密码、蛋白质合成机制(RNA和核糖体)、几乎所有20种氨基酸的相同手性[14]、使用三磷酸腺苷(ATP)作为能量来源,以及所有生物都拥有的DNA基因组[10]。穆迪等人[15]的研究提供了更多关于LUCA的详细信息,他们分析了298个与基因功能相关的标记物。通过分子钟方法、考虑水平基因转移(HGT)的系统发育重建以及现有的生物地球化学模型,他们估计LUCA存在于约42亿年前,其基因组至少为2.5 Mb,编码了约2600种蛋白质,表明它具备了现代原核生物的基本细胞结构。基因谱表明,LUCA是一种有机异养菌,这与当时的环境条件相符(见第2Ci节)。LUCA是三大生物域——单细胞原核生物域古菌和细菌,以及多细胞真核生物域——的起源[16],原核生物大约出现在30亿至38亿年前,而真核生物则出现在15亿至25亿年前。因此,LUCA是所有过去和现在生物的基本结构单位,即膜结合细胞[17]、[18]、[19]。
几乎没有疑问,单链正负链RNA(ssRNA)病毒是RNA世界中的复制体之一[20]。帕帕斯塔夫鲁及其同事[21]提出,RNA世界(以及LUCA)可能经历了达尔文式的自然选择过程,即适者生存。RNA的进化为蛋白质和脂质的合成提供了信息存储和表达的机制,而蛋白质和脂质是构建生物体的主要“工厂”。然而,RNA在表达过程中存在许多问题,如化学不稳定性和缺乏校对机制[22]、[23]、[24],这导致RNA复制过程中产生了大量变异。DNA的进化克服了这些问题,将RNA的信息和功能以DNA的形式保存下来,实现了代际传递,使得RNA病毒(以及类病毒[25])变得多余。这就引出了一个问题:“为什么它们能够存活下来?它们具备哪些选择性优势?”(见第3节)。很可能大多数RNA分子功能形式的“DNA化”(以及为RNA病毒找到新的功能)是RNA世界消亡的众多因素之一[26]。