群体遗传学挑战第一对人类的祖先

在20世纪90年代的名为弗朗西斯科·阿亚拉 (Francisco Ayala)的群体生物学家采用从HLA序列得来的遗传信息, 开始着手挑战两个人的第一对人类祖先的思想。(注1) 阿亚拉选择了HLA-DRB1的一个原因,是那个时候有已经有数百已知的HLA-DRB1不同的版本。因此他有理由怀疑在假想当黑猩猩和人类的谱系分歧进化时,在HLA-DRB1序列可能有已经相当大的差异。

图5.2 : HLA-DR的肽连接结构域 (peptide binding domain)

Illustration: Ann Gauger, created using MacPymol and PDB 1aqd.

HLA-DRB1有什么功能呢? 为什么会有这样多的变异?HLA-DRB1蛋白与另一蛋白HLA-DRA结合,形成称为二聚体蛋白的HLA-DR(参考5.2)。(二聚体dimer是一个由两亚基蛋白质subunit组成的蛋白质) 。这个蛋白二聚体嵌入在抗原呈递细胞 (在免疫系统中特定类型的细胞) 的细胞膜上。该二聚体形成结合外源肽的肽结合袋,并将它们呈现给其他的免疫细胞,以触发它们生产合适的抗体。

为什么有HLA-DRB1的那么多的变异呢? 原因是,在肽结合袋的许多变化,可确保许多不同的外源肽被识别和结合。这是一件好事,因为它能够增强免疫力。如果一个新的寄生虫或致病微生物出现时, 群体中某些个人将有HLA-DRB1的基因, 能够结合入侵者“被提炼过而成的”外源肽蛋白质,并引发免疫系统启动一个防御它们的部位。

这里可见到有趣的事情: 几乎所有的遗传变异, 都是位于被用来绑定多变化外源肽的HLA-DR二聚体, 它们只是来自一个HLA-DRB1中的部分专门基因,即外显子(exon)2。(注2) HLA-DRB1或HLA-DRA的其余基因部分变化不大(按: 外显子乃是被转译为蛋白质的基因序列)。

阿亚拉获得黑猩猩、人和猕猴只从HLA-DRB1的外显子2 取来的DNA序列,使用群体遗传学算法重建那些序列的系统发展历史。 (注3) 他用最紧密贴合外显子2遗传变异模式的方法, 画了一个进化树, 又使用其他来源估计的平均突变率, 和黑猩猩和人类最后共同祖先的估计时候,他计算出共同的祖先在他树上的分歧点有多远。在此一分歧点绘制一个分界线,他数算人类有多少祖先的分支交叉。这样他给黑猩猩/人类最后的共同祖先, 在人群中应有多少HLA- DRB1基因, 作了回顾性的评估。 (注4)

为了说明他遵循的基本过程,我画了一个进化基因树(图5-3)一个简单的例子。左边是树的最古老的部分。随着时间的迁移,单基因的重复和发散,然后再分枝数次。右侧最终分枝的数目为五。(A-E)

图5.3: 使用种系树来估计谱系。

Illustration: Ann Gauger.

通常群体遗传学家使每条种系树水平线的长度, 与遗传改变的量成正比例。长度越长,核苷酸差异越多。假设核苷酸差异是由于突变随着时间发生, 并假设突变发生的速率是恒定的(这并不是肯定的事), 人们可以向后倒数到在进化史的估计时间(在这种情况下,50和250年前), 并通过画一条与树垂直的线, 线穿过种系树的交叉, 确定在每一个特定的时间中出现多少独立的谱系。如果所有的估计是正确的,这棵树50年前有五个谱系, 250年前有两个谱系。

根据这一程序, 阿亚拉计算, 在我们最后与黑猩猩共同祖先的估计时间, 是四百万至六百万年前(并非肯定的事, 这些估计数字不断变化), 群体中HLA-DRB1基因共有32个分别的版本。为了让所有这些基因变异可以遗传到现代,他还估计祖先人数的最​​低不少于4,000,长期平均有效群体的大小为100,000。 (注5) 像阿亚拉的稳定状态的人口模型, 这个大数位是必要的。在这种条件下,假设随机交配和基因漂流,随着时间的推移, 基因是容易丢失的,这样一个大的始创族群是必要的,可以保证所有的基因继续传播。因为这个最小估计是4,000,阿亚拉声称,人类群体在任何时间内, 都不可能只通过两个人的基因瓶颈遗传而来。在他看来,在HLA-DRB1的变异实在有太多祖先的多样性。