**摘要翻译**
自殖民时期以来,美洲原住民、欧洲和非洲群体之间的强烈基因流动导致了贯穿哥伦比亚全境的复杂混合遗传结构。为探究这一遗传结构,研究人员对来自哥伦比亚五大主要区域(安第斯、太平洋、加勒比、奥里诺科和亚马孙)的975名男性分析了23个Y染色体短串联重复序列(Y-STRs)。为探索父系谱系并重建其潜在的历史和人口过程,对175名个体的一个子集使用大规模平行测序(massively parallel sequencing)进行了859个Y染色体单核苷酸多态性(Y-SNPs)的基因分型。与已研究的其他拉丁美洲人群相比,本研究中23个Y-STRs显示出高的单倍型多样性(0.9998)。配对遗传距离分析(FST和RST)显示,当Y-STRs数量从17个增加到23个时,哥伦比亚各区域间的遗传分化更为清晰。在人群比较中,加勒比和奥里诺科区域与欧洲和混合人群聚集较近,而太平洋区域则向非洲人群靠近。亚马孙区域与具有高美洲原住民血统的秘鲁和厄瓜多尔人群聚在一起。加勒比和安第斯区域的主导父系血统是欧洲血统(分别为79%和87.9%),其中宏观单倍群R最为常见(分别为39%和64%)。在加勒比区域,撒哈拉以南非洲谱系是第二常见的(16%),而在安第斯区域,美洲原住民谱系是第二代表性的(7.6%),其次是较小比例的撒哈拉以南非洲谱系(4.5%)。这些结果证实了哥伦比亚国内广泛的区域遗传多样性。Y-STRs显示出良好的种内和种间区分能力,并支持为法医学目的建立特定的区域性数据库。
**论文解读**
哥伦比亚位于南美洲西北部,其人口构成是数百年来复杂历史进程的产物,涉及美洲原住民、欧洲殖民者以及被强制贩运而来的非洲人之间的广泛遗传混合。这种混合造就了该国高度的遗传多样性和复杂的群体结构。在法医学和群体遗传学研究中,Y染色体因其单倍体特性及位于非重组区的有利位置而被广泛应用。然而,对于哥伦比亚这样遗传背景多元的国家,目前公开的、涵盖现代法医学常用全套Y-STRs(如PowerPlex Y23或Yfiler Plus试剂盒)的单倍型数据库仍然稀缺,这限制了法医学证据的精确评估。为了填补这一知识空白,并深入理解哥伦比亚不同地理区域间的父系遗传差异,研究人员开展了本研究。
研究人员从哥伦比亚五个主要自然区域(安第斯、太平洋、加勒比、奥里诺科和亚马孙)选取了975名无关男性个体,使用PowerPlex Y23试剂盒对所有样本进行了23个Y-STRs的基因分型。此外,为了追溯单倍群并解析历史人口过程,从安第斯、加勒比和亚马孙区域随机选取了175个样本,使用Ion AmpliSeq™ HID Y-SNP研究面板v1进行859个Y-SNPs的大规模平行测序基因分型。研究结合了群体遗传学统计分析,包括遗传距离计算(
FST和
RST)、分子方差分析(AMOVA)以及多维尺度分析(MDS)等方法,并利用Y-leaf软件进行单倍群推断。研究得出结论,哥伦比亚国内存在显著的区域遗传多样性,不同地区的父系谱系构成存在清晰差异,这主要反映了该国的殖民历史与人口迁移模式。这项研究的意义在于极大地扩充了哥伦比亚人群的Y-STR单倍型数据库,其数据对于法医学应用(如建立区域性参考数据库以提高证据评估准确性)和理解该国人口历史具有重要价值。论文发表于《International Journal of Legal Medicine》。
该研究主要运用了以下关键技术方法:1)使用PowerPlex Y23试剂盒进行23个Y-STRs的复合扩增与毛细管电泳分型;2)采用基于大规模平行测序的Ion AmpliSeq™ HID Y-SNP研究面板v1对859个Y-SNPs进行基因分型;3)利用NEVGEN软件、SNaPshot多重检测以及Y-leaf软件进行单倍群预测与确认;4)应用Arlequin、STATISTICA、Network等软件进行遗传多样性、群体分化(
FST、
RST、AMOVA)及系统发育网络分析。样本队列来源于哥伦比亚五大区域27个省份。
**单倍型多样性与等位基因变异**
对975名个体的23个Y-STRs分析显示出极高的单倍型多样性(HD = 0.9998),与其它南美混合人群的研究结果一致,共鉴定出913种不同单倍型。研究检测到了中间等位基因、重复等位基因和缺失等位基因。中间等位基因主要在DYS458和DYS385位点被观察到,且未发现地理特异性。重复等位基因见于DYS448、DYS456、DYS576、DYS389I和DYS437位点。缺失等位基因则出现在DYS448、DYS390、DYS19和DYS392位点。通过单倍群分析,发现这些特殊等位基因可能源于多次独立的突变事件,例如与非等位同源重组(特别是在Y染色体的AZF区域)或引物结合区的突变有关。
**哥伦比亚群体间的Y-STR单倍型比较**
研究人员利用17个和23个Y-STRs数据计算了哥伦比亚各省及五大区域间的遗传距离(
FST和
RST)并进行多维尺度分析。结果发现,无论使用17个还是23个标记,亚马孙区域(特别是亚马孙省和普图马约省)都与其他区域显示出显著的遗传分化。乔科省也与其他安第斯省份存在显著差异。使用23个Y-STRs时,五个地理区域(安第斯、加勒比、奥里诺科、太平洋、亚马孙)的区分比使用17个标记时更加清晰。分子方差分析表明,遗传变异主要存在于群体内部(>97.81%),但区域间的差异虽小(F
CT < 0.05)却具有统计学意义。研究认为,使用23个Y-STRs比使用17个更能提高识别区域差异的分辨率,并建议未来研究应加强对遗传独特但人口稀少区域(如亚马孙、太平洋和奥里诺科)的采样。
**与南美混合人群的比较**
为了进行比较,研究人员将哥伦比亚各区域的23个Y-STRs数据集与来自南美混合人群、美洲原住民、欧洲人、东亚人和非洲人的数据进行了比较。MDS图显示,哥伦比亚的安第斯、加勒比和奥里诺科区域与欧洲及其他南美混合人群(如阿根廷、巴拉圭、巴西)聚集在一起,表明它们与伊比利亚半岛人群有更强的遗传亲缘关系。太平洋区域尽管与非洲群体在统计上存在显著分化,但仍然显示出与西非人群更大的遗传邻近性。亚马孙区域则与秘鲁和厄瓜多尔人群聚集,没有显著差异,这很可能归因于它们共享的强大美洲原住民遗传成分。
**Y-SNP分析与安第斯和加勒比区域的单倍群多样性**
对175个样本的272个可变Y-SNPs进行分析,定义了64个单倍群。宏观单倍群R-M173是安第斯和加勒比区域最主要的单倍群(频率分别为64%和39%)。其下游分支R1b-P312在两个区域都很常见,这是西欧尤其是伊比利亚半岛的高频单倍群。单倍群E在加勒比区域(27%)比在安第斯区域(10.6%)更常见。在加勒比区域,E-M2亚单倍群最频繁,它广泛分布于撒哈拉以南非洲,与班图迁徙相关。在安第斯区域,E-M35亚单倍群频率更高,该系谱在欧亚和非洲均有分布。单倍群G、I、J和T也被识别,考虑到哥伦比亚的历史,这些谱系很可能是由欧洲殖民者引入的。美洲原住民单倍群Q-M3*在总数据集中频率较低(6.02%)。此外,还检测到一个可能起源于非洲的R-V88谱系个体。
**哥伦比亚人群的祖源构成**
基于单倍群推断,安第斯和加勒比区域的主导父系血统为欧洲起源(分别占87.9%和79.0%)。在安第斯区域,美洲原住民血统(7.6%)多于非洲血统(4.5%),而在加勒比区域,非洲谱系(16.0%)比美洲原住民谱系(5.0%)更常见。这些结果与先前研究一致,即西班牙殖民导致欧洲谱系成为哥伦比亚父系祖先的主要贡献者。加勒比区域较高的撒哈拉以南非洲谱系频率,则与卡塔赫纳港在跨大西洋奴隶贸易中的关键作用有关。
**法医学相关参数**
利用完整的哥伦比亚单倍型数据集重新计算了分子多样性参数。除奥里诺科外,所有区域的单倍型多样性(HD)均很高(≥99.92%)。研究还比较了不同Y-STRs试剂盒在区分相关男性(1至5次减数分裂分离)方面的预期概率。PowerPlex Y23的平均突变率高于使用较少标记的旧试剂盒,但低于包含更多标记(包括快速突变标记)的Yfiler Plus试剂盒。随着分析位点数量的增加,相关个体间出现单倍型差异的概率也随之增加。
**结论**
本研究全面概述了哥伦比亚国内的父系谱系及其区域变异模式。分析证实了哥伦比亚国内广泛的区域遗传多样性。各区域间的遗传距离结果显示,哥伦比亚五大主要地理区域的父系谱系存在显著差异,这使得在区域层面精确评估法医学证据时,不宜使用统一的国家频率数据库。这种多样性模式反映了该国的殖民历史。与欧洲、非洲和南美混合参考群体的遗传距离分析表明,哥伦比亚的安第斯、奥里诺科和加勒比区域与伊比利亚人群有更近的亲缘关系,这由安第斯和加勒比区域男性谱系中高频出现的欧洲单倍群R1b-P312所进一步证实。相反,亚马孙区域显示出与美洲原住民群体更近的亲缘关系,而太平洋区域则显示出与非洲群体更强的遗传邻近性。研究所用群体具有高的单倍型多样性,PowerPlex Y23标记在哥伦比亚区域群体中显示出高种内区分能力,支持其在法医学应用中的使用。