编辑推荐:
为解决全球南方人群在基因组研究中代表性不足的问题,Nunes等学者对巴西2723名健康个体进行高覆盖度全基因组测序(WGS),揭示了近900万新遗传变异(含36,637个有害变异),精准重构了18-19世纪混合高峰期的非随机婚配模式,发现选择压力作用于生育力(如ZNF184)、免疫应答(如LILRs)和代谢特征(如ACACA)相关基因,为理解混合人群的进化-健康关联提供了范式。该成果发表于《科学》杂志。
在人类基因组研究的版图上,巴西这个拥有2亿多人口的拉丁美洲国家长期处于被忽视的角落。作为全球最大的近期混合人群,巴西人的基因组如同其多元文化一般复杂——殖民时期500万欧洲移民与至少同等数量的非洲奴隶被迫与原本超过1000万的原住民交融,形成了独特的遗传马赛克。然而,这种复杂的混合过程如何塑造当代巴西人的健康特征?不同祖先来源的基因片段如何在时空维度上分布?这些问题因缺乏系统性研究而悬而未决。更严峻的是,全球基因组数据库中巴西人群的代表性不足,导致其特有的3600余种潜在有害变异长期"隐身",严重制约了精准医学在该人群中的应用。
为填补这一空白,由巴西圣保罗大学等机构领导的团队开展了迄今最大规模的巴西人群基因组研究。研究人员对来自五大地理区域的2723名健康个体进行高覆盖度(35×)全基因组测序,涵盖城市、农村和亚马逊河流域社区,特别纳入非裔巴西人和原住民后裔。研究采用Illumina NovaSeq 6000平台进行测序,通过GATK流程进行变异检测,并整合HGDP和SGDP数据集作为参考面板。运用GNOMIX进行局部祖先推断,CHROMOPAINTER/fineSTRUCTURE分析精细遗传结构,fastGLOBETROTTER和TRACTS重构混合历史时间轴,结合LAD和深度学习技术检测选择信号。
研究结果揭示出令人惊叹的遗传多样性。在"解锁巴西人隐藏的遗传多样性"部分,团队鉴定出872万新变异,其中36,637个被预测为有害变异。这些变异与祖先成分显著相关:非洲成分与罕见变异呈强正相关,而欧洲成分呈负相关。特别值得注意的是,新发现的有害变异与原住民成分呈弱正相关,凸显了原住民基因组数据的匮乏现状。在pLoF变异分析中,发现815个基因与传染病易感性相关,包括疟疾、结核病等巴西主要公共卫生负担疾病。
"非随机婚配塑造当代巴西人口"章节揭示了混合过程中的社会历史印记。线粒体DNA(42%非洲,35%原住民)与Y染色体(71%欧洲)的祖先差异,印证了殖民时期的性别不对称混合。更引人注目的是,研究发现从早期的性别偏向混合逐渐转变为现代基于祖先比例的选择性婚配,这种转变在X染色体上表现得尤为显著(r=0.97),反映出巴西社会结构的深层演变。
通过"巴西基因组是全球单倍型马赛克"的精细分析,研究描绘出祖先特异性片段的复杂分布。南部Rio Grande do Sul州的巴西J集群显示出与北欧人群的密切联系,而非洲成分则呈现惊人的多样性——来自东西南北非的基因片段在巴西个体中形成前所未有的新组合。原住民成分主要与亚马逊地区Tupi和Karib语族相关,印证了历史记载中沿海Tupi族群在早期混合中的核心作用。
"混合过程在18-19世纪达到高峰"的时间定位与巴西历史重大事件完美吻合。TRACTS分析显示东北和东南部最早发生混合(约16代前),与甘蔗种植园兴起同步;而18世纪黄金周期引发的移民潮和19世纪奴隶贸易高峰,都在基因组中留下清晰印记。特别值得注意的是,亚马逊地区显示出持续的有效群体大小(Ne)下降,反映出该地区与世隔绝的人口历史。
在"祖先特异性片段在巴西区域和时期的不均衡分布"部分,IBD共享模式揭示出欧洲片段在州际间的高流动性,而亚马逊地区则保留了更多长片段原住民IBD。ROH分析显示非洲成分与杂合度呈正相关,解释了东北部人群更高的遗传多样性。
最富生物学意义的发现出现在"接触后选择基因与生育力、免疫应答和代谢特征相关"章节。通过LAD和深度学习方法,研究鉴定出多个受选择的基因:ZNF184/POM121L2(精子发生)、ACSS1(NK细胞调控)和MTMR3(先天免疫与LDL代谢)。这些信号在三大地理区域(北部、东北/东南部、南部)均重复出现,但表现出祖先成分的差异——例如LINC00871在东北/东南部与欧洲成分相关,而在墨西哥研究中却与原住民成分关联。MHC区域的强选择信号进一步证实了病原体压力在混合人群适应中的关键作用。
这项发表于《科学》的研究从根本上改变了我们对巴西人群遗传架构的理解。通过建立首个覆盖全国的基因组数据库,研究不仅填补了全球基因组多样性图谱的关键空白,更开创性地揭示了:1) 混合历史如何通过非随机婚配模式塑造当代人群结构;2) 不同祖先片段在时空维度上的动态分布规律;3) 自然选择如何优化混合人群的生育、免疫和代谢特征。这些发现为理解人类适应机制提供了新视角,更重要的是,为开发针对巴西人群的精准医疗策略奠定了基石——从预测36,637个有害变异的健康风险,到指导基于区域遗传特征的公共卫生政策制定。正如研究者所言,这些数据"为缓解全球人群基因组覆盖不平等迈出了重要一步"。
该研究的独特价值还体现在方法学创新上:将深度学习应用于局部祖先分析,开发多方法交叉验证的时间推断流程,以及整合历史学证据与基因组数据的跨学科研究范式。这些方法不仅适用于巴西,也为其他混合人群研究提供了可复制的模板。随着DNA do Brasil项目的持续推进,这份遗传"地图"将指引更多探索——从解码巴西人独特的疾病易感性,到揭示人类面对环境挑战的进化应答智慧。
生物通 版权所有