端粒,像是染色体末端的“安全帽”,保护我们的遗传物质。随着细胞分裂,它会逐渐缩短。白细胞端粒长度(LTL)因此常被视为“生物衰老”的分子时钟。更短的LTL与心血管病、糖尿病等多种年龄相关疾病风险升高有关,而更长的LTL则与更健康的生活方式和更低的压力水平相关。然而,这种关联在不同的人群(如不同种族、性别)中是否一致?是否存在我们尚未发现的、能影响端粒长度的遗传秘密?为了更有效地利用端粒信息来推动人口健康,我们需要在多样化的人群中进行更精细的研究。这正是发表在《自然·遗传学》(Nature Genetics)上的一项新研究——《美国人群白细胞端粒长度的基因组、表型组与地理关联性研究》所致力于解答的核心问题。
为了探究这些奥秘,研究人员开展了一项大规模、多层次的整合研究。首先,他们利用了美国“全民研究计划”(All of Us, AoU)中242,494名具有多样种族背景参与者的血液全基因组测序(WGS)数据,采用改进的TelSeq方法估算了LTL,并校正了测序深度的影响。其次,他们系统地分析了LTL与人口学特征、健康相关表型(如生活方式、社会经济状态、生物标志物、疾病)的关联,并检验了这些关联在不同种族和性别间的异质性。此外,研究还进行了地理空间分析,探索LTL在美国不同地区的分布模式。在遗传学层面,研究团队在AoU队列中进行了全基因组关联研究(GWAS)和罕见变异关联分析(RVAS),并与英国生物样本库(UK Biobank, UKB)的数据(共计679,972人)进行了荟萃分析,以发现新的遗传位点和基因。最后,他们评估了基于不同种族人群数据构建的多基因风险评分(PGS)对LTL的预测性能。
研究结果
- •
估算AoU中的LTL及其人口学关联:研究成功从AoU参与者的WGS数据中估算了LTL。分析证实,LTL与年龄、性别和种族显著相关,与既往报告一致。特别发现,非洲裔(AFR)人群的LTL随年龄缩短的速度(损耗率)快于欧洲裔(EUR)人群,且这种种族异质性在男性中更为显著。
- •
LTL与健康相关表型的异质性关联:研究在AoU中验证了LTL与许多已知表型的关联,如身体质量指数(BMI)、体力活动、吸烟和邻里剥夺指数。重要的是,研究发现大多数测试的表型与LTL的关联在不同种族间存在显著异质性,所有7个测试的社会经济状态指标均显示出种族异质性。此外,9个表型显示出显著的性别异质性。例如,收缩压(SBP)与LTL的负相关仅在女性参与者中显著,而在男性中不显著。
- •
LTL与疾病和条件的异质性关联:通过表型组关联研究(PheWAS),研究发现较长的LTL与54种疾病(主要是细胞增殖性疾病,如非血液系统肿瘤)的风险增加相关,而较短的LTL与572种疾病(主要是非细胞增殖性疾病)的风险增加相关。其中,52种疾病与LTL的关联在不同种族间存在显著异质性,7种存在性别异质性。
- •
美国参与者中LTL的地理异质性:地理空间分析显示,LTL在美国的分布并非均匀。西海岸和中西部地区参与者的LTL显著更长,而东南部地区参与者的LTL显著更短。这种地理模式在调整了多种协变量以及仅分析欧洲裔人群后仍然存在,表明不能完全由种族构成解释。
- •
AoU中常见变异的GWAS发现了11个新位点:在AoU各个人群中进行GWAS,共发现了11个新的与LTL相关的基因位点。其中一个位于3号染色体ATR基因内含子的新位点,与已知的DNA损伤应答和端粒维持机制相关。
- •
与UKB的GWAS荟萃分析发现了23个额外的新位点:将AoU的GWAS结果与UKB的数据进行荟萃分析,统计效力大大增强,又发现了23个新的基因位点。通过多基因优先级评分(PoPS)等方法,研究人员对这些新位点中可能的致病基因进行了功能注释和优先级排序,例如RMI2、CKS2等基因,它们均与细胞周期调控、端粒维持等已知生物学通路相关。
- •
种族特异性和性别特异性位点:荟萃分析发现了6个新的种族特异性位点(5个在AFR,1个在EAS),这些位点在EUR人群中不显著。例如,位于BLM基因内的一个变异仅在AFR人群中与LTL显著相关。同时,研究确认了X染色体上一个已知位点与LTL的关联具有女性特异性。
- •
多种族GWAS荟萃分析发现了3个额外的新位点:通过MR-MEGA方法进行的多种族荟萃分析进一步发现了3个新位点,其可能致病基因如MUS81、AXIN1也与端粒生物学功能相关。
- •
RVAS确定了9个新基因:通过对AoU和UKB数据的罕见有害编码变异进行基因聚集检验,研究发现了28个与LTL显著相关的基因,其中9个是先前RVAS未报告的新基因。这些新基因包括TERF2IP(编码Shelterin复合体组分RAP1)、RBM7(参与端粒酶RNA加工)等,为理解端粒长度的遗传调控提供了新的功能视角。分析还显示,端粒酶组分基因的罕见功能缺失变异与更短的LTL相关,而CST复合体和Shelterin复合体的组分基因变异则与更长的LTL相关。
- •
PGS提高了在AFR人群中的预测性能:研究评估了增加遗传多样性和样本量对PGS预测性能的影响。结果显示,与仅使用UKB(EUR人群)数据构建的PGS相比,结合AoU和UKB数据(特别是包含AFR人群数据)构建的PGS,在AFR人群中对LTL的预测能力有显著提升。这支持了在PGS构建中使用对应种族数据的重要性。
研究结论与意义
本研究利用AoU大型多样化队列,系统描绘了LTL与多种健康表型及疾病关联的复杂图谱,并首次在人口规模上揭示了这些关联在种族、性别和地理维度上的广泛异质性。地理分析显示LTL的分布与美国既有的健康差异模式存在重叠,提示LTL可能作为反映区域整体健康水平的潜在生物标志物。更重要的是,通过大规模GWAS和RVAS荟萃分析,研究发现了大量新的与LTL相关的遗传位点和基因,极大地扩充了我们对端粒长度遗传架构的理解,并确认了种族特异性和性别特异性的遗传易感性存在。研究还证实,在多样化人群(如AFR)中,使用对应人群数据构建的PGS具有更好的预测性能,这凸显了在遗传研究中纳入广泛人群代表性对于实现广泛影响、解决健康不平等问题至关重要。
总之,该研究强调了“背景”(包括遗传背景、性别、生活环境)深刻影响着LTL的分布及其与表型的关联。这些发现揭示了此前未被充分认识的异质性,为了解端粒在人类健康和疾病中的作用提供了更精细的视角。未来,进一步阐明这些异质性背后的机制,将有助于推动针对不同人群的健康老龄化策略,并为在美国多样化的社区中促进全民健康提供新的科学依据。