多基因评分(PGS)作为基于全基因组关联研究(GWAS)的复杂性状遗传预测工具,正日益受到研究人员和临床医生的关注。然而,其广泛应用面临一个主要障碍:当预测样本在遗传血统、社会环境或其他特征上不同于构建PGS所用的GWAS样本时,PGS的预测准确性会大幅下降。这就是所谓的“可移植性”问题。传统上,人们通常认为遗传距离(即个体与GWAS样本在遗传上的差异)是导致PGS性能下降的主要原因,并且这种下降在不同性状间应是相似的。但事实果真如此简单吗?
为了深入探究PGS可移植性的复杂本质,研究人员开展了一项大规模实证研究。他们利用英国生物样本库(UKB)中超过40万人的基因型和表型数据,针对15个连续生理性状(如身高、体重、血脂水平等)和2种疾病(哮喘和2型糖尿病),系统地评估了PGS的预测性能如何随个体与GWAS样本的遗传距离变化。研究结果挑战了多个固有认知,揭示了当前对PGS可移植性理解的三个关键空白。
首先,研究发现,个体水平的预测准确性差异只能被遗传距离微弱地解释。例如,对于身高性状,即使使用灵活的三次样条曲线拟合,遗传距离也只能解释个体间预测误差平方差异的约0.51%。更令人惊讶的是,社会经济因素(如汤森剥夺指数)对预测准确性的解释力度与遗传距离相当,甚至在多数性状中解释的方差更大。这表明,除了遗传因素,社会环境差异同样是影响PGS表现不可忽视的重要变量。
其次,PGS的可移植性趋势具有明显的性状特异性。对于身高这类性状,预测精度确实随着遗传距离的增加而近乎单调下降。然而,对于体重和体脂百分比等性状,预测精度在中等遗传距离处达到峰值。尤其值得注意的是免疫相关性状(如淋巴细胞计数、白细胞计数),其群体水平的预测精度在距离GWAS样本较近时就急剧下降至接近零。研究人员推测,这可能反映了免疫系统相关基因在不同人群和地理环境中经历了快速进化更替,导致其遗传效应在不同群体间不稳定。为了验证这一点,他们比较了PGS中指数单核苷酸多态性(SNP)的效应值在原始GWAS样本、遗传距离“近”的预测子集和“远”的预测子集之间的一致性。结果发现,与甘油三酯水平相比,淋巴细胞计数的指数SNP效应值在不同群体间的差异更大,有高达31.7%的SNP效应值符号在原始GWAS和“近”子集的估计中相反,而甘油三酯的这一比例仅为9.6%。这为免疫性状可移植性差提供了直接的证据。
第三,研究强调,可移植性的趋势甚至定性结论,都依赖于所采用的预测性能评估指标。对于甘油三酯水平、淋巴细胞计数和白细胞计数等性状,群体水平的预测精度(以R²衡量)在远离GWAS样本时接近零,但个体水平的预测精度(以预测误差平方衡量)却随着遗传距离增加而有所提升。在疾病风险预测方面,这种指标依赖性同样存在。对于哮喘,精确度和召回率随遗传距离的变化模式相似;但对于2型糖尿病,精确度在中等和较大遗传距离上大致保持恒定,而召回率在远离GWAS样本时反而普遍增加。这一发现至关重要,因为它意味着在选择PGS应用于临床或公共卫生决策时,必须根据具体目标(例如,是优先识别所有病例还是避免假阳性)来选择合适的评估指标。
本研究主要依赖于英国生物样本库提供的大规模基因型和表型数据。研究人员首先对数据进行严格的质量控制,最终纳入336,923名主要为欧洲血统的个体作为GWAS样本,用于构建15个连续性状和2种疾病的PGS。另外69,500名非主要欧洲血统的个体作为预测样本,用于评估PGS的可移植性。关键的技术方法包括:利用主成分分析(PCA)量化个体与GWAS样本中心的遗传距离;通过线性回归计算PGS在群体水平(分箱后)和个体水平上的预测准确性;以及使用三次样条拟合来描绘预测性能随遗传距离变化的非线性趋势。
研究结果
PGS预测准确性受遗传距离影响微弱
研究发现,个体水平的PGS预测误差与遗传距离之间的相关性很弱。即便对于像身高这样通常认为可移植性模式较清晰的性状,遗传距离也只能解释其预测误差方差的一小部分。相比之下,像汤森剥夺指数这样的社会经济指标,对预测误差方差的解释力与遗传距离相当,甚至更强。这表明,影响PGS表现的因素是多维度的,不能仅归因于遗传差异。
不同性状的可移植性模式各异
研究人员观察到了显著的性状间异质性。对于身高,群体水平和个体水平的预测精度都随着遗传距离增加而近乎单调下降。然而,对于体重和体脂百分比,预测精度在中等遗传距离处出现峰值。最引人注目的是免疫相关性状(如白细胞计数、淋巴细胞计数),其群体水平的预测精度在很短的遗传距离内就急剧下降。进一步分析表明,这与其指数SNP的效应值在不同遗传背景群体中稳定性较差有关,支持了自然选择(尤其是针对免疫系统的快速进化)可能在其中扮演重要角色的假设。
预测性能指标影响可移植性判断
研究结果明确显示,选择不同的评估指标会导致对可移植性的不同解读。例如,对于甘油三酯等性状,群体水平的R²在遗传距离增大时趋于零,但个体水平的预测误差却显示出不同的模式。在疾病风险预测中,2型糖尿病的PGS精确度在不同遗传距离组中相对稳定,但其召回率却随距离增加而升高。这意味着,单纯依赖单一指标(如R²)可能会对PGS的实际效用产生误导性结论。
结论与意义
本研究系统地揭示了当前对多基因评分可移植性理解的三个主要空白,并提供了关键的实证见解。首先,个体水平的预测准确性不能简单地由遗传距离预测,社会经济因素发挥着可比拟甚至更强的作用。其次,可移植性并非普适规律,而是高度依赖于特定性状的生物学特性,尤其是其进化历史,例如免疫相关性状表现出独特的、快速衰减的模式。第三,对可移植性的评估和解读强烈依赖于所选择的性能衡量指标,群体水平和个体水平的结论可能截然不同。
这些发现对推动PGS走向更公平、更可靠的应用具有深远意义。它强调,未来在开发和评估PGS时,必须超越简单的遗传血统分组,需要综合考量性状的进化背景、遗传结构、社会环境因素以及PGS的具体构建方法。为了实现PGS在个性化医疗和公共卫生领域的全部潜力,必须着力填补这些认知空白,确保其效益能够普惠不同背景的人群。该研究发表于《自然·通讯》(Nature Communications),为理解和完善多基因评分的跨群体应用奠定了重要的理论基础并指明了未来的研究方向。