摘要:既往大多数研究逐一估算目标疾病与各辅助疾病间的遗传相关性(genetic correlation, rg),常见疾病架构中多效性(pleiotropy)的整体贡献尚不清楚。本研究提出一种方法——带偏差校正的多效共享遗传力(pleiotropic shared heritability with bias correction, PHBC)法,用于估算目标疾病的责任尺度(liability-scale)遗传方差中与特定辅助疾病/性状集所共享的部分(即多效共享遗传力 h2pleio)。PHBC基于遗传相关矩阵,采用蒙特卡洛(Monte Carlo)偏差校正程序来修正抽样噪声引起的偏倚。对15种UK Biobank疾病(跨越7个疾病类别)的分析显示,h2pleio占总SNP遗传力(h2)的平均比例为27±3%;当扩展至62个辅助疾病/性状时升至48±5%。h2pleio/h2在不同疾病类别中广泛分布,剔除信息量最大的辅助疾病类别后仅轻微下降。h2pleio/h2平均为表型方差中被辅助疾病解释比例之1.51±0.16倍,表明遗传因素具更高多效性。综上,约半数常见疾病遗传力与广泛疾病范围存在多效共享。
《Nature Genetics》论文解读:多效共享遗传力量化常见疾病间共享的遗传变异
一、研究背景与意义
常见疾病高度多效(pleiotropic),既往研究多局限于两两估算遗传相关性(genetic correlation, rg)或识别跨疾病潜在遗传组分,缺乏直接量化"某目标疾病遗传方差中有多少比例被一组辅助疾病/性状的遗传架构所共享"的方法,即无法评估多效性对疾病整体遗传架构的真实贡献。为此,研究人员提出多效共享遗传力(pleiotropic shared heritability, h2pleio)概念及带偏差校正的估计方法PHBC(pleiotropic shared heritability with bias correction),从GWAS汇总统计量直接估算目标疾病遗传方差中与指定辅助疾病集共享的部分,并应用于UK Biobank及大型GWAS荟萃分析数据,阐明常见病人效共享遗传力的普遍程度与分布特征。该文发表于《Nature Genetics》。
二、主要关键技术方法
研究人员开发PHBC软件,基于交叉性状连锁不平衡得分回归(cross-trait LD score regression, LDSC)估算SNP遗传力(h2)及目标-辅助疾病间rg矩阵与向量,依公式 h2pleio/h2= rg[D,T]T· rg[D,D]-1· rg[D,T] 作初始估计;针对有限样本rg估计的上偏,采用Monte Carlo偏差校正——从基因组块刀切(block-jackknife)采样协方差矩阵生成rg估计误差样本,通过二分搜索标定缩放系数ξc使校正后估计无偏(最终估计乘ξc2),标准误按Monte Carlo样本前后变异比缩放。对高共线辅助性状按rg2阈值逐步剪枝保数值稳定。实证分析对象:(1) UK Biobank中15种高发、高遗传力疾病(平均n≈157k,7个PheCode类别),互为辅助并纳入17项定量性状(含教育程度years of education、BMI、血压、血脂等);(2) 30种具公开GWAS汇总统计的高遗传力疾病(平均n≈483k,10个PheCode类别)作扩展辅助或目标。表型相关(liability-scale phenotypic correlation, rl)用个体水平数据按责任阈值模型(liability threshold model)转换以估算多效表型方差(V2pleio)。广泛模拟验证无偏性与标准误校准。
三、研究结果
Definition of pleiotropic shared heritability(多效共享遗传力定义)
研究人员将目标疾病遗传值分解为疾病特异组分与多效组分——后者定义为辅助疾病遗传值的加权线性组合中能最大化解释目标疾病遗传力的部分,其方差即h2pleio;等价定义亦可基于因果SNP效应大小向量间最大可解释方差比。h2pleio/h2即共享遗传方差占比,其值依赖所选辅助疾病集。
Overview of estimation of pleiotropic shared heritability(PHBC估计概述)
推导得h2pleio/h2可用目标-辅助rg向量与辅助间rg逆矩阵二次型表达;有限样本rg估计噪声致初始估计上偏,故引入Monte Carlo偏差校正获近似无偏估计与校正标准误;对高共线辅助性状按rg2逐步剪枝。扩展该法替换rg为责任尺度表型相关rl可估多效表型方差V2pleio。
Simulations(模拟验证)
在真实UK Biobank基因型上模拟不同多效架构,未校正h2pleio/h2存明显上偏(平均≈0.026),PHBC校正后各情景下接近无偏(平均偏≈0.0006),刀切标准误校准良好;改变病类内rg(0.2~0.4)、遗传力(0.06, 0.25)等参数结论稳健。
Application to 15 diseases from the UK Biobank(UK Biobank 15种疾病应用)
以15病互为辅助,经PHBC得平均h2pleio/h2=27%(s.e. 3%),未校正达38%;加入17项定量性状升至33%;剔除同类别辅助仅降至24%,再剔影响最大另一类别仍剩18%,表明h2pleio广泛分布于多疾病类别。单类别辅助常解释大部分h2pleio(如重度抑郁障碍MDD与消化/呼吸类别共享分别达41%、31%;2型糖尿病T2D与循环/消化类别共享33%、25%),但移除单类别对总体h2pleio/h2降幅很小,印证广泛分布特性。教育程度单独作辅助时平均h2pleio/h2=9.9%,将其从全部辅助中剔除仅微降0.87%。
Application to 30 diseases from publicly available GWAS meta-analyses(30种GWAS荟萃疾病扩展应用)
以15种UK Biobank病为目标,辅助扩至30种非UK Biobank病时h2pleio/h2均值升至42%,全45病达44%,再加17定量性状至48%;其中MDD达77%、T2D达52%。以30种非UK Biobank病为目标,均值由基准25%依次升至31%(30病辅助)、35%(45病辅助)、37%(62辅助+定量)。单PheCode类别分析重复上述广泛分布规律。
Comparing shared genetic and nongenetic variance(遗传与非遗传共享方差比较)
用个体水平数据估V2pleio/V2(V2=1为责任尺度总表型方差),15病平均h2pleio/h2是V2pleio/V2之1.51倍(s.e. 0.16);GERD、呼吸系统疾病、肥胖、MDD中h2pleio/h2显著大于V2pleio/V2,说明遗传方差较环境方差在多疾病间更具共享性,可能反映复杂性状受多效稳定化选择(pleiotropic stabilizing selection)。
四、讨论总结(翻译研究结论部分)
研究人员定义并估算了目标疾病与特定辅助疾病集共享的遗传方差(h2pleio)。四个主要发现:第一,偏差校正对h2pleio估计影响大;第二,约半数常见病总SNP遗传力与其他疾病/性状共享;第三,h2pleio/h2广泛分布于各疾病类别,剔除单一辅助类别仅轻微降低;第四,遗传方差共享度高于表型(含环境)方差共享度,可能由多效稳定化选择解释。下游意义包括:可为利用多效疾病/性状提升多基因风险评分(polygenic risk score, PRS)提供先验;激励按组织/细胞类型或基因通路分区h2pleio以解析共享生物过程及优先确定共病药物靶点;可拓展至高维辅助性状(如脑影像)。局限:刀切标准误未计入剪枝随机性(预期微小);h2pleio依赖辅助性状选取但增量随辅助数增多边际递减;分析限于欧裔需拓展多样群体验证。