寻常型天疱疮(Pemphigus vulgaris, PV)是一种罕见的由致病性自身抗体介导的自身免疫性大疱性疾病。尽管人类白细胞抗原(HLA)和非HLA位点均有助于疾病易感性,但它们在免疫调节中的联合作用仍不完全清楚。研究人员在综合免疫遗传学框架内研究了HLA-DRB1和FCGR2B变异对PV易感性的共同贡献。分析了286名个体(200名对照和86名PV患者)的基因型数据,使用了减少偏倚的关联模型、两位点基因型组合分析以及累积遗传风险建模。通过上位性检验探索了基因-基因关系,同时使用生物学注释方法检查了功能相关性。在多重检验校正(q < 0.05)后,HLA-DRB1 * 04:02和14:01与PV风险增加显著相关,而11:01和*16:01显示出保护作用。FCGR2B c.671T > C(I232T)变异在单一位点分析中显示出适度效应,但在多重检验校正后未保持统计学显著性。涉及FCGR2B和HLA-DRB1的若干两位点基因型组合在患者中富集;然而,交互作用分析支持加性免疫遗传学架构而非上位性。遗传风险建模显示加权评分改善了区分度,可解释机器学习分析确定HLA-DRB1为主导预测因子,FCGR2B贡献次级调制信号。这些发现描述了 underlying PV易感性的加性免疫遗传学框架,强调了HLA-DRB1的核心作用。尽管FCGR2B在多重检验校正后未保留独立统计显著性,但结果表明其在PV更广泛的免疫遗传学架构内潜在的调制贡献。
研究背景:
寻常型天疱疮(Pemphigus vulgaris, PV)是一种危及生命的自身免疫性大疱性疾病,以表皮内棘层松解为特征,导致皮肤和黏膜糜烂。该病由靶向桥粒芯糖蛋白-3(Dsg3)和桥粒芯糖蛋白-1(Dsg1)的致病性免疫球蛋白G(IgG)自身抗体介导,这两者是负责角质形成细胞黏附的关键钙黏蛋白型黏附分子。尽管皮质类固醇和免疫抑制剂已显著降低死亡率,但复发常见,疾病易感性的分子基础仍不完全清楚。累积证据支持涉及遗传、免疫和环境因素的多因素病因,这些因素导致免疫失调和自身抗体产生。
遗传易感在PV发病中起核心作用。在已识别的遗传位点中,人类白细胞抗原(HLA)II类等位基因——尤其是HLA-DRB1——与疾病易感性关联最强。多项研究证实HLA-DRB1 * 04:02、HLA-DRB1 * 14:01和HLA-DRB1 * 08:04在不同人群(包括德系犹太裔、地中海和南亚队列)中赋予显著风险。这些等位基因被认为增强抗原呈递给自身反应性CD4+ T细胞,从而促进耐受丧失和致病抗体生成。相反,HLA-DRB1 * 07:01和HLA-DQB1 * 02:02在一些族群中被描述为保护性等位基因,提示群体特异性的免疫遗传变异。尽管这些一致的关联,仅HLA多态性不能充分解释疾病异质性或临床变异性,意味着涉及额外的非HLA基因调节免疫稳态。在此背景下,Fc gamma受体IIB(FCGR2B)已成为一个重要的候选基因。FCGR2B编码B细胞和巨噬细胞上唯一的抑制性Fcγ受体,并作为B细胞激活的负调节因子发挥作用。FCGR2B中的功能多态性,如I232T变异,损害抑制信号传导,导致B细胞反应性增高和自身抗体产生。改变的FCGR2B表达或功能已与系统性红斑狼疮和类风湿关节炎等自身免疫疾病相关,但其对PV的贡献仍未充分探索。
以往检查PV免疫遗传背景的研究通常聚焦于单个位点,经常分别评估HLA或非HLA基因。相比之下,非HLA免疫调节基因,特别是FCGR2B,研究较少,尽管它们在调节抗体介导的免疫反应中已确立的作用。FCGR2B内的变异已被显示影响B细胞的抑制信号传导,并与系统性红斑狼疮和类风湿关节炎相关。尽管这些发现提示FCGR2B可能贡献自身抗体驱动的疾病,其在PV中的相关性仍不确定。此外,同时评估PV中HLA-DRB1和FCGR2B多态性的研究很少。来自其他自身免疫性神经疾病(如格林-巴雷综合征)的证据显示,HLA II类等位基因和IgG Fc受体多态性的联合效应可调节疾病易感性。然而,此类基因-基因关系未在PV中系统研究。更好理解这些遗传因素如何交互可阐明PV潜在的复杂免疫机制,并支持未来迈向基于遗传学的综合风险评估的努力。
因此,本研究旨在使用整合分析框架(合并统计、生物信息学和机器学习方法)系统研究HLA-DRB1和FCGR2B变异对PV易感性的独立和联合效应。分析286名个体的基因分型数据,使用Firth惩罚逻辑回归、两位点基因型组合分析和基因-基因交互建模来表征基础遗传架构。此外进行了功能注释和通路映射分析(GO、KEGG和STRING PPI),以识别链接这些位点到PV病理生理学的免疫相关分子网络。
为增强预测和生物学可解释性,实施了可解释机器学习模型(带有SHAP的XGBoost)来评估已识别变异的区分能力,并量化它们对疾病风险的贡献。通过整合遗传、统计、功能和可解释AI证据,本研究旨在阐明塑造PV易感性的加性和调制免疫遗传机制,并为自身免疫性大疱性疾病的精确风险建模提供数据驱动的基础。
本研究论文发表在《Immunogenetics》期刊。
主要关键技术方法:
研究人员开展了病例对照研究,纳入86名经临床、组织病理学和血清学确诊的PV患者,以及200名来自同一地理区域和健康背景的对照。提取外周血白细胞基因组DNA。FCGR2B基因外显子5区域(包含功能性c.671 T > C 即 I232T 变异)通过两步走聚合酶链反应(PCR)策略扩增以确保位点特异性,并进行Sanger测序分型。HLA-DRB1分型使用PCR-序列特异性寡核苷酸探针(PCR-SSOP)Luminex方法。统计分析使用R软件,包括Firth惩罚逻辑回归、两位点基因型组合分析、上位性(交互作用)建模、未加权和加权遗传风险评分(GRS)构建,以及可解释机器学习(XGBoost分类器与SHAP值解释)。功能注释通过clusterProfiler进行GO和KEGG映射,蛋白关联网络使用STRING数据库分析。
研究结果:
Genotype–phenotype association results(基因型-表型关联结果):
分析HLA-DRB1和FCGR2B的基因型和等位基因频率分布以识别与PV易感性的潜在关联。FCGR2B c.671T > C(I232T)基因型分布在对照组中为TT=167(83.5%)、CT=29(14.5%)、CC=4(2.0%);疾病组中为TT=65(75.6%)、CT=18(20.9%)、CC=3(3.5%)。对照组Hardy–Weinberg平衡检验指示分布一致。单一位点分析在显性、隐性和加性遗传模型下进行。等位基因关联分析揭示多个HLA-DRB1等位基因在Benjamini–Hochberg FDR校正后与PV显著相关。04:02(OR=30.10, 95% CI=15.50–61.40, q < 0.001)和 14:01(OR=5.66, 95% CI=2.96–11.10, q < 0.001)被识别为主要风险变异,而16:01(OR=0.05, 95% CI=0.0004–0.34, q=0.001)和 11:01(OR=0.36, 95% CI=0.14–0.82, q=0.037)显示保护性效应。这些发现在Fisher精确检验和Firth惩罚逻辑回归模型中一致。相反,FCGR2B c.671 T > C(I232T)变异在显性遗传模型下未达统计学显著性(OR=1.63, 95% CI=0.83–3.15, q=0.15);加性和隐性模型产生类似不显著趋势。尽管效应方向提示C等位基因携带者风险可能增加,但结果未通过多重检验校正。FCGR2B结果因不显著未在正文主要表格展示。
Two-locus genotype combination analysis and epistasis modeling results(两位点基因型组合分析和上位性建模结果):
综合两位点基因型组合分析揭示了HLA-DRB1和FCGR2B变异与PV易感性相关的不同关联模式。组合水平发现识别了跨越两个位点的更高风险和潜在保护性基因型谱。正式上位性建模进一步澄清了每个基因的相对贡献,指示它们的效应主要是加性而非非加性。
在HLA-DRB1基因型组合(单倍型)中,若干等位基因组合显示强疾病关联。最常见风险组合为DRB1 * 04:02–DRB1 * 14:01(频率=0.168, p < 0.001, q < 0.01)和DRB1 * 14:01–DRB1 * 04:02单倍型(频率=0.155, p < 0.001, q < 0.01),两者赋予显著升高的风险,与单等位基因结果一致。反之,包含DRB1 * 16:01或DRB1 * 11:01的基因型组合显示保护性效应(p=0.012和p=0.035)。常见HLA-DRB1基因型组合分布图强调04:02–14:01在PV病例中过度代表。
整合HLA-DRB1和FCGR2B的两位点基因型组合分析识别了若干与PV显著相关的组合。最强风险多位点组合为FCGR2B–HLA-DRB1(C–HLA-DRB1 * 04:02)(频率=11.6%, 得分=10.04, p=9.96 × 10-24 ),其次为T–HLA-DRB1 * 12:01(p=4.95 × 10-8 )和涉及HLA-DRB1 * 04:02的其他组合(p=1.22 × 10-7 )。相反,涉及FCGR2B T等位基因和HLA-DRB1 * 13变体(*13:02, 13:03, 和 13:05)的特定两位点基因型组合与负得分统计量相关(p < 0.05),提示保护性效应方向。这些发现指示抗原呈递(HLA-DRB1)和Fc受体调节(FCGR2B)通路的协调贡献,与PV中自身免疫易感性的多基因模型一致。
上位性建模显示HLA-DRB1风险等位基因的主导主效应,携带者显示疾病概率九倍增加(6% → 56%)。尽管FCGR2B_C_carrier状态与轻微加性增加相关(11–13%),但交互项(FCGR2B × HLA-DRB1)无统计学显著性(p=0.57),指示加性而非乘法效应。预测概率密切匹配观察疾病率,反映良好模型校准。多变量Firth逻辑回归模型进一步验证,HLA-only模型显示强区分能力(AUC=0.80),组合模型(包含两基因)达到可比性能(AUC=0.81),而包含交互项的模型未显著改善拟合(p=0.570, FDR q=0.410)。这些基于回归的发现进一步支持位点间加性而非上位性关系。
Genetic risk modeling and XAI results(遗传风险建模和可解释AI结果):
为量化HLA-DRB1和FCGR2B变异对疾病易感性的累积影响,构建了未加权和加权遗传风险评分(GRS)。未加权GRS(个体携带的易感等位基因总数)显示与疾病风险的强关联(OR=9.03, 95% CI=5.33–16.45, p < 0.001)。每个额外风险等位基因显著增加疾病 odds,显示清晰的累积遗传效应。模型显示良好区分能力,AUC为0.82(95% CI: 0.77–0.87),伴随Somers’ D值0.64和Brier评分0.15。加权GRS(合并基于回归的β系数以考虑变异特异性效应大小)显示比未加权评分改善的预测性能(OR=2.74, 95% CI=2.24–3.44, p < 0.001)。加权模型显示强区分能力,AUC为0.89(95% CI: 0.85–0.94),伴随Somers’ D值0.78和Brier评分0.10,指示强区分能力和良好校准。
为进一步探索潜在非线性遗传关系,应用了可解释人工智能(XAI)框架使用XGBoost分类器。模型纳入四个预测因子:HLA_risk_allele、FCGR2B_C_carrier、interaction_term和GRS_unweighted。优化模型达到强预测性能,AUC为0.88(95% CI: 0.82–0.95),准确度0.84,灵敏度0.95,特异度0.79,F1分数0.75,指示稳健分类性能。学习曲线分析指示XGBoost模型在增加训练样本量时达到可比的训练和验证AUC值,提示平衡的偏差-方差权衡而无明显过拟合证据。
模型可解释性使用SHapley Additive exPlanations(SHAP)评估。SHAP摘要图识别HLA_risk_allele为主导预测因子(平均|SHAP|=1.69),其次为FCGR2B_C_carrier(0.12)。interaction_term显示最小贡献(0.01),GRS_unweighted贡献可忽略。这些结果突出HLA-DRB1风险等位基因在疾病分类中的首要作用,FCGR2B作为次级调节因子。最小交互项贡献提示XGBoost模型中强非线性基因-基因交互的有限证据。总体而言,可解释性分析确认机器学习模型的强预测信号主要由HLA-DRB1风险等位基因驱动,与基于回归的关联分析和两位点基因型组合结果一致。
Functional annotation and pathway mapping results(功能注释和通路映射结果):
进行了功能注释和蛋白质-蛋白质关联分析以阐明观察到的遗传关联的生物学意义。STRING蛋白质关联网络指示HLA-DRB1和FCGR2B之间统计支持的功能链接(预期交互=0; p=0.046)。此连接反映共享免疫通路而非直接物理结合,并提示抗原呈递(HLA-DRB1)和Fc受体介导的调节(FCGR2B)的协调参与。这些发现支持两免疫基因间的互补功能关系,与遗传和上位性分析中观察到的加性效应一致。
KEGG通路映射突出显示了与HLA-DRB1和FCGR2B相关的既定免疫通路,包括金黄色葡萄球菌感染、吞噬体、结核病、哮喘、1型糖尿病、移植物抗宿主病和自身免疫性甲状腺疾病。这些通路汇聚于抗原摄取、吞噬作用和MHC II类介导的信号传导机制,反映两基因已知的免疫学作用。因分析基于两个基因,这些结果代表策展通路注释而非统计富集。
GO生物学过程(BP)注释进一步强调与抗原呈递、Fc受体信号传导和适应性免疫激活相关的生物学过程。关键注释术语包括抗原加工和呈递、免疫效应过程调节和适应性免疫应答正调节。这些注释突出HLA-DRB1和FCGR2B的互补免疫功能,与遗传和交互分析建议的协调角色一致。
总之,这些分析提示HLA-DRB1和FCGR2B贡献于整合抗原识别和抑制性FcγRIIb信号传导的互补免疫遗传机制。此解释与回归、两位点基因型组合和基于XAI的发现一致,后者支持PV易感性中主要加性遗传效应。
讨论部分总结:
本整合研究结合统计遗传学、两位点基因型组合建模、功能注释和可解释机器学习,以研究HLA-DRB1和FCGR2B变异如何主要以加性方式贡献于PV易感性。与以往免疫遗传研究一致,HLA-DRB1作为主要遗传决定因子出现,04:02和 14:01赋予显著升高风险,11:01和 16:01显示保护性效应。这些发现与地中海、中东和南亚人群中确立的关联一致,其中HLA-DRB1 * 04和HLA-DRB1 * 14等位基因群已反复识别为主要PV易感变异。
使用相同队列的以往研究调查了PV中HLA-DRB1相关遗传易感性,并探索了链接遗传易感与潜在环境触发因素的假设生成框架,通过结构和对向量衍生钙黏蛋白模拟的计算分析。建立在这些发现之上,本研究的分析框架通过纳入累积遗传风险建模和可解释机器学习方法得以扩展。与先前工作(主要聚焦免疫遗传关联和环境模拟机制的结构合理性)相反,当前研究使用多位点遗传分析和预测建模评估HLA-DRB1和FCGR2B变异的联合贡献。此互补策略允许更全面的加性遗传风险评估和易感变异间潜在非线性关系的评估。
观察到的DRB1 * 11和DRB1 * 16等位基因的保护性效应与免疫遗传模型一致,该模型提示某些HLA II类变异显示次优肽结合构象,导致自身反应性CD4+ T细胞激活减少。
重要的是,结果扩展了当前知识,显示FCGR2B尽管校正后无独立显著性,但作为调制位点贡献于PV易感性。c.671 T > C(I232T)变异的分布和效应大小平行于系统性红斑狼疮和类风湿关节炎中的发现,其中抑制性FcγRIIb信号传导减少增强自身反应性B细胞存活。尽管早期PV研究很少纳入FCGR2B,结果显示该位点在与HLA组合时微妙调节风险,此模式与涉及抗体介导病理学的自身免疫疾病一致。
FCGR2B缺乏强独立效应支持这样的解释:该位点可能作为自身免疫易感性的调制因子而非主要决定因子,此作用与系统性红斑狼疮、类风湿关节炎和其他自身抗体介导疾病中的观察一致。受损的FcγRIIb信号传导本身不太可能启动病理学,但可能在存在更强上游驱动因子(如HLA II类风险等位基因)时放大自身反应性B细胞应答。在此背景下,研究发现提示一个框架,其中HLA-DRB1变异代表PV易感性的主要遗传决定因子,而FCGR2B可能贡献次级调制效应。此解释强调在整合分析框架内评估两位点的重要性,同时避免过度解释个体基因效应。对照组的Hardy–Weinberg平衡检验未显示FCGR2B的统计显著偏离(χ² p=0.0539; 精确 p=0.0695)。鉴于无HWE扭曲、100%基因型检出率和严格基于序列的验证程序,系统技术假象不太可能影响观察的关联模式。
位点特异性扩增策略、色谱图检查和与FCGR2B参考序列的比对进一步最小化 paralog 干扰或错误分类的可能性,这在FCGR基因区域内可能是个关切。因此,FCGR2B观察到的适度效应估计可能反映生物学变异性而非分析偏倚。
尽管如此,鉴于适度效应大小和校正后无独立统计显著性,FCGR2B发现应解释为提示性调制信号而非明确易感决定因子。需要在独立队列中复制以确认此观察。
两位点基因型组合分析进一步表征了多位点遗传架构,识别了更高风险组合如FCGR2B–HLA(2–5)和(2–23)。这些发现与多基因易感性框架兼容,其中抗原呈递和Fc受体介导的抑制信号传导可能独立且加性贡献于PV风险。上位性建模未识别乘法交互证据,提示HLA-DRB1和FCGR2B主要通过加性而非协同效应贡献。
此解释具有生物学合理性,鉴于这些位点的已知功能角色:HLA-DRB1变异影响抗原呈递给CD4+ T细胞,而FCGR2B调节抑制性Fc受体信号传导,后者可调制抗体介导的免疫应答。
遗传风险评分(GRS)分析进一步证明清晰累积遗传效应,随易感等位基因数量增加疾病风险显著升高。未加权GRS显示与PV易感性的强关联,指示携带更多风险等位基因的个体疾病 odds 显著升高。通过加权GRS合并变异特异性效应大小改善了与未加权模型相比的预测区分度。此改善反映个体位点对疾病风险的异质贡献,与日益应用于1型糖尿病和自身免疫性甲状腺疾病等自身免疫疾病的多基因风险建模方法一致。
这些发现指示HLA-DRB1和FCGR2B变异的联合效应可能贡献于累积遗传框架内的疾病易感性。加权GRS模型(AUC≈0.89)和XGBoost分类器(AUC≈0.88)的强区分性能显示整合遗传信息可改善研究设置中的风险建模方法。然而,在独立和种族多样队列中的前瞻性验证将是需要考虑临床实施之前的必要步骤。
重要的是,加权遗传风险评分(GRS)在 同 一 数 据 集
打赏