背景:复发性流产(Recurrent Pregnancy Loss, RPL)与抗磷脂综合征(Antiphospholipid Syndrome, APS)显著相关,但二者共同致病机制尚不清楚。本研究旨在鉴定与APS相关RPL的潜在枢纽基因,为其发病机制及潜在诊断策略提供新见解。方法:研究人员从GEO数据库检索APS和RPL数据集,进行差异表达分析以筛选差异表达基因(Differentially Expressed Genes, DEGs)。随后开展基因本体论(Gene Ontology, GO)分析、通路富集分析、加权基因共表达网络分析(Weighted Gene Co-expression Network Analysis, WGCNA)及蛋白质-蛋白质相互作用(Protein-Protein Interaction, PPI)分析。为筛选枢纽基因,应用最小绝对收缩和选择算子(Least Absolute Shrinkage and Selection Operator, LASSO)回归、高斯混合模型(Gaussian Mixture Model, GMM)及随机森林(RandomForest, RF)算法分析RPL基因表达谱。利用CIBERSORT工具评估RPL和APS样本中免疫细胞浸润水平,采用"clusterProfiler"R包对两个队列中各枢纽基因进行单基因基因集富集分析(Gene Set Enrichment Analysis, GSEA)。通过受试者工作特征(Receiver Operating Characteristic, ROC)曲线验证三个枢纽基因的诊断效能,并构建列线图(nomogram)模型,以ROC曲线和校准曲线评估其效能。此外,利用比较毒理学数据库(Comparative Toxicogenomics Database, CTD)探索这些枢纽基因与妊娠相关疾病的关联。最后,通过定量聚合酶链式反应(quantitative polymerase chain reaction, qPCR)和细胞功能实验验证枢纽基因的表达及功能特征。结果:本研究从基因表达综合数据库(Gene Expression Omnibus, GEO)获取RPL和APS数据集,鉴定出10个共同差异表达基因,包括8个下调基因和2个上调基因。对这些共同DEGs的分析表明,免疫系统相关细胞和分子的失衡可能是APS和RPL病理生理过程中的共同特征。通过机器学习及列线图构建,研究人员鉴定出NAA30、ARHGAP44和SUGT1作为枢纽基因。进一步实验揭示,SUGT1在APS合并RPL中表达下调,并可影响滋养层细胞(trophoblast cells)的生物学行为。结论:本研究为APS合并RPL的分子机制提供了宝贵见解,同时鉴定出该疾病的潜在生物标志物和治疗靶点。
# 论文解读
## 研究背景与意义
复发性流产(Recurrent Pregnancy Loss, RPL)是指临床妊娠20-24周前发生两次或以上的妊娠丢失,这一病理状况影响约2.5%的妊娠女性,对人类生殖健康构成重大挑战。RPL的病因涉及内分泌、免疫、感染及遗传等多方面因素,但仍有约50%的RPL病例病因不明。抗磷脂综合征(Antiphospholipid Syndrome, APS)是一种获得性血栓性疾病,可导致血管血栓形成和/或妊娠相关丢失,其核心特征是持续性抗磷脂抗体(Antiphospholipid Antibodies, APL)阳性。流行病学数据显示,育龄期女性中APS临床体征检出率为5%-20%,APL阳性患者的妊娠丢失率在未治疗情况下可达24%-60%。APS是免疫相关RPL最常见的病因因素,在该类患者中的患病率约为7%-25%。APS可通过母胎界面绒毛板微血栓形成,导致复发性流产、胎盘功能不全、早发型子痫前期、胎儿生长受限、胎儿窘迫及死胎等不良围产结局。动物实验及临床研究表明,APS患者体内多种致病机制可触发T细胞活化及伴随的细胞因子产生,不仅损害免疫系统的正常调节能力,还破坏免疫稳态;同时,APL对绒毛细胞迁移和侵袭具有抑制作用,最终均可导致流产。尽管上述证据强烈支持APS与RPL之间的关联,但二者共同作用的潜在机制尚不充分明确,因此亟需探究两种疾病的共同病理生理过程及遗传特征。
本研究发表于《Frontiers in Immunology》,旨在通过整合生物信息学分析、机器学习算法及实验验证,系统筛选并验证APS合并RPL的枢纽基因,为阐明其分子机制及开发诊断标志物和治疗靶点提供新方向。
## 关键技术方法
本研究主要采用以下关键技术方法:(1)从GEO数据库获取四个基因表达数据集(GSE102215、GSE50395、GSE165004、GSE一向后者需注明来源:GSE165004为子宫内膜组织来源的RPL发现队列,GSE26787为子宫内膜组织来源的RPL验证队列,GSE102215为外周静脉血来源的APS发现队列,GSE50395为外周静脉血来源的APS验证队列);(2)利用"edgeR"R包进行差异表达分析;(3)WGCNA构建基因共表达网络;(4)GO和KEGG功能富集分析;(5)STRING数据库构建PPI网络;(6)GeneMANIA在线工具进行共表达分析;(7)三种机器学习算法(LASSO回归、GMM、RF)筛选枢纽基因;(8)CIBERSORT评估免疫细胞浸润;(9)单基因GSEA分析;(10)CTD数据库分析基因-疾病关联;(11)构建并验证列线图诊断模型;(12)miRWalk数据库预测miRNA调控网络;(13)临床样本采集(2023年6月至2025年6月期间,南华大学附属第一医院妇产科15例APS相关RPL患者及15例正常生育女性的蜕膜组织和绒毛组织);(14)qRT-PCR和Western blot验证基因及蛋白表达;(15)体外细胞功能实验(EdU增殖实验、划痕迁移实验、Transwell侵袭实验)。
## 研究结果
### GEO数据集信息提取与共同DEGs筛选
研究纳入四个GEO数据集,GSE102215和GSE165004用于差异表达分析,GSE50395和GSE26787用于枢纽基因诊断效能验证。从GSE102215(APS)中鉴定出1039个上调和2230个下调DEGs,从GSE165004(RPL)中鉴定出102个上调和106个下调DEGs。通过Venn图交集分析,排除表达趋势矛盾的基因后,最终保留10个共同DEGs(8个下调、2个上调),包括ALPL、RAB11FIP1、CLIC4、ATP10A、CD2AP、MATN2、ARHGAP44、TNFRSF25、NAA30和SUGT1。
### 共同DEGs的PPI网络构建与富集分析
GeneMANIA分析显示99.92%为共表达关系、0.08%为遗传互作,鉴定出20个与共同DEGs关联的基因,功能注释提示其参与N端蛋白乙酰转移酶复合物形成、内体逆向转运至质膜、转胞吞作用、囊泡介导的向质膜运输等过程。PPI网络分析显示DLX5、ALPL、MSX2和ATP10A具有较高连接度。GO和KEGG分析表明,这些共同DEGs与肿瘤坏死因子受体活性、小GTP酶介导信号转导的负调控、内皮细胞形态发生等生物过程相关,并与NOD样受体信号通路、细胞因子-细胞因子受体相互作用等多种免疫相关通路密切相关。
### RPL共表达模块与关键基因筛选
对GSE165004数据集进行WGCNA分析,选取表达方差最大的前25%基因,以软阈值β=12(R
2=0.85)构建无尺度网络,识别出24个共表达模块。模块-临床性状相关性分析显示,brown模块与疾病状态正相关性最强(r=0.35,P=0.01),grey60模块负相关性最显著(r=-0.98,P=1×10
-35)。将RPL相关DEGs与模块基因聚类取交集,获得42个关键基因,PPI网络显示这些基因间存在紧密相互作用。GO分析提示其参与嘌呤核糖核苷二磷酸代谢过程、精子-卵子识别、Ras蛋白信号转导的正调控等;KEGG分析显示其在Th1和Th2细胞分化、亚油酸代谢、抗叶酸耐药性、酪氨酸代谢等通路中显著富集。
### 基于机器学习筛选枢纽基因
基于10个共同DEGs,运用三种机器学习算法进一步筛选:LASSO回归(λ=0.01132778)鉴定出6个非零系数基因;GMM确定7个最小误差基因;RF算法筛选出重要性评分>0.5的9个基因。Venn图取交集后,最终确定NAA30、ARHGAP44和SUGT1为枢纽基因。
### 枢纽基因验证
在发现队列中,NAA30、ARHGAP44和SUGT1在RPL和APS组中均显著低表达(P<0.0001)。ROC曲线分析显示三个基因在内部和外部验证数据集中均表现出良好的诊断效能(AUC>0.6)。CTD分析证实这些枢纽基因与女性不良妊娠结局(胚胎丢失、出生体重、胎儿生长迟缓、染色体缺陷、染色体断裂、产前损伤、宫颈肿瘤、女性不孕、胎儿吸收、胎儿死亡、染色体畸变、卵巢疾病、胎盘疾病、早产等)存在关联。
### 单基因GSEA与免疫浸润分析
单基因GSEA显示,三个枢纽基因共同富集于精氨酸和脯氨酸代谢、α-亚麻酸代谢、亚油酸代谢等多条代谢通路,并密切参与炎症相关信号通路。CIBERSORT免疫浸润分析显示:APS样本中初始CD4
+ T细胞升高、静止记忆CD4
+ T细胞降低;RPL样本中活化树突状细胞减少。相关分析显示,枢纽基因与多种免疫细胞亚群(初始B细胞、M1巨噬细胞、单核细胞、活化NK细胞、嗜酸性粒细胞、CD8
+ T细胞、调节性T细胞等)存在显著相关性,且中性粒细胞在APS中与其他免疫细胞类型呈显著负相关。
### 列线图模型构建
以NAA30、ARHGAP44和SUGT1为预测变量构建RPL列线图模型。校准曲线显示模型实际与理想诊断率高度一致(MAE=0.045,MSE=0.00312)。模型内部验证AUC为0.981(95%CI:0.943-1),外部验证AUC为0.840(95%CI:0.517-1),证实该模型具有良好的预测准确性和区分能力。
### miRNA-mRNA调控网络构建
从miRWalk数据库检索到1375个候选miRNA,其中52个miRNA与三个枢纽基因均相关。特别地,hsa-let-7b-5p和miR-31-5p已被报道参与滋养层功能调控,推测其可能在RPL发病机制中发挥重要作用。
### 临床样本验证与SUGT1功能研究
qRT-PCR验证显示:在蜕膜组织中,ARHGAP44和SUGT1呈下降趋势,SUGT1降低最为显著,NAA30未达统计学意义;在绒毛组织中,仅SUGT1表达显著降低。Western blot进一步证实SUGT1蛋白在两种组织中均显著下调。体外功能实验表明:SUGT1沉默显著抑制HTR-8/SVneo滋养层细胞的增殖、迁移和侵袭能力,而过表达SUGT1则增强这些细胞功能。
## 讨论与结论
研究人员系统整合多组生物信息学分析方法,从GEO数据库中筛选出APS和RPL共有的10个差异表达基因,证实两种疾病在基因表达层面存在密切内在联系。通过三种机器学习算法结合列线图验证,确定NAA30、ARHGAP44和SUGT1为连接APS与RPL的关键下调枢纽基因。传统理论将APS相关RPL归因于抗磷脂抗体诱导的血栓形成,但越来越多的证据强调免疫细胞(尤其是T/B细胞)失调是关键致病因素。本研究证实这些枢纽基因参与精氨酸/脯氨酸代谢、α-亚麻酸代谢和亚油酸代谢,并在炎症相关通路中共富集,与免疫调节网络密切相关,直接解释了APS与RPL关联的分子机制。
免疫浸润分析揭示APS和RPL中存在潜在的免疫细胞比例差异:APS患者初始CD4
+ T细胞频率升高而静止记忆CD4
+ T细胞降低;RPL患者活化树突状细胞减少,可能损害抗原呈递和免疫耐受;中性粒细胞在APS中与其他免疫细胞呈负相关,提示其在APS相关RPL中的关键致病作用。CTD分析确认枢纽基因与胎盘功能障碍及不良妊娠结局密切相关。鉴于滋养层功能对胎盘形成的关键作用,APS通过损害滋养层功能导致RPL、早产等并发症,三个枢纽基因可能通过调控胎盘和滋养层功能参与APS相关RPL的病理过程。miRNA-mRNA整合分析预测hsa-let-7b-5p和miR-31-5p为RPL的核心调控分子,二者协同靶向三个枢纽基因,可能通过协调调控枢纽基因加剧胎盘功能障碍从而导致RPL。
临床样本验证显示SUGT1在蜕膜和绒毛组织中均显著下调,被选为后续深入研究靶点。体外实验证实SUGT1对HTR-8/SVneo细胞增殖、迁移和侵袭具有关键调控作用,鉴于滋养层细胞异常增殖、迁移和侵袭是RPL的核心病理特征,SUGT1可能是RPL相关滋养层异常的关键介导因素。
研究结论部分指出:本研究初步揭示了APS合并RPL的候选枢纽基因,通过RT-qPCR、Western blotting及多种生物信息学分析进行验证。具体而言,NAA30、ARHGAP44和SUGT1参与APS合并RPL的病理生理过程,其作用机制涉及代谢支持不足、免疫侵袭增强及细胞功能受损等方面。这些结果可能为APS合并RPL的早期诊断、预后指标开发及治疗靶点筛选提供基础。