**摘要**
**背景**
先天性和适应性免疫系统的失调被认为是酒渣鼻发病机制的核心。然而,与免疫相关的基因的分子机制在酒渣鼻中的研究还不够充分。
**方法**
本研究纳入了GSE65914和GSE155141两个数据集。首先,通过加权基因共表达网络分析(WGCNA)得到的关键模块基因与差异表达基因(DEGs,酒渣鼻组与对照组)的交集来筛选交集基因。随后进行功能富集分析以探索这些交集基因的功能。接着,利用孟德尔随机化(MR)方法识别酒渣鼻的暴露因素(关键基因),并基于这些交集基因进行机器学习和表达分析。进一步利用单基因集合富集分析(GSEA)来研究关键基因的分子机制。此外,还构建了一个调控网络。最后,建立了mRNA-药物相互作用网络。
**结果**
共筛选出624个交集基因,功能富集结果显示这些基因参与蛋白激酶活性的正向调控和Hippo信号通路。确定了4个关键基因(ALDH1A1、COL17A1、RELL1和ZNF404),其中ALDH1A1是酒渣鼻的风险因素,而其他基因具有保护作用。单基因GSEA结果显示这些基因在IL-17和趋化因子信号通路中富集。调控网络包括4个mRNA、2个转录因子(TFs)和61个miRNA。最后,预测了73种针对这些关键基因的药物。
**结论**
本研究通过MR分析和机器学习确定了4个与免疫相关的关键基因(ALDH1A1、COL17A1、RELL1和ZNF404),为进一步的验证提供了潜在的诊断或治疗候选基因。
## 1. 引言
酒渣鼻是一种主要影响面部中央区域的慢性炎症性疾病,其特征是毛细血管扩张、皮肤增厚和结节形成[1]。酒渣鼻的临床表现为反复发红、持续性红斑、炎症性丘疹/脓疱以及毛细血管扩张,后期可能发展为皮肤纤维化。其患病率在1%到22%之间,女性发病率高于男性,高峰年龄在45至60岁之间。这种面部发红和脓疱样皮疹显著影响患者的外貌,导致尴尬、自信心问题、焦虑甚至抑郁,从而对患者的心理状态和生活质量产生重大影响。目前的治疗方法侧重于症状管理,减轻疾病的影响,并延缓或防止疾病进展。对于轻度病例,使用局部抗菌、抗炎和角质溶解剂进行治疗,如甲硝唑和伊维菌素。对于严重病例,可能需要全身性抗炎药物,如四环素、大环内酯类或异维A酸[2]。此外,激光和光疗也被用于治疗某些类型酒渣鼻引起的毛细血管扩张、持续性红斑和皮肤增厚。尽管现有治疗方法多样,但仍存在局限性,特别是在缓解的持久性和复发率方面。鉴于这些挑战,迫切需要深入研究现有的治疗机制并探索新的治疗途径,以提供更坚实的科学基础和标准化的治疗框架[3]。酒渣鼻的形成和发展与免疫系统的调节密切相关,特别是先天性和适应性免疫反应之间的复杂相互作用[3]。研究表明,免疫细胞的异常反应可能加剧炎症反应,这些反应不仅限于皮肤表层,还可能扩展到更深层的细胞结构和组织。因此,免疫系统的失衡和失调是研究的重点,这不仅有助于揭示疾病的潜在机制,也是开发新的酒渣鼻治疗策略的关键。尽管酒渣鼻的确切发病机制尚不清楚,但先天性和适应性免疫系统的失调被认为起着核心作用。研究证实,在酒渣鼻患者的病变周围区域和主要亚型中,极化Th1/Th17细胞、巨噬细胞和肥大细胞的异常浸润较为常见。此外,酒渣鼻早期阶段有中性粒细胞浸润,而B细胞和浆细胞则参与晚期进展。因此,识别和表征酒渣鼻中的关键免疫基因对于揭示其发病机制和临床诊断治疗具有重要意义[4]。为了进一步研究关键免疫基因与酒渣鼻之间的因果关系、关联强度和方向性,我们在研究的第二部分采用了孟德尔随机化(MR)方法。MR是一种利用遗传变异作为工具变量(IV)来检测和量化因果关系的分析方法。近年来,由于MR能够克服潜在的混杂变量和逆转因果关系,其在观察性研究中的应用越来越广泛。然而,目前关于酒渣鼻的MR研究进展有限。例如,Li等人通过MR发现了克罗恩病与酒渣鼻之间的因果关系,其中白细胞介素-23受体基因的变异是影响酒渣鼻发展的关键因素。因此,MR可以作为研究酒渣鼻发病机制的重要工具。在本研究中,我们基于公共数据库中的酒渣鼻患者的转录组数据,结合生物学方法和MR分析,筛选出4个与酒渣鼻相关的关键免疫基因,并通过MR确定了这些基因与酒渣鼻之间的因果关系。同时,我们研究了这些关键基因富集的相关通路,并探讨了针对这些基因的治疗药物,为酒渣鼻的治疗提供了新的线索[5]。
## 2. 材料与方法**
2.1. 数据来源
GSE65914和GSE155141数据集来源于基因表达组学数据库(GEO)(https://www.ncbi.nlm.nih.gov/geo/)。GSE65914数据集(GPL570)包含20个对照组和38个酒渣鼻样本的面部活检组织微阵列数据。GSE155141数据集(GPL10295)包含5个酒渣鼻患者和10个对照组的皮肤组织RNA-seq数据。
2.2. 差异表达基因(DEGs)的获取
在GSE65914数据集中,使用limma包(v 3.50.1)选择p值<0.05且|log2FC|>1的差异表达基因(DEGs)。选择|log2FC|>1的阈值是基于转录组学研究的常见做法,以识别表达变化显著的基因,从而减少假阳性的可能性并关注生物学意义上的差异。随后使用ggVolcano包(v 0.0.2)和Complex Heatmap包(v 2.10.0)绘制火山图和热图,展示DEGs的变异情况。
2.3. 通过加权基因共表达网络分析(WGCNA)筛选关键模块基因
使用CIBERSORT算法[8]计算22种免疫细胞的浸润比例,并通过Wilcoxon检验比较酒渣鼻组和对照组之间的免疫细胞差异。差异免疫细胞被用作进一步分析的特征。进行WGCNA(v 1.71)构建共表达网络,以筛选与免疫细胞相关的基因。首先对样本进行聚类以排除异常值并确保分析准确性。然后选择最佳软阈值(β)构建无尺度网络。接着通过计算邻接性和相似性获得聚类树状图。根据动态树切割算法进行模块划分。最后,评估每个模块与免疫细胞之间的相关性,并选择与最多免疫细胞相关的模块作为关键模块。
2.4. 交集基因的获取和功能注释
使用给定包(v 1.7.3)获取DEGs和关键模块基因的交集。通过clusterProfiler包(v 4.2.2)对交集基因进行基因本体(GO)和京都基因组百科全书(KEGG)富集分析(调整后的p值<0.05)。
2.5. MR和机器学习分析
将交集基因作为暴露因素,酒渣鼻作为结果变量进行MR分析。基于选定的暴露因素,使用glmnet包(v 4.1-2)进行LASSO分析以获得候选基因。我们选择LASSO方法是因为它在高维环境中特别稳健,并通过应用L1惩罚将无信息变量的系数缩减为零来减少模型过拟合。比较GSE65914和GSE155141数据集中候选基因的表达差异,选择表达趋势一致的基因作为关键基因。为了明确关键基因与酒渣鼻的因果关联,我们进行了MR分析。关键基因作为暴露因素,酒渣鼻作为结果变量。从https://www.ncbi.nlm.nih.gov/geo/获取酒渣鼻的全基因组关联研究(GWAS)摘要统计信息。首先使用two-sample MR包(v 0.5.6)的extract instruments函数读取和过滤暴露因素,设置p=5×10^-8,clump=TRUE,r2=0.001。然后使用two-sample MR包(v 0.5.6)的extract outcome data函数读取和过滤结果变量,并通过harmonized函数协调效应等位基因和效应大小。MR分析主要包括五种算法:MR-Egger[13]、加权中位数、简单模式、加权模式和逆方差加权(IVW)回归[14]。结果主要参考IVW算法获得的暴露因素。计算比值比(ORs),大于1的值为风险因素,小于1的值为保护因素。结果通过散点图和漏斗图呈现。通过敏感性分析评估MR分析结果的可靠性,包括异质性检验、水平多效性检验和留一法(LOO)方法。最终筛选出的显著暴露因素是本研究的关键基因。
2.6. 单基因GSEA
进行单基因GSEA,以找到p值<0.05且|NES|>1的关键基因的富集调控通路和生物学功能。KEGG的前5个结果分别进行可视化。
2.7. 构建调控网络
使用miRNet数据库(https://www.mirnet.ca/)预测针对关键基因的转录因子(TFs)和miRNA。然后使用Cystoscope[15]获得调控网络。
2.8. 构建关键基因-药物相互作用网络
从CTD数据库(https://ctdbase.org/)预测关键基因与药物的相互作用。根据预测结果构建关键基因-药物网络,并使用Cystoscope软件(16)进行可视化。
2.9. 转录组数据的统计分析和质量控制
所有生物信息学分析均在R 4.5.1环境中进行。使用Wilcoxon检验比较组间差异。MR分析遵循MR-STROBE指南,数据处理遵循FAIR原则(如适用)。
## 3. 结果**
3.1. 差异表达基因(DEGs)和关键模块基因的识别
从GSE65914数据集中共获得1223个DEGs(酒渣鼻组718个上调,对照组505个下调)(图1)。在Top 20个DEGs中,酒渣鼻组有14个下调基因(C1orf21、ASAP2、PCDH7、ZFYVE21、PLD1、NAB1、PLXNA2、MFSD2A、BCL2L10、TOM1L2、SRGAP2C、PTPN21、HOXA10和HOXC10),6个上调基因(ATP12A、LCN2、S100A9、CHI3L2、IQCG和SOX7)(图1)。方差分析显示酒渣鼻组和对照组之间存在14种不同的免疫细胞(活化树突状细胞、静息肥大细胞等)(图1)。其中,天真B细胞和单核细胞在酒渣鼻组中的浸润较少,而巨噬细胞和浆细胞等在酒渣鼻组中的浸润较多(图1)。图1 在图查看器中打开 PowerPoint
识别与免疫细胞浸润相关的差异表达基因(DEGs)和关键模块基因。(a) DEGs的火山图。(b) DEGs的热图。(c) 22种免疫细胞浸润的丰度分析。(d) 22种免疫细胞之间的差异。(e) 加权基因共表达网络分析(WGCNA)中的聚类分析。(f) WGCNA的最佳软阈值选择。(g) 基于差异免疫细胞的不相似性度量的树状图。(h) 显示模块与免疫细胞之间相关性的热图。*: 显著差异,**: 非常显著,***: 高度显著,****: 极其显著,ns: 无显著差异。在GSE65914数据集中进行了WGCNA分析,以寻找与差异免疫细胞相关的基因。样本聚类结果显示没有异常值样本(图1)。当软阈值等于10时,基因之间的相互作用最符合无尺度分布,R2 = 0.85,平均连通性接近零(图1)。然后,共获得了11个模块(图1)。其中,ME turquoise与大多数免疫细胞的相关性最高(图1)。因此,该模块被视为关键模块,并识别出7798个关键模块基因。
3.2. 交集基因的功能富集
通过取关键模块基因和DEGs的交集,我们共获得了624个交集基因(NAB1、HOXC10、HOXA10、CHI3L2、PTPN21、TOM1L2、S100A9等)(图2)。接下来,富集分析结果显示这些交集基因涉及443个GO条目(CC:10个,MF:20个,BP:413个)和20个KEGG通路。这些交集基因主要富集在如蛋白激酶活性正向调控等GO条目中(图2)。Wnt信号通路、mTOR信号通路、Hippo信号通路等在KEGG通路中富集(图2)。
3.3. 痤疮暴露因子的筛选
通过MR分析,我们共获得了11个与痤疮有因果关联的基因(表1)。随后,通过LASSO分析获得了5个候选基因(ALDH1A1、COL17A1、RELL1、RORA和ZNF404)(图3)。表达分析显示,这4个基因(ALDH1A1、COL17A1、RELL1和ZNF404)在GSE65914和GSE155141数据集中的表达趋势一致,其中ALDH1A1在痤疮中高表达,而COL17A1、RELL1和ZNF404的表达则相反(图3)。因此,这4个基因在后续研究中被作为关键基因进行分析。表1. 与痤疮有因果关联的基因的MR分析。
3.4. 暴露因子的分析
异质性检验的Q值小于0.05,表明样本具有异质性。样本之间没有异质性,Q-p值大于0.05(ALDH1A1:Q - p值 = 0.939056924,COL17A1:Q - p值 = 0.05148826,RELL1:Q - p值 = 0.941952326,ZNF404:Q - p值 = 0.145443598)(表3)。水平多效性检验的结果表明没有水平多效应(ALDH1A1:p = 0.08716599,COL17A1:p = 0.187328512,RELL1:p = 0.169976874,ZNF404:p = 0.863760101)(表4)。此外,LOO分析显示结果与IVW一致,表明分析是可靠的(图4、4b、4c和4d)。因此,ALDH1A1、COL17A1、RELL1和ZNF404是本研究的关键基因。表3. 异质性检验的结果。
3.5. 关键基因的单一基因GSEA分析
功能富集结果显示,ALDH1A1和COL17A1主要富集在碳代谢、冠状病毒疾病(COVID-19)和IL-17信号通路等KEGG通路中(图5)。RELL1和ZNF404主要富集在流感A、类风湿性关节炎等通路中(图5)。总之,功能富集结果显示关键基因主要富集在IL-17信号通路、趋化因子信号通路等KEGG通路中(图5、5b、5c和5d)。
3.6. 关键基因的调控网络
为了进一步研究关键基因的调控机制,我们构建了一个调控网络。总共识别出2个转录因子(TFs)和61个miRNA,这些基因与关键基因相关。该网络包含4个关键基因(ALDH1A1、COL17A1、RELL1和ZNF404)、61个miRNA(hsa-mir-375、hsa-mir-212-3p、hsa-mir-103a-3p、hsa-mir-27a-5p等)以及2个TFs(EZH2和TLX1)(图6)。其中,ALDH1A1被所有TFs和大多数miRNA靶向(图6)。
3.7. 关键基因相关药物的预测
通过CTD数据库,我们发现了4个被73种治疗药物靶向的关键基因(图6)。该网络包括70种药物(乙醛、对乙酰氨基酚、黄曲霉素B1等)针对ALDH1A1,4种药物(苯并(a)芘、对乙酰氨基酚、氯opicrin和四氯二苯二氧英)针对COL17A1,6种药物(双酚A、丙硫氧嘧啶、四氯二苯二氧英等)针对RELL1,以及1种药物(镍)针对ZNF404(图6)。
4. 讨论
痤疮是一种主要影响面部的慢性炎症性皮肤病,其发病机制集中在先天免疫系统和适应性免疫系统之间的失调。本研究利用转录组学和代谢组学分析揭示了痤疮中的关键免疫机制,并识别出4个重要的免疫相关基因。研究发现,ALDH1A1在痤疮患者中的表达上调,而COL17A1、ZNF404和RELL1显著下调[17]。MR分析证实ALDH1A1是风险因素[18],而COL17A1、ZNF404和RELL1是保护因素。网络调控分析和药物预测突显了ALDH1A1在基因调控网络中的重要作用。基于上述分析,本研究初步揭示了这4个基因在痤疮中的潜在作用,为进一步理解其分子病理机制提供了新的方向[1]。ALDH1A1是一种处理邻苯二甲酸酯的重要酶,在维持代谢稳定性中起核心作用[19]。研究发现,ALDH1A1通过G-17转输和沉淀途径显著参与了免疫炎症[20]。IL-17激活了已知的T细胞分化调节因子,促进了炎症细胞的释放,并改变了角蛋白的功能[21]。这表明ALDH1A1可以通过增强Th17炎症来加剧痤疮。相反,COL17A1的减少可能会阻碍皮肤症状的修复,而RELL1信号的减少可能会由于NW-B信号的抑制而降低疾病控制[22]。此外,ZNF404通过控制免疫细胞的活性发挥抗炎作用。综合这些结果,可以推测基因调控的异常为通过免疫调节因子促进酒精问题的发展和持续提供了分子基础。本研究不仅与先前关于痤疮分子机制的研究一致,还在几个关键方面扩展了当前的理解。先前的研究已经证实,基因表达谱分析和GWAS在阐明与痤疮相关的免疫炎症和色素沉着有关的基因中起着关键作用。Feng等人指出,尽管现有研究有限,但特定的基因变异可能参与免疫调控通路[23]。最新证据表明,几个DEGs与痤疮的发病机制密切相关[24]。例如,中性粒细胞激活标志物S100A9已被证明参与了痤疮的炎症反应[25]。此外,Wnt、mTOR和Hippo信号通路已被确定为痤疮中炎症放大、血管扩张和表皮/血管重塑的关键调节因子[26]。这些通路的异常激活促进了免疫细胞的动员、血管生成和角质形成细胞的功能障碍,从而加剧了病变的发展[27]。我们的综合分析结合了多组学和遗传数据,揭示了几个影响关键信号通路的免疫相关基因。这些基因似乎在分子变化和临床特征之间形成了桥梁[28]。这种联系反映了细胞功能障碍如何逐渐发展为组织水平的异常。MR分析显示这些基因与痤疮之间存在因果关系。这些结果支持了方向性的遗传效应。这种方法也被用于研究痤疮与环境因素之间的因果关系。肠道微生物群失衡和吸烟是两个显著的例子。这些发现增强了痤疮研究中因果推理的可信度和临床意义[29]。药物-基因相互作用图谱表明,视黄酸及其类似物可能是有前景的治疗候选物。它们作用于ALDH1A1相关通路。最近的临床研究表明,低剂量异维A酸和类似的视黄酸类药物对丘疹脓疱型和难治性痤疮有效[30]。实验室研究还表明,视黄酸可以改善皮肤病变,促进上皮修复,减少炎症,并调节皮脂腺活性。这些独立观察结果与我们的通路预测一致[31]。它们共同为未来针对ALDH1A1的痤疮治疗提供了实际基础。我们的工作整合了分子和遗传证据,将免疫相关基因与已知的信号通路联系起来。这种整合细化了目前对痤疮机制的理解[32]。它还为开发针对ALDH1A1轴的靶向疗法提供了强有力的科学依据。这些假设需要在大型患者群体和实验模型中进行进一步验证[33],未来的研究将重点利用基因敲除技术在酒渣鼻角质形成细胞和血管内皮细胞培养中阐明ALDH1A1的功能作用,随后在已建立的动物模型中进行验证,以评估其对疾病相关表型的影响。应当认识到几个限制因素:公共数据库中的样本量仍然较小,这限制了研究结果的广泛应用范围;计算分析提供的只是相关性证据而非直接生物学证据;需要在细胞和动物模型中进行实验验证以确认基因功能;磁共振成像(MR)难以捕捉基因与环境之间的相互作用,而这些相互作用可能在酒渣鼻的发病机制中起重要作用;该研究主要关注常见变异,而罕见突变和表观遗传因素尚未得到充分探索[34]。未来的研究应在更大规模和多中心队列中研究这些基因-通路关联;长期研究可以追踪疾病发展和治疗反应过程中的分子变化;利用细胞和动物系统进行的功能实验将阐明ALDH1A1、COL17A1、ZNF404和RELL1的作用,这些基因可能影响免疫调节、炎症和皮肤屏障的恢复[35]。整合基因组学、蛋白质组学和代谢组学信息有助于构建一个完整的“基因-免疫-代谢”网络模型,从而在系统层面描述酒渣鼻的发病机制。在临床应用方面,评估视黄酸衍生物对不同类型酒渣鼻的影响仍然很重要;值得探索使用免疫调节剂、抗氧化剂或信号抑制剂组合疗法的方法。未来的研究方向是将人工智能与多组学整合相结合,这种方法可能支持分子亚型分类和个性化治疗预测,有助于缩小生物学发现与临床应用之间的差距。总体而言,这项研究加深了对酒渣鼻分子机制的理解,为开发针对特定分子通路的精准疗法提供了理论基础。
5. 结论
本研究表明,ALDH1A1及相关基因通过调节免疫炎症通路在酒渣鼻的发病机制中起着关键作用,为针对ALDH1A1的精准治疗提供了理论依据。然而,仍需要更大的样本量和实验验证。
作者贡献
王雅芳进行了研究并分析了数据;张健设计了研究方案并撰写了论文;王雅芳和张健对这项研究做出了同等贡献。
致谢
作者无需报告任何利益冲突。
资金情况
本手稿未获得任何资助。
披露声明
所有作者均已阅读并批准了最终稿件。
利益冲突声明
作者声明没有利益冲突。
数据可用性声明
本研究中生成和分析的数据集可应相应作者的要求提供。