研究背景
中风是全球范围内导致死亡和残疾的主要原因之一,给医疗系统带来巨大挑战。缺血性中风约占所有中风的 87%,常规治疗如溶栓和取栓存在诸多限制,治疗窗口窄,很多患者错过最佳治疗时机,且取栓受医疗设施和手术风险限制。出血性中风包括蛛网膜下腔出血(SAH)和脑出血(ICH),治疗取决于出血源和患者稳定性,SAH 常伴有血管痉挛和迟发性脑缺血,治疗效果差异大,现有药物治疗效果也受限于对病理生理机制的理解不足。
近年来,对中风机制的研究发现了多种生物标志物,为开发更有针对性的治疗方法提供了可能。同时,传统中药(TCM)在中风治疗中的潜力逐渐受到关注,珍宝丸(ZBP)作为一种传统蒙药,在改善中风患者临床结局方面显示出一定前景。已有临床研究表明,ZBP 联合标准西医治疗能提高缺血性中风患者的治疗有效率,改善神经功能和日常生活活动能力,且安全性良好。基础实验研究也发现,ZBP 在治疗心血管疾病、神经系统疾病和风湿性疾病方面有效,可抑制动脉粥样硬化斑块形成,调节血脂,减轻炎症反应。然而,由于中药成分复杂,其具体作用机制尚不清楚,限制了 ZBP 在全球的临床应用。
本研究旨在利用生物信息学方法阐明 ZBP 影响中风结局的机制,确定新的治疗靶点,明确 ZBP 如何通过与中风病理生理相关的信号通路发挥作用。网络药理学和孟德尔随机化(MR)相结合的方法,为探索中药方剂的药理机制提供了有效途径。MR 利用与药物靶基因相关的遗传工具,确定药物靶点与疾病结局之间是否存在关联;网络药理学系统识别中药中的活性成分,并预测药物化合物与蛋白质靶点的关系;分子对接可验证活性成分与关键治疗靶点之间的相互作用。本研究期望发现与 ZBP 信号网络相关的新治疗靶点,更清晰地理解 ZBP 通过调节炎症过程对中风病理的影响,为未来的实验研究和临床干预奠定基础。
材料和方法
- ZBP 的成分和靶点:利用中医药系统药理学技术平台(TCMSP)和中药信息数据库(TCM - ID)确定 ZBP 的成分。TCMSP 提供药代动力学数据,如口服生物利用度(OB)和类药性(DL),用于筛选具有潜在治疗效果的化合物,筛选标准为 OB≥30%、DL≥0.1。对于 TCMSP 中未收录的成分,参考 TCM - ID 并通过文献验证其可靠性。通过瑞士靶点预测数据库(SwissTargetPrediction)确定相关靶点,筛选概率阈值>0.1。对多个数据库的数据进行交叉验证、标准化命名和一致性检查,采用分层冲突解决方法处理数据冲突,确保数据质量。
- 中风相关靶点:综合利用 GeneCards、在线人类孟德尔遗传数据库(OMIM)和治疗靶点数据库(TTD)收集中风相关靶点信息。这些数据库各具特色,相互补充,提高研究结果的可靠性。通过系统比较方法去除重复数据,利用维恩图确定与 ZBP 和中风均相关的靶点,并进行去重处理。
- “药物 - 成分 - 靶点” 网络构建:分析 ZBP 中各活性成分的靶基因与中风相关靶点的交集,使用维恩图在线平台(Wei Sheng Xin)可视化展示。利用 Cytoscape 3.10.2 软件构建网络模型,将药物、成分和靶点表示为节点,它们之间的关系表示为边。通过度分布和中介中心性等拓扑分析指标,确定网络中的关键成分。
- ITGs 的富集分析:运用 R 软件(4.4.1 版本)及 “clusterProfiler”“enrichplot”“ggplot2” 等包,对交集靶基因(ITGs)进行基因本体(GO)富集分析,包括生物过程(BP)、分子功能(MF)和细胞组成(CC),同时进行京都基因与基因组百科全书(KEGG)通路富集分析。设置显著性阈值 P<0.05,并采用 Benjamini - Hochberg 校正控制错误发现率(FDR),通过圆形图和柱状图展示结果。
- 特征基因与中风的 MR 分析:从公开数据库获取数据集,进行两样本 MR 分析,探究与静脉溶栓(IVT)相关基因和中风发生之间的因果关系,以单核苷酸多态性(SNPs)作为工具变量(IVs)。从综合流行病学单位(IEU)数据库提取表达数量性状位点(eQTL)数据,根据 P<5×10−8、千碱基对(kb) = 10,000、r2 = 0.001 的标准选择 IV SNPs,排除连锁不平衡的 SNPs,确保 IVs 的稳健性(F 检验>10)。从上述数据集中选择与 IVTs 基因相关的 SNPs 作为暴露变量,从 FinnGen 数据库获取与中风相关的 SNPs。使用 “TwoSampleMR” 包进行 MR 分析,采用逆方差加权(IVW)方法评估靶基因表达水平与中风风险的关系。使用 Cochran’s Q 统计量评估异质性,P<0.05 表示存在显著异质性。通过 MR - Egger 回归和 MR - PRESSO 分析检测水平多效性,P<0.05 提示存在水平多效性。对存在异质性和多效性的数据进行敏感性分析和异常值处理,重复 MR 分析以获得更准确的估计。
- 贝叶斯共定位分析:使用 R 包 “Rcircos” 生成圆形图,展示特征基因在染色体上的位置。进行贝叶斯共定位分析,计算 5 种假设的后验概率:PPH0 表示两种性状均无关联;PPH1 表示仅性状 1 与遗传变异相关;PPH2 表示仅性状 2 与遗传变异相关;PPH3 表示两种性状均与遗传变异相关,但来自不同的遗传变异;PPH4 表示两种性状均与遗传变异相关,且由同一遗传变异引起。当 PPH4 的后验概率超过 75% 时,表明潜在的可药物靶点基因和中风共享一个共同的遗传变异,使用 “coloc” 包进行贝叶斯分析。
- 分子对接和 GEO 模型验证:从 PubChem 和蛋白质数据库(PDB)获取 ZBP 主要成分和特征基因的三维结构,利用 Autodock Vina 进行分子对接,选择与每个特征基因亲和力最高的对接构象,使用 PyMOL 可视化。从基因表达综合数据库(GEO)的 GSE16561 和 GSE58294 数据集中提取数据,包含正常和中风样本。对数据进行背景校正、log2转换和分位数归一化等预处理,通过主成分分析(PCA)、箱线图和密度图进行质量控制,排除不符合质量标准的样本,使用 “sva” 包中的 “ComBat” 函数校正批次效应。使用 Perl 脚本进行基因符号注释,利用 “limma” 和 “pheatmap” 等 R 包进行差异表达分析,P<0.05 的基因被认定为差异表达基因(DEGs),通过热图、火山图和箱线图展示结果。
- 统计分析:根据数据特点和研究目的选择合适的统计方法。两组独立样本比较采用 t 检验;3 组及以上数据集,若数据符合正态分布,采用单因素方差分析(ANOVA),若不符合正态分布,则采用 Kruskal - Wallis 秩和检验。使用 Spearman 秩相关检验进行相关性分析。以 P<0.05 或经 FDR 调整后的 P<0.05 为具有统计学意义,控制假阳性率,保证统计效能。
研究结果
- ZBP 成分和靶点汇总:通过整合 TCMSP、TCM - ID 和 SwissTargetPrediction 数据库信息,去除重复和无关信息后,确定 ZBP 含有 232 种独特的活性成分、10 种重复成分和 131 个相关靶点。
- 中风相关靶点的识别:从 GeneCards、OMIM 和 TTD 数据库中分别获取 4,858、15 和 32 个中风相关靶点,处理后共得到 4,876 个靶点。通过维恩图分析,发现 105 个与 ZBP 和中风均直接相关的靶点。
- “药物 - 成分 - 靶点” 网络分析:利用 Cytoscape 构建的 “药物 - 成分 - 靶点”(“D - C - T”)网络包含 357 个节点和 8,365 条边。通过拓扑分析确定了 14 个关键活性成分,包括木犀草素(luteolin)、槲皮素(quercetin)、异鼠李素(isorhamnetin)、β - 谷甾醇(β - sitosterol)等,这些成分的节点度阈值≥58,被认为是 ZBP 治疗中风的重要物质基础。
- 靶点富集分析:GO 分析显示,105 个 ITGs 在生物过程方面主要与氧化应激反应相关,包括对外源刺激的反应、营养水平变化和氧化应激等;在细胞组成方面,主要与囊泡腔、分泌颗粒腔和细胞质囊泡腔相关;在分子功能方面,主要与蛋白酶结合、丝氨酸水解酶活性、突触后神经递质受体活性和神经递质受体活性相关。KEGG 通路富集分析表明,ITGs 显著参与脂质代谢和动脉粥样硬化、磷脂酰肌醇 3 - 激酶(PI3K) - Akt 信号通路、流体剪切应力与动脉粥样硬化、丝裂原活化蛋白激酶(MAPK)信号通路等多个与中风病理相关的通路。
- ITGs 与中风的 MR 分析结果:MR 分析中,IVW 方法显示 3 个可药物基因与中风存在潜在因果关系。血管内皮生长因子 A(VEGFA)(优势比(OR) = 0.91,95% 置信区间(CI) = 0.85 - 0.97,P = 0.003)和 ARG1(OR = 0.94,95% CI = 0.90 - 0.99,P = 0.01)与中风风险降低相关,而 GATM(OR = 1.03,95% CI = 1.01 - 1.06,P = 0.02)与中风风险升高相关。漏斗图显示因果效应分布近似对称,留一法分析进一步证实结果的稳健性。Cochran’s Q 检验表明,除 ARG1 外,VEGFA 和 GATM 结果无显著异质性;MR - Egger 回归分析显示 3 个基因均无水平多效性。
- 可药物基因与中风的共定位分析:通过分析,VEGFA、ARG1 和 GATM 分别位于 6 号、6 号和 15 号染色体上。贝叶斯共定位分析发现,VEGFA 与中风风险存在共享的因果变异(rs11965885,后验概率 100%),而其他药物靶点与中风风险之间未检测到共定位证据。
- 分子对接和 GEO 数据集验证:分子对接研究显示,ZBP 核心成分与 MR 分析确定的特征基因之间的所有对接组合结合能均低于 - 6.0 kcal/mol,表明多数特征基因与 ZBP 核心成分可形成稳定复合物。其中,β - 谷甾醇与 VEGFA、槲皮素与 ARG1、β - 谷甾醇与 GATM 的对接相互作用最为稳定。GEO 数据集分析发现,整合 GSE16561 和 GSE58294 数据集(包含 47 个对照样本和 108 个中风样本)后,经数据处理和分析,确定了 200 个与中风相关的 DEGs,其中 125 个基因上调,75 个基因下调。与对照样本相比,中风样本中 VEGF 和 ARG1 的表达水平显著升高,提示它们在中风中可能具有保护作用。
讨论
- ZBP 治疗中风的物质基础:研究确定的 ZBP “D - C - T” 网络揭示了其治疗中风的主要物质基础。木犀草素具有抗炎和抗氧化作用,可减轻中风相关的神经元损伤;槲皮素能通过调节 PI3K/Akt 信号通路抑制细胞凋亡,促进神经元存活;异鼠李素可增加脑血流量,减少脑梗死面积;β - 谷甾醇有助于降低胆固醇,预防动脉粥样硬化;山奈酚(kaempferol)也具有抗氧化和抗炎作用。这些核心成分通过各自的药理特性,从神经保护、炎症调节和血管健康改善等多方面协同发挥作用,为 ZBP 治疗中风提供了有力支持。
- 靶基因和通路的潜在机制:研究发现的 105 个与 ZBP 和中风均相关的靶点,为理解 ZBP 与中风病理机制的相互作用奠定了基础。GO 分析表明,氧化应激在中风病理中起重要作用,调节氧化途径可能对神经元保护和恢复有益。ITGs 与囊泡结构的关联提示其在细胞内运输和神经递质传递中的作用,而这在中风中可能受到干扰。与蛋白酶结合和丝氨酸水解酶活性相关的分子功能,表明 ZBP 可能参与调节与细胞凋亡和炎症相关的酶,影响中风中的突触可塑性和神经炎症。KEGG 通路分析显示,PI3K - Akt 信号通路对抵抗缺氧具有保护作用,MAPK 通路反映了炎症反应对神经元存活的影响,脂质代谢和动脉粥样硬化相关通路则表明脂质代谢异常与中风的关系。ZBP 的 14 个关键活性成分通过调节氧化应激、炎症和细胞凋亡等相关通路,发挥协同治疗作用。例如,木犀草素和槲皮素调节 PI3K - Akt 和 Nrf2 通路保护神经元;β - 谷甾醇和异鼠李素改善血管健康,减少梗死面积;木犀草素和山奈酚激活 PI3K - Akt 通路促进神经元存活,槲皮素和异鼠李素调节 MAPK 通路减轻炎症,β - 谷甾醇抑制 NF - κB 通路减少促炎细胞因子产生。这些通路的协同调节增强了 ZBP 的神经保护和抗炎作用,但其具体机制仍需进一步实验验证。
- ZBP 治疗中风靶点的分析与验证:MR 分析有力地证明了某些遗传因素与中风风险之间的因果关系。VEGFA 和 ARG1 与中风风险呈显著负相关,表明较高水平的这两个基因可能对中风具有保护作用。VEGFA 有助于受损血管修复,改善脑血流量,在中风模型中具有神经保护作用;ARG1 编码的酶可调节炎症反应,在缺血条件下促进神经保护。GATM 与中风风险呈正相关,提示其在中风发展中可能起有害作用。分子对接结果进一步支持了 ZBP 关键成分与中风相关靶点相互作用的稳定性,为传统草药配方的治疗潜力提供了证据。
- 研究的局限性:本研究存在一定局限性。ARG1 共定位分析中的异质性可能源于其参与多种生物途径和基因 - 环境相互作用,尽管采取了 MR - Egger 回归和 MR - PRESSO 分析处理多效性,但仍可能存在残余异质性。GATM 在能量代谢中的作用因个体代谢状况而异,需要进一步深入研究。MR 分析虽能进行有力的因果推断,但存在遗传异质性、基因多效性和水平多效性等问题,可能导致结果偏差。遗传异质性限制了研究结果在不同人群中的普遍性,SNP 的多效性可能影响其他性状,干扰因果估计。即使采用了相关方法处理多效性,仍可能存在残余效应,因此对结果的解释需谨慎,并需进一步验证。此外,本研究的 MR 分析仅聚焦于 VEGFA、ARG1 和 GATM,为更全面了解中风遗传学,未来研究应纳入更多与炎症、脂质代谢和内皮功能相关的基因,以确定新的治疗靶点,深入阐明中风的遗传机制。
结论
本研究利用综合生物信息学方法确定了与中风相关的潜在药物靶点,揭示了中药成分可能的治疗作用机制,为改善中风临床诊断和预后提供了新的方向。研究结果为后续验证这些靶点和探索其治疗意义奠定了基础,有助于推动中风预防和治疗策略的发展。然而,本研究主要依赖生物信息学分析,缺乏湿实验室实验的实证验证,且样本量相对较小,可能无法准确反映中风患者的总体情况。未来研究需要纳入更大、更多样化的队列,并通过实验方法验证已确定的靶点和机制,以增强研究结果的可靠性和适用性。