基因组与药代动力学分析在转移性乳腺癌临床分层中的前沿进展

时间：2025年12月12日

来源：Hormones & Cancer

编辑推荐：

本研究针对转移性乳腺癌（MBC）分子异质性高、治疗耐药性强的临床难题，通过整合多组学数据与人工智能驱动的计算生物学方法，系统识别了ROR1、ROR2、AKT1、SMAD3等8个关键驱动基因，并基于结构生物学手段筛选出Ellagic Acid、Erioflorin等具有高亲和力、良好药代动力学特性的先导化合物，为MBC的精准靶向治疗提供了新的候选策略和分子靶点。

转移性乳腺癌（MBC）是乳腺癌患者死亡的主要原因，其癌细胞能够从原发部位扩散至骨骼、肺部、肝脏和大脑等多个远端器官。尽管早期诊断和局部治疗在乳腺癌初期阶段效果显著，但对于晚期患者，尤其是发生转移的患者，治疗选择非常有限。乳腺癌的分子复杂性以及患者间肿瘤特征的高度异质性，导致肿瘤学中的标准治疗方案往往迅速失效。更棘手的是，转移性乳腺癌的临床表现因转移部位不同而差异巨大，例如脑转移患者可能出现头痛、记忆思维困难，而肺转移患者则主要表现为呼吸困难。当前常用的化疗、内分泌治疗、免疫疗法和靶向治疗效果不尽人意，多数患者最终会产生耐药性。因此，探索新的分子生物标志物，开发更加个性化、精准的癌症疗法变得至关重要。

近年来，结合多组学数据与计算生物学方法的整合性药物发现策略，为应对转移性乳腺癌的分子复杂性提供了成功范例。这种方法不仅有助于深入理解疾病机制，也推动了疾病诊断、治疗及药物研发的进程。通过计算生物学，研究人员能够在进行湿实验之前，有效地发现疾病靶点、筛选药物化合物并模拟药物-靶标相互作用。在此背景下，由Zarlish Attique、Hafiz Muhammad Faraz Azhar和Sajid Khan共同完成并发表于《Discover Oncology》的研究，开展了一项综合性工作，旨在通过整合转录组学、网络分析、结构生物学和药物信息学分析，揭示转移性乳腺癌的关键分子驱动因子，并评估其治疗潜力。

为了攻克上述难题，研究人员设计并实施了一套涵盖三个阶段的综合性研究方案。首先，在数据收集阶段，研究团队从NCBI基因表达 omnibus（GEO）数据库和癌症基因组图谱（TCGA）中获取了多个转移性乳腺癌相关的基因表达数据集，并利用Limma包进行差异表达基因（DEG）分析。随后，通过加权基因共表达网络分析（WGCNA）构建基因模块，并利用Metascape、DAVID等工具进行基因本体（GO）和通路富集分析，以识别与转移相关的核心通路和功能模块。接着，通过蛋白质-蛋白质相互作用（PPI）网络分析和拓扑特征计算，筛选出枢纽基因。在验证阶段，利用GEPIA2、KM Plotter和人类癌症转移数据库（HCMDB）等平台验证了这些枢纽基因在转移性乳腺癌中的表达异常和预后价值，并借助TCGA数据进行了突变分析。最后，在靶向治疗探索阶段，研究采用人工智能（如trRosetta）和同源建模（如MODELLER）技术预测了关键靶蛋白的三维结构，通过虚拟筛选大规模化合物库，利用AutoDock Vina进行分子对接，筛选出高亲和力的先导化合物。并对优选化合物进行了药效团建模、ADMET（吸收、分布、代谢、排泄和毒性）性质预测以及通过iMODS服务器进行的分子动力学模拟（正常模式分析，NMA），以评估复合物的稳定性。

3.1 基因表达数据获取与预处理

研究从GEO数据库筛选出8个具有临床转移注释的乳腺癌数据集，共包含1,287个样本。经过Log2转换和Benjamini-Hochberg错误发现率（FDR）校正等标准化处理后，通过Limma分析鉴定出大量差异表达基因（DEG）。火山图、MA图等质量控制图表证实了数据的可靠性。

3.3 加权基因共表达网络分析（WGCNA）

对GSE40622数据集（275个样本）进行WGCNA分析，共识别出64个基因共表达模块。

3.4 基因集富集分析与PPI网络构建

基因集富集分析显示，DEGs显著富集在PI3K-Akt、MAPK、TGF-β、Wnt等癌症相关信号通路中。通过GenCLiP 3.0文本挖掘构建的基因调控网络（GRN）以及基于Metascape的PPI网络分析，进一步揭示了与乳腺癌转移密切相关的功能模块。

3.5 枢纽基因鉴定

综合DEGs、TCGA数据、WGCNA模块以及已知癌症基因的PPI网络拓扑分析（如度中心性、介数中心性），研究最终确定了8个高置信度的枢纽基因：ROR1、ROR2、SMAD3、AKT1、UBC、RPS6、CDH1和AR。这些基因在多个分析中反复出现，表明它们在MBC进程中扮演着核心角色。

3.6 枢纽基因在生物学通路中的作用

文献调研证实，这8个枢纽基因参与了大量与癌症转移相关的生物学过程和通路，包括Ras-MAPK、Wnt/PCP（平面细胞极性）、PI3K-AKT、TGF-β/SMAD、泛素介导的蛋白降解、AR信号传导等。

3.7 突变分析与结构建模

利用TCGA数据对8个枢纽基因进行突变分析，并通过VEP、SIFT和PolyPhen-2等工具预测了致病性突变。随后，研究采用人工智能辅助的trRosetta（用于ROR1、ROR2、AR）和同源建模（用于SMAD3、AKT1、UBC、RPS6、CDH1）方法，预测了这些靶点的三维结构，并利用Ramachandran图等方法验证了模型的可靠性。

3.10-3.11 虚拟筛选与分子对接

研究从ChEMBL、DrugBank等数据库收集了约17,352个化合物，针对8个靶点及其突变体进行虚拟筛选和分子对接。对接结果显示，多个化合物与靶点具有强结合亲和力（结合能通常在-5.0 kcal/mol以下）。例如，Ellagic Acid对SMAD3和UBC均显示出良好的结合潜力，Erioflorin与AKT1结合紧密。

3.11.2 药效团建模

基于最佳对接复合物，利用LigandScout为每个靶点构建了药效团模型，明确了关键相互作用特征（如氢键供体/受体、芳香环、疏水区域等），为后续基于结构的药物设计提供了指导。

3.12 分子动力学模拟

通过iMODS服务器对对接复合物进行正常模式分析（NMA），评估了其结构稳定性和动态行为。B因子、特征值、协方差图和弹性网络模型等分析结果表明，所选先导化合物与靶蛋白形成的复合物具有较高的结构稳定性和刚性，在模拟的生物学条件下能保持稳定的结合构象。

本研究通过整合多组学数据与多层次计算生物学方法，系统性地识别并验证了ROR1、ROR2、SMAD3、AKT1、UBC、RPS6、CDH1和AR这8个基因作为转移性乳腺癌（MBC）的关键驱动因子。研究不仅揭示了这些靶点在多种促癌通路中的核心作用，还通过先进的结构预测、虚拟筛选和分子模拟，成功鉴定出如Ellagic Acid和Erioflorin等具有高结合亲和力、良好药代动力学特性和低预测毒性的先导化合物。这些发现为理解MBC的分子机制提供了新的视角，并为开发针对这些靶点的精准疗法奠定了坚实的理论基础。尽管本研究属于计算预测性质，其结论尚需后续的体外和体内实验验证，但它无疑为克服MBC的治疗耐药性和异质性挑战提供了有前景的候选策略和化合物，展示了计算驱动的新型药物发现在肿瘤精准医疗中的巨大潜力。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部