背景:放疗(Radiotherapy)仍是直肠癌(RC)局部治疗的基石;然而,放疗抵抗显著降低治疗效果并对患者预后产生不利影响。在RC中鉴定与放疗抵抗相关的生物标志物并基于放疗相关基因构建预后模型,对于改善治疗结局至关重要。
方法:研究人员从公共数据库获取RC相关数据,包括来自4个基因表达综合数据库(GEO)队列和1个癌症基因组图谱(TCGA)队列共993例患者的批量RNA测序数据,以及6个样本的单细胞RNA测序(scRNA-seq)数据。通过差异表达分析、功能富集分析和最小绝对收缩与选择算子(LASSO)回归分析构建预后模型。通过基因集变异分析(GSVA)、基因集富集分析(GSEA)和风险评分关联分析评估预后,并构建列线图以识别RC的潜在治疗靶点。
结果:通过对GEO和TCGA数据集中RC患者的临床数据进行分析,确定了预后相关基因,进而构建了风险评分模型。该风险评分与免疫细胞浸润、化疗药物敏感性和多条信号通路均存在显著关联。利用人类蛋白质图谱(HPA)数据库验证了RC患者关键基因的蛋白表达水平。此外,动物模型的免疫组织化学评估提供了进一步的验证。
结论:通过多组学分析阐明了RC放疗反应的分子特征和潜在机制。鉴定出5个可能与RC放疗敏感性相关的关键基因。这些预后基因可作为RC诊断、预后评估和临床管理的新型生物标志物和潜在靶点。
## 论文解读
### 一、研究背景与意义
直肠癌(Rectal Cancer, RC)是全球范围内高度 prevalent的恶性肿瘤,占结直肠癌(Colorectal Cancer, CRC)病例的显著比例,其危险因素包括肥胖、生活方式和遗传易感性。手术切除仍是RC的主要治疗方式,而根据疾病分期常辅以化疗、放疗、靶向治疗或免疫治疗。其中,放疗在实现RC局部控制中发挥着关键作用,尤其作为新辅助治疗时,旨在降低局部复发风险并改善生存结局。然而,尽管新辅助放疗是局部晚期RC的标准治疗方案,其疗效常因癌细胞的放疗抵抗而受损,导致患者生存率下降、治疗失败、疾病进展和不良预后。肿瘤放疗抵抗的机制涉及DNA损伤修复(DNA Damage Repair, DDR)、细胞周期阻滞、凋亡逃逸、免疫抑制、肿瘤干细胞群体增加以及肿瘤细胞和肿瘤微环境(Tumor Microenvironment, TME)的改变。
近年来,生物信息学分析被越来越多地用于分析微阵列和测序数据,以鉴定疾病相关基因并探索其潜在机制。单细胞测序(ScRNA-seq)的发展和基因芯片的广泛应用进一步促进了关键基因的鉴定,为治疗策略的制定提供了宝贵依据。然而,基于多组学方法系统鉴定RC放疗抵抗相关生物标志物并构建预后模型的研究仍相对缺乏。基于此,Deng等人的研究旨在通过多维数据集分析全面考察RC,探索放疗抵抗的分子机制,并基于RC放疗相关特征基因开发预后模型。该研究检验的核心假设是:基于多组学的预后模型将为RC临床结局提供更优的预测准确性,并作为指导个体化治疗策略的可靠工具。该研究为改善接受放疗的RC患者的预后评估和临床结局提供了新框架,论文发表于《HUMAN MUTATION》。
### 二、主要技术方法
本研究的技术路线涵盖以下关键环节:数据来源于GEO数据库的GSE35452(46例,22例放疗无应答/24例应答)、GSE60331(31例,16例无应答/15例应答)、GSE17536(177例有生存数据)和GSE39582(562例有生存数据)数据集,以及TCGA直肠腺癌(READ)项目(177例)的批量RNA-seq数据,外加GSE278406数据集的6例样本scRNA-seq数据。分析方法包括:使用Limma包进行差异表达分析;Metascape数据库进行功能富集分析;LASSO回归构建预后风险评分模型;CIBERSORT算法评估免疫浸润;GDSC数据库结合oncoPredict包进行药物敏感性预测;GSVA和GSEA进行通路富集分析;构建列线图模型;Seurat包进行单细胞质量控制、降维和细胞注释;CellChat进行配体-受体互作分析;人类蛋白质图谱(HPA)数据库验证蛋白表达;以及HCT116细胞系裸鼠异种移植模型和免疫组织化学(IHC)验证。
### 三、研究结果
**3.1 主成分分析(PCA)校正与差异分析**
研究从NCBI GEO公共数据库获取包含77例RC样本(38例放疗无应答者,39例应答者)的数据集GSE35452和GSE60331。使用替代变量分析(SVA)算法校正微阵列数据的批次效应,PCA可视化显示SVA处理后批次间分布差异减小。应用Limma包识别差异表达基因(DEGs),标准为p<0.05且|logFC|>0.585。共鉴定出100个DEGs,包括31个上调基因和69个下调基因。通过STRING数据库构建DEGs的蛋白-蛋白相互作用网络,Metascape数据库通路富集分析表明这些基因主要富集于上皮细胞分化、循环系统过程、磷脂酰胆碱代谢过程及相关通路。
**3.2 预后模型的构建**
研究人员分析TCGA数据库中RC患者的临床数据,通过Cox单变量回归分析从已鉴定的DEGs中筛选预后基因,确定6个与预后显著相关的基因(p<0.05)。基于LASSO回归分析算法,选择预测价值最高的5个关键基因:CCDC85A、MSLN、UMODL1、PLN和HOXC6。将TCGA数据集按2:1比例随机分为训练集和测试集,经LASSO回归分析计算最优风险评分值,公式为:Risk score = CCDC85A×0.0848430925884313 + MSLN×0.319483666791475 + UMODL1×0.331564570543034 + PLN×0.396571430580948 + HOXC6×0.543131661348868。按中位风险评分将患者分为高风险组和低风险组。Kaplan-Meier生存分析显示训练集和测试集中高风险组总生存期(OS)均短于低风险组;受试者工作特征曲线(ROC)分析证实两组均具有良好的预测性能。
**3.3 外部验证的稳健性**
使用GEO数据库GSE17536和GSE39582中具有生存信息的RC患者数据进行外部验证。按风险模型将患者分层后,Kaplan-Meier分析显示高风险组OS低于低风险组;ROC曲线分析进一步证实该模型在外部验证队列中保持良好的预后预测效能。
**3.4 免疫浸润分析**
肿瘤微环境由肿瘤细胞、成纤维细胞、免疫细胞、细胞外基质及各种细胞因子和趋化因子组成,对肿瘤发生、进展、诊断分类和预后具有关键影响。分析风险评分与肿瘤免疫浸润的关联,结果显示高风险组和低风险组之间免疫细胞亚群比例存在显著差异,尤其是M0巨噬细胞、M2巨噬细胞、单核细胞和中性粒细胞。相关性分析表明,风险评分与M2巨噬细胞和M0巨噬细胞显著正相关,与活化CD4记忆T细胞和浆细胞显著负相关。
**3.5 药物敏感性分析和风险评分涉及的信号通路**
尽管手术联合辅助放化疗是早期RC的标准治疗,但疗效存在异质性。利用GDSC数据库和R包"oncoPredict"预测药物敏感性,发现风险评分与5-氟尿嘧啶(5-Fluorouracil_1073)、索拉非尼(Sorafenib_1085)、伊立替康(Irinotecan_1088)、奥沙利铂(Oxaliplatin_1089)、厄洛替尼(Erlotinib_1168)和替莫唑胺(Temozolomide_1375)的敏感性存在显著关联。GSVA揭示高风险组相较于低风险组富集TGF-β信号通路(TGF_BETA_SIGNALING)、Hedgehog信号通路(HEDGEHOG_SIGNALING)和Notch信号通路(NOTCH_SIGNALING)等;GSEA进一步鉴定出Wnt信号通路、PI3K-Akt信号通路和吞噬体(phagosome)过程等通路。
**3.6 列线图模型预测**
基于多变量回归分析构建预测模型,开发列线图以直观估计1年、3年和5年总生存概率。校准分析显示预测生存结局与实际观察结果具有良好一致性。ROC曲线和决策曲线分析(DCA)进一步评估模型性能。此外,评估风险评分对抗肿瘤免疫治疗的敏感性,表明高风险组的免疫治疗应答率显著低于低风险组。
**3.7 单细胞数据质量控制**
为确保多样本数据质量,剔除检测基因数少于200的细胞及其他异常值,保留45,350个细胞。经过滤后,鉴定出2000个高变基因,数据经标准化、缩放、PCA和基于Harmony的校正处理。
**3.8 细胞注释与细胞通讯分析**
使用已建立的细胞标记物进行细胞注释,鉴定出10个亚群,归为七类:CD8 T细胞、单核细胞、中性粒细胞、B细胞、CD4 T细胞、细胞周期细胞和树突状细胞。利用CellChat包分析配体-受体关系,揭示这些亚群间复杂的细胞间相互作用网络,其中单核细胞相较于其他免疫细胞亚群表现出更明显的细胞间相互作用特征。
**3.9 单细胞中模型基因的表达谱**
在鉴定出的七类细胞中进行关键基因表达分析,结果显示:CCDC85A在B细胞中显著表达,MSLN在细胞周期细胞中表达,UMODL1在细胞周期细胞中表达,PLN在CD4 T细胞中表达,HOXC6在B细胞中表达。使用AUCell函数量化单细胞水平的免疫和代谢通路活性,UMODL1在氧化磷酸化和MYC靶点V1通路中活性高;PLN在氧化磷酸化和MYC靶点V1通路中活性高;MSLN在TNFα经由NFκB信号通路和未折叠蛋白反应通路中活性高;HOXC6在G2M检查点和MYC靶点V1通路中活性高;CCDC85A在未折叠蛋白反应和MYC靶点V1通路中活性高。
**3.10 临床样本和动物模型中模型基因表达水平的验证**
HPA数据库结果显示:UMODL1在正常直肠组织中不表达,在RC中呈不表达或低表达;PLN在直肠组织和RC中均呈极低表达;MSLN在正常直肠组织中呈中等表达,在RC中呈低到高表达;CCDC85A在正常直肠组织中高表达,在RC中呈中到高表达;HOXC6在HPA数据库中无表达数据。基因表达的变异性受RC患者生物学异质性和放疗敏感性差异的影响。
为进一步评估预后基因在放疗敏感性中的作用,研究人员建立人结直肠癌细胞(HCT116)裸鼠异种移植(CDX)模型,对裸鼠进行4Gy局部照射后进行IHC评估。结果显示照射组中UMODL1、MSLN和HOXC6上调,其中MSLN和HOXC6变化更明显,而PLN无显著变化,支持关键基因与RC放疗抵抗的相关性。
### 四、讨论与结论
研究人员在讨论中指出,RC是全球常见的消化道恶性肿瘤,尽管手术、放疗、化疗、靶向和免疫联合治疗策略改善了患者预后,但复发和转移仍是治疗失败的主要原因。本研究通过多组学分析建立了RC新型预后风险评估模型,该模型能有效区分高风险和低风险患者,在多个数据集中表现出稳定性和准确性,为RC的精准诊断和治疗规划提供了有价值工具。
风险评分模型在独立数据集中展现出强大的预后预测效能,药基因组学分析显示风险评分与化疗药物敏感性显著相关。从TCGA数据集鉴定出的5个关键基因各有其生物学背景:CCDC85A属于卷曲螺旋结构域蛋白家族成员,受miR-224-3p调控增强癌细胞内质网应激耐受性;MSLN是一种细胞表面糖蛋白,在多种恶性肿瘤中高表达,促进肿瘤细胞黏附、增殖、迁移和侵袭及上皮-间质转化;UMODL1位于染色体21q22.3,异常甲基化与结直肠腺癌(COAD)不良预后相关;HOXC6在多种实体瘤中高表达,在RC中通过调控DKK1/Wnt/β-catenin信号轴促进转移,且与DNA错配修复(MMR)核心蛋白MLH1呈负相关;PLN是肌浆网Ca
2+-ATP酶内源性抑制剂,在RC的consensus molecular subtype 4(CMS4)分类中与肿瘤进展相关。
研究同时承认存在局限性:样本量尤其是外部验证队列有限;不同公共数据库数据存在固有异质性;目前研究主要基于计算分析和回顾性临床关联,缺乏对鉴定关键基因的直接体外和体内功能验证实验。未来需在更大规模、前瞻性设计的多中心临床队列中验证该预后模型,并通过基因敲低/过表达联合放疗敏感性实验明确关键基因的功能性作用。
**研究结论:** 通过整合多组学分析,研究人员鉴定并验证了一个与RC放疗反应相关的五基因预后特征。该特征能有效将患者分层为不同风险组,在独立队列中展现出稳健的预测性能。此外,研究人员构建了整合分子风险与关键临床变量的临床可解释列线图,为个体化预后评估提供了实用工具。该研究不仅阐明了放疗抵抗的潜在分子机制,还提供了可能指导未来治疗策略和改善RC临床结局的候选生物标志物和靶点。