整合单细胞与GWAS数据解析肾透明细胞癌T细胞亚群特征并构建临床预后模型的研究

时间:2026年4月9日
来源:HUMAN MUTATION

编辑推荐:

本研究聚焦肾透明细胞癌(KIRC)高异质性、高转移率及预后差的临床挑战,通过整合单细胞RNA测序(scRNA-seq)、GWAS和多组学数据,利用scPagwas算法识别出T细胞亚群的关键作用,并联合WGCNA与差异表达基因筛选出86个交叉基因。进一步通过机器学习构建了包含7个风险基因的临床预后模型,经TCGA-KIRC队列及独立验证集(GSE29609、E-MTAB-1980)验证,模型在生存预测与ROC分析中均表现优异。研究还通过功能富集、免疫浸润、突变分析及药物敏感性评估揭示了不同风险人群的生物学机制差异,并基于SHAP值锁定DOCK8为潜在生物标志物,经分子对接预测了五种靶向DOCK8的潜在药物(非那雄胺、诺考达唑、帕洛诺司琼、Pifithrin α、托吡酯)。该工作为KIRC的精准诊断与靶向治疗提供了新见解。

广告
   X   

肾细胞癌是泌尿系统常见的恶性肿瘤,其中肾透明细胞癌(Clear Cell Renal Cell Carcinoma, KIRC)占所有肾癌病例的75%–84%,堪称“主力军”。然而,这位“主力军”却是个难缠的对手:它具有高度的异质性,意味着不同患者的肿瘤甚至同一肿瘤内部都存在巨大差异;它极易转移,且预后较差,是男性第十大、女性第十一大癌症死因。尽管手术切除对早期患者效果尚可,但约25%的局部患者在术后仍会复发。近年来,KIRC的发病率持续攀升,而现有的治疗手段,包括前景广阔的免疫检查点抑制剂(Immune Checkpoint Inhibitors, ICIs)疗法,也面临着耐药性、无法有效应对肿瘤异质性等挑战。因此,深入理解KIRC,特别是其复杂的肿瘤微环境(Tumor Microenvironment, TME),寻找新的生物标志物以构建更精准的预后模型和发掘潜在治疗靶点,已成为临床和科研亟待突破的关口。
为了破解KIRC的预后密码并探索新的治疗方向,来自苏州大学第一附属医院等机构的研究团队进行了一项系统性的研究。他们巧妙地将多种前沿技术和大数据资源整合在一起,就像为KIRC绘制了一张精细的“多维地图”。这项研究成果最终发表在专业期刊《HUMAN MUTATION》上。
为了完成这项研究,作者们运用了几个关键的技术方法。首先,他们从公共数据库获取了多种来源的数据,构成了研究的基础:包括KIRC的单细胞RNA测序数据(GSE171306)、代表大样本群体的TCGA-KIRC队列的基因表达和临床数据、来自OpenGWAS的KIRC全基因组关联研究(Genome-Wide Association Study, GWAS)汇总数据,以及两个用于验证的独立数据集(GSE29609和E-MTAB-1980)。在数据分析阶段,他们采用了scPagwas这一先进算法,将GWAS数据“投影”到单细胞数据上,以量化特定细胞亚群与疾病特征的遗传关联程度。接着,他们结合了加权基因共表达网络分析(Weighted Correlation Network Analysis, WGCNA)差异表达基因(Differentially Expressed Genes, DEGs) 分析来筛选关键基因。在构建核心的临床预后模型时,研究者没有依赖于单一算法,而是集成并评估了10种机器学习算法及其101种组合(如随机生存森林、LASSO、XGBoost等),并通过留一法交叉验证(Leave-One-Out-Cross-Validation, LOOCV)来确保模型的稳定性和准确性。此外,研究还涉及了基因功能富集分析(GO/KEGG)、免疫浸润分析(使用CIBERSORT算法)、体细胞突变分析、药物敏感性预测以及分子对接等多种生物信息学和计算生物学手段,并辅以免疫组化实验对关键发现进行了湿实验验证。
研究结果
3.1. KIRC中免疫细胞亚群的鉴定
通过对单细胞数据集GSE171306进行质控、降维和聚类分析,研究人员将所有细胞划分为23个簇,并最终注释为7个主要的细胞亚群,包括T细胞、髓系细胞、内皮细胞等。这为后续聚焦特定免疫细胞亚群奠定了基础。
3.2. scPagwas鉴定与KIRC相关的特征细胞群体
利用scPagwas算法整合单细胞和GWAS数据后,研究发现T细胞亚群在KIRC中具有最高的性状相关评分(Trait-Related Score, TRS),显著高于其他细胞亚群。同时,他们计算了基因表达与总体遗传多效性关联得分(gPAS)的Pearson相关系数,筛选出相关性强的基因用于后续分析。
3.3. TCGA-KIRC中的差异表达分析和WGCNA分析
在TCGA-KIRC队列中,研究者鉴定出大量DEGs。通过WGCNA分析,他们发现洋红色模块、蓝色模块和青色模块与T细胞亚群的状态显著相关,并从这些模块中提取了3628个核心基因。
3.4. 预后相关基因的鉴定
将来自单细胞分析(T细胞亚群关键基因及PCC>0.05的基因)、DEGs和WGCNA核心模块的基因取交集,共获得86个交叉基因。功能富集分析表明,这些基因显著富集于免疫相关通路,如淋巴细胞活化、白细胞分化以及NOD样受体信号通路、TNF信号通路等。通过单变量Cox回归分析,从中进一步筛选出54个与预后相关的基因。
3.5. 构建与KIRC中T细胞相关的临床预后模型
在TCGA-KIRC数据集中,通过对101种算法组合进行评估,最终选择C-index最高(0.766)的随机生存森林算法构建模型。该模型包含7个关键风险基因:CASP4、CCM2、CCNL2、DOCK8、LENG8、PABPN1和TCIRG1。根据模型计算的风险评分,将TCGA训练集及两个验证集(GSE29609, E-MTAB-1980)的患者分为高危组和低危组。分析表明,高危组与不良临床结局显著相关,而低危组患者则显示出显著的生存优势。时间依赖性ROC曲线分析证实了模型优秀的预测性能(例如,在TCGA队列中,1年、2年、3年AUC分别高达0.965、0.978、0.984)。单变量和多变量Cox回归分析均证明,该风险评分是KIRC患者临床结局的独立风险因素。
3.6. 列线图的构建与验证
为了提升模型的临床实用性,研究者整合了风险评分与临床特征(性别、年龄、分期、分级、TNM分期),构建了一个预测1年、3年和5年总生存期(Overall Survival, OS)的列线图。校准曲线显示,列线图的预测生存概率与实际观测结果高度一致。
3.7. 低危与高危组间的功能富集分析
基因集富集分析揭示了不同风险组别潜在的生物学机制差异。低危组的基因显著富集于脂肪酸代谢、丙酸代谢、视黄醇代谢等代谢通路。而高危组则富集于细胞粘附分子、扩张型心肌病、细胞外基质(Extracellular Matrix, ECM)-受体相互作用等通路。
3.8. 风险评分与免疫细胞浸润和突变状态的关系
免疫浸润分析显示,高危组中活化的CD4记忆性T细胞、浆细胞、M0型巨噬细胞、调节性T细胞(Regulatory T Cells, Tregs)和滤泡辅助性T细胞显著上调。风险评分与免疫检查点蛋白表达相关,例如与CTLA4、PDCD1呈正相关。此外,高危组具有更高的肿瘤突变负荷(Tumor Mutational Burden, TMB),且两组间高频突变基因图谱存在差异。
3.9. 药物敏感性
药物敏感性分析为不同风险人群的个性化用药提供了线索。例如,克唑替尼、拉帕替尼、林西替尼等药物在高危组中表现出更低的半抑制浓度(Half Maximal Inhibitory Concentration, IC50),意味着高危患者可能对这些药物更敏感。而伊布替尼、奥希替尼等则在低危组中IC50更低。
3.10. 临床预后模型中重要风险基因的鉴定、药物预测与分子对接
利用XGBoost和LightGBM机器学习算法评估7个风险基因对模型的重要性,并通过SHAP值进行解释。在两个算法中,DOCK8基因的贡献度均排名第一,被确定为关键基因。免疫组化实验证实,DOCK8在KIRC肿瘤组织中的表达显著高于癌旁正常组织。基于DOCK8高表达与低表达组的差异基因,通过Connectivity Map数据库预测出五种潜在靶向药物:非那雄胺、诺考达唑、帕洛诺司琼、Pifithrin α和托吡酯。分子对接结果显示,这五种小分子药物与DOCK8蛋白的结合能均低于-6 kcal/mol,其中帕洛诺司琼的结合能最低(-8.8 kcal/mol),表明它们具有与DOCK8蛋白稳定结合的潜力。
研究结论与讨论
本研究通过整合多组学数据,系统揭示了KIRC免疫微环境的异质性,并首次将scPagwas算法应用于KIRC研究,成功鉴定出T细胞亚群是与其遗传特征最相关的细胞群体。这凸显了T细胞在KIRC发生发展中的核心作用。通过对T细胞相关基因的深入挖掘,研究构建并验证了一个包含7个基因的稳健临床预后模型。该模型不仅能有效区分患者的预后风险,其风险评分还是一个独立的预后因子,具有很高的临床预测价值。
对高低危人群的深入分析揭示了其背后不同的生物学机制:低危人群的代谢通路活跃,而高危人群则与细胞粘附、ECM重塑等促侵袭转移通路相关。免疫浸润和突变谱的差异进一步解释了不同风险组的肿瘤免疫特征。这些发现为理解KIRC的异质性和进展机制提供了新视角。
尤为重要的是,研究通过机器学习特征重要性分析,将DOCK8基因锁定为关键生物标志物。DOCK8是一种与细胞骨架重排和免疫细胞功能相关的鸟嘌呤核苷酸交换因子。本研究的湿实验验证了其在KIRC中的高表达,并通过计算预测了五种能与之有效结合的小分子药物,为靶向DOCK8的治疗策略提供了直接的候选化合物和理论依据。
总之,这项工作不仅为KIRC的预后评估提供了一个强有力的新工具,还深入阐释了其肿瘤微环境特征,并发现了新的潜在治疗靶点(DOCK8)及靶向药物。这些成果为推进KIRC的精准诊断、风险分层和个体化靶向治疗奠定了重要的理论基础,具有显著的临床转化潜力。

生物通微信公众号
微信
新浪微博


生物通 版权所有