利用RNA测序和T2T-CHM13基因组参考,改进了小细胞肺癌的体细胞突变分析方法

时间:2025年12月31日
来源:Computational Biology and Chemistry

编辑推荐:

SCLC分子景观研究中,基于T2T-CHM13参考基因组与RNA-seq分析,发现COL4A1等6个新驱动基因及259个高影响突变,揭示突变特征与免疫亚型负相关,为精准治疗提供新靶点。

广告
   X   

普拉吉亚·卡希亚普(Pragya Kashyap)| 迪内什·库马尔·艾赫瓦尔(Dinesh Kumar Ahirwar)| 潘卡吉·亚达夫(Pankaj Yadav)
印度拉贾斯坦邦焦特布尔印度理工学院生物科学与生物工程系

摘要

全面识别体细胞突变(SMs)对于理解小细胞肺癌(SCLC)的分子特征至关重要。尽管DNA测序仍然是检测体细胞突变的主要方法,但RNA测序(RNA-seq)通过关注活跃转录区域的突变提供了一种强大的补充策略。尽管RNA-seq具有潜力,但在SCLC中用于发现体细胞突变的实用性仍需进一步探索。在这里,我们提出了一种稳健的RNA-seq分析流程,该流程结合了两轮HISAT2比对和使用Genome Analysis Toolkit(GATK)中的MuTect2进行体细胞突变调用。利用COSMIC和dbSNP数据库对突变进行注释后发现,G > A和C > T的转换占主导地位,这与烟草暴露和氧化应激的突变特征一致。我们的分析确定了六个与SCLC信号通路相关的关键癌基因(COL4A1、FN1、AKT1、TRAF4、MYC、PTK2),以及259个之前未报道的高影响力突变。利用完整的T2T-CHM13参考基因组提高了突变分辨率,与GRCh38相比,能够捕获更多的SNP、MNP和Indel。与CancerVar工具的整合优先考虑了潜在的驱动基因,包括UBC、TSC1、ADGRL1和ATN1。值得注意的是,这些驱动突变与SCLC的炎症亚型呈负相关,后者以免疫浸润增加和生存期延长为特征。我们的发现突显了RNA-seq在SCLC体细胞突变分析中的未开发潜力,并揭示了新的分子靶点,对患者分层、免疫治疗和精准治疗策略具有意义。

引言

小细胞肺癌(SCLC)是一种高级神经内分泌癌,约占所有肺癌(LC)诊断的15%(Keogh等人,2022年)。其特征是细胞快速增殖、早期转移和显著的肿瘤内异质性,这些因素共同导致了较差的预后和侵袭性的临床进程。大约80-85%的SCLC患者在诊断时已处于晚期(ES-SCLC),此时转移已经发生。因此,5年生存率非常低,约为5%(Van Meerbeeck等人,2011年;Knight等人,2017年)。
尽管最近的治疗进展(包括免疫检查点抑制剂)在一定程度上改善了部分患者的生存情况,但大多数SCLC患者仍会迅速复发并对标准治疗产生耐药性(Herzog等人,2021年;Rudin等人,2021年)。从遗传学角度来看,SCLC的特点是肿瘤抑制基因TP53和RB1几乎普遍失活(Fűr等人,2024年;Jiao等人,2022年)。然而,由于这些突变破坏的是调控通路而非激活致癌通路,因此它们作为治疗靶点的效用有限。与其他LC亚型不同,SCLC缺乏可用于精准治疗的明确、疾病特异性的突变。这一挑战因高质量肿瘤样本的缺乏(尤其是可切除病例)以及综合基因组数据集的有限可用性而加剧。
尽管存在这些障碍,但已知SCLC具有较高的突变负担(Boumber,2018年)和显著的转录可塑性(Jin等人,2023年),这些特征表明可能存在尚未发现的体细胞突变(SMs),这些突变可能在疾病进展中起功能性作用。体细胞突变源于非生殖细胞的DNA改变,当它们发生在提供选择性生长优势的驱动基因中时,可能会破坏基因功能或调控。在肿瘤中检测到这些突变具有重要的临床价值,尤其是当突变发生在触发致癌作用并支持肿瘤进展的驱动基因中时。识别这些驱动突变不仅对于将SCLC患者与现有靶向疗法匹配至关重要,而且对于指导新疗法的开发也具有重要意义(George等人,2024年;Katzir等人,2022年;Das和Samaddar,2025年)。此外,体细胞突变可以揭示环境暴露或治疗耐药的突变特征,并可能作为患者分层的生物标志物(Li等人,2024年)。
历史上,体细胞突变的检测依赖于低通量方法,如Sanger测序和RT-PCR。这些技术仅限于预定义的基因组区域,因此无法实现全基因组的发现(Katzir等人,2022年;Tang等人,2024年)。下一代测序(NGS)技术的出现,包括全外显子测序(WES)和全基因组测序(WGS),使得能够在广泛的基因组区域内高效且经济地识别体细胞突变(Kim等人,2024年;Liu等人,2021年)。在SCLC中,这些技术为肿瘤演化和耐药性提供了见解。例如,使用WES和WGS的研究表明,TP53和RB1突变通常是肿瘤发生的早期事件,并将某些突变特征与化疗耐药性和免疫反应联系起来(George等人,2024年;Wang等人,2021年;Wang等人,2022年)。虽然WGS提供了全面的全基因组视图,但其高昂的成本和计算需求限制了其常规使用,因此在研究和临床应用中WES更为实用。然而,由于WES仅限于蛋白质编码区域,它无法捕获调控改变或表达水平的变化,因此需要转录组学方法,如RNA测序(RNA-seq)(Goodwin等人,2016年;Belkadi等人,2015年)。
同时,人类基因组组装技术的进步显著提高了基于DNA和RNA的测序分析的准确性。端粒到端粒CHM13(T2T-CHM13)组装作为第一个真正完整的人类参考基因组,通过解析着丝粒、片段重复和其他重复元素,优于GRCh38(Nurk等人,2022年)。这一改进的参考基因组增强了读段比对、突变调用和结构变异检测,特别是在癌症中频繁改变的复杂基因组区域(Paulin等人,2025年)。在SCLC中,使用T2T-CHM13可能揭示GRCh38忽略的新突变特征和调控扰动。此外,RNA-seq已成为检测表达外显子中低频体细胞突变的宝贵工具,由于肿瘤内异质性,基于DNA的方法可能会遗漏这些突变(Coudray等人,2018年)。尽管基于RNA-seq的突变调用算法(如RNA-MuTect)已在多种癌症类型中得到验证(Tang等人,2024年),但其在SCLC中的系统应用仍然有限,代表了新的基因组发现的前沿。
在这项研究中,我们使用了SCLC肿瘤和正常样本的RNA-seq数据集来识别体细胞突变。我们还比较了GRCh38和T2T-CHM13参考基因组在SCLC背景下的突变检测能力。通过利用精心策划的基因组数据库对识别出的突变进行功能注释,以评估它们的潜在生物学意义。此外,还进行了功能富集分析,进一步研究这些突变对癌症相关通路的影响,重点关注罕见、非同义和剪接位点突变,这些突变更有可能影响蛋白质功能并促进疾病进展。通过结合参考引导的注释和新的体细胞突变发现方法,本研究旨在揭示具有临床相关性的突变,并为未来的精准肿瘤学策略确定潜在的治疗靶点。

方法

图1展示了本研究中使用的全面数据分析工作流程,从数据收集和预处理到体细胞突变识别,再到功能解释和富集分析的逐步概述。统计分析使用R软件(版本4.4.2)和Python(版本3.12.2)进行。整个流程和分析代码可通过GitHub仓库公开获取(URL:https://github.com/kashpk/somatic-variant-NGS)。

体细胞突变过滤和突变谱分析

体细胞突变调用使用GATK MuTect2进行,随后应用过滤步骤以确保仅包含高置信度的突变。最初识别出3600万个原始体细胞突变,其中只有标记为“PASS”的突变被FilterMutectCalls保留。为了进一步提高可靠性,设置了6.3的肿瘤对数几率(TLOD)阈值,将突变数量从3600万个减少到大约40万个。后续基于...

讨论

SCLC仍然是最具侵袭性和致命性的恶性肿瘤之一,其特征是肿瘤快速进展、早期转移和患者生存率低(Wang等人,2021年;Lala和Hall,2022年)。虽然基因组研究大大提高了我们对SCLC突变特征的理解(Wang等人,2021年),但基于转录组的分析通过捕获表达的体细胞突变以及提供关于肿瘤-免疫相互作用的动态见解,提供了补充益处。在这项研究中,我们...

结论

总之,本研究利用尖端的基因组资源和生物信息学方法,对SCLC中的体细胞突变和免疫特征进行了全面的综合分析。我们的发现强调了完整基因组组装和转录组数据在精细化SCLC分子分类学方面的价值,并突显了遗传改变与免疫环境之间的复杂相互作用。这些见解为改进生物标志物的开发和增强...

利益冲突

所有作者声明没有财务或非财务上的利益冲突。

资助

本项工作得到了印度理工学院焦特布尔分校对潘卡吉·亚达夫博士(项目编号I/SEED/PY/20200037)的种子基金支持;以及印度理工学院焦特布尔分校对迪内什·库马尔·艾赫瓦尔博士(项目编号I/SEED/DKA/20230044)和印度政府科技部科学与工程研究委员会(项目编号SRG/2023/002556)的种子基金和启动研究基金的支持。

CRediT作者贡献声明

普拉吉亚·卡希亚普(Pragya Kashyap):撰写——审稿与编辑、撰写——初稿、可视化、正式分析、数据管理、概念构思。迪内什·库马尔·艾赫瓦尔(Dinesh Kumar Ahirwar):撰写——审稿与编辑、撰写——初稿、方法学、资金获取。潘卡吉·亚达夫(Pankaj Yadav):撰写——审稿与编辑、撰写——初稿、验证、监督、软件、资源管理、项目管理、方法学、研究、概念构思。

利益冲突声明

作者声明他们没有已知的财务利益或个人关系可能影响本文所述的工作。

生物通微信公众号
微信
新浪微博


生物通 版权所有