小细胞肺癌(SCLC)是一种高级神经内分泌癌,约占所有肺癌(LC)诊断的15%(Keogh等人,2022年)。其特征是细胞快速增殖、早期转移和显著的肿瘤内异质性,这些因素共同导致了较差的预后和侵袭性的临床进程。大约80-85%的SCLC患者在诊断时已处于晚期(ES-SCLC),此时转移已经发生。因此,5年生存率非常低,约为5%(Van Meerbeeck等人,2011年;Knight等人,2017年)。
尽管最近的治疗进展(包括免疫检查点抑制剂)在一定程度上改善了部分患者的生存情况,但大多数SCLC患者仍会迅速复发并对标准治疗产生耐药性(Herzog等人,2021年;Rudin等人,2021年)。从遗传学角度来看,SCLC的特点是肿瘤抑制基因TP53和RB1几乎普遍失活(Fűr等人,2024年;Jiao等人,2022年)。然而,由于这些突变破坏的是调控通路而非激活致癌通路,因此它们作为治疗靶点的效用有限。与其他LC亚型不同,SCLC缺乏可用于精准治疗的明确、疾病特异性的突变。这一挑战因高质量肿瘤样本的缺乏(尤其是可切除病例)以及综合基因组数据集的有限可用性而加剧。
尽管存在这些障碍,但已知SCLC具有较高的突变负担(Boumber,2018年)和显著的转录可塑性(Jin等人,2023年),这些特征表明可能存在尚未发现的体细胞突变(SMs),这些突变可能在疾病进展中起功能性作用。体细胞突变源于非生殖细胞的DNA改变,当它们发生在提供选择性生长优势的驱动基因中时,可能会破坏基因功能或调控。在肿瘤中检测到这些突变具有重要的临床价值,尤其是当突变发生在触发致癌作用并支持肿瘤进展的驱动基因中时。识别这些驱动突变不仅对于将SCLC患者与现有靶向疗法匹配至关重要,而且对于指导新疗法的开发也具有重要意义(George等人,2024年;Katzir等人,2022年;Das和Samaddar,2025年)。此外,体细胞突变可以揭示环境暴露或治疗耐药的突变特征,并可能作为患者分层的生物标志物(Li等人,2024年)。
历史上,体细胞突变的检测依赖于低通量方法,如Sanger测序和RT-PCR。这些技术仅限于预定义的基因组区域,因此无法实现全基因组的发现(Katzir等人,2022年;Tang等人,2024年)。下一代测序(NGS)技术的出现,包括全外显子测序(WES)和全基因组测序(WGS),使得能够在广泛的基因组区域内高效且经济地识别体细胞突变(Kim等人,2024年;Liu等人,2021年)。在SCLC中,这些技术为肿瘤演化和耐药性提供了见解。例如,使用WES和WGS的研究表明,TP53和RB1突变通常是肿瘤发生的早期事件,并将某些突变特征与化疗耐药性和免疫反应联系起来(George等人,2024年;Wang等人,2021年;Wang等人,2022年)。虽然WGS提供了全面的全基因组视图,但其高昂的成本和计算需求限制了其常规使用,因此在研究和临床应用中WES更为实用。然而,由于WES仅限于蛋白质编码区域,它无法捕获调控改变或表达水平的变化,因此需要转录组学方法,如RNA测序(RNA-seq)(Goodwin等人,2016年;Belkadi等人,2015年)。
同时,人类基因组组装技术的进步显著提高了基于DNA和RNA的测序分析的准确性。端粒到端粒CHM13(T2T-CHM13)组装作为第一个真正完整的人类参考基因组,通过解析着丝粒、片段重复和其他重复元素,优于GRCh38(Nurk等人,2022年)。这一改进的参考基因组增强了读段比对、突变调用和结构变异检测,特别是在癌症中频繁改变的复杂基因组区域(Paulin等人,2025年)。在SCLC中,使用T2T-CHM13可能揭示GRCh38忽略的新突变特征和调控扰动。此外,RNA-seq已成为检测表达外显子中低频体细胞突变的宝贵工具,由于肿瘤内异质性,基于DNA的方法可能会遗漏这些突变(Coudray等人,2018年)。尽管基于RNA-seq的突变调用算法(如RNA-MuTect)已在多种癌症类型中得到验证(Tang等人,2024年),但其在SCLC中的系统应用仍然有限,代表了新的基因组发现的前沿。
在这项研究中,我们使用了SCLC肿瘤和正常样本的RNA-seq数据集来识别体细胞突变。我们还比较了GRCh38和T2T-CHM13参考基因组在SCLC背景下的突变检测能力。通过利用精心策划的基因组数据库对识别出的突变进行功能注释,以评估它们的潜在生物学意义。此外,还进行了功能富集分析,进一步研究这些突变对癌症相关通路的影响,重点关注罕见、非同义和剪接位点突变,这些突变更有可能影响蛋白质功能并促进疾病进展。通过结合参考引导的注释和新的体细胞突变发现方法,本研究旨在揭示具有临床相关性的突变,并为未来的精准肿瘤学策略确定潜在的治疗靶点。