编辑推荐:
这篇研究报道了ALPACA(等位基因特异性拷贝数系统发育分析)算法,通过多样本bulk DNA测序数据解析肿瘤克隆特异性拷贝数变异(SCNAs)与单核苷酸变异(SNVs)的共进化关系。该方法显著提升了对模拟肿瘤SCNA演化的推断精度,并在TRACERx421肺癌队列中发现转移克隆的染色体不稳定性(CIN)增强、抑癌基因(TSGs)丢失及CCND1扩增等特征。研究首次揭示克隆拷贝数多样性(CCD)与患者无病生存期(DFS)的负相关性,为肺癌预后评估提供了新指标。
ALPACA算法:解码肿瘤克隆拷贝数进化的新工具
摘要
研究团队开发了ALPACA(等位基因特异性拷贝数系统发育分析)算法,通过整合多样本bulk DNA测序数据与SNV系统发育树,实现了对肿瘤克隆特异性SCNAs的高精度推断。该方法在模拟数据中准确率达99%,显著优于现有工具HATCHet和cloneHD。应用至TRACERx421肺癌队列(421例非小细胞肺癌患者),ALPACA揭示了转移克隆特有的基因组不稳定性模式。
ALPACA算法原理
ALPACA以SNV衍生的系统发育树为骨架,通过混合整数线性规划(MILP)模型推断克隆特异性等位基因拷贝数。其创新性在于:
将复杂拷贝数反卷积问题简化为线性优化
引入LOH(杂合性缺失)事件不可逆等生物学约束
采用Kneedle算法进行模型选择优化参数λs
在单细胞数据验证中,ALPACA与真实拷贝数状态的吻合度达97%。
转移克隆的基因组特征
对TRACERx421队列中126例转移性肺癌的分析显示:
转移起始克隆(seeding clones)的SCNA数量显著高于非转移克隆(P=0.0474)
染色体11q13.3(CCND1)和8q24.21(MYC)扩增在转移路径中富集(Fisher检验P<0.05)
抑癌基因LOH事件在转移前克隆中更常见(29% vs 26%,P=0.0289)
典型案例CRUK0048中,ALPACA识别出仅占18%的微小克隆携带BRCA2/RB1位点LOH,该克隆后续形成转移灶。
多克隆转移的进化机制
比较37例多克隆转移与80例单克隆转移肿瘤发现:
多克隆转移肿瘤的克隆平均SCNA数量更高(P=0.007)
仅发生胸腔外转移的肿瘤中,MRCA克隆扩增事件更频繁(P=0.011)
提示早期获得基因组不稳定性可能赋予多个克隆转移能力。
临床预后标志物
基于克隆拷贝数多样性(CCD)的新指标:
CCD高组患者3年DFS率显著低于低组(log-rank P=0.0016)
在多变量Cox模型中,CCD是独立预后因素(HR=1.14,P=0.038)
相较传统SCNA-ITH指标,CCD对预后的分层更显著(AIC降低12.7)。
讨论
ALPACA首次实现克隆水平SCNA与SNV协同进化分析,其发现包括:
肺腺癌(LUAD)中EGFR扩增多发生于未扩张亚克隆
肺鳞癌(LUSC)中17p(TP53)LOH多为主干事件
多克隆转移肿瘤具有独特的SCNA积累模式
该研究为理解肿瘤转移的基因组基础及开发预后标志物提供了新视角。
生物通 版权所有