随着 CRISPR-Cas9 技术逐渐走进临床应用,人们越来越担心它可能带来的潜在风险。之前的研究已经发现,该技术可能会导致脱靶突变,就像是射箭时没有射中靶心,反而射到了其他地方。除此之外,还有研究表明它会产生一些意想不到的基因变化,比如非随机的大片段和复杂结构变异、单核苷酸变异增加以及杂合性频繁缺失等。但是,这些研究大多是在没有供体模板的情况下进行的。在实际的基因编辑操作中,供体模板起着重要作用,它就像一个 “模板指南”,引导细胞按照我们的期望对基因进行修改。可不同类型的供体序列对 Cas9 介导的基因编辑结果有什么影响?Cas9 诱导的意外大片段插入(LgIns)情况究竟如何?这些问题就像一团迷雾,一直困扰着科研人员。为了拨开这团迷雾,来自阿卜杜拉国王科技大学(King Abdullah University of Science and Technology,KAUST)的研究人员展开了深入研究。他们的研究成果发表在《Communications Biology》杂志上,为我们理解 CRISPR-Cas9 技术的潜在风险提供了重要线索。
研究人员主要运用了两种关键技术方法。一是长读长测序技术 IDMseq(Individual Molecule DNA sequencing),它能给原始目标 DNA 加上独特分子标识符(UMIs),就像给每个 DNA 分子贴上了独一无二的 “小标签”,这样就能对 Cas9 编辑后的细胞中数万个等位基因进行分析,检测出频率低至 0.004% 的各种变异类型 。二是牛津纳米孔技术(ONT)测序,通过这种技术对编辑后的基因位点进行测序,获取详细的基因信息。研究中使用的样本是人类胚胎干细胞(hESCs),这些细胞为研究提供了重要的实验材料。
研究人员进一步探究插入 DNA 的来源,发现未添加供体模板样本中,大多数插入 DNA 是独特的,96.15% 能与人类 hg38 参考基因组比对上,但都不与假定的脱靶位点重叠。25% 的插入 DNA 来自 Cas9 切割位点附近区域(±2kb),其余分别来自靶染色体的远端区域(23.08%)或其他染色体(48.08%)。有趣的是,还检测到两个无法与已知核苷酸序列比对上的插入 DNA,这表明在 Cas9 编辑过程中可能通过易错的 DNA 修复机制产生了新的序列。
Cas9 诱导大片段插入的功能分析揭示插入 DNA 的基因组热点来源
通过对插入 DNA 和编辑区域进行多序列比对,发现它们之间没有明显相似性。利用 RepeatMasker 数据库注释发现,未添加供体模板样本中,大量插入 DNA(46.15%,不包括切割位点 ±2kb 区域内的)来自基因组重复区域,这些区域包含散布重复序列和低复杂性 DNA 序列。其中,逆转座子元件(REs),如长末端重复序列(LTRs)、长散在核元件(LINEs)和短散在核元件(SINEs)占重复序列的 86.21% 。所有插入的 LINEs 都是截断的,且大多数是 LINE1 元件(87.5%)。通过卡方检验发现,各种 RE 插入的观察值与预期值接近,说明 RE 插入的普遍性可能是随机的,意味着 DNA 修复机制在基于 DSB 的 Cas9 编辑过程中随机获取了基因组片段。