Compact Cas12f 能够在鸟类细胞中进行基因组编辑

时间:2026年5月15日
来源:Poultry Science

编辑推荐:

韩宇珍|徐成哲|崔熙贞|韩在勇 韩国首尔国立大学农业生物技术系及农业与生命科学研究所 **摘要** 由于传统CRISPR核酸酶(如Cas9和Cas12a)的分子量较大,其在鸟类物种中的精确基因组编辑效率一直受到限制。Cas12f(也称为Cas14)是一种紧凑型CRI

广告
   X   

韩宇珍|徐成哲|崔熙贞|韩在勇
韩国首尔国立大学农业生物技术系及农业与生命科学研究所

**摘要**
由于传统CRISPR核酸酶(如Cas9和Cas12a)的分子量较大,其在鸟类物种中的精确基因组编辑效率一直受到限制。Cas12f(也称为Cas14)是一种紧凑型CRISPR核酸酶,其在哺乳动物系统中的递送效率有所提高,因此成为一种潜在的基因组编辑工具。然而,其在鸟类系统中的有效性尚未得到验证。本研究显示,Cas12f在鸡Leghorn雄性肝瘤(LMH)细胞和原始生殖细胞(PGCs)中表现出显著的转染效率和细胞内表达,并且没有检测到细胞毒性。下一代测序(NGS)结果显示,Cas12f在LMH细胞的特定位点实现了高达40%的靶向编辑效率。与Cas9介导的编辑模式不同,Cas12f主要产生缺失-主导的插入/缺失(indel)结构。通过Sanger测序和CRISPR编辑推断(ICE)分析,仅检测到少数潜在的脱靶位点,且没有超过检测阈值的脱靶突变。跨物种的计算机模拟分析也表明,随着基因组大小的增加,Cas12f的脱靶比例仅略有上升。这些发现表明,Cas12f是适用于鸟类细胞的紧凑型基因组编辑工具,为遗传工程和生物技术研究提供了新的可能性。

**引言**
历史上,鸡一直是人类蛋白质的重要来源,在研究和工业领域具有多种应用价值。由于其卵生特性,鸡胚胎易于获取和操作,使其成为胚胎发育研究的理想模型动物(Lee等人,2019年)。此外,鸡作为研究人类健康和疾病的模型动物也越来越受到重视,因为它们的遗传和生理特征有助于探究复杂的生物过程。因此,在鸡中进行精确的基因组编辑在科学和实践上都具有重要的意义(Han和Lee,2017年)。

基因组编辑技术的发展,包括锌指核酸酶(ZFNs)、转录激活因子样效应核酸酶(TALENs)以及成簇规律间隔短回文重复序列(CRISPR)/CRISPR相关蛋白(Cas)系统,极大地改变了基因组编辑动物的生成方式(Khalil,2020年)。特别是Cas9(1,368个氨基酸)和Cas12a(1,307个氨基酸)核酸酶,由于其高效性和灵活性而被广泛用于靶向基因修饰(Swarts和Jinek,2018年)。然而,它们的相对较大分子量往往限制了递送效率,尤其是在转染能力较低的系统中,如鸡细胞(Vergara等人,2015年;Molnar等人,2004年)。这促使人们关注那些既能保持高效编辑活性又能提高递送能力的紧凑型Cas变体。

Cas12f(也称为Cas14)是一种体积极小的II类V型CRISPR核酸酶,仅包含400-700个氨基酸,能够切割含有T富集5’ PAM序列(5’-TTTR-3’,R = A或G)的DNA(Harrington等人,2018年)。Cas12f含有一个RuvC核酸酶结构域,能够诱导双链DNA(dsDNA)断裂,这些断裂主要由宿主细胞通过非同源末端连接(NHEJ)修复(Karvelis等人,2020年)。其紧凑的体积使其特别适合用于体内基因治疗应用或载量有限的载体系统,如腺相关病毒(AAV)和禽腺相关病毒(A3V)(Wu等人,2021年;Cui等人,2024年;Robinson等人,2022年)。然而,天然Cas12f在真核细胞中的活性通常很低(Kim等人,2022年)。最近的研究表明,经过工程改造的Cas12f变体可以在细菌和哺乳动物细胞中诱导靶向突变,这突显了它们作为高效基因组编辑工具的潜力。具体来说,Cas12f_ge4.1是一种通过重新设计引导RNA(gRNA)结构来克服天然Un1Cas12f1低切割活性的工程变体,其平均插入/缺失频率比原始系统提高了约867倍,并保持了与Cas9相当的效果同时保持了高靶向特异性(Kim等人,2022年)。尽管在细菌和哺乳动物系统中工程化Cas12f系统取得了进展,但其在鸟类系统中的应用仍待探索。在鸡细胞中建立Cas12f介导的编辑平台将推动鸟类遗传工程的发展。本文报告了首次在鸟类系统中验证Cas12f介导的编辑实验结果,评估了其在鸡细胞中的可行性和效率,重点关注转染效率、靶向编辑效率和细胞存活率。这些结果为在鸟类基因组编辑中应用紧凑型CRISPR系统奠定了基础。

**材料与方法**
**载体构建**
用于Cas9介导的编辑,使用了pSpCas9(BB)-2A-GFP(PX458)(#48138,Addgene,美国马萨诸塞州)和pSpCas9(BB)-2A-Puro(PX459)(#48139,Addgene)质粒。用于Cas12f介导的编辑,使用了Cas12f-GE ver4.1(_GFP)(#176544,Addgene)质粒,通过EcoRI限制性内切酶(#R0101L,New England Biolabs,美国马萨诸塞州)和T4连接酶(#2011A,Takara,日本滋贺县)将GFP cassette替换为嘌呤霉素抗性基因来生成Cas12f-GE ver4.1_Puro。引导RNA序列(表1)使用BpiI(BbsI)限制性内切酶(#ER1011,Thermo Fisher,美国马萨诸塞州)和T4连接酶通过Golden Gate组装技术插入每个载体中。所有质粒均按照制造商说明使用Plasmid Transfection-grade Prep Kit(#740490,德国杜伦)或Endo-free plasmid maxi kit(#12362,Qiagen,德国希伦)进行纯化。

**表1. sgRNA靶向位点**
| 名称 | 5’-gRNA序列 | 3’ | 染色体 | 位点 | 核酸酶 |
|------|-----------|-------|------|-------|------|
| COL8A1 | CCC ACA GGG CCC TGA GGG CCC | M000093.58 | 5386690 | Cas12f, Cas9 |
| MYLIP | CTG CCA GTG AAC TGC AGC CCC | M000094.56 | 1480697 | Cas12f#1 |
| GCA GTT CAC TGG CAG CAA AG | 1480703 | Cas9#2 |
| TGC AGT TCA CTG GCA GCA AA | 1480702 | NOD1 |
| CTG AAG GTA TAC CGA GAG CTC | M000094.54 | 1184989 | Cas12f#1 |
| GAA GGT ATA CCG AGA GCT | 1184996 | Cas9#2 |
| AGC AAA GCA ATG CAG GAT GG | 1184976 | RAG1 |
| TTT TCC TAG GAA CAG CAC GAC | M000097.51 | 9742909 | Cas12f, Cas9 |
| VEGF | TG TGC TGT AAG AAG CTC | M000095.53 | 782729 | Cas12f#1 |
| CGC TAT GTG CTG ACT CTG AT | 30782757 | Cas9#2 |

**细胞培养和转染**
Leghorn雄性肝瘤(LMH)细胞每2-4天在添加了胎牛血清(FBS)和抗生素-抗真菌剂(ABAM)的Waymouth's Medium(#11220035,Thermo Fisher)中传代一次。LMH细胞在37°C、5% CO2和60-70%相对湿度条件下培养。
对于LMH细胞,将3 µL Lipofectamine 2000试剂(#11668027,Thermo Fisher)和2 µg CRISPR质粒混合在500 µL Opti-MEM(#31985070,Thermo Fisher)中,然后加入1×10^5个LMH细胞。转染后6小时更换培养基,并在转染后48小时向LMH培养基中加入嘌呤霉素(1.5 μg/mL),筛选持续2天,此时大部分野生型(WT)细胞会死亡。
鸡原始生殖细胞(PGCs)从胚胎第6天(E6)的韩国Ogye胚胎的生殖腺中分离。PGCs每3-5天在添加了7.5% FBS、2.5%鸡血清、核苷酸、非必需氨基酸、β-巯基乙醇、10 mM丙酮酸和人基本成纤维细胞生长因子(10 ng/ml)的knockout DMEM(#10829018,Thermo Fisher)中传代一次。PGCs在37°C、5% CO2和60-70%相对湿度条件下培养。
对于PGCs,将3 µL Lipofectamine 2000试剂和2 µg CRISPR质粒悬浮在100 µL Opti-MEM中,然后加入1×10^5个PGCs和400 µL PGC培养基。每1-1.5小时轻轻吹打细胞一次,转染后6小时更换培养基。所有实验均使用传代次数小于30次的PGCs。

**流式细胞术分析**
转染后的细胞被收集并重新悬浮在Flow缓冲液(2% FBS in PBS)中,使用Attune NxT流式细胞仪(Thermo Fisher)进行分析。后续分析使用FlowJo软件(Treestar,美国俄勒冈州)进行。每个样本收集≥30,000个事件,GFP阳性细胞相对于载体对照组进行定义。通过Live/Dead Fixable Near-IR Dead Cell Stain Kit(#L34975,Thermo Fisher)区分细胞存活率。门控策略见图S1。

**gDNA提取、PCR和PCR纯化**
从每个细胞样本中提取基因组DNA(gDNA),使用NanoDrop-2000(Thermo Scientific)测量DNA浓度。每个样本的最终DNA浓度稀释至100 ng/µL,用于PCR。引物根据美国国家生物技术信息中心(NCBI)提供的鸡基因组序列使用Geneious Prime(GraphPad Software,美国马萨诸塞州)设计并合成(Cosmogenetech,韩国首尔)(表S1)。PCR反应总体积为20 µL,包含0.4 µL dNTP(每种10 mM,#DN112-10h,Biofact,韩国首尔)、2 µL 10X Buffer、0.1 µL Taq聚合酶(5单位/µL,#ST111-50h,Biofact)、4 µL 5X Band Helper(#BB741-10k,Biofact)、1 µL每种引物(10 µM)和9.5 µL Ultra-Pure Water(#ML019-02,Welgene,韩国南川)。PCR条件为:初始变性95°C 5分钟,随后35个循环95°C变性30秒,适当温度退火30秒,72°C延伸60秒,最后72°C延伸10分钟。通过1.5%琼脂糖凝胶电泳确认目标位点的成功扩增后,使用Wizard™ SV Gel and PCR Clean-Up System(#A9282,Promega,美国威斯康星州)纯化每个扩增子。

**下一代测序(NGS)分析**
NGS分析外包给Bionics(韩国首尔),使用MiSeq系统(Illumina,美国加利福尼亚州)。FASTQ(.fastq.gz)文件使用CRISPResso2(Clement等人,2019)进行分析。Cas12f和Cas9的定量窗口分别设置在gRNA间隔序列3′端下游2 bp和上游3 bp处,窗口大小为每侧10 bp。仅量化插入/缺失频率,排除替换突变。

**扩增子分析**
扩增子还通过T7内切酶I(T7E1)检测(#M0302L,New England Biolabs,美国马萨诸塞州)进行分析。变性后,扩增子重新退火形成双链DNA,然后在37°C下用T7E1处理20分钟,再进行2%琼脂糖凝胶电泳。图像由ChemiDoc XRS+ System(Bio-Rad,美国加州)和Image Lab Software(Bio-Rad)分析。

**脱靶位点预测和分析**
使用CRISPR RGEN工具Cas-OFFinder(Bae等人,2014)(http://www.regenome.net/cas-offinder/)预测潜在的脱靶位点。在鸡参考基因组Gallus_gallus-6.0(GCRc6a)中选择最多有3个碱基错配的潜在脱靶位点(表S2)。每个位点使用特异性引物(表1)扩增,并通过ABI Prism 3730XL DNA Analyzer(Thermo Fisher)和可用软件(https://ice.editco.bio/#/)进行CRISPR编辑推断(ICE)分析(Conant等人,2022)。当未检测到脱靶位点时,将脱靶频率设定为ICE分析的检测限(1%)以计算特异性比率。

**分析基因组大小对脱靶比例的影响**
使用以下参考基因组分析基因组大小对预测脱靶比例的影响:鸡(Gallus gallus,GRCg6a)、猪(Sus scrofa,susScr11)、小鼠(Mus musculus,mm10)、大鼠(Rattus norvegicus,rn5)和人类(Homo sapiens,GRCh38)。

**统计分析**
统计分析使用GraphPad Prism(GraphPad Software,美国马萨诸塞州)进行。两组之间的统计显著性通过双尾非配对Student’s t检验和Welch’s t检验确定。当P<0.05时认为差异具有统计学意义。所有数据表示平均值±标准误差(SEM)。

**结果**
**Cas12f在鸡细胞中的递送和表达**
为了评估Cas12f的递送效率和细胞内表达,将LMH细胞和PGCs转染表达GFP的质粒,这些质粒编码Cas12f或Cas9。Cas9作为参考核酸酶。两种构建体具有相同的启动子和报告基因配置,包括CMV驱动的核酸酶表达,随后是T2A连接的GFP cassette和U6驱动的单一引导RNA(sgRNA)模块,从而可以直接比较核酸酶的表达水平(图1A)。明场和GFP荧光成像显示两种细胞类型均成功转染,引入任一构建体后均可轻松检测到GFP阳性细胞(图1B)。

**下载:** 下载高分辨率图像(688KB)
**下载:** 下载全尺寸图像

**图1. Cas12f和Cas9在LMH细胞和PGCs中的细胞存活率和转染性能评估**
(A)Cas12f和Cas9表达质粒的示意图。两种构建体均包含CMV启动子驱动的核酸酶(Cas12f或Cas9),随后是T2A连接的GFP报告基因和U6启动子驱动的sgRNA cassette。为了细菌筛选,包含了一个氨苄西林抗性基因(Amp)。(B) 代表性的明场和GFP荧光图像显示了在LMH细胞和PGCs中传递Cas12f或Cas9构建体后的转染结果。刻度尺=50 μm。(C) 转染后48小时对两种细胞类型的细胞活力进行量化,结果显示Cas12f和Cas9之间没有显著差异。(D) 基于GFP的转染效率测量显示Cas12f在两种细胞类型中的转染率变化较大但总体一致。(E) 对LMH细胞和PGCs中的平均GFP荧光强度进行量化。Cas12f转染的细胞表现出强烈的GFP表达,表明其表达和传递效率很高。数据代表三个独立生物学重复实验的平均值±标准误差(SEM)。P值通过双尾非配对Student’s t检验确定。统计显著性表示为*P<0.05、**P<0.01、***P<0.001和****P<0.0001。为了确定紧凑型Cas12f的表达是否影响细胞活力,在转染后48小时对LMH和PGCs的细胞存活进行了评估。在LMH细胞(90.07 ± 0.96% vs. 92.67 ± 1.46%,n=3)和PGCs(96.74 ± 0.349% vs. 95.97 ± 0.20%,n=3)中,Cas12f处理组与对照组之间没有观察到显著差异(图1C)。这些结果表明,Cas12f的有效传递和表达与细胞毒性增加无关。为了评估转染效率和细胞内表达,进行了流式细胞术分析。Cas12f在LMH细胞(62.50 ± 0.95% vs. 43.67 ± 1.19%,n=3,P<0.001)和PGCs(16.33 ± 0.84% vs. 8.01 ± 2.22%,n=3,P=0.025)中成功传递并表达(图1D)。同样,作为转基因表达代理的平均GFP荧光强度在Cas12f表达的细胞中也显著增加(LMH细胞为112247 ± 2004.08 vs. 60981 ± 956.70,n=3,P<0.001;PGCs为23739 ± 1539.49 vs. 9880 ± 435.55,n=3,P<0.001)(图1E,图S1C)。总体而言,这些数据证实Cas12f是一种在禽类细胞中具有适当传递和表达能力的基因组编辑核酸酶。

**Cas12f在LMH细胞中的靶向基因组编辑**
LMH细胞和PGCs被转染了含有Cas12f或Cas9表达质粒,这些质粒允许使用嘌呤霉素进行筛选,通过NGS评估了靶向基因组编辑的效率。两种载体具有相同的启动子和报告基因配置,包括由CMV驱动的核酸酶表达,随后是一个T2A连接的嘌呤霉素抗性基因(Puro)盒和一个U6驱动的sgRNA模块(图2A)。设计了针对胶原蛋白类型VIII alpha 1(COL8A1)外显子1、含有核苷酸结合寡聚化结构域1(NOD1)的重组激活基因1(RAG1)、肌球蛋白调节轻链相互作用蛋白(MYLIP)外显子2以及血管内皮生长因子A(VEGFA)外显子4的sgRNAs,这些sgRNAs的PAM序列基于Cas12f的TTTR和Cas9的典型NGG(N = A或T或C或G)。为了使用相同的间隔序列直接比较Cas12f和Cas9,目标位点需要包含TTTR–N20–NGG基序。然而,在大多数目标基因的合适外显子位置上不容易找到这样的基序。因此,只在COL8A1和RAG1上应用了共享的间隔序列,因为在这些基因中找到了合适的位点。对于MYLIP、NOD1和VEGFA,选择了位于选定Cas12f位点附近的Cas9目标位点,以便在同一外显子内进行比较(图2B;表1)。

**下载:**下载高分辨率图像(748KB)
**下载:**下载全尺寸图像

**图2. Cas12f在LMH细胞中的基因组编辑活动**
(A) Cas12f和Cas9表达质粒的示意图。这两种构建体都包含一个由CMV启动子驱动的核酸酶(Cas12f或Cas9),随后是一个T2A连接的嘌呤霉素抗性基因(Puro),以及一个由U6启动子驱动的sgRNA盒。包含了一个氨苄西林抗性基因(Amp)用于细菌筛选。
(B) 目标位点的示意图。Cas12f的PAM(红色,TTTR)、目标序列(蓝色,N20)和Cas9的PAM(绿色,NGG)被标出。sgRNAs的目标位点设计在COL8A1、RAG1和NOD1的外显子1,MYLIP的外显子2,以及VEGFA的外显子4。对于MYLIP、NOD1和VEGFA,在同一外显子内测试了两个独立的Cas9 sgRNAs,并分别显示了编辑效率。
(C) 用Cas12f或Cas9转染的莱格霍恩雄性肝癌(LMH)细胞的代表性明场图像。图像显示了转染和嘌呤霉素筛选后的整体细胞形态和活力。刻度尺=50 μm。
(D) 在COL8A1、MYLIP、NOD1、RAG1和VEGFA位点的基因组编辑效率。Cas12f和Cas9介导的编辑效率通过基于NGS的深度测序进行了量化。数据代表三个独立生物学重复实验的平均值±标准误差(SEM)。P值通过双尾非配对Student’s t检验确定。统计显著性表示为*P<0.05、**P<0.01和***P<0.001。
(E) Cas12f和Cas9在所有目标位点的平均基因组编辑效率比较。数据代表平均值±标准误差(SEM)。P值通过Welch’s t检验确定。

**LMH细胞在转染Cas12f或Cas9后48小时以及嘌呤霉素筛选48小时后的形态和活力**
转染Cas12f或Cas9的LMH细胞在转染后48小时和嘌呤霉素筛选48小时后显示出相似的形态和活力(图2C)。随后通过基于NGS的深度测序评估了每个目标位点的基因组编辑效率。

**Cas12f在所有测试位点诱导了可检测的靶向编辑,尽管观察到了位点依赖的变异性**
为了进一步表征Cas12f在LMH细胞中的基因组编辑,我们分析了每个目标位点周围的插入缺失(indel)模式。对于Cas9,最大编辑活性发生在目标位点3′端上游3 bp处,与其切割位点一致;而对于Cas12f,最大编辑活性发生在3′端下游2 bp处。Cas12f产生了广泛的缺失峰,而插入事件相对较少且大小有限(图3A)。

**下载:**下载高分辨率图像(513KB)
**下载:**下载全尺寸图像

**图3. Cas12f在LMH细胞中产生的插入缺失模式**
(A) Cas12f和Cas9介导的编辑的代表性插入缺失大小分布图。红色峰值代表缺失事件,绿色峰值表示插入事件。垂直虚线表示预测的核酸酶切割位置,灰色阴影区域表示用于分析的量化窗口。
(B) 比较Cas12f和Cas9在每个位点产生的平均插入和缺失大小。数据代表三个独立生物学重复实验的平均值±标准误差(SEM)。P值通过双尾非配对Student’s t检验确定。统计显著性表示为*P<0.05、**P<0.01、***P<0.001和****P<0.0001。
(C) 比较Cas12f和Cas9在所有目标位点产生的平均插入和缺失大小。Cas12f诱导的缺失显著更大,而插入大小则小于Cas9。数据代表平均值±标准误差(SEM)。P值通过Welch’s t检验确定。统计显著性表示为***P<0.001。

**跨共享目标位点的定量比较显示,Cas12f产生的平均缺失显著大于Cas9通常报告的插入缺失模式**
在COL8A1位点,Cas12f产生的平均缺失显著大于Cas9;而在RAG1位点则相反(图3B;表3)。当将五个目标位点的编辑效率汇总进行综合分析时,Cas12f介导的编辑效率略低于Cas9(21.60 ± 3.56% vs. 31.93 ± 4.25%,P=0.069),并且与Cas9介导的编辑相比没有达到统计显著性(图2E)。因此,一种核酸酶相对于另一种的明显优势是依赖于上下文而非绝对的。总体而言,这些结果表明Cas12f可以在鸡细胞中实现可测量的、但依赖于位点的靶向基因组编辑效率。

**表2. Cas12f和Cas9在LMH细胞中的靶向基因组编辑效率**
目标基因 | 核酸酶 | 编辑效率(%) | SEM值(与Cas12f相比)
|-------|---------|-----------|-------------|--------------|-----------------|-----------------|-----------------|-----------------|-----------------|-----------------|该特性在通过质粒传递时可能有助于提高转录和翻译效率(图1B-E),这与先前的研究结果一致,即较小的蛋白质通常具有更高的翻译效率(Fernandes等人,2017年)和更好的细胞内折叠能力(Farías-Rico等人,2018年)。此外,较低的载荷需求意味着对于其他传递形式(包括核糖核蛋白(RNPs)和信使RNA(mRNA)传递)也有额外的好处。重要的是,Cas12f的紧凑尺寸可能为其在A3V介导的体内应用提供实际优势。尽管已有报道表明A3V能够在鸟类物种中实现高效的基因传递(Robinson等人,2022年;Matsui等人,2012年),但其有限的包装容量(约4.7 kb)限制了像Cas9这样的大型核酸酶的使用,通常需要双载体策略,这会导致共转导效率的变异性(Terada等人,2025年)。在这种情况下,Cas12f可以与其引导RNA一起包装在单个A3V载体中,从而简化载体设计和传递过程。此外,基于AAV的系统已被证明具有组织趋向性(Terada等人,2025年),这表明有可能在体内进行组织特异性的体细胞基因组编辑。然而,这些潜在优势仍需在鸟类体内系统中通过实验验证。因此,需要进一步的研究来确定基于Cas12f的平台是否可以成功应用于细胞类型特异性的功能研究和体内靶向基因组修饰。

目标基因的选择基于它们在血管功能、免疫反应、炎症调节和代谢稳态等主要生物学轴中的作用(Lee等人,2022年;Pérez-Gutiérrez和Ferrara,2023年;Li和Shang,2024年;Weissglas-Volkov等人,2011年;Liu等人,2024年)(图2B)。研究发现Cas12f的表达水平与编辑效率之间存在位点依赖性。虽然在RAG1位点上Cas12f的活性低于Cas9,但在大多数检测的位点上仍实现了可变的编辑效率(图2D,E)。虽然先前的研究报道了Cas12f在体外的活性较低(Karvelis等人,2020年),但本研究进一步证明了其在鸡细胞中的位点依赖性且有意义的编辑活性。这一观察结果与哺乳动物系统中的报道一致,即Cas12f的活性显著受到局部序列环境和目标结构的影响(Park等人,2025年;Xin等人,2022年)。重要的是,这些结果表明,仅高表达Cas12f并不能保证高编辑效率。尽管Cas12f表现出相对较高的转染效率和表达水平,但基因组编辑效果并非在所有位点上都成比例增加。这种差异可能反映了多种因素的影响,包括PAM兼容性、染色质可及性、目标依赖性变异性以及核酸酶本身的活性,这突显了目标选择和gRNA优化的重要性(Jensen等人,2017年)。

在所有测试的位点上,一致观察到以缺失为主的插入缺失(indel)模式,而插入事件相对较少(图3B,3C)。这种模式表明Cas12f引入的切割结果与Cas9不同。这种偏向于较大缺失的倾向可能对基因敲除应用有利,因为这些应用需要有效破坏编码序列。这种indel模式可以解释为Cas12f在PAM序列远端的位点引入双链断裂(DSB)。因此,PAM在初始的NHEJ修复后可能保持完整,并可能促进反复的切割和修复循环,从而随时间累积突变(Kim等人,2022年)。此外,Cas12f的不对称切割模式可以产生较长的5′突出端,这可能有助于经典NHEJ过程中的末端切除,进一步偏向于缺失的形成(Xiao等人,2021年)。这些切割特性也可能降低单碱基插入、载体片段整合和染色体易位的频率,而这些现象与Cas9介导的平端切割有关(Xin等人,2022年)。然而,Cas12f是否支持同源定向修复(HDR)尚不清楚,其是否适合精确的敲入策略还需要进一步研究。

本研究还探讨了Cas12f的脱靶效应。由于其紧凑的结构,Cas12f具有简化的PAM识别界面和较小的DNA接触面积(Xiao等人,2021年),这可能限制了其对错配的容忍度。与此一致,ICE分析在测试的位点上检测到极少的脱靶信号(图4C)。此外,先前的研究(Bae等人,2014年;Tsai等人,2015年;Lazzarotto等人,2020年;Piao等人,2022年)报告了计算机预测的脱靶位点数量与实验观察到的脱靶编辑频率之间的正相关关系。在这种情况下,Cas12f预测的脱靶位点数量相对较少(图4A,B)可能表明其无意中引起基因组修饰的可能性较低。

除了位点特异性分析外,我们的跨物种计算机比较表明,Cas12f的潜在脱靶效应可能因基因组背景的不同而异,包括基因组组装大小的差异。当在基因组大小逐渐增加的物种中分析相同的保守目标序列时,预测的Cas12f脱靶位点比例逐渐增加(图5A,B)。这些计算观察结果提示,脱靶负担不仅由核酸酶本身的特性或引导序列组成决定,还可能受到更广泛基因组背景的影响(Tsai等人,2015年)。在像鸟类这样的相对紧凑的基因组中(Kapusta等人,2017年),部分匹配序列的搜索空间较小,理论上可能限制了脱靶机会。然而,由于这项分析仅基于计算机预测,因此无法证明不同物种之间的特异性差异。因此,需要通过实验验证来确定Cas12f在不同基因组背景下的表现是否有所不同。

本研究存在一些局限性,在解释结果时应予以考虑。由于Cas12f和Cas9对PAM的要求不同,直接进行头对头比较受到限制,从而限制了完全匹配的目标位点的可用性。此外,低频脱靶事件无法完全评估,表明需要高分辨率、无偏见的全基因组检测方法,如CIRCLE-seq(Tsai等人,2017年)或GUIDE-seq(Tsai等人,2015年)。由于当前的脱靶分析依赖于Sanger测序和ICE分析,因此无法可靠地检测到低于约1%的低频编辑事件。此外,尽管观察到了目标间的变异性,但这种趋势在保守位点上是一致的。由于这项分析仅基于计算机预测,因此无法确定基因组大小与脱靶倾向之间的因果关系。

尽管LMH细胞因其可靠的转染兼容性而被广泛用于鸟类基因组编辑研究(Vilela等人,2020年;Xu等人,2023年;Han等人,2026年),但它们是肿瘤来源的细胞,可能无法完全再现正常原代细胞的编辑特性。此外,虽然评估了PGCs中的转染效率和细胞毒性,但本研究并未直接量化PGCs中的基因组编辑效率。由于已知鸟类PGCs由于其特定的DNA修复特性而表现出相对较低的编辑效率(Lee等人,2020年;Rengaraj等人,2022年),因此PGCs实验主要是为了评估紧凑型Cas12f平台的传递可行性和细胞兼容性。因此,需要在原代鸟类细胞和PGCs中进行进一步评估,以更全面地评估基于Cas12f的基因组编辑的生物学适用性和特异性。

总之,Cas12f在鸡细胞中表现出可测量且可重复的基因组编辑活性。这些特性支持其在抗病育种、与生产力相关的性状修饰和基础生物学研究中的潜在应用。进一步的优化,包括密码子优化、gRNA设计的改进以及在多种基因组位点上的验证,可能会提高Cas12f的性能并扩展其在鸟类研究中的应用。

**数据可用性**
本研究生成或分析的所有数据均包含在已发表的文章及其补充信息文件中。

**作者贡献**
Y.H.和J.Y.H.主要构思和设计了这项工作。Y.H.进行了实验。Y.H.和S.J.W.、H.J.C.解释了数据。Y.H.撰写了文章的第一稿,S.J.W.、H.J.C.和J.Y.H.协助撰写了最终版本。所有作者都阅读并同意了发表的手稿版本。

**作者贡献声明**
Yujin Han:撰写——原始草稿、可视化、方法学、数据分析、概念化。
Seung Je Woo:撰写——审阅与编辑、方法学、数据分析。
Hee Jung Choi:撰写——审阅与编辑、方法学、数据分析。
Jae Yong Han:撰写——审阅与编辑、监督、项目管理、资金获取、概念化。

生物通微信公众号
微信
新浪微博


生物通 版权所有