植物细胞转录调控元件多重分析新技术ENTRAP-seq的开发与应用

时间:2025年11月26日
来源:Nature Biotechnology

编辑推荐:

本研究针对植物转录调控蛋白功能解析技术缺失的瓶颈,开发了ENTRAP-seq(植物核内反式元件富集测序)技术,通过农杆菌介导的蛋白编码文库导入植物细胞,结合磁性核分选和测序分析,实现了数千种蛋白变体调控活性的多重并行检测。研究人员利用该技术筛选了1,495种植物病毒蛋白,鉴定出数百个具有转录激活潜力的病毒结构蛋白和酶类结构域,并通过机器学习指导的蛋白质工程成功调控了植物开花关键转录因子CONSTANS的活性。该技术为植物天然和合成编码多样性的功能解析提供了强大工具,对作物改良具有重要意义。

广告
   X   

在植物生物学研究领域,转录调控因子如同乐队的指挥,掌控着植物生长、发育和环境应答的每一个环节。然而,这些"指挥家"是如何通过蛋白质序列编码其调控功能的,一直是科学家们难以破解的谜题。传统的功能预测方法在面对转录调控域的高度无序性和低保守性时显得力不从心,而经典的随机突变筛选又因为调控域突变的表型效应微弱而难以开展。更令人困扰的是,植物转录调控的研究长期依赖于酵母或动物细胞等非植物模型系统,这些与植物在10亿年前就分道扬镳的生物,其转录调控机制能否真实反映植物的特性,实在令人怀疑。
面对这一挑战,来自美国劳伦斯伯克利国家实验室和加州大学伯克利分校的研究团队在《Nature Biotechnology》上发表了一项突破性研究,开发了一种名为ENTRAP-seq(植物核内反式元件富集测序)的高通量方法。该技术巧妙地将农杆菌介导的瞬时表达、核膜靶向标签和磁性分选相结合,首次实现了在植物细胞内并行检测数千种蛋白变体调控活性的目标。
研究团队首先优化了核分选报告系统,通过筛选发现番茄WIP2-C末端结构域(SIWIP2-C)作为外核膜标签(ONEtag),其积累水平与驱动其表达的启动子活性高度相关。随后,他们构建了包含ONEtag报告基因、BirA生物素连接酶和待测蛋白文库的T-DNA载体,通过低密度农杆菌浸润确保单个细胞仅表达一种转基因,避免了不同调控元件间的相互干扰。
研究人员利用26个已知活性的合成转录因子对ENTRAP-seq进行验证,结果显示磁珠富集分数与荧光报告基因活性高度相关(Spearman ρ=0.97),证实了该技术的可靠性。随后,他们将技术扩展至大规模病毒蛋白库筛选,从1,495种植物病毒的5,607个蛋白中鉴定出1,105个具有转录激活潜力的肽段。这些"意外"的激活域主要集中在Geminiviridae和Caulimoviridae等DNA病毒家族,以及Potyviridae和Betaflexiviridae等RNA病毒家族的结构蛋白和酶类中,如衣壳蛋白和RNA依赖的RNA聚合酶。
特别引人注目的是,研究人员发现四个病毒来源的激活域在激活强度上媲美甚至超过了常用的VP16和VPR激活域,为植物合成生物学提供了新的紧凑型工具。此外,通过比较拟南芥转录因子在酵母和本氏烟中的活性,研究揭示了两种系统间普遍存在的差异,挑战了当前关于激活域保守性的假设,强调了植物体内 assays 的必要性。
研究最令人印象深刻的应用是对拟南芥开花关键调控因子CONSTANS(CO)的蛋白质工程。通过机器学习指导的半理性突变,研究人员构建了包含350个变体的CO激活域文库,成功获得了一系列活性强弱不同的等位基因,甚至将CO从激活因子转变为抑制因子。这一成果不仅深化了对CO功能的理解,更为作物开花时间的精准调控提供了新策略。
ENTRAP-seq技术的核心创新在于将多重并行报告基因分析(MPRA)的成功经验移植到植物系统,解决了植物生物学中长期存在的技术瓶颈。与STARR-seq、DAP-seq和TARGET等技术主要关注顺式调控元件不同,ENTRAP-seq专注于反式作用因子,特别是蛋白质编码变异的功能解析。
研究的关键技术方法包括:优化核膜靶向标签系统实现启动子活性的精准报告;建立低密度农杆菌浸润技术确保单细胞单转基因表达;开发磁性核分选流程实现基于报告基因表达水平的核群体分离;利用机器学习模型PADDLE预测蛋白质激活域;结合深度测序定量分析蛋白变体的富集程度。
在技术优化方面,研究团队通过系统筛选获得了性能优异的SIWIP2-C外核膜标签,其积累水平与启动子活性呈线性相关(R2=0.91)。通过共表达核标记蛋白H2B-BFP,他们证实磁珠富集分数中的细胞核具有更高的ONEtag表达水平,且单个核内的报告基因活性与ONEtag积累高度相关(Pearson r=0.83)。
在大规模应用方面,研究人员从NCBI数据库获取1,495个植物病毒基因组,通过90%序列同一性聚类获得4,537个代表性非冗余蛋白,使用53个氨基酸的滑动窗口进行分割,利用PADDLE深度学习模型预测酸性激活域,最终筛选出2,000个高预测得分的肽段进行实验验证。
研究的重要发现包括病毒蛋白中广泛存在转录激活能力,这些激活域在蛋白中的位置相对保守,且在不同功能的病毒蛋白中均有分布。特别值得注意的是,传统的转录激活蛋白如Geminivirus的AL2蛋白,其激活域位于C端高度无序区域,而多功能病毒蛋白如RNA依赖的RNA聚合酶中的激活域则倾向于分布在稳定的折叠区域。
通过比较酵母和本氏烟系统中拟南芥转录因子肽段的活性,研究人员发现了大量系统特异性的激活域。例如,ARF19和AGL65中的多聚谷氨酰胺富集区域在本氏烟中显示激活活性,而在酵母中无此功能;相反,一些在酵母中活跃的肽段在植物系统中却表现为抑制或中性作用。这些发现挑战了转录激活机制在真核生物间完全保守的传统观点。
在蛋白质工程应用方面,研究团队以开花关键调控因子CO为模型,通过理性设计构建了350个突变体文库。突变策略基于酸性激活域的功能特征,包括减少正电荷残基、增加负电荷残基、富集疏水残基等。筛选结果与机器学习预测模型PADDLE和TADA显示中等程度的一致性(Spearman ρ=0.38-0.40),而生化特性分析证实正电荷与活性负相关,色氨酸富集与活性正相关。
研究的创新价值在于首次实现了植物细胞内蛋白质编码文库的高通量功能筛选,填补了植物功能基因组学的技术空白。与传统方法相比,ENTRAP-seq的通量提高了2,000倍,虽然分辨率相对较低,但足以区分不同强度的激活域类别。该技术为植物转录调控元件的系统鉴定、作物性状相关基因的深度突变扫描以及合成生物学元件的挖掘提供了强大平台。
从更广阔的视角看,这项研究代表了植物功能基因组学向高通量、定量化方向的重要迈进。随着基因编辑技术的发展,培育具有定量差异转录因子活性的作物品种已成为可能。ENTRAP-seq与机器学习模型的结合,将加速植物转录调控的序列-功能关系解析,为作物精准改良提供新策略。未来,将该技术扩展至所有拟南芥转录因子的系统性筛选,或将揭示植物特异性转录调控的新规律。
总之,ENTRAP-seq技术架起了植物基因序列与功能之间的重要桥梁,为理解植物转录调控的分子基础和应用蛋白质工程改良作物性状开辟了新途径。这项研究不仅解决了植物生物学中长期存在的技术挑战,更为未来植物功能基因组研究和作物改良提供了强大工具。

生物通微信公众号
微信
新浪微博


生物通 版权所有