兰州百合MADS-box基因家族的全基因组分析与非生物胁迫下的表达模式解析

时间:2026年3月14日
来源:International Journal of Molecular Sciences

编辑推荐:

这篇研究首次在基因组水平上对兰州百合(Lilium davidii var. unicolor)的MADS-box转录因子家族进行了系统分析,成功鉴定出62个LdMADS基因。研究发现该家族的SOC1亚家族显著扩张,并揭示了LdMADS基因在染色体上的分布、组织特异性表达模式及其在干旱、高温和低温胁迫下的响应,为深入理解MADS-box基因在百合发育与抗逆性中的功能提供了重要依据。

广告
   X   

1. 引言
转录因子(TFs)是调节高等植物基因表达并执行多种功能的关键蛋白,在植物发育、器官发生、胁迫响应和激素信号传导中扮演主要角色。在众多转录因子家族中,MADS-box家族是真核生物中最为广泛的家族之一。所有MADS-box基因编码的蛋白在其N端都包含一个由约60个氨基酸组成的保守MADS结构域。根据其蛋白结构域,MADS-box基因可分为两个谱系:Type I(亦称M型)和Type II。其中,Type II MADS转录因子包含四个特征结构域,称为MIKC型TFs,它们又可进一步细分为MIKCC和MIKC*两类。特别是MIKCC型成员,在植物发育的几乎所有阶段都发挥重要作用。
MADS-box蛋白形成二聚体,通过其保守的MADS结构域与DNA相互作用,识别一个称为CArG-box的10 bp共有基序。在高等植物中,MADS-box TFs是许多生物过程的关键调节因子,包括花发育、营养和能量代谢、信号转导、休眠解除、种子萌发和果实发育。此外,越来越多的研究表明MADS-box TFs也参与各种胁迫响应。例如,在番茄中过表达SlMBP22可通过改善保水性、渗透调节物积累和抗氧化能力来增强耐旱性。在栽培稻(Oryza sativa)中,OsMADS22、OsMADS26和OsMADS55已被证明参与胁迫响应。值得注意的是,MADS-box蛋白识别的CArG-box基序普遍存在于许多防御相关基因的启动子中。因此,阐明MADS-box基因在生物和非生物胁迫下的作用,对于植物育种和作物改良具有重要价值。
兰州百合是川百合的一个变种,主要分布在中国甘肃省兰州市以南的高原地区。其主要种植区为典型的温带大陆性气候,降水分布不均且稀少,生长季常发生干旱。同时,早春晚霜和夏季的极端温度波动使植物面临高低温胁迫。这些非生物胁迫已成为限制兰州百合产量和品质的主要因素。兰州百合的基因组巨大,约为36.68 Gb,这给其遗传和育种研究带来了挑战。2024年其染色体水平基因组组装完成,使得对兰州百合MADS-box基因进行全基因组鉴定成为可能。本研究旨在对兰州百合中的MADS-box基因家族进行全基因组鉴定,分析其成员特征,并探究其在干旱、高温和低温胁迫下的表达变化,初步鉴定潜在的LdMADS关键基因,为兰州百合的种质资源改良和耐逆性研究提供理论基础。
2. 结果
2.1. LdMADS基因的鉴定与理化性质
在兰州百合的基因组中,共鉴定出62个MADS-box基因,并根据其染色体位置系统命名为LdMADS1至LdMADS62。这62个LdMADS蛋白的长度从110个氨基酸(LdMADS57)到423个氨基酸(LdMADS11)不等,分子量在12.449 kDa(LdMADS57)到48.087 kDa(LdMADS11)之间,等电点(pI)范围为4.92(LdMADS58)到10.04(LdMADS29)。
2.2. LdMADS基因的系统发育分析
为探究兰州百合MADS-box基因的系统发育关系,研究者将其蛋白序列与拟南芥(A. thaliana)和水稻(O. sativa)的序列比对,分别构建了Type I和Type II的系统发育树。系统发育分析结果表明,有17个LdMADS蛋白属于Type I谱系,可进一步分为两个亚组,包括10个Mα和7个Mγ。值得注意的是,在兰州百合基因组中没有发现Mβ亚组成员。有45个LdMADS蛋白被鉴定为Type II,其中包括3个MIKC*和42个MIKCC成员。此外,MIKCC型LdMADS蛋白分布在11个亚家族中,包括SEP、AGL6、SQUA、AG、AGL12、SOC1、DEF/GLO、GGM13、AGL17、SVP和MADS32,未检测到属于FLC或AGL15亚家族的成员。
总体而言,兰州百合的Type II蛋白数量与水稻和拟南芥相似,而Type I蛋白的数量相对较少。特别值得注意的是,SOC1亚家族在兰州百合中发生了显著的扩张,包含了22个结构完整的SOC1蛋白。
2.3. LdMADS基因的保守基序与基因结构分析
为研究不同成员和亚家族之间共享的基序,研究者使用在线工具MEME分析了62个LdMADS蛋白,在其氨基酸序列中识别出15个不同的基序。其中,Motif1和Motif3由大多数LdMADS蛋白共享,共同编码高度保守的M结构域。Motif2、Motif6、Motif9和Motif12对应于K-box,且仅在MIKC蛋白中发现。尽管C端区域的保守性整体较低,但属于同一亚家族的蛋白倾向于具有相似的基序组成,这表明存在一定程度的亚家族特异性保守。这些模式表明,基序结构在每个亚家族内部大体一致,但在不同亚家族之间存在差异,这一特征可能反映了它们各自的功能特异性。
为了探究62个LdMADS基因的结构进化,研究者分析了它们的基因结构。分析显示,LdMADS基因在基因长度和内含子数量上存在相当大的差异,内含子数量从0到10个不等。具体而言,LdMADS53和LdMADS56内含子数量最多,各有10个。相比之下,有11个基因(LdMADS6、LdMADS12、LdMADS35、LdMADS37、LdMADS38、LdMADS39、LdMADS48、LdMADS57、LdMADS58、LdMADS60和LdMADS62)完全不含内含子,仅由一个外显子构成。此外,MIKC型基因通常含有3到10个内含子,而M型基因含有0到3个内含子。
值得注意的是,相当大比例的LdMADS基因异常长。有30个基因(48.39%)长度超过50 kb,因此被归类为超长基因。即使在同一亚家族内,也观察到了相当大的基因长度变异。鉴于LdMADS基因的内含子数量与其他植物相当,其超长的基因长度主要归因于极其长的内含子。先前的研究表明,百合基因组的扩张主要是由于转座元件的增殖显著延长了基因间区和内含子区域,同时全基因组复制和串联复制事件也有贡献。
2.4. 染色体定位与共线性分析
为了研究MADS-box家族的遗传分化和基因复制事件,研究者利用兰州百合基因组数据生成了染色体定位图。除了LdMADS62位于一个未组装的支架上,其余61个LdMADS成员分布在全部12条染色体上,但分布极不均匀。4号染色体以22个基因的数量最为突出,7号染色体以12个基因位居第二。5号、11号和12号染色体上各仅定位到一个基因。Type II的SOC1亚家族成员主要集中在4号和7号染色体上。Type I Mα亚家族的一半成员集中在7号染色体上。
研究者使用MCScan扫描了LdMADS基因与水稻、岷江百合(L. regale)和拟南芥中间源基因的共线性关系。共线性分析显示,两个亲缘关系较近的百合物种之间存在39对共线性基因对。共线性基因对分布于除5号和11号染色体外的所有染色体,其中4号染色体包含的数量最多,占20对。相比之下,在兰州百合与水稻之间检测到9对共线性基因对,而在兰州百合与拟南芥之间仅发现一对。这表明在进化过程中,单子叶植物(百合、水稻)和双子叶植物(拟南芥)之间存在显著的基因组分化。LdMADS14在岷江百合、拟南芥和水稻中均表现出共线性关系,表明其功能可能在进化过程中是保守的。共线性分析为LdMADS基因跨物种的潜在功能保守性提供了间接证据。
2.5. LdMADS基因的顺式作用元件分析
为了进一步分析LdMADS基因的顺作用元件,研究者提取了LdMADS基因上游2000 bp的序列,并使用PlantCARE在线数据库分析了31个具有明确定义生物学功能的元件。这些元件可分为光响应、胁迫响应、激素响应和生长发育调节元件。在启动子区域,与胁迫响应和植物激素调节相关的众多基序非常丰富。
分析表明,所有候选基因至少含有一个与胁迫相关的顺式作用元件,包括分布在33个LdMADS基因启动子中的49个干旱胁迫响应元件(MBS),以及分布在39个LdMADS基因启动子中的52个低温响应元件(LTR)。此外,还鉴定出了防御和胁迫响应元件(TC-rich repeats)、植物损伤响应元件(WUN-motif)和氧化胁迫响应元件(如ARE和GC-motif)。
鉴定出的8种激素响应元件可分为5组,包括SA(TCA-element)、ABA(ABRE)、GA(P-box、GARE-motif)、MeJA(CGTCA-motif和TGACG-motif)和生长素(TGA-element和AuxRR-core)响应元件。其中,对MeJA响应的元件特别丰富,在44个LdMADS基因的启动子中发现了197个MeJA响应元件。此外,研究表明ABA在营养组织适应非生物胁迫中起重要作用,在45个LdMADS基因的启动子中总共鉴定出178个ABA响应元件。这些证据有力地支持了LdMADS基因在转录水平上介导非生物胁迫适应的推测功能。
2.6. LdMADS基因的组织特异性表达分析
基于公共转录组数据集,研究者生成了热图,揭示了62个LdMADS基因在百合十个组织中清晰的组织特异性表达谱和丰度变化。在所有组织中均未表达的五個基因包括四个Type I基因(LdMADS6、LdMADS7、LdMADS11、LdMADS57)和一个Type II基因(LdMADS45)。有十个基因仅在单一组织中表达。例如,LdMADS13、LdMADS35、LdMADS37、LdMADS39、LdMADS48、LdMADS49和LdMADS62仅在子房中表达;LdMADS15和LdMADS54仅在花药中表达;LdMADS51仅在鳞片中表达。相反,有九个基因,包括LdMADS14、LdMADS19、LdMADS20、LdMADS26、LdMADS28、LdMADS40、LdMADS41、LdMADS42和LdMADS46,在全部十个组织中均有表达。
Type I基因比Type II基因表现出更强的组织特异性表达。与先前关于Type I MADS-box基因对植物生殖发育至关重要的发现一致,大多数Type I基因仅在子房或花药中表达。它们相对较低的表达水平意味着它们可能仅在生殖的特定时期活跃。所有MIKC*型基因均被发现在花药中表达,其中LdMADS55在茎根和鳞茎根中也有表达。
相比之下,MIKCC基因显示出更广泛的表达模式。大多数MIKCC基因在两个或更多组织中检测到表达。这在SOC1亚家族中尤为明显,其22个成员中有7个在所有检测的组织中均有表达。这些SOC1亚家族基因的一个主要表达模式是它们在鳞茎(百合特化的贮藏器官)中高表达。除了SOC1,鳞片中SVP(LdMADS50)和FUL(LdMADS46)的同源基因也表现出显著表达。同一亚家族的成员通常表现出相似的表达谱。例如,AG亚家族的三个基因在花药、花丝和子房中表现出显著且特异的表达。SEP亚家族的三个基因中的两个(LdMADS10和LdMADS14)在所有花器官中强表达,而两个基因(LdMADS14和LdMADS4)在叶片中表现出高转录水平。LdMADS基因的表达模式显示出清晰的亚家族特异性,并且与早期关于其在花器官发育中作用的研究一致。
对组织表达数据的分析表明,LdMADS基因家族成员表现出复杂而独特的表达模式,暗示了与其功能分化相关的潜在关联。
2.7. 胁迫条件下LdMADS基因的表达模式
为了研究LdMADS基因家族在胁迫响应中的潜在作用,研究者结合了根和叶的表达水平分析、启动子元件分布分析以及对MADS-box基因先前功能研究的了解。基于此综合分析,筛选了六个候选基因进行深入研究。在叶片中,这些基因是LdMADS4/14(SEP2)、LdMADS20/26/28(SOC1)和LdMADS50(SVP)。在根中,这些基因是LdMADS4(SEP2)、LdMADS8(AGL12)、LdMADS25/27/40(SOC1)和LdMADS52(AGL16)。随后,通过qRT-PCR分析了它们在冷(4 °C)、热(37 °C)和干旱胁迫下的表达模式。
对叶片中表达的六个基因的检测显示,除LdMADS50外,其余基因均对至少一种胁迫有响应,且表达模式存在差异。值得注意的是,在低温条件下,只有LdMADS26(SOC1的同源基因)被显著诱导,处理48小时后其表达水平达到处理前的十倍以上。这种响应与其启动子中存在LTR基序相一致。相比之下,包括SVP同源基因LdMADS50在内的其他基因的表达变化在低温下未显示显著变化。在高温胁迫下,LdMADS4的表达下降,在6小时时达到最低水平,之后略有反弹,而LdMADS14/20/26则表现出延迟的上调。除LdMADS50外,所有筛选的基因均对干旱有响应。LdMADS4/14/20/26/28表现出持续的转录上调,表明存在一个持续的响应过程。
对根中表达的六个基因的检测显示,两个SOC1成员LdMADS25和LdMADS40在低温响应中被上调。LdMADS40在低温处理3小时后表达略有下降,表现出延迟响应。在高温胁迫下,不同LdMADS基因的表达模式差异很大。LdMADS4/8/52的表达普遍下降,并在12小时时达到最低,而LdMADS25被强烈上调,在12小时时达到峰值表达。这个共同的时间点可能表明12小时是响应高温胁迫的关键时期。LdMADS40在根中也对高温有响应,表达先下降后上升。LdMADS25和LdMADS40对干旱胁迫有响应,但显示出相反的表达模式。
基于qRT-PCR结果,研究者观察到SOC1亚家族成员表现出不同的胁迫响应表达模式。LdMADS25(根)和LdMADS26(叶)在所有三种胁迫条件下均被强烈上调,表明它们可能作为参与多种胁迫响应的正调控因子发挥作用。值得注意的是,SOC1亚家族成员是所选候选基因中唯一在根(LdMADS25/40)和叶(LdMADS26)中均对冷胁迫有响应的基因。相比之下,SEP2同源基因LdMADS4和LdMADS14主要对高温和干旱有响应,尽管它们的具体表达模式不同。这表明兰州百合中扩张的SOC1成员可能部分充当介导各种胁迫响应的正调控因子。
3. 讨论
本研究在兰州百合中鉴定出62个MADS-box基因。根据其染色体位置,这些基因被命名为LdMADS1至LdMADS62。LdMADS成员被分为两大类:Type I(Mα 10个基因,Mγ 7个基因)和Type II MIKC(MIKC* 3个基因,MIKCC42个基因)。MIKCC基因随后被分配到11个不同的亚家族。MADS-box基因的数量在不同物种间差异显著。例如,水稻有75个,高粱有65个,拟南芥有107个。尽管兰州百合的基因组明显大于其他物种,但LdMADS基因的总数并未相应增加。进一步分析显示M型基因的数量相对较少,并且缺少Mβ亚组成员。与MIKC基因不同,Type I基因通常长度较短,在进化过程中经历了更快速的产生和消亡。它们通常通过小规模复制事件扩张,使其在基因组中更容易沉默或丢失。然而,一部分Type I基因在关键的生殖发育途径中起着至关重要的作用。在兰州百合中,在其Type I成员中鉴定出了这些基因的多个同源基因,并发现它们在生殖组织中特异性表达。这表明Type I基因的结构和功能在被子植物中可能是保守的。相比之下,Type II MADS-box基因在全基因组或大规模复制事件后优先保留。这种差异保留可能解释了为什么Type I MADS-box基因的拷贝数在不同物种间比Type II基因表现出更大的变异。
特定MADS-box亚家族的扩张在各种植物中都有记载。例如,巨桉的SOC1亚家族经历了显著扩张。SOC1的亚功能化使其能够适应从热带到温带的各种生态环境,从而满足开花调节的不同需求。此外,在某些菊科物种中也观察到了FLC和SEP亚家族的扩张。在兰州百合中,SOC1亚家族经历了显著的扩张,鉴定出22个成员,占其所有MIKC型基因的近一半。这一比例远高于其他被子植物的报道。兰州百合中SOC1亚家族的扩张模式似乎很复杂。除了两对串联重复基因(LdMADS20/LdMADS21和LdMADS25/LdMADS26),大多数SOC1成员在4号和7号染色体上形成局部基因簇。这些基因在物理位置上相近,但被少数其他基因间隔,符合近端复制的特征。与其他复制模式相比,串联和近端重复通常经历高度选择压力,表现出更紧凑的基因结构和更广泛的表达模式,是进化新功能的关键遗传储备。转录组数据显示,扩张的SOC1基因在兰州百合检测的10个组织中表现出广泛而多样的表达模式。大多数在鳞茎(特化的贮藏器官)中高表达,表明该亚家族内可能存在亚功能化或新功能化。一个特别值得注意的观察是,在兰州百合基因组中缺少FLC亚家族成员。在拟南芥中,FLC是春化作用的主要调节因子,而百合也表现出对低温开花的春化需求。这表明百合中SOC1亚家族的功能分化可能补偿或替代了FLC在春化途径中的调节作用。与此假设一致,SOC1在兰州百合的越冬器官鳞茎中高表达,并对冷胁迫有响应。这些扩张的SOC1同源基因因此可能不仅作为开花信号的整合因子,还参与百合特有的发育过程,如鳞茎形成、休眠解除和春化作用。
植物MADS-box基因的进化涉及内含子的丢失和获得。通常,Type II MIKC成员比Type I成员含有更多的内含子。基因结构分析显示,Type II成员平均含有6.4个内含子,而大多数Type I基因完全不含内含子,只有少数例外。LdMADS基因的内含子数量与拟南芥、水稻和其他植物中观察到的相似。然而,兰州百合拥有一个巨大的基因组,这反映在基因长度上。先前的基因组分析显示,兰州百合所有注释基因中有33.88%的长度超过50 kb,被定义为超长基因。引人注目的是,在LdMADS基因家族中,这一比例上升至48.39%。尽管这些LdMADS基因长度超长,但其外显子结构仍然保守,平均数量和长度与其他植物相当。因此,这些基因的显著延长主要归因于内含子的极端延长。先前的研究表明,百合基因组大小的急剧增加很大程度上与转座元件插入的爆发有关,这些元件大量积累在基因间区和内含子中。转座元件序列在MADS-box内含子中的优先

生物通微信公众号
微信
新浪微博


生物通 版权所有