ABSTRACT
中枢免疫耐受是在胸腺中建立的,它确保T细胞对自身抗原无反应性,同时维持功能性的免疫库。髓质胸腺上皮细胞(mTEC)和胸腺树突状细胞(DC)在这一机制中扮演关键角色,它们协调自身反应性胸腺细胞的选择和删除,这一过程深受自身免疫调节因子(AIRE)的影响。AIRE促进mTEC中组织限制性抗原(TRA)的混杂表达,从而使得自身反应性T细胞被清除,并促进调节性T细胞(Treg)的分化。对AIRE在转录调控和核体定位中作用的研究显著增进了我们对其机制的理解,揭示了其与染色质相关复合物的蛋白质相互作用,从而促进了mTEC中广泛的转录组复杂性。然而,在APECED患者中发现的中和性1型干扰素(T1 IFN)自身抗体,以及最近鉴定的AIRE诱导的胸腺内IFN信号,表明AIRE的影响超越了其在负向选择中的经典功能,可能通过炎症信号在胸腺稳态中扮演更广泛的角色。
1 Introduction
在T细胞发育过程中,胸腺细胞通过一系列命运决定进行分化,以产生功能性且自身耐受的库。这个过程依赖于胸腺在空间和功能上不同的区室:皮质和髓质,阳性选择和阴性选择以及Treg分化主要在此发生。在胸腺髓质中,mTEC与胸腺DC协同作用,对于将发育中的胸腺细胞暴露于自身抗原至关重要,从而确保对普遍表达和组织限制性抗原(TRA)的耐受。
胸腺细胞选择始于皮质,皮质胸腺上皮细胞(cTEC)通过专门的抗原加工途径(包括胸腺蛋白酶体)呈递独特的肽-MHC复合物库。表达对自身肽-MHC复合物具有中等亲和力TCR的双阳性(CD4+CD8+)胸腺细胞被阳性选择并存活下来,进一步分化为CD4+或CD8+单阳性(SP)细胞。对这些复合物低亲和力的胸腺细胞通过“忽视死亡”发生凋亡,而那些具有过高亲和力的则被导向在髓质中删除或分化为Treg。
阴性选择发生在髓质,mTEC和胸腺DC呈递广泛的自身抗原,包括TRA。TCR与这些自身抗原之间的高亲和力相互作用触发凋亡,清除自身反应性胸腺细胞并预防自身免疫。自身抗原呈递机制得到混杂基因表达的支持,该表达受AIRE调控,因为AIRE促进mTEC中数千种TRA的表达。胸腺DC通过从mTEC捕获抗原并将其呈递给胸腺细胞来增强这一过程,从而扩大了可用于选择的抗原多样性。
一部分遭遇髓质自身抗原的胸腺细胞被转入调节性T细胞(Treg)谱系。这些FOXP3+Treg通过抑制外周中的自身反应性T细胞,在维持免疫耐受方面发挥着不可或缺的作用。它们的分化是由TCR与自身抗原之间中等至高亲和力的相互作用和持续时间驱动的,其亲和力窗口将Treg与经历删除的胸腺细胞区分开来。
本综述讨论了AIRE的分子功能、其与染色质的相互作用、转录机制及其在核体组织中的定位。除此之外,综述还重点介绍了关于AIRE参与1型干扰素(T1 IFN)信号传导的最新发现,并表明AIRE的功能超越了阴性选择,在胸腺稳态中扮演更广泛的角色。
2 AIRE in Thymic Promiscuous Expression
mTEC是胸腺内TRA的主要来源,它们与DC一起提供抗原的表达和呈递,这些抗原在其他情况下仅限于外周组织。这种机制将耐受性扩展到全身各器官表达的自身抗原。此外,mTEC有效表达肿瘤抗原,这些抗原在正常细胞中不表达或仅低水平表达。AIRE是这一过程的核心,它驱动数千种TRA的转录并促进这些抗原在MHC分子上的呈递。值得注意的是,AIRE的高表达几乎仅限于mTEChi群体。这些细胞以高水平的主要组织相容性复合体(MHC)II类分子和CD80共刺激标记为特征,负责将TRA呈递在MHCII分子上给发育中的SP胸腺细胞。
大多数TRA在mTEC中表达。据估计,mTEC表达高达85%的编码基因组,近18,000–19,000个基因。相比之下,大多数组织表达12,000–14,000个基因(约占编码基因组的60%–65%),其中大约8000个蛋白编码基因普遍表达。mTEC中混杂表达的基因数量高于两个免疫特权组织——大脑和睾丸,它们以高转录活性和表达约70%–75%的编码基因而闻名。在Aire缺陷的mTEC中,大约有15,000个基因表达,表明Aire负责诱导mTEC中约3000–4000个基因。然而,这表明在所有混杂表达的基因中,只有少数(可能20%–40%)是直接受Aire调控的。尽管有其他调节因子,如Fezf2或Hipk2被报道有助于混杂表达,但绝大多数TRA基因表达的分子驱动因素仍然未知。
细胞表面标记物大致将mTEC分为未成熟的mTEClow和成熟的mTEChi亚群,后者进一步分为表达Aire的细胞,以及随后的终末分化为后Aire(post-Aire)细胞。后Aire mTEC的MHC II类和CD80表达低,其中一部分细胞类似于皮肤角质形成细胞,表达天疱疮相关抗原,如桥粒芯糖蛋白1和3。最近的scRNAseq研究揭示了后Aire mTEC的亚群模拟其他外周细胞类型,这表明了一种进化机制,旨在最大化胸腺的自我表征能力。这些细胞获得外周组织的特征,如肠道、肝脏和内分泌细胞,从而有助于T细胞分化所需的抗原多样性。
mTEC中转录组复杂性的增加不一定是每个个体mTEC的固有属性,而是模拟mTEC群体内整体转录组多样性的结果。mTEC中较高的转录水平让人联想到睾丸中的情况,后者是由不同的细胞群体共同表达更广泛基因的结果。虽然单个mTEC在分化的特定阶段可能在转录上范围狭窄,但整个mTEC群体代表了胸腺发育过程中广泛的转录组复杂性。事实上,似乎只有一小部分mTEC表达任何给定的抗原。例如,胰岛素(1型糖尿病(T1D)的标志性自身抗原)仅在少量mTEChi细胞中以相对较低的水平被检测到,然而这种表达足以进行阴性选择,因为其在mTEC中的缺失会导致中枢耐受崩溃和随后的胰岛炎。在人类胸腺中,胰岛素基因表达与AIRE基因表达相关,胰岛素基因中的一个VNTR多态性与胸腺胰岛素表达减少有关,并与T1D的发展相关。小鼠模型中的研究和人类胸腺中的定量表达分析已经确定了其他案例,其中单个抗原基因的删除会引发自身免疫。然而,mTEC并非胸腺中TRA的唯一来源,胸腺B细胞和DC也通过直接呈递或与mTEC的合作性抗原转移来贡献自身抗原库。
mTEC的异质性为混杂表达引入了额外的复杂性层。模拟细胞的鉴定引发了关于其发展和功能的耐人寻味的问题,因为有证据表明它们在中枢耐受中起作用并影响其他胸腺驻留群体的稳态。模拟细胞主要存在于后Aire mTEC群体中,并且在Aire缺陷小鼠中其数量显著减少,表明Aire参与了它们的发育。然而,在Aire缺陷宿主中它们并非完全缺失,这表明一些模拟细胞可以独立于Aire形成,尽管数量较少。这一观察结果提出了一个问题:Aire在模拟细胞发育中的作用是直接的(例如,通过其调控转录网络)还是间接的(其效应通过其他上游过程促进了这些细胞类型的出现)。很可能存在额外的调控输入,例如特定的转录因子,在模拟细胞中编程细胞类型特异性特征,这表明Aire依赖和Aire非依赖的机制共同作用,塑造了mTEC群体的多样性和功能。
在人类和其他大型哺乳动物中,胸腺髓质内存在称为哈索尔小体(HCs)的上皮结构。这些独特的同心圆簇直径范围从20到100微米,包含无核的角质化细胞。它们的大小与整体胸腺体积相关。在较小的啮齿类动物(如小鼠)中,如果没有抗原特异性免疫染色,HCs很难被检测到。在人类中,HCs的大小和丰度似乎反映了胸腺活性,因为它们在儿童期增加,并随着成年期胸腺退化而减少。值得注意的是,在胸腺增生的情况下,例如与重症肌无力相关的胸腺瘤,HCs更为丰富。尽管研究相对不足,特别是由于它们在鼠类胸腺样本中几乎不可见,但HCs很可能代表了后Aire mTEC谱系的最终分化阶段,并且可以使用晚期上皮标记物(如细胞角蛋白CK10和内披蛋白)通过免疫组织化学进行染色。
3 AIRE Enhances Transcriptional Activity
虽然AIRE是mTEChi中混杂基因表达的关键驱动因子,但其功能在很大程度上独立于调控外周细胞中TRA组织特异性表达的转录因子。与这些因子不同,AIRE通过一种通用机制起作用,不依赖于靶基因内的任何特定近端调控基序。例如,当在组织培养细胞中表达时,AIRE可以扩增没有明确启动子区域或mRNA加工元件的报告构建体的表达。此外,受AIRE激活的基因受其表达细胞环境的影响。因此,mTEC中的混杂表达并非仅由AIRE的作用控制;相反,它充当mTEC中已在开放染色质区域准备就绪、准备转录的基因的放大器。靶基因通常是沉默的或仅低水平表达,并以随机方式转录,可以是单等位基因或双等位基因,并使用不同的替代转录起始位点。
尽管mTEChi细胞中的混杂基因表达看起来是随机的,但它也是高度协调的。靶基因往往来源于基因组位置相对接近的基因簇。单细胞RNA-seq研究表明,mTEC以有序的随机性模式表达基因,意味着单个mTEC表达某种程度上随机的TRA基因子集。共表达的基因集要么在染色体上物理位置接近,要么发生染色体间相互作用,但不一定共享其他共同特征,例如属于相同的信号或代谢通路。染色体簇中的共定位与AIRE结合超级增强子的能力有关,超级增强子富含拓扑异构酶TOP1和TOP2。在这些超级增强子处,AIRE促进了高阶染色质结构的形成,正如在离体mTEC上进行的高分辨率染色体构象捕获(Hi-C)实验所证明的那样。AIRE被证明可以增强超级增强子与AIRE诱导基因之间的相互作用,而与AIRE中性基因的相互作用则减少。有趣的是,AIRE对常规增强子与AIRE诱导基因之间相互作用的影响较小,表明其在特异性促进超级增强子与AIRE诱导基因之间相互作用方面具有偏好性。通过靶向超级增强子,AIRE促进了TRA基因的广泛转录激活。这是通过AIRE经由黏连蛋白复合物协调染色质环化来实现的,有效地桥接了远端增强子与其靶启动子。染色质架构的这种三维重组似乎是AIRE作为有效转录放大器的一项关键功能。
除了与超级增强子区域直接相互作用外,AIRE还与其他染色质结合和转录机制相关。AIRE的保守结构域主要作为蛋白质-蛋白质相互作用的支架。这一作用已通过蛋白质组学筛选和小规模下拉实验得到强调,这些实验鉴定出数十个AIRE相互作用伙伴。这些伙伴可以大致分为参与染色质结合、转录调控和mRNA剪接的组。
在结构上,AIRE具有一个N端的CARD区域、一个SAND结构域和两个PHD型锌指。通过其第一个PHD1锌指,AIRE与染色质中的抑制性组蛋白标记相互作用。PHD1结构域的静电带电表面提供整体负电荷,增强了其与组蛋白H3在赖氨酸4处未甲基化(H3K4me0)的结合,这是染色质中转录失活基因的关键标记。然而,与未甲基化组蛋白H3的相互作用本质上是低亲和力和瞬时的,表明了一种短期的动态结合机制。AIRE-PHD1对组蛋白H3的翻译后修饰非常敏感,其折叠破坏导致全长蛋白无法与组蛋白H3结合,从而随之降低AIRE靶基因的激活。通过特异性靶向H3K4me0标记的启动子,AIRE优先与转录沉默的基因座结合,促进其激活。然而,这种特异性并非绝对,因为AIRE以一定程度的随机性运作,允许单个mTEC表达不同的TRA子集。PHD2结构域虽然结构与PHD1相似,但具有带正电荷的表面,表明其参与不同的蛋白质-蛋白质相互作用。
目前的证据也支持一种机制,即AIRE促进了在沉默染色质位点暂停的RNA聚合酶II(RNAP-II)的释放。这是通过AIRE招募正转录延伸因子b(P-TEFb)实现的,P-TEFb磷酸化RNAP-II暂停因子和RNAP-II本身,使聚合酶能够进入延伸阶段。在转录起始后,RNAP-II受到负延伸因子的抑制,导致延伸在启动子附近停滞。RNAPII活性通过P-TEFb恢复,P-TEFb克服这些负调控因子以实现RNAPII的 productive 延伸。AIRE被证明通过其与BRD4的相互作用来招募P-TEFb。据报道,BRD4通过其溴结构域与AIRE结合,与AIRE的CARD结构域中的赖氨酸残基相互作用并被组蛋白乙酰转移酶CBP乙酰化。然而,这种依赖乙酰化的相互作用后来受到质疑,证明BRD4对于AIRE介导的转录是可有可无的,因为BRD4抑制或敲低并不影响AIRE活性。
4 AIRE is Associated with DNA Break Complexes
AIRE的许多结合伙伴参与DNA损伤反应。关键伙伴包括DNA拓扑异构酶2-α(TOP2A)、DNA依赖性蛋白激酶(DNA-PK)、其非催化亚基Ku70/Ku80和聚[ADP-核糖]聚合酶1(PARP1)。TOP2A通过引入瞬时DNA断裂来缓解转录过程中产生的超螺旋DNA的扭转应力。这进而激活了DNA-PK/Ku70/Ku80复合物。随后,DNA-PK磷酸化核蛋白以启动DNA修复。DNA-PK相关复合物也是AIRE募集到染色质所必需的,并且已被证明在多个丝氨酸和苏氨酸残基上磷酸化AIRE。尽管DNA-PK的激酶活性并非AIRE反式激活活性所必需,并且这种磷酸化在AIRE依赖性基因激活中的确切作用仍然未知,但对CARD结构域中苏氨酸69和丝氨酸157(两者都是潜在的DNA-PK靶点)残基的突变分析表明,磷酸化可能是CBP依赖性乙酰化的先决条件。
AIRE与拓扑异构酶之间的相互作用可能在AIRE靶基因表达中起关键作用,并且TOP1和TOP2都被鉴定为关键的AIRE相互作用蛋白。鉴于转录诱导拓扑扰动,这些相互作用可能促进有利于转录的染色质环境。由于TOP1和TOP2与DNA断裂相关,这些很可能与AIRE功能有关。
例如,诱导DNA断裂增强了AIRE靶基因的转录。依托泊苷(一种稳定TOP2-DNA复合物的药物)被证明可以增强AIRE靶基因的表达并促进AIRE与TOP2之间的相互作用。有趣的是,低浓度的拓扑替康(一种TOP1抑制剂)也能有效刺激AIRE依赖性转录。与依托泊苷类似,拓扑替康将TOP1–DNA复合物共价捕获在染色质上。Guha等人的研究进一步区分了TOP1和TOP2抑制剂的功能效应。虽然依托泊苷和拓扑替康都诱导DNA断裂并形成共价蛋白质-DNA复合物,从而促进AIRE靶基因表达,但其他抑制剂如merbarone和β-拉帕醌,它们阻断TOP催化活性而不产生DNA断裂,未能增强AIRE靶基因表达。这表明TOP1和TOP2抑制剂(通过诱导DNA断裂起作用)通过类似的机制和转录复合物增强AIRE靶基因表达。此外,TOP2A敲低导致AIRE靶基因表达显著降低。单链DNA断裂可能是AIRE依赖性基因表达的最重要贡献者,因为低剂量依托泊苷主要诱导单链DNA损伤。TOP1在其与AIRE相互作用中的作用也通过它们在超级增强子上的共定位被确定,支持了一个模型,即AIRE定位于超级增强子以上调其靶基因。
如前所述,胸腺中的mTEC和睾丸中的精原干细胞是转录复杂性最高的细胞类型之一。高转录活性的一个后果是转录相关突变和重组,导致氧化损伤的积累,可能作为细胞DNA内诱变的来源。尽管校对活动在DNA复制过程中纠正了许多此类损伤,但少数可能作为双链DNA中的碱基对错配持续存在,形成异源双链并招募DNA修复机制。更高的转录也似乎形成非B型DNA结构,如发夹、Z-DNA、G-四链体和RNA-DNA杂交体。此外,转录诱导的超螺旋产生瞬时单链DNA区域,与双链DNA相比,这些区域化学反应性更强,更容易受损。这与最近的发现一致,证明AIRE诱导的基因表达与Z-DNA(一种非经典的左旋双螺旋DNA形式)相关。ChIP-seq分析显示,在与AIRE相关的染色质峰中Z-DNA富集,反之亦然。Z-DNA基序与AIRE可诱导基因的 poised 启动子正相关的双链断裂相关。根据这个模型,Z-DNA可能增强AIRE靶基因启动子处DNA断裂的产生,从而促进其 poised 染色质状态的维持,使AIRE能够招募,并最终促进基因表达。因此,AIRE驱动mTEC中混杂基因表达和高转录活性的能力与DNA断裂发生率增加以及AIRE靶基因启动子处Z-DNA结构的存在相关。
5 AIRE in Nuclear Structures
N端的CARD能够寡聚化,类似于其他蛋白质中的CARD结构域。寡聚化是AIRE在核体内亚细胞定位所必需的。对于核转运,AIRE还拥有一个双分核定位信号,位于CARD结构域附近。AIRE在其CARD、SAND结构域及其第一个PHD指内与Sp100蛋白家族成员具有结构相似性。与AIRE不同,SP100家族成员包含一个溴结构域而不是第二个PHD指。这种与AIRE的结构相似性突出了耐人寻味的平行关系,因为Sp100家族蛋白是免疫细胞中的染色质调节因子。然而,与促进基因表达相反,它们的活性主要与沉默相关。Sp110和Sp140蛋白也定位于核体;然而,这些是 distinct 的早幼粒细胞白血病蛋白(PML)核体。SP100家族蛋白在核定位、染色质关联和转录活性方面如何与AIRE不同,仍然是一个悬而未决的问题。
对破坏CARD结构域的AIRE突变的研究得出结论,AIRE的转录活性依赖于大分子蛋白质复合物的形成。在结构上,CARD结构域采用由六个α螺旋组成的有序蛋白质折叠,这些α螺旋组装成一个球状结构域。此外,该结构域显示出负责同型蛋白质-蛋白质相互作用的其他CARD结构域特有的静电表面电荷的极化分布。在人类患者中发现的突变部分或完全破坏了CARD结构域的结构,导致其展开并丧失作为蛋白质相互作用模块的功能。
许多影响CARD结构域或其他结构区域的突变破坏了AIRE向核体的定位。由AIRE形成的核体类似于但不完全与PML核体重叠。重要的是,这些核体结构也存在于mTEC中。虽然AIRE的定位与核中的PML体不直接匹配,但由AIRE和PML形成的核结构通常很接近,甚至共享 distinct 的蛋白质,表明存在结构和功能相互作用。例如,AIRE被组蛋白乙酰转移酶CBP和p300乙酰化,它们位于PML体中。然而,当在同一细胞中过表达时,它们的位置与AIRE核体重叠,导致AIRE介导的转录激活增强。相反,人为地将AIRE导向PML体会抑制其转录活性。此外,显性负性AIRE突变导致其错误定位到PML体。由于PML体是已知的转录抑制位点,这种错误定位有效地抑制了AIRE的功能。此外,AIRE与另一个PML核体蛋白DAXX的相互作用通过共免疫沉淀实验被鉴定。这项研究还表明,DAXX对AIRE的转录活性发挥强烈的抑制作用。因此,AIRE在替代核结构(如PML体)中的异常隔离导致功能丧失和其转录活性抑制。
AIRE核体是否作为转录的活跃位点一直存在争议。早期研究发现,与PML核体类似,AIRE核体的核心缺乏染色质和RNAP II,表明这些结构不直接参与转录。相反,最近的发现表明AIRE转录活性发生在其核结构内,这些结构在CBP/p300富集的增强子处形成以驱动基因激活。总之,这些研究表明精确的亚核定位和与伙伴蛋白的相互作用调节其转录活性。然而,由于