神经发育障碍(Neurodevelopmental Disorders, NDDs)影响着全球2-4%的人口,其病因复杂,尽管已知大部分与遗传因素相关,但仍有约一半的病例即使经过全基因组测序也找不到明确的遗传学解释。这就像一场大规模的医学“悬案”,无数家庭在等待一个答案。近年来,科学家们将目光投向了基因组中一些过去被忽略的非编码区域,特别是那些编码小核RNA(small nuclear RNAs, snRNAs)的基因。这些snRNA是细胞“剪接机器”——剪接体(spliceosome)的核心组成部分,负责精确地“剪辑”我们基因转录出的前体信使RNA,移除不需要的部分(内含子),将有用的部分(外显子)拼接成最终指导蛋白质合成的模板。不难想象,这个关键机器的零件(snRNA)一旦出问题,可能会导致细胞功能紊乱,进而引发疾病。事实上,已有一些snRNA基因的变异被发现与人类遗传病,包括NDDs相关。
近期,科学家们发现了一个名为RNU2-2的基因。它编码的是U2 snRNA的两个功能相似体(paralog)之一:U2-2。U2 snRNA是剪接体识别和结合内含子分支点的关键。有趣的是,就在不久前,研究发现RNU2-2基因的杂合(单个拷贝)变异会导致一种显性遗传的严重NDD。那么,一个自然而然的问题产生了:RNU2-2基因两个拷贝都发生变异(即双等位变异)的情况是否存在?如果存在,它又会导致什么样的疾病?其发生频率和临床意义又如何?为了解答这些问题,研究人员开展了一项大规模的系统性研究。
本研究主要利用了来自英国“10万人基因组计划”(100,000 Genomes Project, 100kGP)等大型罕见病队列的基因组测序数据。研究人员对其中近8万人的数据进行了生物信息学分析,专门寻找在snRNA基因中发生的罕见双等位(纯合或复合杂合)变异。为了验证发现,研究团队还整合了来自英国国家医疗服务体系(NHS)基因组医学服务、Solve-RD、澳大利亚未确诊疾病网络(UDN-Aus)以及瑞典、沙特阿拉伯、韩国等多个国际队列的数据,形成了庞大的多中心研究样本。在分子机制探索方面,研究利用了100kGP队列中部分参与者同时拥有的RNA测序数据,通过OUTRIDER和FRASER2等生物信息学工具,分析了基因表达异常和剪接异常事件。这些高通量测序技术和先进的多组学数据分析方法是本研究的基石。
研究结果
1. 双等位RNU2-2变异在未确诊NDD个体中富集且过度传递
研究人员首先在100kGP队列的6762名未确诊NDD个体和71289名对照中,对1901个注释的snRNA基因进行了双等位变异富集分析。结果显示,在RNU2-2基因中,罕见双等位基因型在未确诊NDD个体中显著富集。进一步对12015个核心家系(父母子三人)的传输分析发现,当父母双方都是RNU2-2罕见变异的携带者时,他们的子代(先证者)如果患有未确诊的NDD,其从父母那里遗传到两个变异等位基因(即成为纯合子或复合杂合子)的比例,显著高于孟德尔遗传的预期值。而在子代没有未确诊NDD的家系中,则没有观察到这种偏离。这些统计证据强烈提示RNU2-2是一个新的隐性NDD致病基因。
2. 通过读段相位鉴定双等位RNU2-2变异
为了确保鉴定出的双等位基因型的准确性,研究人员对统计相位结果进行了手动检查和基于原始测序读段的验证,纠正了部分相位错误。最终,在100kGP中确定了122名携带罕见双等位RNU2-2变异的个体。通过对这些变异在RNA一级和二级结构上的分布进行可视化分析,发现与对照相比,NDD病例中的复合杂合变异显著富集于转录本5'端的一个限制性区域(核苷酸1-67)。这表明该区域对功能更为关键。
3. 跨多个队列验证确认RNU2-2为新的隐性致病基因
为了优先锁定可能的致病性变异组合,研究人员制定了一套严格的过滤标准,排除了那些在大型人群数据库(如gnomADv4、UK Biobank)或本研究的内部对照中也以相同组合形式出现的基因型。在100kGP的“发现队列”中,最终锁定了来自31个家庭的38名未确诊NDD个体,他们携带31种独特的候选双等位RNU2-2基因型。随后,在多个国际验证队列中,使用相同的严格标准,又发现了45名携带候选变异的NDD个体。所有总计84名来自67个家庭的个体均患有NDD,这为RNU2-2的致病性提供了强大的独立验证。
4. 隐性RNU2-2综合征是一种发育性癫痫性脑病(DEE)
接下来,研究人员对这些患者的临床表型进行了深入分析。通过对31名无关先证者的人类表型本体(Human Phenotype Ontology, HPO)术语进行相似性计算,发现他们的表型相似性显著高于随机抽取的NDD患者群体。进一步的HPO术语富集分析显示,显著富集的表型包括“全面性发作”、“脑病”、“智力残疾”和“言语语言发育迟缓”等,这些均指向一种严重的发育性癫痫性脑病。
通过对34名患者(27个家系)的详细临床资料汇总,描绘出该综合征的核心临床画像:所有患者均表现出发育迟缓和智力残疾;绝大多数(94.1%)有运动发育迟缓和癫痫发作,其中61.8%的患儿在1岁内就出现发作;73.5%的患者无语言能力,41.2%无法独立行走;脑电图异常率达53.8%,头颅磁共振成像(MRI)异常率达46%,最常见的是脑萎缩。此外,多数患者(20/34)存在面部特征异常。这些发现共同定义了隐性RNU2-2综合征是一种严重的DEE。
5. 候选双等位变异与U2-2丰度降低及U2-2:U2-1比值下降相关
隐性遗传模式通常提示功能丧失(loss-of-function)的致病机制。研究人员利用血液RNA测序数据发现,携带候选双等位RNU2-2变异的个体中,RNU2-2的表达量显著低于对照。有趣的是,虽然U2-2与其同源体U2-1(由RNU2-1基因编码)的表达高度相关,但在病例中,U2-2与U2-1的转录本比值显著降低。这种降低的U2-2:U2-1比值似乎是隐性RNU2-2障碍更特异的生物标志物,因为即使在少数表达量很低的对照个体中,这个比值也保持正常。这表明U2-2转录本耗竭(可能由转录本稳定性降低导致)是该病的一个潜在致病机制。
6. 显性与隐性RNU2-2综合征存在区别
研究将新发现的隐性综合征与之前报道的由RNU2-2杂合变异引起的显性综合征进行了多方面比较。遗传学上,显性障碍主要由5'端的少数高频复发变异(如n.4 G>A, n.35 A>G)引起,而隐性障碍的基因型谱更广。分子机制上,隐性病例表现为U2-2丰度降低和U2-2:U2-1比值下降,而显性病例的U2-2表达量和比值与对照无异。剪接分析上,在血液RNA数据中可检测到显性病例存在显著的剪接异常信号,但在隐性病例中未发现类似信号。临床表型上,尽管两者都是严重NDD,但统计分析显示,隐性障碍中“痉挛”和“1岁内发作”更常见,而显性障碍中“刻板手部动作”和面部特征异常更突出。这些证据表明,显性和隐性RNU2-2障碍是遗传、分子和临床上均不相同的两种疾病。
7. 双等位RNU2-2变异是100kGP中最常见的隐性NDD病因
最后,研究评估了该病在人群中的相对频率。在100kGP的NDD队列中,隐性RNU2-2综合征是迄今为止最常见的隐性诊断,患者数量是第二常见隐性诊断(VPS13B相关的科恩综合征)的三倍多。仅考虑具有明确致病基因证据的“绿色”评级基因,隐性RNU2-2障碍是仅次于显性RNU4-2相关综合征的第二大常见诊断,也是前20名中最常见的隐性障碍。综合计算,新发现的隐性RNU2-2综合征、显性RNU2-2综合征以及其他近期发现的“RNU病变”(包括RNU4-2和RNU5B-1相关疾病),共同解释了100kGP中1.48%的此前未确诊NDD病例。考虑到这些基因在基因组中所占的物理长度总和仅为448个碱基对,其致病变异的高频性显得尤为惊人。
研究结论与意义
本研究系统阐述并证实了一种由RNU2-2基因罕见双等位变异引起的新型神经发育障碍。研究人员明确了该综合征是一种严重的发育性癫痫性脑病,具有独特的临床特征。在分子层面,研究将候选致病变异与U2-2转录本丰度降低联系起来,并发现降低的U2-2:U2-1比值可能作为潜在的诊断生物标志物。至关重要的是,该研究揭示,隐性RNU2-2综合征是所研究大型队列中最常见的隐性神经发育障碍,其发病率之高与RNU2-2基因本身极小的基因组“足迹”形成了鲜明对比。
这一发现具有多重重要意义。首先,在诊断层面,它为数以千计在全球范围内长期得不到明确诊断的神经发育障碍患者及其家庭提供了答案,为遗传咨询和家庭生育计划提供了关键信息。尽管临床解读该基因广泛的变异仍具挑战,但本研究为此建立了坚实的统计和临床证据基础。其次,在疾病认知层面,研究明确了显性与隐性RNU2-2障碍是截然不同的疾病实体,这纠正了可能存在的混淆,并为精准的基因型-表型关联研究铺平了道路。再者,在发病机制研究层面,指向转录本稳定性降低的发现,为未来开发针对该病的靶向疗法(如旨在稳定或增加功能性U2-2 RNA的治疗策略)指明了潜在方向。最后,在医学遗传学领域层面,该研究与近期其他关于snRNA基因(RNU4-2, RNU5B-1)的突破性发现一起,凸显了非编码RNA基因,特别是核心剪接体组分,在人类疾病,尤其是常见罕见病中的核心作用。它提醒科学界和临床界,必须将目光超越蛋白质编码区,深入探索基因组中这些曾被忽视但功能至关重要的“暗物质”区域,才能真正解开大量未确诊遗传病的谜团。这项研究发表于《自然·遗传学》(Nature Genetics),标志着人类对神经发育障碍遗传病因的探索又迈出了重要一步。