编辑推荐:
本研究针对传统孟德尔随机化(MR)方法无法解析时变风险因素动态效应的局限,开发了FLOW-MR框架。通过构建贝叶斯因果结构方程模型,仅需GWAS摘要数据即可解析BMI、血压等指标的年龄特异性效应,发现儿童期BMI对乳腺癌的保护作用及血压对卒中的阶段特异性影响,为生命历程流行病学研究提供新范式。
在探索疾病因果机制的征程中,科学家们长期面临一个关键挑战:如何解析那些随时间变化的遗传风险因素的动态影响?传统孟德尔随机化(Mendelian Randomization, MR)方法虽然能有效控制混杂因素,但通常将风险因素视为静态指标,这种简化可能掩盖了生命不同阶段风险因素的差异化效应。例如,维生素D水平在童年期与成年期对多发性硬化症的风险影响可能存在显著差异,但常规MR分析往往无法捕捉这种时变特征。
这种局限性催生了"生命历程MR"的研究框架,然而现有方法面临两大瓶颈:一是早期生命阶段的全基因组关联研究(GWAS)样本量通常较小;二是同一风险因素在不同时间点的测量值存在高度相关性。更棘手的是,当需要分析早期风险因素通过中间变量影响结局的间接效应时,主流的多变量MR(MVMR)方法显得力不从心。
来自芝加哥大学(University of Chicago)的研究团队在《Nature Communications》发表的重要研究,提出了突破性的解决方案——FLOW-MR(Frame-for Life-cOurse pathWay analysis using Mendelian Randomization)分析框架。这项研究通过构建完整的因果结构方程系统,仅利用GWAS摘要数据就能解析时序性遗传特征的直接、间接和路径特异性效应。研究不仅揭示了儿童期体重指数(BMI)对乳腺癌的特异性保护作用,还阐明了血压、BMI和胆固醇在卒中风险中的动态交互关系,为理解复杂疾病的发育起源提供了新视角。
研究团队采用了三项关键技术方法:首先建立基于结构方程模型的贝叶斯层次框架,将个体水平的结构方程投影到单个SNP上;其次采用尖峰-平板先验(spike-and-slab prior)处理遗传效应的极端多基因性和弱工具偏倚;最后通过吉布斯采样器(Gibbs sampler)生成后验样本,构建所有因果效应的可信区间。分析数据来源于MoBa、ALSPAC等队列的儿童期GWAS,以及UK Biobank等成人数据库。
方法创新性
FLOW-MR的核心突破在于将传统MR扩展为完整的因果结构方程系统。如图1a所示,该方法将时序性风险因素X1至XK-1和结局Y(记为XK)纳入统一框架,通过矩阵方程Γ=(I+B)Γ+A建立关联。其中B矩阵包含研究者最关心的直接因果效应βkl,而A矩阵则捕捉SNP的直接遗传效应αkj。通过假设αkj在不同性状间独立分布,该方法巧妙地将经典的InSIDE假设推广到纵向数据场景,解决了普遍存在的多效性和未测量混杂问题。

在算法实现上,研究采用尖峰-平板先验处理αkj:(1-pk)N(0,σk02)+pkN(0,σk12),这种设置既能适应复杂性状的不同多基因模式,又能有效缓解弱工具偏倚。与需要个体水平数据的结构方程模型相比,FLOW-MR仅需GWAS摘要统计量即可实现全参数估计,这在当前强调数据隐私保护的研究环境下具有显著优势。
应用发现:儿童BMI的发育阶段特异性效应
在乳腺癌风险分析中,研究团队获得了令人瞩目的发现。当使用UK Biobank回忆性儿童体型评分时,FLOW-MR与所有MVMR方法均复制了先前结论:成年BMI无显著效应,而儿童体型显示直接保护作用(图4a)。然而当替换为MoBa队列实测的8岁BMI数据时,传统方法出现矛盾结果——MVMR-IVW错误地提示成年BMI具有保护效应,而GRAPPLE等方法则完全失去统计功效。

唯有FLOW-MR在样本量仅3,000的MoBa数据中仍稳健检测到8岁BMI的保护效应(OR=0.82,95%CI:0.76-0.89)。进一步纳入1岁BMI分析后,研究构建了完整的因果通路(图4c):1岁BMI通过影响8岁BMI(β=0.31)间接降低乳腺癌风险,而8岁BMI又直接影响成年BMI(β=0.29),但1岁BMI对成年BMI无额外直接效应。这些发现首次证实:BMI对乳腺癌的保护作用具有发育阶段特异性,仅存在于特定童年时期。
心血管风险因素的动态网络
在分析血压、BMI与卒中风险的复杂关系时,研究揭示了更精细的因果网络。如图5所示,通过将童年期和成年期的SBP、BMI、LDL-C(低密度脂蛋白胆固醇)分阶段建模,FLOW-MR发现仅有成年SBP对卒中存在直接因果效应(β=0.41,95%CI:0.33-0.49)。而先前研究认为的成年BMI对SBP的正向影响,在控制童年SBP后变得不显著,提示早期研究可能混淆了童年血压的影响。

研究意义与展望
这项研究通过FLOW-MR框架实现了三大突破:一是建立了仅需GWAS摘要数据就能进行生命历程因果推断的完整方法论体系;二是发现了风险因素影响疾病的发育关键期效应;三是澄清了心血管风险因素间的动态因果关系。特别是提出的遗传效应正交性假设,将经典MR的识别条件推广到更现实的场景,允许SNP对所有时间点特征存在多效性。
在实践层面,研究证实当早期生命阶段GWAS样本量较小时(如MoBa队列),FLOW-MR仍能保持良好统计性能,这对研究胚胎起源假说等早期暴露效应具有重要意义。技术层面,采用的贝叶斯建模策略为处理极端多基因性和弱工具变量提供了新思路。
未来研究方向包括:拓展至非线性因果效应建模、整合表观遗传时钟等生物年龄指标、以及应用于更多发育源性疾病的研究。随着更多生命早期GWAS数据的积累,FLOW-MR有望成为解析疾病发展轨迹的利器,为精准预防提供时变风险靶点。
生物通 版权所有