基于多任务学习的阿尔茨海默病复杂性状遗传预测模型构建与应用研究

时间:2026年2月8日
来源:Scientific Reports

编辑推荐:

本研究针对阿尔茨海默病(AD)遗传风险预测中单任务模型的局限性,创新性地采用多任务学习(MTL)框架整合跨表型遗传信息,并结合基因水平变异聚合策略。结果表明Sluice Network模型通过灵活参数共享机制显著提升预测精度,为复杂疾病遗传架构解析提供了新范式。

广告
   X   

随着全球人口老龄化进程加速,阿尔茨海默病(Alzheimer's Disease, AD)作为最常见的神经退行性疾病,正成为重大公共卫生挑战。这种疾病具有复杂的遗传背景,涉及多个基因和生物通路的相互作用。传统上,研究人员通常采用单任务学习(Single-Task Learning, STL)方法构建遗传风险预测模型,即针对单个表型(如记忆衰退程度或脑萎缩速率)独立建模。然而,AD相关表型往往共享共同的遗传基础,这种"各自为战"的建模方式不可避免地忽视了宝贵的表型间关联信息,如同医生仅通过单一症状判断病情而忽略症状间的内在联系。
为突破这一局限,本研究创新性地将多任务学习(Multi-Task Learning, MTL)范式引入AD遗传研究领域。MTL的核心思想是让多个相关任务在模型训练过程中共享知识,类似于医生综合患者多种症状进行联合诊断。研究团队重点探讨了两个关键科学问题:MTL是否能有效提升AD遗传风险预测的准确性?在基因水平(而非单个单核苷酸多态性位点)聚合遗传信号能否进一步优化模型性能?
研究方法与技术路径
本研究采用AD神经影像倡议(Alzheimer's Disease Neuroimaging Initiative, ADNI)队列的遗传和表型数据,系统比较了四种建模策略:单任务学习(STL)、硬参数共享(Hard Parameter Sharing, HPS)、Sluice Network和学习分支(Learning to Branch, LTB)模型。通过模拟实验评估不同遗传共享程度下的模型表现,并验证基因水平变异聚合(将多个单核苷酸多态性信号汇总至基因维度)的增效作用。
研究结果
  1. 1.
    模型性能比较
    模拟实验显示,Sluice Network在多种遗传共享情境下均保持最优预测精度,这得益于其可自动学习任务间参数共享强度的自适应机制。当表型间遗传相关性较高时,LTB和HPS模型表现接近Sluice Network,但在低共享场景下性能显著下降。STL模型因无法利用跨表型信息而持续落后。
  2. 2.
    基因水平聚合的增益效应
    将遗传变异从单核苷酸多态性水平提升至基因水平(通过汇总基因内所有变异信号)后,所有模型预测性能均获提升,其中Sluice Network和LTB模型的改善幅度最为显著。这表明生物导向的特征工程能有效浓缩遗传信息,降低数据噪声。
  3. 3.
    真实数据验证
    在ADNI队列实证分析中,Sluice Network对临床评分和影像学生物标志物的联合预测误差较STL降低23.6%。基因水平聚合策略使模型曲线下面积(Area Under Curve, AUC)平均提高0.07,证实该方法在真实场景的有效性。
结论与展望
本研究首次系统验证了多任务学习在AD遗传风险预测中的优势,并揭示基因水平信号聚合的协同增益效果。Sluice Network凭借其灵活的参数共享机制,成为处理复杂疾病异质表型的理想工具。该研究为破解复杂疾病"遗传-表型"映射难题提供了新思路,推动遗传风险预测从"单打独斗"向"协同作战"范式转变。未来可进一步整合多组学数据,建立动态风险预测模型,最终实现AD的精准预防与早期干预。论文发表于《Scientific Reports》,为复杂疾病计算建模研究提供了重要方法论参考。

生物通微信公众号
微信
新浪微博


生物通 版权所有