综述：人工智能作为衰老研究催化剂的综合评述：洞见、空白与未来展望

时间：2026年1月28日

来源：Frontiers in Aging

编辑推荐：

衰老是由从单细胞到生物体水平的相互关联的遗传、表观遗传、分子和生理过程驱动的。高通量数据（包括临床、影像学和多种组学数据）的激增已经超过了传统分析方法的处理能力，推动了人工智能（AI）在衰老研究中的整合。本篇综合评述探讨了机器学习（Machine Learni

衰老是由从单细胞到生物体水平的相互关联的遗传、表观遗传、分子和生理过程驱动的。高通量数据（包括临床、影像学和多种组学数据）的激增已经超过了传统分析方法的处理能力，推动了人工智能（AI）在衰老研究中的整合。本篇综合评述探讨了机器学习（Machine Learning, ML）、深度学习（Deep Learning, DL）和计算机视觉（Computer Vision, CV）在四种经典衰老模型（酵母、秀丽隐杆线虫（Caenorhabditis elegans）、黑腹果蝇（Drosophila melanogaster）和小鼠）中的应用，重点阐述了AI在寿命预测、生物标志物和基因发现、衰老时钟（Aging-clock）构建以及通过自动化动物计数和成像实现的分析自动化中的作用。然而，仅有3%的被综述研究纳入了体内（in vivo）生物学验证，普遍存在的问题包括数据集规模小且不平衡、数据集偏差、预测噪声、缺乏跨物种分析、缺乏细胞毒性测试以及过度依赖合成数据。这些缺陷将AI定位为一种辅助工具而非独立解决方案，若不改进这些方面，AI衍生的发现应被视为假设生成而非确定性结论。为解决这些问题，作者提出了开发标准化评分系统——AI质量评估指标（AI Quality Assessment Metric, AI-QAM）的建议，用于从六个标准评估研究：（1）数据集规模，（2）特征维度，（3）生物学验证类型，（4）物种多样性，（5）模型泛化能力，以及（6）可解释性。此外，为了缓解缺乏统一框架以整合AI方法与衰老生物学机制的难题，作者提出了一个概念框架，将AI应用映射到生物学水平和衰老特征上。只有当AI牢固地基于生物学原理、经过系统性基准测试并通过实验研究进行严格验证时，它才能在衰老研究中充分发挥其潜力。

1 引言

衰老是一个复杂的生物学过程，涉及分子、细胞、生理和组织层面的相互关联的变化，随着时间的推移导致功能衰退。随着全球老年人口的增长，迫切需要理解衰老机制并制定促进健康老龄化和预防年龄相关疾病的策略。模式生物如果蝇、秀丽隐杆线虫、酵母和小鼠因其寿命短、遗传易操作性及与人类系统的生物学相关性而成为衰老研究的中心。这些模型提供了实验可扩展性和伦理优势。传统上，这些生物的研究依赖于劳动密集型和时间密集型的分析来研究衰老表型。然而，高通量技术（如下一代测序、组学分析和先进成像）的使用增加了数据的体量和复杂性，促使研究者转向能够处理和解释这些数据的计算工具。AI（包括ML、DL和CV）已成为这一背景下的变革性方法，不仅能加速发现，还能实现以前手动任务的自动化，减少错误并提高可重复性。尽管影响日益增大，但AI仍面临数据集小或存在偏差、过拟合、缺乏实验验证和跨物种泛化能力差等问题。为此，作者提出了一个统一的框架，将AI应用（预测、发现、自动化等）映射到生物组织水平（分子、细胞、组织和生物体）和衰老特征上，并引入了三级验证体系和AI-QAM评分系统，旨在为AI驱动的老年学研究提供结构和方向。

2 检索策略

本研究进行了结构化的文献检索，涵盖了五种生物系统（酵母、秀丽隐杆线虫、果蝇、小鼠和人类）中所有可用的AI衰老相关研究。研究从PubMed和Google Scholar等主要学术数据库中收集，检索关键词包括“AI in aging studies”、衰老相关关键词（如寿命、健康跨度、生殖跨度）以及AI方法相关关键词（如机器学习、深度学习、计算机视觉）并结合模式生物名称。经过彻底审查，纳入了所有使用AI进行衰老研究并产生显著结果的研究。提取的信息包括生物体、用于训练模型的数据类型（如影像学、组学、临床）、建模方法、验证策略和研究结果。共审查了55项研究（酵母：8项，秀丽隐杆线虫：15项，果蝇：9项，小鼠：11项，人类：12项）。生物学验证被量化为三个层次：计算（仅in silico）、体外（in vitro）和体内（in vivo）。

3 人工智能概览

面对当今数字世界产生的海量数据，AI作为一个多学科领域应运而生，旨在开发能够模拟人类认知功能（如感知、预测、决策和自主行动）的系统。AI系统利用复杂的技术，包括ML、DL和CV。其中，CV是DL的一个子集，而DL本身属于ML的范畴。ML检测大型、非线性和多模态数据集中的复杂模式，而DL使用多层神经网络进行复杂的特征提取，CV则是用于视觉数据解释和分析的DL驱动模型。

4 AI在衰老研究中的应用：AI如何改变生物医学发现

自2020年以来，AI在衰老研究中势头强劲，最显著的优点是在不需要先前生物学知识的情况下识别模式，但输入数据的质量和结构至关重要。AI简化了分析大量临床数据（包括患者记录、影像学数据和多组学数据集）的过程，通过整合海量数据集生成预测模型并有效识别模式。例如，传统的抗衰老化合物筛选涉及广泛的湿实验室实验，而AI通过预测最佳靶标化合物显著简化了这一过程。然而，AI的性能严重依赖于输入数据的质量和数据集规模及偏差。此外，合成数据生成、缺乏生物学实验验证以及模型跨物种的泛化能力是当前限制AI在衰老研究中可靠性的主要瓶颈。

5 衰老研究中的模式生物

鉴于人类生物学复杂性、长寿命和相关伦理限制，模式系统被广泛用作人类衰老研究的类比物。研究揭示了关键的信号通路和基因网络与衰老相关。在常用的模式生物中，从生物学复杂性和人类直系同源基因比例来看，酵母（约8%直系同源基因）、秀丽隐杆线虫（13.3%，具有简单神经系统）、果蝇（16.2%，具有更先进的神经系统）和小鼠（约76.9%，具有相似的器官系统和脑结构）构成了一个层级结构。虽然简单的生物（如酵母和线虫）具有遗传操作容易、成本低和实验周期短的优势，但更复杂的模型（如果蝇和小鼠）为人类疾病提供了更大的生理学相关性和转化潜力。

5.1 酵母

酵母（特别是酿酒酵母和裂殖酵母）是剖析分子水平衰老的主要单细胞模型。其关键分析包括复制寿命（Replicative Lifespan, RLS）和时序寿命（Chronological Lifespan, CLS）。

5.1.1 AI驱动的靶标识别和基因发现

AI已被广泛应用于揭示长寿相关基因、分析蛋白质相互作用和基因功能。例如，利用两层预测算法结合最近邻（Nearest Neighbor, NN）ML模型评估基因缺失对酿酒酵母寿命的影响，强调了线粒体功能和染色质沉默在寿命调控中的关键作用。另有研究采用层次聚类根据微阵列表达谱对基因进行分类，成功识别出潜在的长寿基因。近期研究结合了大规模菌落生长表型组学与NET-FF ML框架，预测了新的基因本体（Gene Ontology, GO）术语，揭示了以前未表征的与细胞衰老相关的蛋白质。

5.1.2 结合微流控和AI的衰老分析自动化

传统的CLS和RLS分析劳动强度大且易出错。为了克服这些限制，微流控技术和AI被集成到酵母衰老研究中。研究探索了多模型DL方法（CNN和胶囊网络的集成）对酵母生命阶段进行分类，准确率高达98.5%。随后，研究引入了自动化RLS预测系统，结合了YOLOv3检测、基于似然的谱系追踪和回归分析，准确率达93%。显著的进展包括“酵母寿命机器”（Yeast Lifespan Machine），一个利用ResNet风格和U-Net模型检测出芽事件和母细胞死亡的微流控平台。最近的“二倍体酵母长期培养（Diploid Yeast Long-term Culturing, DYLC）”芯片结合了18层ResNet算法，实现了高吞吐量的RLS、出芽时间间隔和动态事件的提取（F1 > 92%），标志着单细胞衰老研究的新基准。

5.1.3 关键挑战

尽管AI增强了酵母的生物学分析和数据管理，但主要局限性在于平台特定的AI模型和缺乏跨物种验证。基因发现研究使用的基因组数据集样本量有限，存在过拟合风险。此外，不同平台的成像和实验协议差异导致数据集不兼容，限制了AI模型的泛化能力。

5.2 秀丽隐杆线虫（Caenorhabditis elegans）

这种透明的线虫因其寿命短（约20天）、维护成本低以及约65%的基因具有人类直系同源物而成为衰老遗传学研究的革命性工具。

5.2.1 寿命预测

传统上依赖主观视觉评估，现在AI能够通过图像和视频数据准确预测寿命。研究利用多维表型分析和支持向量回归（Support Vector Regression, SVR）基于高分辨率视频预测年龄和剩余寿命。研究改进了InceptionResNetV2和EfficientNet-B0等模型，分别达到了87%和89.8%的准确率。最新的研究引入了结合U-Net基HydraNet进行分割和CNN基WormNet进行寿命预测的框架，区分短寿和长寿线虫。然而，这些模型需要更大更多样化的数据集以确保在不同成像条件下的可靠性。

5.2.2 揭示分子靶标：预测性基因发现

利用随机森林（Random Forest, RF）模型训练DrugAge数据，识别出了硝基普鲁士钠作为一种有前途的抗衰老化合物。另一项研究应用Mol2vec模型筛选数据库，发现了山奈酚（Kaempferol）和土大黄苷（Rhapontigenin），并在线虫和小鼠中验证了它们的神经保护和抗衰老潜力。还有研究使用监督式ML流程（包括递归特征消除（Recursive Feature Elimination, RFE）与SVM）在多组学数据上优先考虑基因，列出了daf-2、let-363等优先列表。

5.2.3 衰老分析自动化

为了解决分析终止判断和蠕虫追踪问题，研究提出了结合CV和DL（ResNet18和长短期记忆网络（Long Short-Term Memory, LSTM））的自动化方法，以91%的准确率对蠕虫生死进行分类。为了解决数据过拟合和标记问题，生成对抗网络（Generative Adversarial Networks, GANs）和强化学习（Reinforcement Learning, RL）被用于合成数据生成，尽管合成数据可能无法捕捉真实的生物噪声和罕见表型。

5.2.4 关键挑战

最普遍的问题是缺乏毒性评估和早期衰老阶段预测的不确定性，因为早期表型变化细微且发育阶段转变快。

5.3 黑腹果蝇（Drosophila melanogaster）

果蝇因其大小适中、成本效益高、能产生遗传相同的后代、寿命短以及与人类疾病相关基因具有近75%的直系同源基因而被证明是理想的研究对象。

5.3.1 寿命估计

一项独特的方法通过分析睡眠模式估计果蝇寿命，采用双步DL框架，首先使用零膨胀自回归条件泊松（Zero-Inflated Autoregressive Conditional Poisson, VZI-ACP）模型计算活动概率，再输入CNN模型将果蝇分类为短寿和长寿组，准确率>70%。另一项研究开发了结合UNet分割、CNN年龄预测和逻辑回归分析心脏参数的自动化DL流程，准确预测了年龄并识别出扩张型心肌病相关基因OGDH。

5.3.2 精确衰老时钟：细胞水平的生物学年龄估算

为了全面观察衰老相关的基因表达变化，构建了单核转录组图谱——衰老果蝇细胞图谱（Aging Fly Cell Atlas, AFCA），随后建立了以单核转录组作为输入估算生物学年龄的衰老时钟。该时钟确定了核糖体基因表达是衰老的主要驱动力。另一项研究专注于性别差异，利用一维卷积神经网络（1D Convolutional Neural Network, CNN）训练单核RNA测序（snRNA-seq）数据，识别出长链非编码RNA（long non-coding RNA, lncRNA）roX1作为生物标志物，并在体内验证了roX1功能丧失突变体导致存活率降低。

5.3.3 绘制神经变性图谱：大脑衰老的洞察

利用单细胞RNA测序（Single-Cell RNA Sequencing, scRNA-seq）构建成年果蝇大脑的单细胞转录组图谱，并利用基因表达谱训练RF进行脑细胞年龄预测。研究还整合了人类前额叶皮层（Prefrontal Cortex, PFC）和果蝇头部的RNA-seq数据，在测试的13种ML模型中，XGBoost表现最佳，揭示了50个与年龄相关的基因。

5.3.4 衰老诱导基因活性的洞察

早期研究训练SVM模型分析雄性果蝇五个生命阶段的基因表达时间序列数据，预测特定基因的功能，强调了线粒体在衰老过程中的关键作用。

5.3.5 营养调节寿命的AI驱动洞察

为了探索热量限制（Caloric Restriction, CR）的遗传机制，研究训练了四种基于树的集成ML模型（平衡随机森林、Easy Ensemble分类器、XGBoost和CatBoost），确定了一组同时与年龄和饮食相关的基因。另一项研究训练RF模型分析果蝇遗传参考面板（Drosophila Genetic Reference Panel, DGRP）数据集，识别出了关键的代谢物（如乳清酸、苏氨酸和胆碱），并在人类中验证了Src64B基因的作用。

5.3.6 关键挑战

最强贡献是基于组学数据的衰老时钟，但面临数据集有限且高度不平衡的问题，大多数研究仅在少数实验室品系、特定组织和年龄段进行，导致过拟合风险高。此外，只有极少数计算识别的生物标志物进行了体内验证。

5.4 小鼠

小鼠作为典型的哺乳动物模型，寿命适中（约2年），易于操作，拥有定义明确的连接组以及丰富的生物信息学工具和遗传资源，使其特别适用于心脏疾病和神经退行性疾病的建模。

5.4.1 寿命预测

早期研究训练了22种不同的ML模型（包括最近收缩质心（Nearest Shrunken Centroid, NSC）算法），准确率仅为35.3%。随后的进展包括开发基于磁共振成像（Magnetic Resonance Imaging, MRI）的大脑年龄预测模型，结合高斯过程回归（Gaussian Process Regression, GPR）和逻辑回归，显示出高准确性，并将大脑衰老速度与死亡率联系起来。

5.4.2 多模态衰老时钟：甲基化与寿命预测

研究引入了DNAmAge，一种基于弹性网络回归（Elastic Net regression）训练的表观遗传衰老时钟，从DNA甲基化模式中预测年龄，发现异染色质区域的甲基化增加与衰老有关。同年，开发了两种互补的衰老时钟：FRIGHT（Frailty Inferred Geriatric Health Timeline）时钟用于生物学年龄预测，AFRAID（Analysis of Frailty and Death）时钟用于寿命预测，两者均基于虚弱指数（Frailty Indices）并使用随机森林回归训练，显示出与DNA甲基化时钟相当的预测精度。

5.4.3 精准长寿的新型生物标志物发现

通过尿液代谢组学分析和LASSO回归与支持向量机递归特征消除（SVM-RFE）的结合，揭示了六种关键的衰老相关代谢物，包括肾上腺素、戊二酰肉碱、L-犬尿氨酸、牛磺酸、3-羟基十二烷二酸和N-乙酰瓜氨酸。

5.4.4 神经衰老中的AI：代谢与结构洞察

研究调查了衰老诱导的代谢变化和药物（他克林）效果，利用主成分分析（Principal Component Analysis, PCA）、偏最小二乘判别分析、层次聚类分析和SVM分析质谱成像（Mass Spectrometry Imaging, MSI）数据，准确检测了线粒体功能、神经传递和脂质信号的变化。另一项研究结合多粒子追踪（Multiple Particle Tracking, MPT）和XGBoost模型检查细胞外基质（Extracellular Matrix, ECM）随衰老的改变，发现纳米颗粒流动性随年龄下降，表明ECM密度增加。

5.4.5 解读年龄驱动的分子与结构改变

利用RF模型分析转录组数据，发现免疫和应激反应基因的上调驱动大脑衰老，而代谢和发育基因的下调导致心脏和肌肉衰老。另有研究结合图像处理和SVM分类器（SVM-C）调查小胶质细胞的形态学变化，揭示了随着年龄增长，活化小胶质细胞增加，杆状类型减少。利用衰减全反射-傅里叶变换红外光谱（Attenuated Total Reflectance-Fourier Transform Infrared, ATR-FTIR）和线性判别分析（Linear Discriminant Analysis, LDA），研究了年轻血浆输注对老年大鼠肝脏和肠道组织的影响，发现年轻血浆减少了肝纤维化并恢复了脂质-蛋白质平衡。

5.4.6 关键挑战

尽管小鼠提供了比无脊椎动物更接近人类的生理相关性，但普遍面临的挑战是小样本量。此外，小鼠相对较长的寿命使得实验耗时，高昂的动物维护成本限制了研究通常只能在小型队列中进行，导致AI模型训练不足，增加了偏差、噪声敏感性和过拟合的风险。

5.5 人类

由于伦理考虑、复杂的人类生理学和较长的人类寿命，直接对人体进行衰老实验是不可行的。然而，AI与广泛患者数据集的结合提供了一个强大的替代方案。

5.5.1 基于临床和分子数据的年龄预测

研究比较了传统统计模型与RF、XGBoost（XGB）、支持向量回归（SVR）和深度神经网络（Deep Neural Networks, DNN），确认DNN是利用临床生物标志物（如血压、代谢标志物、身体成分指标）预测生物学年龄最准确的模型。另一项研究开发了一个基于XGBoost的生物学年龄（Biological Age, BA）预测器，分析了44个临床和生理特征，表明健康的生活习惯可能减缓生物学衰老。

5.5.2 衰老时钟技术的进展

研究引入了iAge，一种基于引导自动编码器（Guided Autoencoder, GAE）DL模型的炎症免疫衰老预测因子，通过分析血液免疫生物标志物，将慢性炎症与年龄相关疾病联系起来，并确定了CXCL9是关键驱动因素。在眼部系统方面，开发了eyeAge，一种利用Inception-v3架构从眼底图像预测实际年龄的视网膜衰老时钟，平均绝对误差约为3年，并通过全基因组关联研究（Genome-Wide Association Study, GWAS）确定了ALKAL2为顶级视网膜衰老基因，并在果蝇中进行了功能验证。

5.5.3 新型人类衰老生物标志物识别

早期研究利用五种监督式ML模型分析肌肉基因表达数据，估算肌肉组织年龄，鉴定了20个衰老相关基因和通路。为了解决血液、大脑、视网膜生物标志物与衰老的关系，研究开发了基于ResNet的CNN模型分析T1加权MRI扫描，引入预测年龄差（Predicted Age Difference, PAD）作为潜在的衰老生物标志物。另有研究将循环RNA（circular RNAs, circRNAs）确定为法医年龄生物标志物。

5.5.4 抗衰老基因和药物发现的AI驱动策略

研究利用XGBoost、SVM和逻辑回归检查了21,000个人类蛋白质特征，验证了已建立的衰老相关蛋白并提出了新的候选者。另一项研究结合线性回归模型、SHapley Additive exPlanations（SHAP）和贝叶斯网络分析跨物种基因表达与最大寿命的关系，发现了57个新的长寿相关基因。针对癌症与衰老的关联，利用PandaOmics平台预测了23个以前未知的兼具抗衰老和抗癌潜力的基因。针对年龄诱导的心力衰竭，应用LASSO、RF和SVM-RFE识别了14个关键的衰老相关基因和六种潜在的药物候选物。

5.5.5 关键挑战

尽管取得了实质性进展，但人类衰老研究中的AI应用面临关键限制。大多数研究依赖于主要由健康个体组成的数据集，这引入了显著的偏差，限制了发现在多样化或患病群体中的临床适用性。此外，小样本量、缺乏纵向数据以及对高风险或老年群体的代表性不足，降低了模型的稳健性和泛化能力。许多模型缺乏分子水平数据的整合，这对于机制解释和转化相关性至关重要。

6 讨论

AI无疑彻底改变了衰老研究，改变了数据分析、可预测性、模式识别和实验加速。上述研究清楚地表明，AI不仅有助于新发现和加深对衰老生物学的理解，而且显著实现了实验程序的自动化。最初，衰老研究中的AI严重依赖ML技术，面临准确性和验证方面的挑战，而DL的整合显著改善了这些结果。然而，AI仍然是一种工具而非独立的解决方案。AI预测和识别从根本上取决于用于训练和验证的数据的类型和数量。当数据集小、不平衡或缺乏关键的生物学因素时，AI模型的预测可能会产生误导。为了解决这个问题，各种AI模型（包括GANs和RL）被用来生成合成数据，但这引发了关于其现实性、伦理影响和有效性的担忧。一个引人注目的发现是，只有3%的研究包含了体内验证，强调了实施分层模型验证系统的必要性（Level 1：仅in silico；Level 2：in vitro确认；Level 3：in vivo生物学验证）。如果没有完成这个实验验证层级，AI衍生的见解应被视为假设而非具有转化意义。另一个挑战来自于AI模型建立的相关性。例如，如果一个AI模型识别出一个特定基因随衰老而上调，这并不一定意味着该基因导致了衰老。因此，许多由AI模型识别的药物候选物在临床前试验中因不可预见的副作用或缺乏有效性而失败。最后，纵向数据在基于AI的衰老研究中的利用目前未得到充分重视。纵向数据集允许模型捕捉真正的衰老轨迹，消除潜在的个体间变异性，并产生更可靠的衰老预测。

7 未来展望

正如综述中所观察到的，该领域缺乏将AI技术与衰老的生物学机制统一起来的框架。为了弥补这一差距，作者提出了一个对齐的框架，阐明特定的AI工具如何更好地服务于特定的机制目标。为了增强AI生成发现在衰老研究中的可信度和可靠性，作者建议开发标准化评分系统——AI质量评估指标（AI-QAM）。该评分系统将从六个维度评估研究：（1）数据集规模，（2）特征维度，（3）生物学验证类型，（4）物种多样性，（5）模型泛化能力，以及（6）可解释性。这些指标可用于研究人员验证其结果，审稿人也可以基于标准的AI-QAM分数评估AI模型的声明和性能。例如，每个维度可以从0-3分，总分18分，也可以表示为百分比。此外，AI-QAM统一适用于所有数据类型（组学、影像学、临床）。总之，该领域不仅需要先进的算法，还需要更智能的框架，每一个AI研究都应通过实验验证层级才能声称具有临床相关性或转化潜力。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部