基因组学已成为精神病学研究中的一个变革性工具,为历史上以主观症状为特征的疾病提供了客观的生物学框架[1]。这种方法通过确定遗传风险变异及其影响的功能途径,揭示了疾病的分子病因,从而发现了新的治疗靶点[2]。基因组学的一个关键优势在于它能够在症状出现之前量化疾病易感性,为预防性干预和一级预防提供了可能[3]。同时,快速的技术创新以及促进开放数据共享的联盟倡议,使得大规模多组学数据集呈指数级增长[4]。这一丰富的资源为解析精神疾病固有的细胞和表型异质性提供了前所未有的基础。基于这些发展,本文系统地评估了人工智能(AI)在这一领域中的重要作用。
基因组学研究逐渐揭示了人类疾病的遗传结构,使得从靶向肿瘤学到早期诊断的临床应用成为可能[5]。虽然大规模生物样本库已经在利用这些发现进行预测医学研究,但在过去十年中,精神疾病基因组学领域经历了特别的复兴,这得益于合作联盟和先进分析工具的推动[6, 7, 8]。这些努力表明,该领域仍面临许多复杂且依赖于具体背景的挑战,包括高度多基因的遗传结构、显著的表型异质性、脑组织的难以获取性以及普遍存在的基因-环境相互作用[9]。因此,将AI应用于这一领域仍然是揭示精神疾病生物学基础的一个艰巨但至关重要的前沿课题。
精神疾病基因组学的复杂性要求使用先进的计算方法,尤其是AI和深度学习(DL)[10],来解析高维数据。这些方法在识别传统的统计方法难以捕捉的微妙非加性模式(如上位效应和基因-环境相互作用)方面表现出色[11]。因此,本文总结了针对基因组数据的深度学习最新进展及其在精神疾病中的应用。我们首先介绍了特定任务的模型,然后探讨了基础模型,这些模型通过预训练从庞大的分子数据集中提取基本的生物学“语言”。最后,我们展示了这些工具如何被用来揭示精神疾病的机制,勾勒出了从计算创新到治疗洞察的路径。图1总结了本文讨论的关键概念。这一概述旨在跨越不同学科,为研究人员提供必要的概念框架,以便他们能够利用这些强大的方法。