ABSTRACT
遗传血统指的是通过等位基因频率相关性推断出的个体生物地理学起源。在药物基因组学(PGx)领域,理解遗传血统的复杂性已被证明大有裨益。PGx旨在通过个性化用药方案优化治疗效果,同时将副作用风险降至最低。随着电子健康记录(EHR)的普及,利用机器学习方法可以将人群特异性遗传数据与临床数据整合,以改进个性化治疗计划。此外,转录组、甲基化组、蛋白质组和代谢组等多组学数据,结合机器学习方法的进步,为理解遗传变异提供了更全面的方法。在多样化人群中扩展PGx研究可以扩大精准医学的影响,特别是在代表性不足的群体中。
1. 引言
1.1. 药物基因组学(PGx)与精准医学
在后人类基因组计划时代,药物基因组学(PGx)被誉为以患者为中心的精准医学的重要组成部分。PGx领域研究遗传学对个体药物反应的影响,旨在利用患者的遗传信息促进更安全、个性化的用药。药物反应的个体间差异与多种因素有关,包括导致药物代谢酶(DMEs)、受体、通道以及其他涉及药效学和药动学的蛋白质活性或可用性改变的遗传变异。这种药物反应差异可能导致药物不良反应(ADRs)和无反应表型(缺乏疗效)。通过识别影响药物反应的遗传标记,PGx使医疗保健提供者能够预测哪些患者更有可能出现不良反应或治疗失败。这些知识有助于制定更个性化的用药方案,同时将副作用风险降至最低。
1.2. 理解遗传血统
遗传血统在此指的是祖先来自世界相似区域的个体,因此具有更高程度的遗传相似性,特别是在等位基因频率和连锁不平衡(LD)模式方面。数千年来的人类迁徙、种群瓶颈和其他塑造人类群体遗传学的因素导致了群体分层。对于许多遗传分析,使用遗传血统对个体进行分层是有帮助的,以避免将结果与血统相关的LD模式或等位基因频率关联起来。这通常通过将个体分配到与标记的基因组参考面板(如1000个基因组计划(1KGP)参考面板)具有最高遗传相似性的组来实现。1KGP包括五个定义的超群体分组:非洲(AFR)、混合美洲(AMR)、东亚(EAS)、欧洲(EUR)和南亚(SAS)。这并不意味着这些群体之间存在有意义的、根本的生物学差异,并且这些群体内部的遗传变异远远大于它们之间的差异这一事实仍然成立。
1.3. 将种族和民族与遗传血统解耦
种族和民族是基于共同起源、文化、传统和社会经历的社会赋予的特征。这些不是生物学类别;它们是遗传多样性的不精确代理。相比之下,遗传血统是一种基因组特征,它基于祖先源群体之间共享的相关等位基因频率来估计个体的生物地理学起源。由于人类群体经过数千年的迁徙,不同的迁徙和定居模式导致了遗传瓶颈和其他事件,从而塑造了遗传多样性。因此,等位基因的全球分布是非随机的,某些等位基因在特定群体中频率显著偏高或偏低。
2. 基因组学时代的药物遗传学发现
2.1. 用于PGx发现的全基因组关联研究(GWAS)
PGx方法学近几十年来发生了显著演变。早期方法包括家族和双胞胎研究、连锁分析以及候选基因关联研究(CGAS)。虽然家族研究、连锁分析和CGAS产生了重要的早期PGx发现,但它们固有的局限性在于其关注范围狭窄,无法检测到对药物反应的复杂遗传贡献。2003年人类基因组计划的完成,加上高通量基因分型技术的发展以及国际HapMap项目,通过实现全基因组关联研究(GWAS)彻底改变了PGx发现。GWAS采用一种不可知论的方法,同时评估整个基因组中数十万乃至数百万个遗传变异,而无需事先的生物学假设。
2.2. 药物-基因相互作用的血统特异性研究
PGx研究已经确定了几种药物-基因相互作用,其中遗传变异仅在特定血统群体中与药物反应显著相关。多年来,硫嘌呤毒性被认为主要与在欧洲血统人群中常见的TPMT变异相关。然而,在亚洲血统人群中的研究显示,NUDT15变异是这些人群中毒性的更关键预测因子,这从根本上改变了整个东亚地区的处方实践。
2.3. 混合人群中离散遗传血统的局限性
基于PCA的参考匹配这种标准的遗传血统推断方法,对于具有混合基因组的个体来说存在不足。尽管近期的全球化加速了全球人群的遗传混合,但历史上的迁徙、贸易关系、战争、奴役和殖民都影响了人类的混合。虽然遗传主成分(PCs)能有效捕捉与相对同质的参考人群的遗传相似性,但在更混合的人群中用于调整群体结构时,可能会产生虚假关联。
3. 多基因评分(PGS)在PGx中的机遇
随着GWAS拓宽了我们对药物反应中遗传因素的理解,小的PGx样本量在存在多重检验的情况下限制了统计功效,这意味着在获得更大的队列之前,只能检测到少量大效应的PGx变异。此外,如前所述,这些大效应变异本身仅占药理学性状总遗传力的一小部分。多基因评分(PGS)应运而生,它将众多遗传变异的效应组合成一个单一指标,可以更全面地捕捉对药物反应的遗传贡献。
3.1. PGS临床实施的障碍
尽管该领域对PGS保持着显著的热情,但将PGx PGS实施到临床护理中的例子有限。PGx PGS临床实施的一个主要障碍,特别是精神病学领域,是缺乏PGx检测的机会,这主要是由于以下原因之一:1)提供者理解/教育不足;2)卫生系统对检测的临床效用缺乏共识;3)在某些卫生系统中,订购PGx基因检测的工作流程复杂;4)PGx基因检测报销的支付方环境不一致且不断变化;5)即使在监管标签建议进行此类检测的情况下,也缺乏符合临床指南的实践。
4. 生物样本库规模的PGx
电子健康记录(EHR)关联的生物样本库是结合了来自大型患者队列的EHR和基因组数据的综合数据库。EHR包含关于患者病史的大量信息,包括诊断、治疗、药物、实验室结果和其他临床数据。单个患者的信息存储时间很长,创建了一个可用于追踪疾病进展和药物反应的临时信息库。
4.1. EHR关联生物样本库中的PGx计划
在PGx范围内,EHR关联的生物样本库为研究人员提供了资源,以研究遗传变异如何影响个体对药物的反应,包括药物疗效和ADRs风险。基于EHR的算法和数据通常用于在自然发生的医疗/卫生系统人群中开发PGx研究的临床表型。将药物暴露作为表型通常需要连接EHR中的结构化和半结构化数据。基于特征(如暴露、遗传学和额外表型)对患者进行病例对照分层需要额外连接基因组和EHR信息。
4.2. PGx群体频率研究
这些大规模EHR关联的生物样本库是表征PGx变异群体水平频率的关键资源,使研究人员能够评估一系列遗传血统群体和全球人群中药物反应和疗效的变异性。药物遗传学临床注释工具(PharmCAT)基于CPIC指南标准化临床PGx注释,已应用于各种生物样本库以量化可操作的PGx等位基因。
5. 解决PGx中血统差异的新兴方法
5.1. 多组学数据整合
除了基因组之外,其他组学数据类型,如转录组、甲基化组、蛋白质组和代谢组,允许使用表型测量值进行药物反应预测,这些测量值能更好地代表人类生理的动态特性。具有PGx意义的临床终点,如治疗效果方差和严重ADRs,已被证明受到转录组、蛋白质组、表观遗传、临床和环境因素的调节,这些因素仅靠遗传变异无法充分捕捉。
5.2. 机器学习(ML)方法
尽管机器学习(ML)在PGx应用中的使用还处于起步阶段,但这些方法在通过从复杂的高维数据预测药物反应和患者分层来推进PGx方面已开始显示出前景。精神病学的PGx应用,其中治疗结果变化很大且患者分层至关重要,在采用这些新方法来改进患者反应预测方面尤为迅速。
6. 未来展望
随着基因组和临床数据变得越来越容易获得,PGx的开发和临床实施仍有巨大的进步空间。全球人群在发现和验证研究中的有限代表性仍然是该领域的一个主要挑战。生物样本库研究表明,具有重要临床意义的已知PGx变异在不同血统群体中的频率和效应大小存在显著差异,然而当前的剂量指南和决策工具通常依赖于主要来自欧洲血统个体的证据。
文章亮点
引言
- •
药物基因组学(PGx)被誉为以患者为中心的精准医学的重要组成部分。
- •
国家科学院关于群体描述符的报告描述了遗传相似性与遗传血统之间的关系。解释了在整篇综述中使用这两个短语的基本原理。
- •
定义了全局和局部遗传血统之间的差异。
基因组学时代的药物遗传学发现
- •
描述了全基因组关联研究(GWAS)PGx,重点介绍了一些关键例子,并讨论了PGx研究中样本量有限的基本挑战。
- •
有许多已发表的PGx药物-基因关系在特定大陆血统群体中存在关联或频率不同。
- •
通过几个关键例子重点介绍了PGx研究中的全局和局部血统特异性方法。
多基因评分在PGx中的机遇
- •
多基因评分(PGS)已成为疾病风险预测的新前沿,但很少有例子将PGS方法用于预测PGx的药物反应。
- •
由于缺乏PGx检测的机会,PGS的临床实施仍然存在若干障碍,包括患者/提供者教育不足、保险覆盖范围以及不符合临床指南。
- •
遗传血统对于预测药物反应或疾病表型的PGS模型仍然至关重要,并且需要清晰的科学指导来适当解释PGS结果。
生物样本库规模的PGx
- •
电子健康记录(EHR)关联的生物样本库近年来可用性不断提高,其中许多包含纵向EHR以及测序模式。
- •
EHR关联的生物样本库为PGx研究提供了获得更大、更多样化数据集的能力,并描述了几项PGx群体频率研究。
解决PGx中血统差异的新兴方法
- •
多组学研究将为PGx研究提供新的、令人兴奋的数据资源;这些数据集可能会限制当前PGx研究中的一些遗传血统局限性,因为基因和蛋白质表达受遗传血统的影响较小。
- •
机器学习(ML)方法将为这些大型、多样化、多组学PGx数据集中的发现提供强大的新机会。强有力的科学指导对于确保这些方法在临床背景下得到恰当解释至关重要。
- •
大型语言模型(LLMs)的开发和评估可以促进PGx在临床环境中的实施。
未来展望
- •
持续扩展具有多样化、全球代表性的数据集对于在所有人群中扩展PGx以实现精准医学至关重要。
- •
越来越需要能够整合环境数据以预测药物反应的、具有血统意识的多组学模型。
- •
开发包含群体特异性等位基因频率和药物相互作用效应的临床决策支持系统可以显著改善患者护理。