生物标志物是可客观测量的生物学特征,可反映正常生理状态、病理状态或药物反应,是精准医疗不可或缺的组成部分。基因组学、表观基因组学、转录组学、蛋白质组学、代谢组学和脂质组学的多组学平台融合,通过跨平台数据整合实现了传统单一组学无法达到的生物标志物发现能力。组内水平整合与跨组学垂直整合能够识别具有更高诊断精度和治疗预测性的分子特征。本综述批判性评估内容包括:生物标志物的分类与临床用途;疾病特异性监测与预测应用;现代分析与生物传感策略;纳米技术检测平台的比较分析,明确评估检测限、可扩展性和技术就绪度(TRL);涵盖美国食品药品监督管理局(FDA)生物标志物资格认定计划、BEST(Biomarkers, EndpointS, and other Tools)框架及欧洲药品管理局(EMA)资格认定意见的监管路径;生物信息学与影像组学工具;以及空间转录组学、基于CRISPR的诊断和人工智能驱动液体活检等新兴技术。每个生物标志物与检测平台均结合其证据等级与技术就绪度进行语境化说明,以避免将临床前观察结果与经过临床验证的标志物混淆。
1. 引言
生物标志物是现代精准医疗的核心,其临床用途覆盖几乎所有疾病领域的疾病预测、诊断、患者分层、治疗监测和预后评估。然而,生物标志物转化中存在显著差距:大多数候选标志物在分析验证阶段失败,仅有极少数获得监管机构批准用于常规临床应用。多组学技术的快速发展为填补这一空白提供了可能,但单一组学平台的分析往往产生不完整且不一致的标记特征。多组学的核心优势在于数据融合:水平整合可在单一组学层内联合不同平台或队列的数据,垂直整合则可关联多个组学层的信号,揭示单平台分析无法发现的收敛分子机制。现有文献大多仅描述单个组学的贡献,缺乏系统的跨组学整合策略及其临床实施所需的分析框架。此外,多数生物标志物综述缺乏监管语境,未能结合FDA生物标志物资格认定计划(BQP)、FDA-NIH BEST框架及EMA资格认定意见所定义的证据标准,导致读者无法评估所述标志物的转化成熟度。同时,纳米生物传感器综述常孤立报告检测限,缺乏对平台的可扩展性及临床部署障碍的比较分析。本综述针对这些不足,系统整合生物标志物分类与临床应用、纳米检测平台的性能比较、监管资格路径、多组学整合策略,并展望空间转录组学、CRISPR诊断及AI驱动液体活检等前沿技术的临床转化瓶颈。
2. 检索策略与文献选择
本研究为结构化叙述性综述,检索数据库包括PubMed/MEDLINE、Scopus、Web of Science及Google Scholar,使用布尔逻辑组合MeSH术语如“生物标志物”“多组学”“生物传感器”“纳米技术”“蛋白质组学”“基因组学”“代谢组学”“精准医疗”“CRISPR诊断”“液体活检”“空间转录组学”,检索时间截至2024年12月,纳入标准为经同行评议的原创研究或综述,内容涉及生物标志物的检测、表征、验证或临床应用。
3. 生物标志物的分类
生物标志物依据功能目的分为五类:风险生物标志物(antecedent biomarkers)用于疾病发生前的危险识别;筛查生物标志物(screening biomarkers)用于亚临床疾病检测;诊断生物标志物(diagnostic biomarkers)用于确诊已发生的疾病;分期生物标志物(staging biomarkers)用于评估疾病严重程度;预后生物标志物(prognostic biomarkers)用于预测病程或治疗反应。药代动力学生物标志物用于量化药物暴露与分布,药效动力学生物标志物反映对治疗或环境因子的生物学反应。预测性生物标志物指导治疗选择,安全性生物标志物指示毒性。替代终点需具备坚实的流行病学与治疗学证据支持。已验证的生物标志物需采用科学证据证明其与生理、药理、毒理或临床相关的分析方法进行定量。此外,依据FDA-NIH BEST框架,生物标志物还可按类型分为分子、影像、生理、数字、病理及暴露生物标志物,各类别在不同疾病或药物研发阶段发挥特定作用。
4. 疾病监测与治疗中的生物标志物
蛋白质、核酸、酶、抗原、抗体及代谢产物是疾病监测的主要标志物类别。慢性丙型肝炎中,HCV RNA定量用于监测治疗反应;凝血酶原时间与国际化比值(INR)指导抗凝治疗;前列腺特异性抗原(PSA)用于前列腺癌疗效监测;CA-125用于卵巢癌进展评估;HIV RNA指导抗逆转录病毒治疗;B型利钠肽(BNP)及N末端B型利钠肽原(NT-proBNP)用于儿童肺动脉高压随访。预测性生物标志物在治疗前或早期治疗中评估反应并优化方案,例如结核分枝杆菌特异性CD4+ T细胞与抗结核治疗效果相关,内脏利什曼病中巨噬细胞相关标志物可敏感预测抗利什曼原虫治疗反应。具体疾病相关标志物的分类、检测技术、标本类型及技术就绪度(TRL)显示,PSA、CA-125、肌钙蛋白I等为TRL 9级(FDA批准临床标准),循环肿瘤DNA(ctDNA)突变特征为TRL 7-8级(部分获FDA批准),缺血性卒中模型中的心房利钠肽(ANP)仅为TRL 3-4级(临床前阶段),不可与临床验证标志物等同视之。
5. 生物标志物分析
生物标志物包括病理生理分子、细胞或组织特征、基因改变和蛋白质组分,其定性或定量分析可反映疾病状态或治疗干预效应。信使RNA水平与蛋白质表达谱常被用作标志物。微阵列、二维凝胶电泳、质谱及生物信息学整合的蛋白质平台推动了检测能力的进步。临床应用的生物标志物需在血清、尿液、唾液、汗液或血液等易获取体液中有较高疾病特异性,其诊断性能取决于灵敏度、特异性和预测准确性。例如CA-125用于区分卵巢恶性肿瘤与其他癌症类型,但单一标志物常不足以确诊,因其在良性疾病中也可能升高。多种方法学被用于评估,包括基因组学、转录组学、蛋白质组学、代谢组学、脂质组学及糖组学,所有标志物均需严格验证以确保临床可靠性。
6. 多组学数据整合:框架、工具与临床应用
单一组学平台提供的信息重要但有限:基因组学识别遗传性风险变异,转录组学揭示基因表达失调,蛋白质组学表征功能性蛋白改变,代谢组学反映下游生化后果,表观基因组学连接环境暴露与可遗传的基因调控变化。多组学整合成为精准生物标志物发现的核心策略,分为两类架构:水平整合,即在单一组学层内联合不同队列、平台或时间点数据以提高统计效力与跨研究可重复性;垂直整合(又称跨组学整合),即关联多个分子层的信号以识别收敛的疾病机制,相比单平台分析显著降低假发现率。计算工具包括MOFA+(多组学因子分析),用于无监督整合转录组、蛋白质组和表观基因组数据以识别驱动疾病异质性的潜在因子;DIABLO(mixOmics R包中实现),用于有监督整合以识别区分疾病亚型的多组学标志物组合;癌症基因组图谱(TCGA)与国际癌症基因组联盟(ICGC)提供标准化多组学数据集;PaintOmics 4与Reactome等通路整合工具可将多组学信号映射到已知代谢与信号通路,提升富集分析的可解释性。在临床应用中,肿瘤学的整合基因组-转录组-蛋白质组分析比单一PD-L1表达更能准确预测免疫治疗反应;心血管疾病的代谢组、脂质组与蛋白质组交叉整合可识别补充传统血脂检测的新型风险标志物;循环肿瘤DNA(ctDNA)与转录组及甲基化数据的多分析液体活检整合,显著提高了单一ctDNA检测的早癌灵敏度,Grail Galleri多癌早检测试即为商业化实例。当前瓶颈包括平台间数据协调需精细批次校正以避免技术变异干扰生物学信号;患者缺失某些组学层的数据给建模带来困难;高维多组学数据需要大样本量,对罕见病构成挑战;分析流程尚未标准化限制实验室间可重复性;临床实施需简化且具成本效益的检测形式,无需每位患者全基因组测序,这在工程与卫生经济学层面均为重大挑战。完整的转化工作流程包括跨组学数据整合、基于生物学与统计学意义的候选优先级排序、技术与临床验证,以及对预后、诊断和治疗应用的临床效用评估。
7. 生物标志物检测与分析方法
检测复杂生物基质中生物标志物的分析技术多样,包括免疫组织化学染色、聚合酶链反应(PCR)检测、酶联免疫吸附试验(ELISA)、免疫沉淀及免疫聚集法。微粒免疫聚集测定利用抗体包被微粒在抗原结合后聚集,通过浊度变化定量标志物,适用于PSA、CA-125、C反应蛋白(CRP)及治疗性抗体监测。表面功能化通过固定蛋白质、多肽或生物活性化合物实现选择性分子识别,例如硫醇化甲基丙烯酰氧乙基磷酸胆碱自组装单层修饰的纳米线检测C反应蛋白,纤维素或生物素衍生物功能化的金纳米颗粒(AuNP)在结合分析物时产生可见比色信号,电化学修饰的碳纳米纤维实现DNA与寡核苷酸结合,DNA探针修饰的金包被磁性纳米颗粒可在全血中检测1-10 nM的微小RNA(miRNA),区分肿瘤相关miRNA谱。原位分析支持实时监测,焦点分子记录术(focal molography)无需大量样品制备即可检测特异性无标记生物分子相互作用;和频振动光谱结合衰减全反射傅里叶变换红外光谱(ATR-FTIR)可在200 nM浓度检测生物分子,界面灵敏度优异;安培酶通道免疫传感器可实现免疫球蛋白相互作用的实时定量与动力学参数分析。直接结合测定中,基质辅助激光解吸电离成像质谱(MALDI-IMS)可从组织切片直接生成多维空间表达图谱,同时提供分子身份与空间定位信息,如前列腺组织中差异肽表达谱可区分恶性与健康组织;微流控芯片实验室平台可检测急性心肌梗死相关的心肌肌钙蛋白I(cTnI)与肌酸激酶同工酶(CK-MB)。治疗性抗体检测方面,表面等离子体共振(SPR)可同时测量英夫利昔单抗及其抗药物抗体,灵敏度和重现性优于商业ELISA;靶向CH2结构域抗体的夹心ELISA可定量非人灵长类血清中的治疗性抗体;功能化碳纳米管结合ANP靶向抗体可在临床前大鼠卒中模型中实现靶向检测,但该研究仍处于TRL 3-4级,未进入临床转化阶段。
8. 临床相关大分子传感
纳米生物材料传感器凭借高生物相容性、便携性及低成本优势用于生物医学诊断。电化学生物传感器利用酶、抗体、核酸等识别元件检测生物分子浓度变化,石墨烯量子点电化学生物传感器可在1-50 nm尺度检测疾病特异性标志物,在早期癌症检测中具有潜力;3D打印电化学平台包括石墨烯基葡萄糖传感器、辣根过氧化物酶-石墨烯过氧化物检测器及用于离体小鼠结肠组织血清素检测的碳纳米复合材料电极。光机传感器将机械运动与光学共振耦合,具备极高灵敏度与抗电磁干扰能力,高Q值微腔光学系统可实现单分子无标记传感;纳米机械生物传感器可检测低至10 ag/mL的肿瘤蛋白;光学弹簧光机系统可在信噪比16.8条件下检测单个牛血清白蛋白分子(66 kDa)。纳米技术传感平台的比较显示:金纳米颗粒平台临床成熟度最高(TRL 7-9),已有多个FDA批准的侧流层析产品上市;CRISPR-Cas12a/Cas13平台(SHERLOCK/DETECTR)检测限达阿摩尔级(aM),等温扩增适配即时检测(POC),已获COVID-19紧急使用授权(EUA),正扩展至ctDNA与miRNA癌症检测;碳纳米管与石墨烯平台虽达飞摩尔(fM)检测限,但存在血清表面污染、批次差异及无获批体外诊断(IVD)格式等问题;金属有机框架(MOF)仍处TRL 2-4级,合成复杂且稳定性数据有限。实验研究涵盖从无细胞体外检测到体内动物实验及人类临床研究,约65%的平台在血清、血浆、加标样品或组织切片的体外系统中验证,15%使用离体组织模型,8%使用体内动物模型,12%直接进行人类临床评估,不同模型的转化局限性需在解读结果时予以考虑。
9. 生物标志物分析的生物信息学工具与统计标准
生物信息学工具支持生物标志物发现与癌症分型,单细胞RNA测序(scRNA-Seq)可在单细胞分辨率表征肿瘤亚群;突变特征分析利用SignatureAnalyzer与Musicatk识别特征性体细胞突变模式;肿瘤突变负荷(TMB)作为预测免疫治疗反应的标志物,可通过微卫星不稳定性与热点平台评估;基于网络的工具如Reactome通路分析可识别癌症驱动突变;机器学习工具DriverNet、Oncobox、DeepCC可识别预后与预测性生物标志物。生物标志物性能的统计验证指标包括灵敏度(真阳性率)、特异性(真阴性率)、阳性预测值(PPV)、阴性预测值(NPV)、受试者工作特征曲线(ROC)及曲线下面积(AUC)、校准度,以及技术就绪度(TRL)分级(TRL 1-3为基础与分析验证,TRL 4-6为临床前转化研究,TRL 7-9为临床验证与监管批准)。
10. 生物标志物资格认定的监管路径
理解监管资格框架对于判断生物标志物的转化成熟度至关重要。FDA-NIH BEST框架定义了八类生物标志物,并标准化了“使用情境(COU)”语言,指导所有FDA监管提交中的分析验证与临床验证策略,是强制性的概念框架。FDA生物标志物资格认定计划(BQP)提供三阶段正式路径:意向书(LOI)、资格认定资料包(QP)、完整资格认定资料包(FQP);截至2025年,61个项目获受理,仅8项完全获批,中位QP开发时间为32个月,最常见类别为安全性(30%)、诊断性(21%)及药效学反应标志物(20%)。EMA资格认定意见程序为临床试验中新型方法与生物标志物提供科学意见,常与FDA BQP并行以实现全球监管协调,已完成超过20项程序。关键路径研究所(C-Path)作为公私合作伙伴关系,通过预竞争数据共享与联盟生成证据以支持资格认定提交,首个获批的临床安全性生物标志物组合(2018年肾脏毒性标志物)即通过该联盟方式完成。
11. 影像组学标志物
影像组学标志物从医学影像中提取与肿瘤形态、纹理及空间异质性相关的定量特征,可预测治疗反应、疾病进展与生存情况,支持早癌检测、患者分层、治疗监测与预后评估。影像组学可识别肉眼无法辨别的细微肿瘤大小、形状及结构改变,实现对异常组织生长的验证性检测,并可用于估计复发风险及预测总生存与无病生存率。将分子生物标志物与影像组学标志物整合,可提供更全面的肿瘤特征,提高肿瘤学中的预后准确性。
12. 生物标志物研究中的新兴技术
空间转录组学技术(Visium、MERFISH、Stereo-seq、10x Xenium)在保留空间组织结构的前提下分析基因表达,解决批量RNA测序掩盖的细胞异质性,可识别肿瘤-基质界面等区域的耐药细胞亚克隆等空间限制性标志物群体。当前转化瓶颈包括成本高、通量低于免疫组化、缺乏兼容福尔马林固定石蜡包埋(FFPE)档案的标准化组织处理流程、缺乏临床报告的计算流程,以及监管框架尚未适应空间分辨多组学数据。CRISPR诊断系统(SHERLOCK/Cas13与DETECTR/Cas12a)利用Cas蛋白在结合靶核酸后的附带切割活性产生放大信号,无需热循环即可达阿摩尔检测限,Mammoth Biosciences的SHERLOCK平台于2020年获COVID-19检测EUA,现正开发用于癌症生物标志物如ctDNA中KRAS突变、HPV DNA及miRNA组合的即时检测。主要瓶颈包括复杂基质中向导RNA特异性维持、单反应中多重靶标检测、缺乏标准化FDA/EMA分析验证框架,以及冷链需求限制资源匮乏地区部署。AI驱动的液体活检整合外周血细胞游离DNA(cfDNA)、ctDNA、循环肿瘤细胞(CTC)、细胞外囊泡及细胞游离RNA,提供微创早癌检测、微小残留病监测与实时治疗反应评估平台。Grail Galleri测试利用机器学习分析50余种癌症的cfDNA甲基化模式,实现早期多癌检测。关键瓶颈包括人群筛查所需临床特异性高于99%以降低假阳性率、需要前瞻性收集的大规模多样化训练队列以避免模型过拟合与种族偏差、与影像及电子健康记录系统集成、人群规模的卫生经济学建模,以及持续学习AI体外诊断设备的监管路径设计。
13. 结论与未来展望
生物标志物已成为阐明生物学机制、疾病病理生理及治疗反应的重要工具。多组学平台的整合,特别是基因组学、转录组学、蛋白质组学、代谢组学与表观基因组学的融合,通过跨平台数据融合策略彻底改变了生物标志物发现。疾病特异性标志物已常规应用于血浆、血清及组织分析,为治疗策略开发提供支撑。有效的生物标志物具备高于传统临床测量的灵敏度与特异性,可增强临床决策并指导合理治疗干预设计。然而,疾病致病过程的复杂性仍是重大挑战,区分候选标志物与足够成熟可用于临床决策的已验证标志物是该领域最关键障碍之一。FDA BQP、BEST框架及EMA资格认定意见提供了必要的证据标准,但仅有少数候选标志物能成功通过这些流程(截至2025年仅8/61项BQP项目完全获批)。基于此,本综述提出五项可操作的转化优先事项:一是建立多组学整合流程的标准化,制定统一质量控制基准与最低报告标准,促进实验室间可重复性与跨研究荟萃分析;二是在发表阶段即对候选标志物系统应用TRL评估与BEST框架使用情境定义,避免将临床前观察与临床验证标志物混淆;三是扩展FDA BQP与EMA资格认定计划以容纳多组学生物标志物组合与AI驱动IVD算法,并针对这些新型标志物模式明确分析验证要求;四是开发具成本效益、适配即时检测场景的纳米传感形式,优先基于现有TRL推进CRISPR与金纳米颗粒平台,以满足疾病负担最重的资源受限地区的部署需求;五是建立前瞻性、人口代表性、多机构的生物标志物验证队列,同步收集标准化多组学数据与临床结局,实现分析验证、临床资格认定与卫生经济学评估的并行推进。
打赏