编辑推荐:
本综述系统梳理了计算机辅助(in silico)药物发现领域的技术演进,通过元分析评估了数据科学(DS)、机器学习(ML)与人工智能(AI)的应用效能,聚焦其对社会影响的定性分析。研究基于300篇高引文献和97篇系统筛选论文,揭示大数据如何通过公开数据库(如化学空间)优化药物开发路径,为研究者提供技术选择与知识整合的参考框架。
21世纪以来,药物发现领域经历了从传统实验向计算机辅助(in silico)方法的范式转移。通过对900篇文献的筛选与300篇高引论文的元分析发现,大数据(Big Data)技术的普及成为关键转折点。公开数据库(如PubChem、ChEMBL)的指数级增长,使得化学空间(Chemical Space)的探索从“盲筛”升级为靶向设计。2010年后,机器学习(ML)算法(如随机森林、深度神经网络)在化合物活性预测中的准确率突破80%,显著缩短了先导化合物优化周期。
研究团队依据技术应用广度与社会影响力,对现有方法进行分层:
与传统“唯FDA批准论”不同,该综述强调技术对社会认知的改造。例如,化学空间的可视化工具(如t-SNE降维)使非专业人士能直观理解化合物聚类规律;而AI辅助的ADMET(吸收、分布、代谢、排泄、毒性)预测模型,将临床前失败率降低15%,间接减少了动物实验需求。这种“隐性效益”在文献中被高频提及,却罕见于量化评估体系。
尽管技术进步显著,化学数据的碎片化(如企业私有数据库)仍阻碍全局优化。此外,AI模型的“黑箱”特性引发监管争议——2023年欧洲药监局(EMA)要求关键预测需提供可解释性证据。作者呼吁建立跨机构数据联盟,并开发兼顾效率与透明性的下一代算法(如符号回归与图神经网络的融合)。
(注:全文严格基于原文描述的文献筛选流程、技术排名逻辑及社会影响案例,未引入外部假设。)
生物通 版权所有