编辑推荐:
药物安全性评估方法:本研究整合体外hERG抑制数据、FAERS药监信号及分子结构信息,构建可解释的GATv2图神经网络模型预测QT prolongation风险。模型在交叉验证和外部验证中表现优异(ROC-AUC 0.838-0.918),并通过原子特征解释验证了与已知SARs的一致性,为药物安全性评估提供结构化决策工具。
药物引起的QT间期延长是一种非特异性的生物标志物,表明发生尖端扭转型室性心动过速(TdP)的风险增加,这是药物开发中的一个主要安全问题。虽然需要进行体外hERG抑制试验来进行早期筛选,但来自FDA不良事件报告系统(FAERS)等来源的药物警戒数据可以提供补充性的见解。将这些异构数据与分子结构相结合,为预测致心律失常风险提供了一种有前景但尚未得到充分利用的方法。我们开发了一个可解释的图神经网络(GNN)框架,该框架整合了体外hERG抑制数据(PubChem AID 588834)、FAERS衍生的药物警戒信号以及分子结构信息。使用RDKit将规范的SMILES转换为分子图,并对原子和键级特征进行了编码。通过分层五折交叉验证比较了四种GNN架构(GINE、GCN、GraphSAGE和GATv2)。表现最好的模型GATv2进一步通过集成梯度方法被用来识别影响QT间期延长的结构特征。最终数据集包含了4,808个小分子及其二进制的QT风险标签。GATv2的交叉验证ROC-AUC为0.838,PR-AUC为0.830,F1分数为0.756。在完整数据集上重新训练后,ROC-AUC达到0.918,PR-AUC为0.908,F1分数为0.847。在独立的hERG试验(AID 1671200,n=2,405)上的外部验证也证实了其强大的性能(ROC-AUC为0.859,敏感性为0.80,特异性为0.82)。原子度数和氢原子数量是主要的预测因子,这与已知的药效关系(SARs)一致。这个基于GNN的框架整合了结构和药理学数据来预测QT间期延长风险,提供了一个透明、基于结构的决策支持工具,符合ICH S7B/E14和CiPA指南的要求。
作者声明本研究中不存在任何利益冲突。
分析使用了公开可用的资源(例如,来自PubChem BioAssay的体外hERG数据AID 588834/1671200以及FAERS的药物警戒信号)。可复制的脚本和配置文件存储在仓库中。受第三方条款约束的原始数据集可从其原始来源获取。
生物通 版权所有