编辑推荐:
研究人员针对肝细胞癌(Hepatocellular carcinoma, HCC)现有治疗药物索拉非尼(Sorafenib, SOR)疗效有限及耐药性问题,采用定量构效关系(Quantitative Structure–Activity Relationshi
研究人员针对肝细胞癌(Hepatocellular carcinoma, HCC)现有治疗药物索拉非尼(Sorafenib, SOR)疗效有限及耐药性问题,采用定量构效关系(Quantitative Structure–Activity Relationship, QSAR)方法探究其衍生物抑制活性的结构特征。研究构建了多种机器学习模型,包括多元线性回归(Multiple Linear Regression, MLR)、随机森林(Random Forest, RF)、梯度提升回归(Gradient Boosting Regression, GBR)和极限梯度提升(Extreme Gradient Boosting, XGBoost)。其中,GBR模型表现最优,决定系数(R2)达0.951,测试集均方根误差(RMSEtest)为0.150,显示出良好的内部性能。基于优化模型设计了11种新型1,2,3-三唑基索拉非尼类似物并预测其抑制活性,随后完成合成及体外评价。结果显示,这些化合物对HepG2细胞系具有高抑制活性,其中化合物10a的半抑制浓度(IC50)为0.515 μM,活性约为母体索拉非尼的12倍,并具有初步体外选择性。研究表明,将QSAR建模、合成与生物活性评价相结合可有效指导索拉非尼类似物的理性设计,为开发抗HepG2细胞活性的新型候选药物提供了可行策略。
本研究发表于《Medicine in Drug Discovery》,围绕提高肝细胞癌治疗药物的活性和选择性展开。当前,肝细胞癌是全球高发且致死率极高的恶性肿瘤,索拉非尼作为首个系统性靶向治疗药物,因溶解度低、口服生物利用度不稳定及获得性耐药等问题,限制了其临床应用。因此,研究人员旨在通过结构改造与计算模拟相结合的方法,开发活性更高、选择性更好的索拉非尼衍生物。
研究采用了四个关键技术方法:首先,基于已有文献中50个索拉非尼衍生物的化学结构与活性数据,构建数据集并进行分层采样划分训练集与测试集;其次,利用密度泛函理论(DFT)优化分子结构,并在分子操作环境(MOE)中计算分子描述符,通过遗传功能算法(GFA)筛选关键特征;第三,分别建立MLR、RF、GBR和XGBoost模型,并通过五折交叉验证与网格搜索优化超参数;第四,结合SHAP(Shapley Additive Explanations)方法解析模型特征贡献,指导新化合物设计,并通过MTT法测定合成化合物的细胞毒性与选择性指数(SI)。
在结果部分,经典QSAR模型 采用MLR方法,选取五个独立描述符,训练集R2 为0.674,测试集RMSE为0.424,揭示了疏水性、溶剂化能和表面电荷分布对活性的影响规律。机器学习QSAR模型 中,GBR模型性能最佳(R2 =0.951,RMSEtest =0.150),优于RF与XGBoost,并能稳定捕捉非线性构效关系。GBR模型验证 通过Y-随机化、外部验证、适用性域(AD)分析及Boosting迭代误差评估,证实模型非偶然拟合且具有合理的稳定性与预测能力。SHAP解释分析 表明,疏水体积(vsurf_CW3)、脂水分配系数(h_log_pbo)和部分电子描述符在不同取值范围内对pIC50 有显著正向或负向贡献。潜在抑制剂设计与pIC50 预测 阶段,研究人员依据模型与SHAP分析结果,在训练集中高活性化合物骨架基础上引入烷基、醚、酰胺等取代基,设计出11个新衍生物并预测其活性。ADMET性质计算 显示所有设计化合物符合超越五规则(beyond Rule of Five, bRo5)的药物相似性标准。细胞毒性测试 结果显示,合成的六个化合物对HepG2细胞IC50 介于0.515~18.9 μM之间,其中化合物10a (–CONHMe取代)活性最强,约为索拉非尼的12倍,且选择性指数超过19.4,显著高于对照药物阿霉素与索拉非尼。
讨论部分指出,尽管本研究在单一细胞系中验证了化合物的高效活性,且计算模型在限定化学空间内表现出良好性能,但仍需进一步在多种HCC细胞系及体内模型中验证其机制与作用靶点。此外,扩大数据集规模与结构多样性有助于提升模型的泛化能力。结论部分强调,将QSAR、机器学习与实验验证整合的策略,可有效支持针对肝细胞癌的索拉非尼类似物骨架优化,为后续抗肿瘤药物研发提供了可靠的理论与实践基础。
打赏