基于概率的Hansen溶解度理论中相对能量差解读

时间:2026年5月28日
来源:Macromolecular Theory and Simulations

编辑推荐:

聚合物-溶剂相容性通常使用Hansen溶解度参数(HSPs)进行评估,其中相对能量差(RED)通常被解释为一个分离良溶剂与不良溶剂的确定性阈值。实验研究表明,聚合物的溶解度在Hansen空间中呈渐进式演变,尤其是在溶解边界附近,溶胀和部分溶解现象常见。本研究提

广告
   X   

聚合物-溶剂相容性通常使用Hansen溶解度参数(HSPs)进行评估,其中相对能量差(RED)通常被解释为一个分离良溶剂与不良溶剂的确定性阈值。实验研究表明,聚合物的溶解度在Hansen空间中呈渐进式演变,尤其是在溶解边界附近,溶胀和部分溶解现象常见。本研究提出了一种对RED准则的概率重新表述,该表述在保持Hansen空间几何结构的同时,将RED解释为一个映射到溶解概率的连续描述符。溶解度参数和半径通过数值优化进行估计,其目标函数平衡了几何一致性与概率可靠性。通过一种加权编码方案,将与部分溶解体系相关的实验不确定性纳入考量。该方法使用热塑性聚氨酯、聚醚砜(PES)、木质素和水性聚氨酯(WPU)的文献数据集进行了评估,并进一步利用溶胀作用超过真实溶解的微晶纤维素(MCC)的实验数据进行了检验。在水性聚氨酯体系中,优化后的溶解度半径从16.3 MPa1/2减小至7.8 MPa1/2,得到了更具选择性的溶解度域。在Hansen空间中训练的机器学习(ML)模型所提供的决策边界,当用等概率轮廓线(p ≈ 0.5)近似时,与优化后的溶解度球相吻合。
聚合物在溶剂中的溶解性是材料科学与工程领域的一个核心问题,它对加工、配方、回收以及涂层、分散体和纳米复合材料的开发有着直接影响。从热力学角度看,聚合物的溶解是分子间相互作用的焓贡献与混合及聚合物链构象相关的熵效应之间平衡的结果。基于聚合物溶液理论的模型,如Flory-Huggins方法,为描述相容性和相分离提供了一个形式化的框架。然而,其实际应用通常受限于确定可靠相互作用参数的实验困难,以及溶解行为对聚合物分子量、多分散性、结晶度和热历史的强烈依赖[1, 2]。因此,文献中已固化了使用半经验准则来筛选和比较聚合物-溶剂体系。

在这些准则中,溶解度参数已成为主流方法。Hildebrand基于内聚能密度的原始公式为评估化学物种之间的亲和性提供了一个初始的定量指标[3]。Hansen通过将内聚能分解为色散(δD)、极性(δP)和氢键(δH)贡献,扩展了这一概念,从而建立了一个三维分子间相互作用空间,可在其中系统地比较聚合物和溶剂[4, 5]。这种三维表示已被广泛采用,并常规用于溶剂选择、涂层配方、共混物相容性评估、溶胀评估以及填料分散,涵盖从传统聚合物到功能化材料和生物聚合物的多种体系[5-7]。

Hansen溶解度参数的应用几乎普遍被简化为一种二元几何解释。(𝛿D, 𝛿P, 𝛿H)空间通过一个通常表示为半径为𝑅0的球体的溶解度区域来操作化,与此表示相关的核心度量是相对能量差,定义为RED = Ra/R0。自其引入以来,RED一直被解释为一个确定性阈值,即RED≤1的溶剂被分类为良溶剂,而RED>1的被归为不良或非溶剂[5]。由于其简单性和操作上的清晰性,这种二元解释已成为主流,并被广泛采用在技术手册、数据库和工业应用中[5, 7]。

然而,大量实验研究表明,这种二元分类很少能充分描述聚合物-溶剂体系的实际行为。位于溶解度球外部的溶剂经常引起显著的溶胀或部分溶解,而位于球内的溶剂可能表现出缓慢或不完全的溶解,这取决于聚合物的形态、结晶度和体系动力学[8]。这些观察表明,聚合物的溶解并非突然发生,而是在三维分子间相互作用空间内逐渐过渡。

Gharagheizi[9]证明,计算得到的δD、δP、δH以及溶解度半径R0对优化程序高度敏感,表明拟合标准的微小变化可能导致实质上不同的参数集和相互矛盾的溶解度预测。这项工作确立了Hansen参数的不确定性不仅是实验性的,而且本质上是数值性的,这对聚合物在Hansen空间中的定位稳健性提出了挑战。

后续研究将注意力转向了溶解度区域的几何重优化。Vebber及其合作者[10]采用遗传算法同时优化Hansen参数和相互作用半径𝑅0,揭示了存在多个最优解,这取决于目标函数和所选溶剂集。基于此方法,Weng等人[11]比较了确定性和全局启发式优化方法以推导球形和椭球形Hansen区域,报告了所得参数和溶解度边界的显著差异。沿着相同的思路,Díaz de los Ríos和Hernández Ramos证明,不同的非线性优化算法可以为同一实验数据集产生不同的Hansen参数和球半径,这强化了解对应的是一个最优区域而非唯一点[12]。

相关努力引入了基于目标达成法的多目标优化策略,以确定Hansen参数和相互作用半径R0,证明了经典的Hansen计算常常高估𝑅0并对边界溶剂进行错误分类[13]。这些结果表明,改进的数值优化可以产生更小、更明确的溶解度区域,并实质性地改变基于RED的相容性预测,突显了溶解度分类对所选优化程序的强烈依赖,而不仅仅取决于内在的物理化学差异。沿着这一思路,Mihalovits[14]超越了可溶/不溶的二分法,明确地将溶解度视为连续变量,并引入了同心椭球法。通过拟合对应于不同溶解度水平的多个椭球面,该方法证明了聚合物-溶剂相容性在Hansen空间中随距离平滑变化,并且在溶解度边界(RED ≈ 1)附近的信息比位于传统球体深处或远处的点具有不成比例的更多信息价值。这些发现提供了直接证据,表明单一的二元阈值无法严格捕捉溶解度,RED应被解释为一个连续描述符而非确定性准则。一些研究已定性地认识到,RED值略高于1的溶剂仍可能引起溶胀或部分溶解,表明溶解度边界并不尖锐。然而,这些观察通常是特定于体系的经验性的,并未建立明确的定量RED范围,也没有提供连续或概率性的聚合物-溶剂相容性解释[15]。

与此同时,基于机器学习的方法日益被探索用于预测聚合物-溶剂的溶解度和混溶性。最近的研究采用了监督学习、深度神经网络和多任务学习框架,这些模型基于实验混溶性数据或相互作用参数进行训练,通常比经典的基于Hansen的准则获得更好的预测性能[16, 17]。然而,这些方法通常将溶解度视为二元分类问题或学习高维潜在表示,从而限制了直接的物理化学可解释性。因此,Hansen溶解度参数和RED经常仅被视为辅助描述符或被完全绕过,优先考虑统计准确性而非对聚合物-溶剂相容性的物理透明描述。

Howell和Boucher[8]提出了一种概念上不同的方法,他们基于定量实验数据,在Hansen空间中将溶解度构建为一个连续函数。虽然该框架明确承认了聚合物溶解度的连续性,但它依赖于详细的实验输入,并未直接将RED作为一个简单、可操作的相容性度量与之广泛使用相连接。

综合来看,这些研究表明,经典使用Hansen溶解度参数的主要局限性不在于三维相互作用空间本身的定义,也不在于优化球心和半径的可能性,而在于对RED的严格确定性解释。尽管RED从定义上讲是一个连续变量,但它几乎普遍被当作一个刚性阈值使用,从而掩盖了表征聚合物溶解度的渐进性、不确定性和过程依赖性。

尽管取得了这些进展,大多数现有的基于Hansen的方法仍然依赖于对相对能量差(RED)的基本确定性解释,隐含地假设存在一个尖锐的溶解度边界。这种假设即使在那些采用复杂优化或全局搜索策略的研究中仍然存在,并且与大量关于在溶解度前沿附近出现渐进过渡、溶胀和部分溶解的实验证据不一致。迄今为止,还没有任何方法能够明确地调和Hansen空间的几何简单性和物理化学可解释性与对溶解度的概率处理,同时保留RED作为连续描述符。

在此背景下,本研究提出了对相对能量差(RED)的概率重新解释,同时明确保留Hansen参数空间(δD, δP, δH)的几何结构和物理意义。RED不再被视为区分良溶剂与不良溶剂的确定性阈值,而是被解释为一个控制聚合物-溶剂相容性可能性的连续描述符。这种表述允许将经典的Hansen溶解度边界描述为一个渐进的过渡区域,而非一个尖锐的表面,从而更好地反映在溶解度前沿附近观察到的溶胀和部分溶解等实验现象。通过保留Hansen理论的几何简单性和物理可解释性,同时引入相容性的概率描述,所提出的方法为复杂聚合物-溶剂体系的溶解度分析提供了一致的扩展。

本工作所开发的方法将基于数值优化Hansen溶解度参数的物理动机模型与监督机器学习(ML)模型进行了比较,以预测聚合物在溶剂中的溶解行为。所有模型都完全依赖Hansen溶解度参数(𝛿d, 𝛿p, 𝛿h)作为输入变量,确保观察到的性能差异源于建模策略,而非引入额外的分子描述符。

溶解度被视为一种概率现象,允许明确纳入实验不确定性、部分溶解等中间状态以及Hansen空间中的渐进过渡区域。作为基准,所提出的框架首先使用木质素[5]、热塑性聚氨酯[18]、水性聚氨酯[19]和聚醚砜[9]的文献数据进行评估。随后,使用微晶纤维素(MCC)样品进行了溶解度实验。在这种情况下,系统评估了对溶胀体系分配部分溶解度评分(0.5)的影响,并与将溶胀样品视为不溶的另一种分类进行了比较。该分析允许评估溶胀的处理方式如何影响模型校准、溶解度概率和整体预测性能。

为了保持这种连续性同时实现概率建模,将原始的三级实验响应重新表述为描述溶解度存在与否的二元变量。虽然部分溶解系统被归入可溶类,但由于动力学效应、形态以及对溶胀或不完全溶解的主观解释,其表征本质上不够精确[5, 10]。为明确考虑这种不确定性,为每个观察分配了一个样本权重。使用降低的样本权重来处理不确定或边界观测值的做法遵循了统计学习和概率建模中的既定实践,即降低置信度较低数据的权重而非将其排除[20]。这些权重在分析的所有阶段一致使用,包括溶解度参数的数值优化、机器学习模型的训练和校准以及性能评估。该加权方案反映了部分溶解系统固有的更高实验不确定性,并且是先验定义的,不暗示一个独特的热力学状态。结果对其他加权选择的敏感性在支持信息中进行了讨论。

Hansen方法在Hansen溶解度参数空间中,聚合物-溶剂相容性通过溶剂与聚合物溶解度中心之间的几何距离来描述。该距离称为Hansen距离Ra,i,定义为[21]:其中(δD,c, δP,c, δH,c)表示聚合物溶解度中心的坐标,(δD,i, δP,i, δH,i)代表溶剂i的Hansen参数。应用于色散项的因子四反映了其相对于极性和氢键相互作用的区分能力降低。Hansen最初引入这个权重是基于广泛的经验观察,即仅色散相互作用的差异在区分良溶剂和不良溶剂方面不如极性或氢键贡献的差异有效[5]。

为了以无量纲形式表达聚合物-溶剂相容性,Hansen距离被特征相互作用半径R0归一化,得到相对能量差(RED)[5]:在经典的Hansen解释中,RED≤1的溶剂被分类为良溶剂,而RED>1的被认为是不良或非溶剂。这种表述隐含地假设在Hansen空间中存在一个明确分离可溶区域和不溶区域的尖锐、清晰的边界[5]。然而,大量实验研究表明,这种二元解释在溶解度边界附近经常失效。RED值略高于1的溶剂仍可能引起溶胀或部分溶解,而位于标称溶解度球内的溶剂可能表现出缓慢或不完全的溶解,这取决于聚合物形态、结晶度和动力学效应[8, 14, 17, 19, 22]。

实验证据表明,聚合物的溶解度在RED = 1处并非突变,而是表现出一个反映实验不确定性和分子间相互作用连续性的渐进过渡区域。为了捕捉这种行为,RED被视为一个控制溶解可能性的连续潜在变量,而非确定性阈值。因此,RED通过逻辑函数映射到溶解概率上:其中𝑝𝑖表示溶剂i溶解聚合物的概率,k控制在RED = 1附近的过渡陡峭程度。这种表述将经典的Hansen溶解度球重新解释为概率边界,与溶解度行为逐渐变化的实验观察一致[8, 14, 19]。在本工作中,k被固定为代表性值,仅用于可视化和解释目的,不影响优化后的Hansen溶解度球的几何形状。因此,概率映射应理解为叠加在Hansen模型之上的解释层,而非额外的拟合自由度。

优化策略基于三个互补原则:(i)与经典Hansen框架的几何一致性,(ii)在溶解度边界附近的概率可靠性,以及(iii)溶解度半径的数值稳定性。Hansen参数(δD,c, δP,c, δH,c, R0)通过数值优化估计,使用联合强制几何和概率一致性的目标函数。优化变量包括溶解度中心坐标和溶解度半径,所有变量都约束在物理意义范围内。为了减少对初始化和数值策略的敏感性,从不同起点使用局部优化算法(Powell型、拟牛顿法、基于单纯形法)的组合执行了多次运行。对半径应用了弱正则化以防止不切实际的小或大溶解度球。最终参数集基于整体目标值选择,确保不同优化策略下的稳健性。详细的实现设置在支持信息中提供以确保可重现性。

为了防止优化收敛到不切实际的大或过小的溶解度球,对溶解度半径R0应用了一个弱正则化项。该惩罚项惩罚R0偏离从数据中得出的特征尺度的大幅偏差:其中是从Hansen距离中位数估计的参考半径,λ控制正则化的强度。该正则化稳定了优化过程,没有施加硬约束或将解决方案偏向预设的球体大小,确保Hansen参数的估计具有物理意义和数值稳健性。

为了将物理动机的Hansen框架与数据驱动方法进行基准比较,采用了监督机器学习(ML)模型,使用Hansen溶解度参数(δD, δP, δH)作为输入变量预测聚合物-溶剂溶解度。未引入额外的分子描述符,确保性能差异完全源于建模策略而非输入信息的差异。ML任务被表述为二元概率分类问题,与第2.1节中描述的重新表述的溶解度响应一致。所有模型都经过训练以估计Hansen空间中的溶解度概率,并在算法支持时纳入样本权重以考虑与部分溶解系统相关的实验不确定性。评估了广泛使用的、具有互补建模原理的分类器,包括基于树的集成方法、基于核的分类器和梯度提升模型,这些模型在低维非线性问题上表现良好[26-29]。所有模型均使用已建立的机器学习库在Python中实现,并仅在每个验证折内可用的数据上进行训练。

由于ML分类器的原始概率估计通常校准不佳,因此系统地应用了事后概率校准。根据训练集大小,使用了等保序回归或Sigmoid(Platt)缩放,遵循概率学习中的既定最佳实践[30-32]。校准仅在训练数据上进行以防止信息泄漏。该程序确保ML导出的概率与Hansen模型获得的溶解度概率解释具有直接可比性。

为了与Hansen溶解度球进行直接的几何比较,在Hansen空间中构建了一个近似的ML导出的溶解度区域。生成了一个跨越相关Hansen参数范围的规则三维网格,并使用校准后的ML模型在每个网格点预测溶解度概率。选择接近目标等概率水平的网格点来定义围绕ML决策边界的概率壳层,并对这些点进行最小二乘球面拟合。该程序产生了一个可解释的Hansen空间中ML溶解度区域的几何近似,允许与物理动机的Hansen球进行定性和定量比较。

本工作中开发的应用程序是一个开放获取的、基于网络的工具,旨在用于Hansen空间(𝛿𝐷, 𝛿𝑃, 𝛿𝐻)中的概率性聚合物-溶剂溶解度分析。该软件将Hansen溶解度参数的数值优化与监督机器学习分类器集成在一个统一的计算框架内。实验溶解度数据,包括完全可溶、不溶和部分可溶的情况,使用加权概率编码进行处理,以考虑与边界观测值相关的不确定性。Hansen参数通过使用多个目标函数的数值优化进行估计,产生一个具有概率RED到溶解度映射的、物理可解释的溶解度球。同时,监督机器学习模型(随机森林、SVM-RBF和XGBoost)直接在Hansen空间中进行训练并校准为概率。为了实现基于物理和数据驱动模型之间的直接几何比较,该应用程序在Hansen空间中采样一个三维网格,并通过拟合等概率壳层的球面来提取机器学习导出的溶解度边界。该软件输出优化后的Hansen参数、预测性能指标(ROC、精确率-召回率、log-loss、Brier分数、MCC)以及用于定性和定量评估的交互式三维可视化。该应用程序使用Python实现,并使用Streamlit部署,通过网络界面实现交互式数据上传、模型执行和可视化。该软件可在线公开访问:https://solubility-g8rrrnnvcbchyhlc2qf5nl.streamlit.app/。

本研究的主要结果在多个体系中得到验证。表1总结了不同硬段(HS)含量的热塑性聚氨酯(TPUs)和水性聚氨酯(WPU)的Hansen溶解度参数(δD, δP, δH)及相应的溶解度球半径(R0),并将使用经典Hansen分析或确定性优化算法获得的文献值与本工作使用数值优化结合RED准则概率解释确定的值进行了比较。对于Gallu等人报道的TPU[18],随着HS含量的增加,观察到清晰且物理一致的趋势。色散分量δD几乎保持恒定(≈17.5–18.1 MPa1/2),表明聚合物主链主要控制色散相互作用,受微相组成影响较弱。相比之下,极性(δP)和氢键(δH)分量均随HS含量的增加而增加,反映了脲烷基团浓度的增加以及相关的偶极-偶极相互作用和氢键的增强。同时,随着HS含量从8 wt.%增加到30 wt.%,Hansen球半径R0从7.3减小到3.7 MPa1/2,表明溶解度域逐渐变窄。这种行为是具有较高硬段分数的TPU的特征[33, 34],其中更强的特异性相互作用导致对兼容溶剂的选择性增加。本工作获得的参数保留了这些趋势,证明了所提出方法的物理一致性。δD值基本保持不变,而δP和δH随HS含量的预期增加。所得R0值与文献报道值[18]接近,仅有微小偏差。这些差异并不表示数值不稳定性,而是源于溶解度准则的重新表述。虽然经典Hansen分析依赖于严格的RED = 1阈值,但此处采用的概率框架容纳了位于溶解度边界附近的溶剂,导致优化后的溶解度球中心和半径发生微小但系统性的偏移。

WPU体系由于其高极性和结构复杂性,代表了一个更关键的情况。Dall'Agnol等人报道的文献值[19]得出较高的色散参数(δD = 24.8 MPa1/2)和非常大的溶解度球半径(R0 = 16.3 MPa1/2),导致异常宽的溶解度域。虽然如此大的半径与WPU体系的两亲性性质一致,但也表明其区分能力有限,因为仅基于几何接近性就将大量溶剂分类为兼容。相比之下,本工作获得的参数表明溶解度空间得到了显著细化。优化后的δD减小至20.1 MPa1/2,而δP和δH均增加,突显了极性和氢键相互作用在主导WPU-溶剂亲和性方面的主导作用。最值得注意的是,溶解度球半径缩小了50%以上(从16.3降至7.8 MPa1/2),得到了更具选择性的溶解度域。这种溶解度球的收缩反映了RED的概率解释在不人为放大R0的情况下解决溶解度边界附近模糊性的能力。因此,优化后的参数提供了更符合物理实际的溶解度有效区域表示,这在几何叠加和Hansen空间的二维切面中得到进一步证实。

表2比较了聚醚砜(PES)和木质素的Hansen溶解度参数和溶解度球半径(R0),这些值是使用文献中报道的不同数值策略以及本工作的结果获得的。尽管所有方法依赖于相同的Hansen距离度量,但所得参数存在系统差异,这些差异可直接归因于优化过程中对溶解度的解释方式。对于聚醚砜,Nelder-Mead优化、遗传算法和GRG非线性优化获得的参数集非常一致。对于化学定义明确、溶解度边界相对清晰的聚合物,不同优化策略产生相似的Hansen表示。对于木质素,观察到相反的行为,优化策略的选择对所得溶解度参数有显著影响。经典Hansen分析和遗传算法优化产生几乎相同的中心和较大的溶解度半径(R0 ≈ 13.5–13.7 MPa1/2),反映了一个广阔的溶解度域,可容纳广泛的实验分类溶剂。然而,在本工作中,优化后的参数显示出溶解度球的明显收缩,R0减小至9.29 MPa1/2,减少了约32%。这种减少伴随着向较低δD和δP值的转移,而氢键分量保持较高(δH ≈ 16.4 MPa1/2),与木质素的化学结构一致。这些差异突显了确定性拟合方法应用于非均质聚合物时的一个关键局限性。在这些体系中,强制执行二元溶解度标准隐含地倾向于大的溶解度球,因为边界或部分溶解溶剂对优化产生强烈影响。相比之下,本工作采用的RED概率解释允许模糊溶剂贡献信息,而不强迫人为扩大R0。因此,优化后的溶解度域变得更具选择性,同时保持化学一致性。

对纤维素溶解行为的分析(图5-7)整合了经典的Hansen溶解度参数(HSP)方法与对部分相容性(溶胀)的明确处理。需要区分纤维素体系中的真实分子溶解与分散或溶胀现象。由于存在扩展的氢键网络和显著的结晶度,大多数溶剂不能完全溶解纤维素,而是促进溶胀、增塑或胶体分散。在此背景下,Hansen方法应被解释为描述能量相容性和溶剂可及性,而非完全的热力学溶解。与大多数合成聚合物不同,纤维素表现出强烈的分子间缔合,由扩展的氢键网络和显著的结晶度控制,导致在不溶、溶胀和完全可溶状态之间存在渐进的过渡,而非尖锐的溶解度边界[35]。本工作为纤维素优化的Hansen球中心位于(δD, δP, δH) = (22.76, 16.15, 18.70) MPa1/2,半径R0 = 16.09 MPa1/2(图5)。相对较大的R0值与纳米纤维素材料报道的宽溶解度域完全一致。图6显示了还原的Hansen距离(RED)随实验溶解度类别的分布,明确区分了不溶、部分相容(溶胀)和可溶状态。该分布表明部分相容性是一种内在的边界现象,溶胀和部分分散集中在RED ≈ 1区域附近。图7通过使用逻辑函数将RED映射到连续的溶解概率来解决这种模糊性。这种映射没有引入新的实验信息,也没有改变底层的Hansen几何形状。相反,它将经典的RED阈值重新表述为一个连续的解释尺度,更好地反映了纤维素溶解的渐进本质。在这种表述中,远低于1的RED值对应较高的溶解概率(p ≳ 0.7),而显著高于1的RED值则迅速衰减至接近零的概率。重要的是,部分相容溶剂自然占据中间概率值(p ≈ 0.3–0.6),为溶胀行为提供了物理上有意义的描述。这种概率解释对于纤维素尤其合适,因为其溶解过程通过渐进式破坏扩展的氢键网络而非尖锐的热力学相边界进行。

通过概率数值优化获得的Hansen溶解度域与从机器学习(ML)溶解度预测中提取的Hansen等效球之间的比较(图8)。在ML工作流程中,溶解度直接作为监督分类问题在Hansen空间溶剂坐标(δD, δP, δH)中预测,不施加任何几何约束。随后,通过拟合p ≈ 0.5等概率壳层上的球面,从后验中提取等效Hansen球,从而实现与经典框架的直接且物理可解释的比较。ML模型的预测性能评估(图S3-S6和表S1)表明,集成模型如XGBoost和随机森林表现出强的样本内区分度(ROC AUC ≈ 0.98–0.99),但在留一交叉验证(LOO)下性能下降(ROC AUC ≈ 0.62–0.74),表明泛化能力有限和过拟合。相比之下,数值优化方法显示出较低的区分度指标(样本内ROC AUC ≈ 0.70;LOO ROC AUC ≈ 0.61),反映了其有意约束的几何公式化而非物理相关性降低。必须强调,ML模型优越的区分性能反映了其更大的灵活性而非更高的物理保真度。因此,机器学习模型并非作为验证工具,而是作为对比基准。其主要作用是提供在Hansen空间中决策边界的独立、数据驱动估计。因此,ML结果的相关性在于等概率轮廓线(p ≈ 0.5)与优化后的Hansen球在几何上的一致性,而非其预测准确性。该比较允许评估数据驱动模型在仅基于Hansen空间训练时是否收敛于相似的溶解度域。概率校准分析(图S6和表S1)确认ML预测的溶解度概率校准足够好,可以证明提取等概率壳层的合理性。所得ML导出的球与数值优化的Hansen球存在显著重叠,在中心位置和半径上仅有有限差异,表明尽管优化目标根本不同,但仍收敛于相似的溶解度域。微小的偏差反映了ML在捕获溶解度边界的局部各向异性和非线性特征方面的更大灵活性,这是单个全局球无法表示的。总体而言,图8突出了数值优化和机器学习的互补作用,表明ML为通过概率数值优化获得的物理可解释的Hansen溶解度域提供了独立的、数据驱动的验证。

本研究得出的结论明确指出,经典Hansen溶解度分析的主要局限性不在于三维相互作用空间(𝛿𝐷, 𝛿𝑃, 𝛿𝐻)本身,而在于传统上赋予相对能量差(RED)的僵化确定性解释。通过将RED重新表述为概率描述符,所提出的框架在保留Hansen理论几何可解释性的同时,明确考虑了实验观察到的聚合物-溶剂相容性的渐进和不确定性本质。在此背景下,RED不应被解释为一个尖锐的边界,而是溶解度域中的一个连续过渡。数值优化策略整合了几何和概率标准,在保持Hansen溶解度球物理意义的同时惩罚边界不一致性。通过加权编码纳入部分溶解系统对于避免人为扩大溶解度域至关重要,使得溶解度半径能够收缩到物理上有意义的值。这一效应在水性聚氨酯体系中得到了例证,其优化半径从16.3减小到7.8 MPa1/2,且未损害与实验确定的溶解度参数的一致性。在纤维素中也观察到类似的边界局域化行为,支持将溶胀和部分溶解解释为内在的界面区而非实验模糊性,并强化了需要从溶剂可及性而非完全分子溶解的角度来解释相容性。仅在Hansen空间中训练的机器学习模型被用作对比基准,以提供决策边界的独立、数据驱动估计。数值优化的Hansen球与ML导出的等概率轮廓线(p ≈ 0.5)在几何上的一致性表明,尽管ML模型泛化性能有限,但它们收敛于一个一致的溶解度域。所提出的方法扩展了经典溶解度分析在溶剂筛选和配方设计中的应用。通过实现候选溶剂的定量比较和溶解度边界的合理探索,它支持在聚合物加工、涂层配方和可持续溶剂选择中做出更明智的决策。

生物通微信公众号
微信
新浪微博


生物通 版权所有