引言
单分子Förster共振能量转移(smFRET)实验极大地促进了对蛋白质及其他生物分子构象动力学的理解。生成高保真度的smFRET模拟数据是开发和检验准确、高效的数据分析技术的关键步骤。本文介绍了一个统一的模拟策略,将真实的分子内动力学与三维扩散和光子发射相结合,以生成逼真的自由扩散smFRET数据。
与将分子固定在表面的实验相比,自由扩散smFRET方法可以捕获更快速尺度的动力学(纳秒范围),并且避免了表面对构象动力学的潜在影响。然而,短暂的光子爆发数据对分析提出了挑战。现有的smFRET模拟框架通常孤立地处理构象动力学、平移扩散和光子发射统计这些组成部分,最常用的方法是通过固定的FRET效率或离散状态切换来表示分子内动力学,即使底层构象运动是连续的。因此,当前的自由扩散smFRET模拟缺乏将真实构象动力学纳入探测器级时间戳数据的通用机制。
方法
本文概述的模拟工作流程包含四个概念组件:(i)构象动力学,(ii)布朗平移扩散,(iii)光子时间戳生成,以及(iv)下游smFRET数据分析。
构象动力学可以通过多种方式建模。在固定效率模型(基线PyBroMo)中,每个分子群体被分配一个恒定的FRET效率,不模拟分子内动力学。在基于朗之万动力学的模型中,染料-染料距离根据所选自由能景观上的过阻尼朗之万动力学演化,产生时间依赖的效率。此外,分子动力学轨迹也可以作为距离统计的替代来源被纳入。
无论采用何种构象模型,每个分子都通过PyBroMo的平移扩散引擎在共聚焦点扩散函数(PSF)中进行三维布朗扩散。然后使用泊松发射模型生成光子时间戳,该模型考虑了供体和受体通道以及背景光子。生成的时间戳数据随后使用一套smFRET分析工具进行处理,包括混合模型推断、爆发方差分析(BVA)、隐马尔可夫模型(HMM)和变点检测。
过阻尼朗之万动力学
为了在smFRET模拟中更准确地模拟柔性分子的构象动力学,我们集成了过阻尼朗之万动力学。基础PyBroMo软件使用布朗运动来模拟标记分子通过共聚焦体积的平移扩散(无旋转自由度),而我们的实现使用过阻尼朗之万动力学来模拟由标记分子构象动力学引起的染料-染料距离波动。
朗之万轨迹根据欧拉-丸山方法计算,在每个时间步长(δt),染料-染料距离通过计算自由能函数V(r)的距离导数贡献和一个随机随机贡献来更新。对于谐波自由能模拟,使用了一个常见的假设,即距离呈高斯分布。FRET效率模型将染料-染料距离轨迹转换为效率轨迹。本文使用了两种不同的效率模型,其中一种采用了2.65的指数,而不是经典的Förster反六次方依赖关系,以更好地反映在构象异质系统中观察到的行为,因为在这些系统中,供体和受体染料的运动受限,理想偶极-偶极相互作用和各向同性平均的假设不成立。
单态分子
为了演示使用朗之万动力学构象轨迹生成时间戳,模拟了一个在谐波自由能场中的分子的简单示例系统。模拟了100个分子,其布朗扩散系数(DB)设置为30 μm2/s。朗之万扩散系数(DL)设置为1300 Å2/ns,以实现快速扩散以探索自由能阱。谐波函数由系数kH定义,其中50个分子的谐波阱中心在40 Å,另外50个在65 Å。使用R0= 56 Å将距离转换为效率。
双态互转换分子
为了模拟在状态之间动态移动的系统,将具有两个对称阱的双稳态自由能应用于朗之万动力学模拟中的分子系统。双稳态函数VB(r)被定义,其中最小值位于rc± W,即35和65 Å,势垒高度为1.265625 kcal/mol。使用更标准的反六次幂效率模型(E = 1 / (1 + (r/R0)6)来转换距离。此外,还包括了10个分子保持在恒定的“仅供体”状态(E = 0),以代表实验中存在的不完全标记现象。
结果
单态模拟的比较
对时间戳数据进行分析,首先将原始光子时间戳数据进行分箱和阈值处理。使用1毫秒的典型实验箱宽度。将表观效率定义为每个时间箱中在受体通道中检测到的光子占总光子的比例:Êt= ItA/ (ItA+ ItD)。
使用简单的表观效率直方图以及拟合到表观效率的高斯混合模型分析模拟的smFRET实验。对于朗之万模拟数据,双组分高斯混合分析显示,低效率分量的均值为0.41,标准差为0.07,混合权重为0.48;高效率分量的均值为0.68,标准差为0.09,混合权重为0.52。与显示较少分布重叠的非朗之万时间戳分析相比,朗之万时间戳分析显示的分布更宽,重叠更多,这是由于两个群体的底层距离分布存在重叠。
双态互转换模拟的比较
对示例2(双态互转换)生成的时间戳进行了更深入的分析,包括使用偏斜高斯混合模型、爆发分析和HMM分析。
偏斜高斯混合模型:对时间戳数据拟合三组分偏斜高斯混合模型,以解释仅供体分子导致的低FRET峰。朗之万数据的分析能够合理地恢复效率峰的位置以及仅供体峰。与非朗之万数据相比,朗之万时间戳数据的效率状态分布更宽,重叠更多,这与距离上的点质量分布不同。
爆发分析:使用FRETBursts软件和滑动窗口搜索算法来识别光子爆发。然后进行爆发方差分析(BVA),将每个爆发分割成连续且不重叠的10个光子的窗口,以计算爆发内估计效率的标准差(σi)。对于静态分子,FRET的标准差与其平均FRET值存在可预测的分析关系;而经历动态FRET波动的分子由于在测量时间尺度内发生构象变化,会表现出更大的标准差。在非朗之万数据中,两个状态峰以虚线(二项分布的标准差)为中心,表明可忽略的动态异质性。相反,朗之万数据的两个状态峰略高于虚线,表明存在小的动态异质性,并且状态之间转换的弧线区域人口更多,这与朗之万动力学引入的逐渐转变一致。
HMM分析:使用隐马尔可夫模型(HMM)分析时间戳数据,假设有两个隐藏状态,且表观效率在每个状态下服从条件正态分布。对于朗之万数据,估计的转移矩阵与理论值合理相似。朗之万模型产生的转移矩阵略接近于真实情况。通过变点分析对转换的可视化显示,朗之万和非朗之万模拟之间存在合理的定性一致性。
讨论
朗之万动力学的加入使得生成的smFRET数据更加真实,特别是对于非结构化蛋白质或与内在无序相关的蛋白质。本文提出的方法可以推广到更复杂的构象动力学表示,例如使用更复杂的势函数、位置依赖的扩散系数或多维坐标空间。甚至可以结合全原子分子动力学(MD)模拟来生成染料-染料距离轨迹,然后将其纳入PyBroMo软件中。
作为一个说明性例子,文章展示了如何将Alb3-Cterm(一种固有无序蛋白质域)的MD模拟数据整合到所开发的方案中。比较了直接从MD染料-染料距离轨迹和结合MD-PyBroMo方法获得的距离分布和FRET效率分布。两者定性相似,但结合方法允许进行更真实的FRET效率估计。
通过使用朗之万动力学来包含标记生物分子的构象异质性,研究人员将能够重复生成大量具有已知异质性染料-染料距离地面实况的数据。不同的模拟参数可以轻松更改,以生成时间戳并测试基于柔性分子实验扩散smFRET数据的假设。然后可以针对模拟数据开发和测试超出标准时间分箱方法的新分析方法,最终目标是从柔性分子的扩散smFRET实验中提取更多信息。
结论
总之,我们已经证明,将朗之万动力学加入自由扩散smFRET模拟中,能够生成具有更真实的标记生物分子构象动力学异质性的时间戳数据。朗之万动力学的实施为定义分子底层动力学提供了一种灵活的方法,并完全了解地面实况。具有已知真实异质性染料-染料距离的模拟数据将在开发分析柔性生物分子自由扩散smFRET数据的新技术中发挥重要作用。