Deep-Motion-Net:基于图神经网络(GNN)的体积肝脏形状重建技术,可从单视角2D投影数据中实现

时间:2026年5月15日
来源:International Journal of Computer Assisted Radiology and Surgery

编辑推荐:

摘要 目的:在体外束放射治疗过程中,内部解剖结构的运动对精确的放射剂量传递构成了挑战。估计和补偿解剖结构运动对于提高目标体积的计划剂量传递同时保护风险器官至关重要。本研究仅使用传统直线加速器的平面X射线成像实现了准确的运动预测,无需替代信号或侵入性基准标记。 方法:我们提出了D

广告
   X   

摘要
目的:在体外束放射治疗过程中,内部解剖结构的运动对精确的放射剂量传递构成了挑战。估计和补偿解剖结构运动对于提高目标体积的计划剂量传递同时保护风险器官至关重要。本研究仅使用传统直线加速器的平面X射线成像实现了准确的运动预测,无需替代信号或侵入性基准标记。

方法:我们提出了Deep-Motion-Net:一种针对患者的端到端图神经网络(GNN),能够从单次治疗期间的kV平面X射线图像中重建任意投影角度下的3D体积器官。一个2D卷积神经网络(CNN)编码器提取图像特征,四个特征池化网络将这些特征融合成一个3D模板器官网格。然后,基于ResNet的图注意力网络对特征编码的网格进行变形。训练使用合成生成的器官运动实例和相应的kV图像,这些图像是通过变形与模板网格对齐的参考CT体积创建的,生成所需角度的数字重建放射图(DRRs),并通过条件CycleGAN应用DRR到kV的风格转换。

结果:在合成呼吸运动场景上的定量测试和对四名肝癌患者治疗期间图像的定性评估表明,各数据集的平均预测误差分别为0.16 ± 0.13毫米、0.18 ± 0.19毫米、0.22 ± 0.34毫米和0.12 ± 0.11毫米。平均峰值预测误差分别为1.39毫米、1.99毫米、3.29毫米和1.16毫米。

结论:这种方法利用了可获得的治疗期间成像,避免了昂贵的MRI系统或侵入性标记。据我们所知,这是第一个从整个治疗扫描系列中任意角度的单视图图像重建3D体积器官模型的深度学习框架。当在合成运动实例上验证时,我们的方法实现了亚毫米级的精度,并在实际治疗kV图像上展示了临床可行性,而这些图像的体积真实值本质上是不可用的。代码可在https://github.com/isurusuranga/DeepMotionNet获取。

引言
在体外束放射治疗过程中,内部解剖结构的运动会干扰对目标体积的精确放射剂量传递,这对于在保护周围组织的同时实现肿瘤覆盖至关重要[1]。未考虑的运动可能导致风险器官(OARs)的过度照射或肿瘤的照射不足,从而导致生存率降低和发病率增加[1]。这一挑战在低分割治疗中尤为突出,因为在这种治疗中需要更高、更精确的剂量。虽然在治疗开始时获取的圆锥束CT可以确保正确的患者定位,但这种静态表示忽略了放射治疗过程中的后续解剖结构运动。为了解决由呼吸引起的运动,存在各种缓解策略[1, 2]。被动方法如带有运动包容边缘的内部靶体积(ITVs)[2]需要更大的正常组织照射[3]和降低的放射强度。主动方法包括呼吸门控和实时跟踪——需要实时的肿瘤位置信息,但能提供更好的结果。门控通过在特定的呼吸阶段传递放射来延长治疗时间[1],而跟踪则可以连续重新定位射束,但在技术上具有挑战性。主动运动缓解方法通常依赖于侵入性植入的标记,这些标记仅提供基于点的信息,而不是完整的靶/OAR几何形状[4]。非侵入性成像是更受欢迎的选择。MR直线加速器提供了出色的实时、无放射的图像,并具有优越的软组织对比度[5],但只能提供正交的2D切片,价格昂贵,并且大多数患者无法使用。

配备机载kV X射线成像的传统直线加速器提供了一个替代方案,尽管其挑战包括较差的软组织对比度和体积信息压缩。深度学习的进步显示出前景:Ying等人[6]从双平面X射线重建了3D CT;Wang等人[7]使用变形从单视图投影预测了肺表面;Tong等人[8]结合CNN-GNN重建了具有平均形状先验的肝脏网格,后来扩展到多个腹部器官[9, 10]。然而,这些方法仅在固定的投影角度下运行。Wei等人[11]使用CNN预测的PCA系数在4D CT运动模型中解决了这个问题,并添加了角度依赖的层,但面临DRR-CBCT强度变化和离散角度处理的挑战。Shao等人[12]提出了基于GNN的肝脏表面预测,结合了有限元体积变形,引入了生物力学约束,但需要每个角度重新训练,并从ResNet-50骨干中提取了3840个特征向量。关键的是,现有方法[7,8,9,10,12]存在以下关键限制:(1)固定而非任意的投影角度[7,8,9,10,12];(2)仅重建表面而不进行体积变形[7,8,9,10,11];(3)宽视野(FOV)要求与临床实践不兼容[7,8,9,10,12]。

我们提出了Deep-Motion-Net,这是一种深度GNN,可以从任意机架角度的单kV平面X射线图像估计3D体积器官变形。该模型通过图注意力(GAT)网络学习从CNN提取的特征到网格节点位移的映射。特征池化网络通过将图像特征与3D图节点融合来实现端到端训练,而投影角度依赖的特征则通过角度编码作为额外的输入通道进行学习。据我们所知,这是第一个从任意角度、有限FOV的kV投影重建3D解剖结构的框架。

方法
我们的方法使用一个GNN,该GNN从kV图像特征学习到患者特定器官网格的节点位移的映射,每个患者分别进行训练。

3D器官形状表示
体积器官形状使用3D非结构化四面体网格表示,描述为一个无向图\(G = {V, E, F}\),其中V表示顶点,E表示边,F表示顶点特征。患者特定的模板网格是根据参考CT体积构建的,顶点数分别为\(N = 785\)、827、803和756。

模型架构
所提出的架构(如图1所示)包括两个组成部分:一个2D CNN编码器,具有四个可学习的特征池化网络(FPNs),这些网络从kV图像中提取感知特征并将它们附加到网格节点;以及一个基于GAT的网格变形网络。

结合投影角度:2D CNN编码器接收单视图kV图像及其投影角度。由于2D投影中可见的解剖信息在不同机架角度下会变化,显式编码投影几何结构允许模型解决这些视角依赖的特征,并在连续的机架旋转过程中将它们准确映射到3D体积空间。为了便于实现这一点,投影角度通过除以360(机架旋转范围:0–360度)进行标准化,并作为额外的通道连接到输入图像,然后扩展和重塑以匹配图像的空间分辨率(256 × 256)。虽然投影角度在整个投影过程中是一个全局参数常量,但我们将其编码为一个完整的256 × 256通道,其中每个像素包含相同的标准化角度值。这种编码策略确保了角度信息在整个层次化特征提取过程中对所有卷积操作都是空间可用的,使网络能够在多个尺度上学习角度依赖的特征表示。

图1
Deep-Motion-Net架构使用2D CNN图像编码器从输入的kV X射线图像中提取投影角度依赖的语义特征。四个可学习的特征池化网络将这些特征附加到患者特定模板网格的顶点上,然后基于图注意力网络预测相应的网格变形。

2D CNN配置:图像编码器使用四个卷积层提取投影角度依赖的感知特征,这些卷积层的滤波器分别为16、32、64和128。所有卷积层使用3 × 3的核,步长和填充均为1。每个卷积层之后使用指数线性单元(ELUs)提供非线性。隐藏层输出使用组归一化[13]进行归一化,以减少训练期间的内部协变量偏移。每个卷积层的输出特征图通过2 × 2的最大池化(步长为2)进行下采样,然后传递到下一层。

特征池化网络:可学习的FPNs被集成以将图像特征与网格节点关联起来,实现端到端训练并提高图网络性能。四个FPNs,每个都与一个CNN层(图1)相连,由自适应平均池化(\(7\times 7\)输出)后跟一个具有5N个神经元的全连接(FC)层组成。展平后,具有5N个神经元的FC层产生的输出被重塑为(N, 5),以便直接将潜在特征附加到各个网格顶点。结果输出(N, 5)与3D网格坐标连接起来,每个顶点有23个特征(20个来自FPNs,3个表示3D位置)。

网格变形网络:该网络使用基于GAT的残差块组成的GNN估计变形网格顶点的3D坐标。残差连接通过保留早期层的信息来提高训练效率和输出质量。每个块遵循残差瓶颈设计[14],用每个顶点的FC和GAT层替换了1 × 1和3 × 3的卷积[15]。使用组归一化[16]代替批量归一化来减少小批量大小的误差,ELU激活提供非线性。这种设计扩展了[17]中的图CNN,有两个修改:图卷积网络(GCN)层被GAT层替换,后者为相邻节点分配基于注意力的非均匀权重(与各向同性GCN过滤[18]不同),ReLU被ELU替换以避免神经元死亡并允许负输出。如在线资源1的第5节所述进行了消融研究。

损失函数
总体目标函数\(\mathcal {L}\)定义为:
$$\begin{aligned} \mathcal {L} = \mathcal {L}_{Shape} + \lambda \mathcal {L}_{Laplacian}, \end{aligned}$$
其中权重项为\(\lambda \)。\(\mathcal {L}_{Shape}\)量化了预测和真实3D网格之间的差异。模板网格的起始形状由其顶点V定义(第3节3D器官形状表示)。我们定义Y和\(\hat{Y}\)分别为这些顶点的真实和预测的变形位置。一个直观的目标是最小化每个顶点之间的\(L_{1}\)损失:
$$\begin{aligned} \mathcal {L}_{Shape} = \sum _{i=1}^{N} \left\Vert {\hat{Y}_{i} - Y_{i}}\right\Vert _{1}, \end{aligned}$$
其中\(Y_{i}\)和\(\hat{Y}_{i}\)分别是各自集合中的第\(i\)个顶点。

表1
所有包含合成kV图像的测试集的摘要统计。第1列是患者案例编号。\(E_{pred}\)和\(U_{GT}\)分别表示预测误差和真实节点变形幅度。平均值(标准差):所有节点、变形状态和投影角度的平均值。平均峰值:所有投影角度下每个变形状态的峰值平均值。最大峰值:所有节点、状态和角度下的总体最大值。第99百分位数:所有节点、状态和角度下的第99百分位数值。所有值以毫米为单位。粗体值表示在临床上可接受的肝脏SBRT范围5.0毫米内的预测误差。尽管在某些情况下孤立的最大峰值误差超过了这个范围,但第99百分位数值仍然远低于2毫米,表明大的误差是高度局部化的,并不代表典型的模型性能。

图2
投影角度对预测精度的影响:根据图像投影角度(度)分组显示平均(顶部)和峰值(底部)预测误差的箱线图。每个箱线和 whisker 显示了测试集中所有变形状态下的误差分布。为了便于可视化,角度进一步分为10个等间隔的区间,覆盖完整的旋转。分别显示了患者1(蓝色)、2(黄色)、3(绿色)和4(红色)每个区间的结果。

仅使用\(\mathcal {L}_{Shape}\)时,发现顶点移动过于自由。我们引入了一个离散的拉普拉斯([19])损失\(\mathcal {L}_{Laplacian}\)作为正则化项,以限制这种自由度,确保顶点不会相对于它们的邻居移动得太远。额外的约束确保了网格具有光滑的表面。顶点 \(\hat{Y}_{i}\) 的离散拉普拉斯算子表示为:$$\begin{aligned} \delta _{\hat{Y}_{i}} = \frac{1}{|S(\hat{Y}_{i})|} \sum _{j\in S(\hat{Y}_{i})} (\hat{Y}_{i} - \hat{Y}_{j}), \end{aligned}$$ (3)其中 \(\hat{Y}_{j}\) 是 \(\hat{Y}_{i}\) 的相邻顶点,\(S(\hat{Y}_{i})\) 表示所有这些相邻顶点的集合。离散拉普拉斯损失函数表示为:$$\begin{aligned} \mathcal {L}_{Laplacian} = \frac{1}{N} \sum _{i=1}^{N} \left\Vert { \delta _{V_{i}} - \delta _{\hat{Y}_{i}} }\right\Vert _{2}^{2}, \end{aligned}$$ (4)其中 \(\delta _{V_{i}}\) 和 \(\delta _{\hat{Y}_{i}\) 分别是变形前后的离散拉普拉斯算子。在我们的实验中,我们使用了 \(\lambda =0.1\) 来平衡两种损失的权重。实现和训练细节在在线资源1的方法部分有介绍。

临床数据集
我们在四个肝癌患者的数据上评估了Deep-Motion-Net框架。每个数据集包括:1) 一个4D CT扫描,包含10个相位(\(10\times \)3D体积,分辨率为 \(512\times 512\times 105\),\(0.98\times 0.98\times 2.0\) 毫米\(^3\);2) 在治疗开始的不同日子获取的两个kV扫描系列(4–5分钟自由呼吸,全机架旋转)。与临床实践一致,kV扫描以肝脏为中心,视野(FOV)受到限制,因此一些投影角度只能捕捉到部分肝脏。

合成数据集生成
模型训练需要配对的器官运动实例和相应的kV图像,这些数据无法直接获取。因此,我们为训练和评估生成了合成数据。从4D CT图像中提取特定于患者的运动模式,并通过插值和适度外推这些运动来生成新的实例。过程如下:1) 使用SuPReMo工具包[20]分析4D CT图像,该工具包生成与替代信号相关的运动模型;2) 通过扰动这些信号生成新的运动实例;3) 由运动场变形参考(第0相位)CT体积;4) 从变形后的体积在所有需要的投影角度生成数字重建的放射图像(DRRs);5) 将DRRs的风格转移到kV图像的强度和噪声特性上。这样就得到了具有已知真实3D运动状态的逼真合成kV图像。最后,从参考CT中分割出目标器官,并构建一个模板网格。通过插值网格节点处的位移场获得真实节点位置。

对于每个患者,我们生成了550个变形状态,分为训练集(350个)、验证集(100个)和测试集(100个)。对于训练和验证状态,以 \(3.6^\circ\) 的间隔均匀采样了100张合成kV图像(共生成35,000张训练图像和10,000张验证图像)。对于测试状态,在随机采样的投影角度生成了50张kV图像(共生成5,000张测试图像)。为了确保合成kV图像和真实kV图像之间的正确视野对齐,每张合成图像都是使用来自同一扫描系列中相应真实图像的视野原点头部信息生成的。真实kV图像在实验中不再起作用。对测试集中所有合成kV图像的模型预测和真实3D肝脏形状进行了比较。详细信息在补充材料(在线资源1)的引言部分提供。

结果
首先,我们在具有已知真实变形的合成运动状态上评估了该框架。总结结果见表1。研究使用欧几里得距离作为度量标准来评估真实形状和估计形状之间的距离误差。每个测试集的平均误差和峰值误差分布,以及每个投影角度的分布(分为多个区间),显示在图2中。最后,真实形状、参考形状和预测形状的网格表面渲染图叠加在变形的3D CT体积上,显示在图3中。

图3
这张图像的替代文本可能是使用AI生成的。

全尺寸图像
真实变形(左)、模板(中)和估计变形(右)的3D肝脏形状的可视化,叠加在变形的3D CT体积上。第1-3行分别显示轴向、冠状和矢状视图。结果是针对表现最差的测试案例:投影角度 \(80.849^\circ\) 和误差最大的变形状态。右列的等高线显示了表面的空间误差分布。患者2-4的结果在在线资源1的讨论部分。

对于每个测试集,总体平均误差都很低:\(\le 0.22\) 毫米。在每个测试集内,最大峰值误差(即在任何变形状态和任何节点上找到的最大误差)相对较高,从患者4的4.36毫米到患者3的14.66毫米不等。这些峰值出现在真实位移最大的变形状态(分别为患者1的28.12毫米、患者2的34.91毫米、患者3的49.63毫米和患者4的25.64毫米)。通常,较高的真实位移对应较高的峰值误差,尽管平均误差始终较低。如图2所示,位移预测的准确性几乎不受图像投影角度的影响:平均误差和峰值误差的箱线图在各个角度范围内非常相似。

最后,重要的是要注意,在所有情况下,较高的峰值误差都极其局部化。这首先通过较低的整体平均值以及第99百分位误差(表1)得到体现,其中3/4的测试集的误差低于1毫米,第四个测试集的误差低于2毫米。也就是说,对于绝大多数网格节点来说,误差非常低,甚至低于毫米级。这一点通过图3右列中按位移误差着色的预测网格形状渲染图进一步说明。对于肝脏网格,大部分表面的误差接近零,只有非常局部的区域误差较大。

虽然整体平均预测误差始终较低(表1),但最大峰值误差需要详细的空间分析来证实极端局部化的观点。表2提供了每个患者所有测试实例中超过特定误差阈值的网格节点百分比的定量分解。

分析证实,预测误差确实极其局部化。对于所有患者,少于3.5%的节点超过5毫米的误差阈值,这完全在临床SBRT容差范围内。即使对于表现出最高误差负担的患者3,也只有1.42%的节点超过10毫米,尽管其最大峰值误差为14.66毫米。这定量验证了大型误差是罕见的异常值,仅影响非常小的解剖结构部分。

如表2所示,高误差区域在患者之间表现出一致的解剖学模式。峰值误差主要发生在肝脏的上部或后上部穹顶——该区域在呼吸运动中位移最大,且最容易受到肝脏-膈肌界面处滑动运动伪影的影响。对于患者3,即使在SuPReMo生成的真实值中,后上部穹顶也显示出网格-图像不对齐,这是由于规划4D CT中的运动伪影,特别是在大幅度变形的初始和最终时间点。这表明报告的最大误差反映了模型生理平滑预测与包含重建伪影的碎片化参考几何形状之间的不匹配。

峰值误差与呼吸相位而非投影角度有很强的相关性。最大误差主要发生在吸气末期和呼气末期,对应于肝脏穹顶的最大位移和呼吸周期的极端位置,此时4D CT相位分箱伪影最为严重。相反,如图2所示,预测误差在很大程度上不受投影角度的影响。模型在整个 \(360^{\circ }\) 机架旋转范围内保持了稳定的亚毫米级平均准确性。这证实了Deep-Motion-Net成功地从kV X射线图像中学习了3D解剖表示,并且局部的高误差是由于4D CT真实值中的内部几何不一致性而非角度依赖的特征提取失败造成的。

在线资源1的第6节提供了模型性能的额外统计特征描述,包括患者间变异性分析、位移-误差相关性分析和CT质量影响评估。

表2 每个患者案例中四面体网格节点的重建误差的定量空间分布。数值表示所有测试实例中落在特定误差阈值内的节点百分比。

在真实kV图像上的评估
我们的第二组实验使用了每个患者第二次扫描系列中的真实治疗期间kV图像(即训练数据创建期间未使用的系列)。这些系列分别包含患者1、2、3和4的1378、1310、1320和1292张图像。由于缺乏真实的3D变形数据,无法直接评估预测误差。因此,采用了两种方法:1) 基于输入真实kV图像和模型生成的DRRs之间的图像相似性度量的半定量评估;2) 基于将模型预测的肝脏边界叠加在输入kV图像上的定性评估。在定性评估中,使用了扫描系列中的所有图像。为了减少计算时间(特别是与图像体积的样条变形相关),在基于相似性的评估中仅使用了每个患者系列中均匀采样的100张图像。

基于互信息的评估
对于每张真实kV图像,使用薄板样条变换将预测的3D变形应用于参考CT,然后在相应的投影角度生成DRRs。在肝脏特定感兴趣区域内计算互信息(MI),以确保比较仅限于解剖学相关区域。使用未变形的CT体积作为基线,重复了相同的程序。

表3总结了结果。在所有患者中,从运动校正的CT体积生成的DRRs一致地获得了比从参考CT生成的DRRs更高的MI分数,表明与真实kV图像的对应性有所提高。单因素方差分析(ANOVA)测试确认这些改进在统计上是显著的(患者1-4分别为p = 0.0449、0.0283、0.0453和0.0423;\(\alpha \) = 0.05)。

表3 每个患者案例中真实kV图像和在相同投影角度生成的数字重建放射图像(DRRs)之间的互信息(MI)相似性分数。数值以平均值(标准差)报告,从每个扫描系列中抽取的100张图像计算得出。第2列显示了使用参考(未变形)CT体积获得的结果,而第3列显示了使用模型预测的变形场变形的CT体积获得的结果。所有值都在肝脏区域内计算。

通过边界叠加进行定性评估
将提到的扫描系列中的kV图像输入到训练好的模型中以获得3D网格形状预测。使用了第二次扫描系列中的所有图像。从每个预测的网格生成了相应的二值图像体积。最后,通过对这些二值图像体积进行光线追踪获得了投影的肝脏表面边界,并将其叠加在相应的输入kV图像上。更多详细信息在补充部分的结果中提供(在线资源1),完整的2D动画在在线资源2和3中。

比较模型
我们将我们的方法与IGCN [9, 10] 进行了比较,后者从单视图X射线预测3D器官形状,但仅限于固定投影角度和仅表面几何形状。为了公平起见,两种模型都在这些约束下进行了训练和评估。IGCN使用从我们的真实值体积中提取的表面网格和合成的0\(^{\circ }\) kV图像(256 \(\times \) 256分辨率,批量大小1,学习率0.0001,1000个周期)进行训练。在测试时,将0\(^{\circ }\)图像输入IGCN以预测表面网格,而我们的模型的体积输出被转换为表面以便直接比较。

表4显示我们的方法在所有患者案例中的肝脏表面变形方面取得了更高的准确性。单因素方差分析(ANOVA)测试确认了统计显著性:对于每个测试集,我们计算了真实形状和预测表面网格之间的平均欧几里得距离,产生了两组各100个平均误差值(每个模型对应测试集中的100个变形状态)。结果p值分别为0.0419、0.0088、0.0074和0.0485(患者1-4),在 \(\alpha =0.05\) 下确认了显著性。

表4 比较我们模型和IGCN的预测误差统计。所有误差都是从预测的器官表面网格计算得出的。患者案例编号在列1中。\(E_{Pred}^{Ours}\) 和 \(E_{Pred}^{IGCN}\) 分别表示我们方法和IGCN的预测误差。\(U_{GT}\) 表示真实变形幅度。平均值(标准差):所有节点、变形状态和投影角度的平均值。平均峰值:所有投影角度下每个变形状态的峰值平均值。最大峰值:所有节点、状态和角度下的总体最大值。第99百分位:所有节点、状态和角度下的第99百分位值。所有数值单位为毫米(mm)。
完整表格:
讨论:
我们提出了一个基于CNN-GNN的模型,用于从单次治疗过程中的kV X射线图像中恢复任意投影角度下的3D器官网格变形。该框架的吸引力在于它仅需要在放疗期间进行标准成像,无需MRI、替代信号或侵入性基准标记。据我们所知,这是第一个能够从整个治疗扫描系列中的任意单视图图像重建3D器官模型的深度学习框架。

训练依赖于SuPReMo工具包中的合成数据,因为缺乏真实kV图像的变形基准数据。因此,性能取决于从4D CT呼吸周期中得出的合成运动的准确性,该模型将呼吸运动视为主要的变形来源,而不是其他生理因素(如腹压变化或邻近器官引起的变形)所引入的全部变异性。我们通过生成有界的随机运动状态来近似这种变异性,但未来的工作将结合来自扩展kV序列的更真实的变异性。尽管该方法是为呼吸运动开发的,但只要有合适的训练数据,它也可以推广到其他器官的运动。

结果显示了较高的准确性;然而,预测误差受到CT图像质量的影响:存在运动相关伪影的患者表现出更高的峰值误差,尽管这些误差仍然局限于特定区域,平均误差保持较低。对于没有真实基准数据的真实kV图像,定性对比显示帧与帧之间的肝脏轮廓一致且平滑,变形参考CT图像提高了图像的相似性,表明预测结果是合理的。

对真实kV图像的定性评估显示,尽管预测是独立进行的,但预测的器官轮廓在帧与帧之间过渡一致且平滑,没有明显的跳跃。这表明该模型对真实图像中的噪声和不规则性具有鲁棒性。需要注意的是,鉴于这些低对比度kV X射线图像的特性,为这些图像划定边界对临床医生或放射科医生来说是一个固有的挑战。基于这些发现,未来的工作将致力于系统地量化模型在同一患者不同视野(FOV)变化下的鲁棒性,从而进一步评估其在不同临床环境下的适应性和可靠性。

本研究的一个关键局限性是训练数据来源于SuPReMo运动模型,而该模型本身是基于相位平均的4D CT构建的,因此无法明确捕捉到不规则的呼吸行为,如周期内的突然变化、咳嗽或强烈的患者特异性呼吸模式。虽然引入了替代信号扰动以增加变异性,但这些扰动只是一种实用的近似,并不能完全反映生理学上的复杂性。因此,所报告的性能是在典型呼吸运动的背景下进行解释的,未来的工作将重点关注结合更真实的、时间分辨的运动数据,以进一步评估在不规则呼吸条件下的鲁棒性。

除了运动建模之外,其他局限性还包括目前仅关注单一目标器官,忽略了器官周围的组织(OARs)和周围解剖结构。将模型扩展到多个网格是可行的,但可能需要一些约束来防止重叠或使用更大的统一网格。此外,目前的预测完全基于图像数据。尽管如此,Deep-Motion-Net的体积建模为未来整合生物力学约束(例如通过有限元方法实现的本构模型)提供了自然的基础,从而进一步提高预测变形的物理合理性。从临床角度来看,这项工作的主要目标是通过降低正常组织并发症概率(NTCP)同时保持或提高肿瘤控制概率(TCP),从而在不需侵入性跟踪的情况下允许使用更高的辐射剂量。在这方面,本研究中描述的疗程间和疗程内适应工作流程(在线资源1)旨在展示所提出的运动估计框架所支持的潜在临床整合路径。虽然当前工作验证了运动预测组件的准确性和性能,但包括剂量学验证、系统延迟特性分析以及故障检测和恢复策略在内的端到端验证超出了本研究的范围,是正在进行和未来工作的重点。因此,所提出的工作流程应被视为启发性概念,而不是已经完全部署的临床解决方案。

生物通微信公众号
微信
新浪微博


生物通 版权所有