利用 3D 卷积深度学习从全身形态非线性估计身体成分的研究解读
华盛顿大学保罗・G・艾伦计算机科学与工程学院的 Isaac Y. Tian 等人在npj Digital Medicine 期刊上发表了题为 “3D convolutional deep learning for nonlinear estimation of body composition from whole body morphology” 的论文。该研究通过创新性地运用深度 3D 卷积图网络和非线性高斯过程回归,实现了从人体 3D 形态对身体成分进行更精准的估计,为临床身体成分评估提供了新的有效方法,对慢性疾病管理和健康监测意义重大。
一、研究背景
身体成分与多种疾病密切相关。在美国乃至全球,总身体成分和局部身体成分与许多主要死因相关。例如,高内脏脂肪沉积会使代谢综合征风险加倍,还会增加癌症死亡率 。代谢综合征又与癌症、心力衰竭和糖尿病等慢性疾病紧密相连。此外,身体成分,特别是低瘦体重,会影响疾病治疗效果和死亡率 。
传统的身体成分评估方法存在局限性。历史上,身体成分评估依赖如双能 X 线吸收法(DXA)或空气置换体积描记法(ADP)等先进仪器。DXA 虽能测量局部脂肪和瘦体重沉积,但会让参与者暴露在有害的电离辐射中,不适合频繁重复测量,尤其是对儿童和孕妇等高危人群。因此,需要一种理想的替代评估系统,在不使用电离辐射的情况下,达到与 DXA 相当的准确性和精确性,且成本相对较低、易于使用。
3D 光学(3DO)成像技术具有潜力。近期研究表明,3DO 成像可作为 DXA 成像的准确、精确、低成本且无创的替代方法。它利用光谱中的光测量人体表面几何形状,无需注射同位素对比剂,能在一分钟内扫描完整成人身体,扫描系统成本约 1 万美元,且可自动操作,无需专业技术人员。然而,目前基于 3DO 扫描学习身体成分的研究多依赖线性数学模型,如主成分分析(PCA)和线性回归,这些模型存在局限性。非线性方法可能更符合形状与身体成分之间的真实关系,有望提供更准确的预测。
二、研究材料与方法
(一)实验队列
研究使用了四个数据集:CAESAR、Shape Up! Adults(SUA)、Shape Up! Kids(SUK)和 DFAUST。CAESAR 数据集包含 2400 名 18 - 65 岁的美国和加拿大成年人的 3D 扫描数据,扫描时参与者处于中性 A 姿势,大多穿着紧身灰色内衣和泳帽。SUA 和 SUK 数据集是横断面研究,按年龄、种族、性别和 BMI Z 评分分层,包含全身 DXA 扫描和 3DO 扫描数据。DFAUST 数据集是 10 个独特个体的 4D 人体姿势捕捉数据,用于预训练 3DAE 模型。
(二)标准 3D 网格拓扑结构
为确保所有 3DO 网格的拓扑一致性,除 DFAUST 数据本身已符合外,其他数据均标准化为包含 6890 个顶点的 SMPL 拓扑结构。首先将 3D 扫描的无组织原始点云转换为 60,001 顶点模板,再通过最近邻映射矩阵转换为 6890 顶点的 DFAUST 格式。
(三)3D 深度自动编码器与图卷积网络
采用基于 Zhou 等人研究的 3D 图卷积神经网络进行非线性降维和特征提取。该网络是一个 3D 自动编码器,以 6890×3 大小的张量表示 3D 网格顶点坐标作为输入,通过几何平均绝对误差(MAE)损失函数最小化重建误差。网络中定义卷积核半径和空间核步长均为 2,通过预计算图下采样操作实现特征提取,不同层的顶点是前一层中心顶点 2 环邻域内所有顶点的加权平均。为缓解数据不足问题,先用 DFAUST 数据集对 3DAE 模型进行 200 轮预训练,再在 SUA、SUK 和 CAESAR 的组合数据集上训练 400 轮。训练了不同瓶颈通道深度的 3DAE 模型,以测试模型大小与重建精度的关系。
(四)用 GPR 学习非线性传递函数
在身体成分分析中,使用非线性高斯过程回归(GPR)在从 SUA 数据集提取的特征和其配对的 DXA 测量值之间建立非线性映射。选择平方点积核,假设身体形状特征与身体成分之间的关系是非线性但一阶和二阶导数单调的。分别对男性和女性参与者训练 GPR 模型,并在 3DAE 形状模型的所有中间特征层上进行 GPR 以预测身体成分目标。
(五)综合消融试验与线性方法对比
训练 PCA 模型作为线性基线,与 3DAE 进行对比。设置 3DAE 最大瓶颈层大小为 4284,与 PCA 最大可能的组件数相对应,同时构建 301 组件的 3DAE 模型测试过拟合情况。还训练了使用相同 PCA 基础的 GPR 模型(PCA - GPR M391/F457),以测试非线性 GPR 相对于普通最小二乘法(OLS)的预测准确性。
(六)统计分析
测量不同模型大小下线性和非线性形状模型的几何重建精度,以评估非线性自动编码器相对于线性 PCA 方法在形状建模精度上的边际贡献。比较不同模型排列组合下身体成分估计的准确性,包括仅使用人口统计特征的 GPR 基线、PCA 形状特征的 OLS 回归(PCA - OLS)、使用 PCA 形状特征的 GPR(PCA - GPR)以及使用深度形状特征的完全非线性 GPR(3DAE - GPR)。通过均方根误差(RMSE)量化估计误差,并绘制相对于 PCA - OLS 完全线性基线的归一化 RMSE。评估 3DAE - GPR 模型与 DXA 的决定系数(
)。在测试 - 重测数据对上预测身体成分,比较不同模型排列的精度与先前工作和 DXA 扫描仪的精度,使用内脏脂肪的变异系数(% CV)和体脂百分比的重复 RMSE。对 3DAE - GPR 在两个模型大小下与 PCA - GPR 和 PCA - OLS 进行比较。进行消融研究,评估跳过模型训练步骤或保留训练数据对几何重建精度和身体成分预测精度的影响。
三、研究结果
(一)形状重建误差
研究对比了 3DAE 和 PCA 形状模型在不同大小下的几何重建误差。结果显示,随着模型增大,两者重建测试数据的误差均降低。在前三个模型大小中,线性和深度方法的几何重建精度相当。在最高参数计数时,PCA 的几何重建误差更低,而 3DAE 的重建误差在略高于 2mm MAE 处趋于平稳。
(二)身体成分预测结果
通过不同线性和非线性形状特征提取及回归方法的排列组合进行实验。结果表明,引入形状信息可降低预测误差,说明 3DO 形状对身体成分预测有用。在大多数身体成分指标上,GPR 比 OLS 更准确,例如 PCA - GPR 相对于 PCA - OLS 在大多数预测指标上 RMSE 更低。3DAE 特征提取对男性身体成分预测有一定提升,但在女性中,其提取的特征不如原始网格坐标信息丰富,未能超越 PCA 在高参数计数下的几何重建性能。
(三)测试 - 重测精度
GPR 在重测时比 OLS 更精确,3DAE 相对于 PCA 也降低了精度误差,3DAE 与非线性 GPR 结合具有最高精度。与 DXA 相比,3DAE - GPR 的体脂百分比精度误差约为 DXA 的两倍,但内脏脂肪精度更高,表明该模型在重测准确性上更可靠。
(四)与先前工作对比
与先前基于线性模型的工作相比,本研究的完全非线性模型 3DAE - GPR 在内脏脂肪和体脂百分比估计上产生了最低误差。在所有预测指标上,3DAE - GPR 模型的
值均大于或等于 0.86,RMSE 低于先前工作。
(五)消融结果
利用 DFAUST 数据预训练对创建准确的非线性 3DAE 形状模型至关重要,随机初始化训练的模型重建误差远高于预训练模型。对 3DAE 模型进行微调可显著降低重建误差,提高对不同个体扫描的泛化能力。包含所有可用 3D 网格数据训练形状和回归模型可产生最低的 3D 重建和身体成分预测误差。
四、研究结论与讨论
(一)研究结论
GPR 在身体成分预测方面表现出色。无论特征域是线性(PCA)还是非线性(3DAE),GPR 相对于线性回归通常能提高身体成分预测的准确性和精确性。在大多数身体成分指标上,GPR 的预测效果优于 OLS,仅女性腿部瘦肉指标除外。
3DAE 特征提取的性别差异。3DAE 特征提取对男性身体成分预测有改善作用,但在女性中,其深度特征不如未编码的网格几何信息有价值,在高参数计数下的几何重建性能也未超越 PCA。
3DAE 和 GPR 的高精度。3DAE 和 GPR 在男性和女性的体脂百分比和内脏脂肪质量测量中,均比其线性对应方法具有更高的精度。
(二)讨论
本研究构建的端到端模型性能卓越。通过扩展和多样化训练集,结合深度特征提取和非线性 GPR 预测,构建的模型在身体成分预测准确性上超越了先前所有工作。这进一步确立了 3DO 作为可靠且易获取的临床身体成分评估工具的地位,训练好的模型可集成到商业扫描仪软件中,无需临床或计算专家操作。
未来研究方向明确。未来可对比本研究与商业 3D 扫描仪身体成分估计方法的准确性和精确性;探索不同非线性回归方法对身体成分预测准确性的影响;研究如何将当前的两步管道集成到单个端到端深度网络中,以进一步提高模型性能;持续收集高分辨率 3DO 扫描数据和配对 DXA 扫描数据,改进非线性回归模型。
本研究首次将深度非线性自动编码器网络应用于 3DO 身体成分估计,为该领域的研究和临床应用开辟了新的道路,有望在慢性疾病管理和健康监测中发挥重要作用。