基于深度学习的腕戴加速计数据分析揭示膝骨关节炎早期诊断前长达5年的运动特征信号

时间:2026年2月18日
来源:KNEE SURGERY, SPORTS TRAUMATOLOGY, ARTHROSCOPY

编辑推荐:

本研究利用英国生物银行(UK Biobank)大样本数据,开发了一种融合深度学习的一维卷积神经网络(1D CNN)模型。该模型通过分析单周腕戴加速计记录的日常活动模式,能够区分健康人群与膝骨关节炎(KOA)患者,并可在临床诊断前长达5年识别出处于前驱期(prodromal)的高风险个体。研究发现,尽管各组活动模式相似,但KOA患者日间加速度略低。结果表明,日常手腕运动模式蕴含与KOA相关的可重复信号,为利用可穿戴设备进行无创、大规模人群筛查提供了新思路。

广告
   X   

摘要
本研究旨在探索为期一周的腕戴加速计数据结合深度学习,能否(i)区分健康个体与膝骨关节炎(KOA)患者,(ii)分离前驱期KOA与已确诊KOA,以及(iii)识别将在5年内被诊断为KOA的个体。研究采用了英国生物银行(UK Biobank)数据集进行回顾性病例对照分析。经过质量控制,共有102,120名参与者提供了有效的加速计数据;其中通过ICD-10 M17.x代码识别出KOA患者(n = 7,262)。为减少肥胖因素的混杂影响,分析被限制在体质量指数(BMI)≥ 29的范围内,并将对照组与KOA组在年龄、性别和BMI分布上进行匹配。
研究使用了经过预处理的、与方向无关的、以24小时为周期的每小时平均加速度数据,并将月份、性别、年龄和体重作为协变量。模型采用了一个一维卷积神经网络(1D CNN)来建模每日活动曲线,并对分类协变量(如月份、性别)使用了嵌入(embeddings)处理。通过五折交叉验证来评估模型的准确性、宏观F1分数、宏观敏感性和AUC。
经过匹配,为三个任务分别构建了平衡队列:健康 vs. KOA(每类n = 3,677)、前驱期KOA vs. 已确诊KOA(n = 1,596 vs. 2,081),以及健康 vs. 5年内发病的前驱期个体(每类n = 1,369)。各组间的日常活动模式相似,但KOA/前驱期参与者的日间加速度略低。模型在区分健康与KOA任务中表现出中等性能(准确率63.5 ± 1.2%;AUC 0.672 ± 0.017),在区分健康与5年内发病的前驱期个体任务中表现类似(准确率64.5 ± 0.5%;AUC 0.675 ± 0.019)。然而,区分前驱期与已确诊KOA的任务表现接近随机水平(54.6% ± 1.5%;AUC 0.552 ± 0.015)。
结论表明,一周的腕戴加速计数据包含与KOA相关的可重复信号,并能在诊断前长达5年识别出风险升高的个体。由于已确诊KOA无法与前驱期KOA区分开来,可以假设患者在诊断前多年就已表现出改变的运动模式。这些发现凸显了早期、无创运动监测的临床相关性,并支持可穿戴设备作为人群层面KOA筛查的可扩展、低成本工具的潜力。
引言
肌肉骨骼疾病(MSDs),尤其是膝骨关节炎(KOA),包含一系列影响肌肉、骨骼和关节的病症,全球有数百万人受累。由于其进展缓慢,早期检测和治疗更为可取。然而在实践中,大多数患者仅在出现明显症状(如夜间疼痛、持续疼痛或严重功能障碍)后才寻求医疗护理。KOA在首次临床就诊前的发展阶段通常未被识别,关于此前数周或数月内运动强度和质量的客观数据也极少可用。对个体运动的纵向监测可以揭示日常活动模式的细微变化,并有助于在显著的临床体征出现前识别出如KOA这样的慢性病。
为收集纵向运动数据,一个实用且用户友好的移动工具至关重要。加速计(accelerometers)特别适合此目的。它们的数据支持生物反馈辅助治疗等即时应用,并支持对大型队列进行长期分析以用于跨站点监测或预测建模。由于其紧凑的尺寸,加速计可以嵌入到可穿戴设备中,使其易于在临床和研究环境中使用。
在KOA领域,加速测量已被应用于广泛的临床相关场景,包括步态特征和关节生物力学的表征、风险评估、患者分层、症状分类和功能衰退监测。此外,已有研究证明,在识别已确诊和前驱期帕金森病方面,加速测量数据的表现优于遗传、生活方式、血液生物标志物和前驱期症状数据。
尽管惯性测量技术(如加速计)在神经病学和老年医学中越来越多地用于诊断、治疗和预防,但它们在骨科中的应用仍然相对不足。在KOA领域,已有各种关于预测KOA相关个体参数的研究,但尚未有针对KOA本身的预测研究。利用机器学习(ML)处理大规模加速计数据集,可能为在最早阶段检测KOA提供一种有前景的方法。
本研究旨在开发和验证一个深度学习模型,该模型能够利用英国生物银行中的日常腕戴加速计数据,区分健康个体、前驱期KOA病例和已确诊KOA患者。目标是确定日常运动模式是否可以作为KOA发病的早期指标或预测因子。
方法
研究设计
本研究采用回顾性病例对照设计,利用英国生物银行的加速计数据来识别和预测KOA状态及进展。研究围绕三个预测情景构建:(1)区分健康参与者与所有KOA患者(包括临床确诊KOA和前驱期KOA),(2)区分前驱期KOA与已确诊KOA患者,以及(3)通过比较健康参与者与处于前驱期的个体,预测未来5年内的诊断。其中,“前驱期”定义为在加速测量时尚未被诊断,但在10年内接受了诊断的参与者。
英国生物银行数据集
英国生物银行是一个生物医学数据库,包含50万名参与者的去识别化遗传和健康信息,这些参与者在招募时年龄为40-69岁,居住在英国。所有参与者均签署了书面知情同意书。研究获得了英国生物银行103,712份加速计记录,中位佩戴时间为6.9天。活动测量使用Axivity AX3腕戴式三轴加速计。
参与者
参与者来自英国生物银行数据集,限于拥有完整加速计记录且无异常高读数(>1000 m/s2)的个体(n = 102,120)。KOA患者通过ICD-10诊断代码M17、M17.0、M17.1和M17.9识别,最终获得7,262名患者。为尽量减少肥胖的潜在混杂,两组均要求BMI ≥ 29。对照组按性别、年龄和BMI分布与KOA患者进行匹配以增强人口统计学可比性。
数据预处理
英国生物银行的加速计数据已经过标准化预处理。原始三轴信号经过校准、过滤和处理以检测非佩戴期,随后得出经过验证的体力活动和睡眠指标。本研究使用了英国生物银行提供的处理数据集,该数据集将加速计记录汇总为24小时周期内每小时间隔的平均加速度值。除了这些活动指标,还提取了人口统计学和背景变量,包括记录时的年龄、性别、体重和记录月份。月份被专门纳入,以考虑活动的季节性变化,因为与夏季月份相比,冬季月份在所有参与者中观察到的活动水平持续较低。
为了预测建模,数据被构建成三个比较类别:1)健康 vs. KOA(前驱期+已确诊),2)前驱期KOA vs. 已确诊KOA,以及3)健康 vs. 随后5年内被诊断为KOA的前驱期KOA病例。
预处理涉及加速计数据的详细构建和标准化,删除了有缺失值或异常测量的记录。涉及健康对照的比较样本量由可用的疾病病例数决定,以防止类别不平衡。健康对照被欠采样以基于年龄、性别和BMI的相似性与特定疾病组进行1:1匹配。相反,对于疾病阶段之间的比较,保留了所有符合条件的参与者以最大化可用数据。KOA组和对照组之间的匹配采用加权抽样来实现年龄、性别和BMI分布的平衡,从而减少人口统计学混杂。
预测建模
由于数据由短的、固定的24点每小时曲线组成,因此问题具有固有的时间和昼夜节律结构。随机森林等传统模型能很好地处理表格特征,但难以在不进行自定义特征工程的情况下捕捉局部日常模式。而一个紧凑的、具有24小时感知池化的一维卷积神经网络(1D-CNN)可以针对这些节律,同时通过嵌入层原生融合背景输入(月份和性别),通过简单投影融合年龄和体重。
该CNN由两个连续的卷积层(分别为16和32个滤波器)组成,每个卷积层后接批量归一化和线性整流单元(ReLU)。输出使用对24小时序列的平均池化进行池化。包含额外的嵌入层来处理分类变量(记录月份和性别)。一个数值投影器通过一个带有ReLU激活的全连接层来处理人口统计学特征(年龄和体重)。这些不同的特征集随后被拼接起来,并通过一个最终的分类器(由两个线性层组成,中间由ReLU激活分隔)进行处理,以产生跨多个类别的最终预测。
模型训练和评估采用分层五折交叉验证方案进行,以评估泛化能力。网络每个折叠训练30个周期,批次大小为64,学习率为0.001。
数据分析
统计分析和预测建模使用Python编程语言进行,特别是使用PyTorch库进行CNN实现,使用scikit-learn进行模型评估。模型性能使用准确率、宏观F1分数、敏感度、受试者工作特征曲线下面积(AUC)和混淆矩阵进行评估。为确定分类结果的统计显著性,对混淆矩阵进行了独立性卡方检验,以确定预测标签与真实标签之间的关联是否显著。此外,使用单样本比例z检验将模型的总体准确率与平衡数据集中随机预期的50%基线进行比较。
结果
在102,120名拥有有效加速计数据的参与者中,识别出7,262名KOA患者。随后进行了上述三个分类分析。应用纳入标准后,29,138名参与者被归类为健康,3,985名被归类为KOA。各情景的人口统计学数据如图所示。
对于健康 vs. KOA(前驱期+已确诊)分析,每组纳入3,677名参与者,平均年龄约为65.5岁。前驱期 vs. 已确诊KOA的比较分析了1,596名前驱期病例(平均年龄64.8岁,44%男性)与2,081名已确诊KOA病例(平均年龄65.7岁,49%男性)。最后,健康对照 vs. 5年内发病前驱期子集将1,369名健康对照与1,369名在5年内被诊断的前驱期病例匹配,两组平均年龄均为65.9岁。所有预测模型的分类准确率均显著高于50%的随机基线。
健康 vs. KOA
比较了从未接受过KOA诊断的参与者与在任何时间有过KOA诊断或在随访期间被诊断的参与者的加速计数据。为创建平衡队列,每组随机选择了3,677名参与者。两组在性别、记录年龄和BMI方面相似。
两组的平均加速计值在24小时内显示出相似的昼夜模式,活动高峰出现在10:00左右,随后在傍晚逐渐下降。健康组(Class 0)全天的平均加速度略高于KOA组(Class 1)。
最佳模型的归一化混淆矩阵显示,模型正确分类了69%的健康个体和58%的KOA患者。误分类发生在31%的健康个体和42%的KOA患者中。
五折交叉验证性能显示,平均准确率为63.5%,宏观一对一AUC为0.672。这些结果表明了稳定且优于随机水平的性能。
前驱期KOA vs. 已确诊KOA
比较了处于KOA前驱期的参与者与已确诊KOA的参与者。前驱期状态定义为在观察窗口内(具体为临床诊断前0-10年)发展为KOA。两组在性别、记录年龄和BMI方面相似。
两组24小时内的平均加速计值均显示夜间(00:00-06:00)数值较低,早晨急剧上升,活动高峰在10:00左右,随后逐渐下降。前驱期组全天的加速度略高。
最佳模型的归一化混淆矩阵显示,模型正确分类了55.5%的前驱期病例和53.9%的已确诊病例。误分类发生在前驱期组的44.5%和已确诊组的46%。性能中等,前驱期组略有优势。
五折交叉验证性能显示,平均准确率为54.6%,宏观一对一AUC为0.552。性能在各个折叠中一致但较为一般。
健康 vs. 5年内发病
比较了从未接受过KOA诊断的参与者与在测量后5年内被诊断为KOA的参与者。每组随机选择了1,369名参与者。两组在性别、记录年龄和BMI方面相似。
两组全天的平均加速计值均显示夜间和清晨数值较低,从06:00左右开始急剧上升,活动高峰在10:00-11:00,随后逐渐下降。健康组在活动时段(尤其是09:00-16:00)的加速度略高。
最佳模型的归一化混淆矩阵显示,模型正确识别了71%的健康个体和58%的5年内发病个体。误分类发生在29%的健康个体和42%的5年内发病个体中。
五折交叉验证性能显示,平均准确率为64.5%,宏观一对一AUC为0.682。各个折叠间性能一致,具有中等区分能力。
讨论
研究发现,腕戴加速计能够捕捉到KOA的可检测信号。模型能够以中等准确率区分健康人群与当前或前驱期KOA患者,并且能以相似水平预测5年内的KOA发病,这表明该信号在诊断前很久就已出现。相比之下,区分前驱期与已确诊KOA的表现接近随机水平。这与一个观点一致,即许多前驱期个体尽管缺乏诊断编码,但已经表现出类似KOA的运动模式。
研究队列反映了该时期全国范围内的身高、肥胖和性别分布数据。BMI对总体活动有很强的影响。由于KOA病例的平均BMI高于29,而过量的体重是KOA发展的已知风险因素,因此分析被限制在BMI ≥ 29的参与者中,以限制混杂。因此,无法从结果中得出关于BMI < 29受试者的可靠结论。
各组的日常活动曲线相似,都有熟悉的中午活动高峰和傍晚下降,但健康参与者全天的平均加速度略高。区分健康个体与患病或未来患病个体的模型取得了中等区分度(AUC 0.67)。特异性超过敏感性,表明模型在识别保持未患病者方面优于识别已患病或将患病者。这一模式可能反映了未被手腕设备完全捕捉到的异质性和细微的早期运动变化。
比较在接下来0-10年内发展为KOA的个体与记录时已确诊的个体,两组在年龄、性别、BMI和身高上匹配。与第一组(健康 vs. 任何KOA)不同,区分前驱期与已确诊KOA没有预测价值。尽管前驱期参与者显示出稍高的活动水平,但模型表现接近随机水平。KOA通常缓慢进展多年,因此一旦出现与KOA相关的运动变化,无论是否有正式诊断记录,手腕层面的活动可能看起来大致相似。
当限制在保持KOA未患病或在5年内被诊断的个体时,健康参与者再次显示出略高的日间加速度。分类器取得了中等区分度,且交叉验证结果一致。误分类更常见于后来发展为KOA的个体,这指向了可变且细微的早期信号。
总之,出现了三种模式:首先,对比健康参与者与任何患有或将患有KOA的个体的模型达到了中等区分度,表明大部分相关信号存在于日常运动中。其次,预测5年内KOA的表现类似,这与在诊断编码出现前数年就已出现的信号一致。第三,区分前驱期与已确诊KOA接近随机水平,这符合诊断延迟假说,即许多前驱期参与者已经表现出类似KOA的活动但尚未被诊断。
从实践角度来看,即使是单个腕戴设备采集的非结构化加速计数据,结合机器学习和最少的临床背景,也可以为KOA提供人群层面的风险分层。与基因测试或生物标志物面板相比,加速计提供了一种低成本且广泛可用的选择,特别是许多人已经在日常生活中佩戴此类设备。
本研究使用了单一现实世界数据集的数据,参与者在日常活动中佩戴手腕设备。虽然这提高了现实生活中的适用性,但数据噪声更大。纳入更多具有不同人口统计特征的数据集可以增强模型的泛化能力。模型仅依赖于与方向无关的加速度大小,排除了受设备放置影响的特定轴数据。
当前的性能尚未准备好用于个体临床决策,但对于开发筛查方法和优先进行进一步评估是有用的。仅凭腕戴加速计无法区分前驱期与已确诊KOA,这仍然是临床检查和专注于膝关节的影像学检查的领域。结合来自多个传感器、替代身体位置以及补充性临床和生物标志物数据的信号的持续工作可能会提高性能。但加速计仍然是人群层面分诊的低成本、可扩展选择,特别是因为许多人已经在日常生活中佩戴此类设备。
数据是在自由生活条件下收集的,这引入了噪声、伪影和缺失值。虽然应用了预处理,但可能存在残留伪影,并且过滤减少了样本量。数据集不包含活动标签,这限制了对特定行为的解释,需要基于模型的推断。因此,将疾病状态映射到信号模式是间接的。英国生物银行队列也可能与更广泛的人群不同,这限制了泛化性。
研究分析了每周每小时汇总的加速度,而非英国生物银行的原始腕戴加速计信号。原则上,分析行走片段内的原始数据更为可取,因为它可以捕捉步速、步频、对称性和可能与膝关节病理相关的短时活动片段。但这在此处不可行,因为加速计数据未被标记,且当前用于自由生活手腕数据的分割模型在识别多样化日常场景中的行走方面仍然不够准确。使用小时级别的汇总减少了由噪声分割检测导致的误分类,但也牺牲了时间细节,并可能减弱了与短暂或特定任务运动相关的信号。
腕戴设备可能无法捕捉与膝关节病理最相关的运动。先前的研究表明,位于大腿的单个传感器对KOA更具信息性。加速计仅测量线性加速度,无法捕捉可以反映跛行或不对称性的旋转运动。添加陀螺仪或使用复合惯性测量单元可能会提供更丰富的信息。
BMI和相关因素影响活动模式。研究数据显示,清晰的KOA与非KOA参与者之间的活动差异从BMI为29及以上开始出现。低于该阈值,是BMI而非KOA似乎导致了较低的活动水平。因此,研究聚焦于BMI ≥ 29,无法对BMI < 29得出可靠结论。最后,依赖ICD-10医院记录来定义KOA,可能会使真实情况偏向于寻求专科护理的严重病例,可能漏掉了在初级保健中管理的较轻病例。
结论
腕戴加速计数据包含与KOA相关的可重复信号,能够以中等水平区分健康个体与当前或未来KOA患者,并能在诊断前长达5年识别出风险升高的个体。无法区分前驱期与已确诊KOA,表明与KOA相关的运动变化在临床编码出现前很久就已出现。

生物通微信公众号
微信
新浪微博


生物通 版权所有