基于深度学习的25关键点人体姿态估计与关节角度计算方法及其在物理治疗与远程医疗中的应用

时间:2026年4月9日
来源:Journal of Imaging

编辑推荐:

本文介绍了一种基于深度学习的人体姿态估计(HPE)与关节角度计算方法。针对物理治疗和远程医疗场景中姿态分析准确性不足的问题,研究人员利用改进的YOLO8n模型,构建了包含25个解剖关键点的自定义骨架和超过15万张增强图像的数据集。实验结果表明,该方法在关键点定位(mAP@50=0.58)和目标检测(mAP@50=0.98)上均表现出色,能有效评估运动正确性和识别姿态偏差,为自动化运动分析、数字健康和远程患者监护提供了有前景的技术支持。

广告
   X   

在计算机视觉领域,如何让机器像人类一样理解身体的姿态和动作,一直是一个充满挑战又极具价值的课题。这项被称为人体姿态估计(Human Pose Estimation, HPE)的技术,早已超越了实验室的范畴,悄然走进了健身房、康复中心和我们的家庭。想象一下,一位正在进行术后康复训练的患者,如果能通过摄像头实时获得自己动作是否标准的精准反馈,康复过程将变得更加安全高效;或者,身处偏远地区的居民,通过视频通话就能得到专业理疗师的远程动作指导,医疗服务的可及性将大大提高。这并非遥不可及的未来图景,而是HPE技术正在努力实现的目标。
然而,通往理想应用的道路上布满荆棘。现实世界复杂多变:人体的遮挡、多样的体型、不同的光照环境,都给精准的姿态识别带来了巨大困难。更关键的是,在许多至关重要的应用场景,如物理治疗和康复医学中,仅仅知道关节的位置还不够。临床专家和康复师们迫切需要知道关节之间的角度——例如肘部的屈曲角度、脊柱的弯曲角度——因为这些角度是评估姿势正确性、诊断运动功能障碍、预防二次损伤的核心量化指标。现有的主流HPE模型通常只标注17个关键点,对于手、脚等细节部位以及脊柱等关键姿态分析部位的刻画不够精细,导致角度计算的基石不稳,分析的深度和准确性因此受限。为了攻克这些难题,一篇题为“A Method for Human Pose Estimation and Joint Angle Computation Through Deep Learning”的研究论文在《Journal of Imaging》上发表,提出了一套全新的解决方案。
为了开展这项研究,研究人员主要运用了以下几项关键技术方法:首先,是数据集的构建与增强,他们从Roboflow等平台整合了多个公开数据集,并手动标注,创建了一个包含25个关键点(较标准的17点增加了手、脚、脊柱等细节)的自定义骨架,最终通过预处理(如调整对比度、模糊化)和增强(如旋转、亮度变化)技术,将数据集扩充至超过15万张图像。其次,是模型的选择与训练,他们采用了以实时性见长的YOLO(You Only Look Once)模型的第8版纳米变体(YOLO8n)作为基础架构,并针对HPE任务进行微调,该模型包含用于特征提取的主干网络(Backbone)、用于多尺度特征融合的颈部网络(Neck) 和用于最终预测的姿态头(Pose Head)。最后,是关节角度计算算法,他们开发了一个Python脚本,利用模型预测出的关键点二维坐标,通过向量点积公式计算任意三个关键点(例如,肘部作为顶点,连接肩部和手腕)形成的几何角度,从而量化关节活动度。
研究结果部分详细展示了该方法的有效性:
  • 3.1. 数据集:研究构建了一个专用于姿态分析的大规模、多样化数据集。其核心创新在于设计了一个包含25个解剖关键点的骨架模型(如图6所示),相比常见的17点模型(如COCO数据集),它额外包含了右眼、左眼、鼻子、脊柱、双手的拇指与小指、双脚的脚趾与脚跟等关键点。这种设计提供了更精细的身体表征,特别是增强了对手、脚细节和头部方向的刻画,为后续精准的角度计算奠定了坚实基础。
  • 3.2. 数据集扩增与预处理技术:为了提升模型的鲁棒性和泛化能力,研究综合运用了灰度转换、色调/饱和度/亮度调整、曝光度变化、模糊、添加噪声等多种预处理和数据增强技术(如图7-10所示)。这些操作模拟了各种真实世界条件(如光照变化、图像质量不佳),确保训练出的模型能够适应复杂环境。
  • 3.3. 实验结果:模型训练取得了显著成效。评估指标显示,在目标检测(Bounding Box)任务上,模型的平均精度(mean Average Precision, mAP)在交并比(Intersection over Union, IoU)阈值为0.5时达到了0.98;在关键点(Pose)定位任务上,mAP@0.5达到了0.58。这些数据表明,该模型能够非常准确地框出人体位置,并对25个关键点进行有效定位。在此基础上,研究进一步展示了如何利用预测出的关键点坐标,通过几何计算实时得出关节角度,并将其应用于评估瑜伽姿势、运动动作等实际场景,验证了其解决实际问题的潜力。
结论与讨论部分对全研究进行了总结并展望了未来。本研究表明,所提出的基于深度学习的方法,通过集成一个更详尽的25关键点骨架、一个大规模增强数据集以及高效的YOLO8n架构,成功实现了高精度的人体姿态估计。更重要的是,该方法超越了单纯的关节点定位,发展出了一套自动化的关节角度计算流程。这使其特别适用于对姿态准确性有严苛要求的领域,如物理治疗和远程医疗。在物理治疗中,该系统可以实时监控患者康复训练的动作角度,确保其符合标准,避免错误动作导致的二次伤害;在远程医疗场景下,医生可以依托该系统远程评估患者的运动功能,制定个性化的康复计划。尽管在极端遮挡等复杂情况下性能仍有提升空间,但该方法为实现自动化、定量化的运动分析迈出了关键一步,为数字健康、康复辅助和远程患者护理等应用提供了切实可行的技术方案,具有重要的研究和应用价值。

生物通微信公众号
微信
新浪微博


生物通 版权所有