然而,通往理想应用的道路上布满荆棘。现实世界复杂多变:人体的遮挡、多样的体型、不同的光照环境,都给精准的姿态识别带来了巨大困难。更关键的是,在许多至关重要的应用场景,如物理治疗和康复医学中,仅仅知道关节的位置还不够。临床专家和康复师们迫切需要知道关节之间的角度——例如肘部的屈曲角度、脊柱的弯曲角度——因为这些角度是评估姿势正确性、诊断运动功能障碍、预防二次损伤的核心量化指标。现有的主流HPE模型通常只标注17个关键点,对于手、脚等细节部位以及脊柱等关键姿态分析部位的刻画不够精细,导致角度计算的基石不稳,分析的深度和准确性因此受限。为了攻克这些难题,一篇题为“A Method for Human Pose Estimation and Joint Angle Computation Through Deep Learning”的研究论文在《Journal of Imaging》上发表,提出了一套全新的解决方案。
为了开展这项研究,研究人员主要运用了以下几项关键技术方法:首先,是数据集的构建与增强,他们从Roboflow等平台整合了多个公开数据集,并手动标注,创建了一个包含25个关键点(较标准的17点增加了手、脚、脊柱等细节)的自定义骨架,最终通过预处理(如调整对比度、模糊化)和增强(如旋转、亮度变化)技术,将数据集扩充至超过15万张图像。其次,是模型的选择与训练,他们采用了以实时性见长的YOLO(You Only Look Once)模型的第8版纳米变体(YOLO8n)作为基础架构,并针对HPE任务进行微调,该模型包含用于特征提取的主干网络(Backbone)、用于多尺度特征融合的颈部网络(Neck) 和用于最终预测的姿态头(Pose Head)。最后,是关节角度计算算法,他们开发了一个Python脚本,利用模型预测出的关键点二维坐标,通过向量点积公式计算任意三个关键点(例如,肘部作为顶点,连接肩部和手腕)形成的几何角度,从而量化关节活动度。
3.3. 实验结果:模型训练取得了显著成效。评估指标显示,在目标检测(Bounding Box)任务上,模型的平均精度(mean Average Precision, mAP)在交并比(Intersection over Union, IoU)阈值为0.5时达到了0.98;在关键点(Pose)定位任务上,mAP@0.5达到了0.58。这些数据表明,该模型能够非常准确地框出人体位置,并对25个关键点进行有效定位。在此基础上,研究进一步展示了如何利用预测出的关键点坐标,通过几何计算实时得出关节角度,并将其应用于评估瑜伽姿势、运动动作等实际场景,验证了其解决实际问题的潜力。