研究背景与意义
近年来女子足球在参与度和专业化程度上的显著增长,推动可穿戴技术如全球导航卫星系统(GNSS)设备在女足运动员活动监控中的广泛应用。通过量化特定速度区间内的跑动距离,可以深入理解比赛对运动员的身体需求,从而为训练计划设计等提供依据。然而,当前女子足球速度区间阈值常直接沿用男足标准,忽视了男女在体能属性(特别是最大跑速)上的显著差异。这种阈值应用导致女足运动员在高速度区间的跑动距离被低估,可能扭曲对比赛身体负荷的真实理解。虽然部分研究尝试对女足采用下调的阈值,但这些调整往往带有主观随意性,缺乏经过验证的标准化框架。个体化速度区间阈值的发展与实施有助于更精确地规划训练负荷,但基于实验室生理参数(如最大摄氧量O2max、血乳酸阈值)的方法存在生态效度低、实施不便等问题。数据挖掘技术为分析和相对化活动数据提供了一种非侵入性、可扩展的替代方案。
研究方法
本研究利用了来自挪威女子顶级联赛(Toppserien)两支球队的47名精英俱乐部级别女子足球运动员在2020至2021赛季76场竞争性比赛中的活动数据。最终数据集包含792个比赛观察(每场45分钟以上)。运动员佩戴STATSports追踪单元(10 Hz,多星座GNSS技术)收集数据。数据经过严格质控,排除瞬时速度>10 m·s−1或加速度>±6 m·s−2的数据点。采用谱聚类这一无监督聚类技术对每位运动员瞬时比赛速度数据进行分段。通过肘部法则确定数据集中的最佳聚类数量(k=3),并使用轮廓分数评估聚类质量。团队基准速度区间阈值通过计算个体运动员各阈值的平均值得到。统计分析包括线性混合效应模型比较不同阈值方法下的跑动距离差异,以及多元线性回归模型探索个体化速度区间阈值的预测因子(如平均最大比赛跑速、>5.5 m·s−1跑动距离)。
研究结果
霍普金斯统计量表明速度数据具有强聚类趋势(H值=0.99)。确定的最佳聚类数k=3,轮廓分数为0.40。新建立的团队基准速度区间阈值为1.12 m·s−1、2.83 m·s−1和5.10 m·s−1,由此定义了四个速度区间。与应用现有的男足或女足通用阈值相比,新阈值使得最高三个速度区间的跑动距离均显著增加。个体化速度区间阈值分析显示,运动员进入最低、中间和最高速度区间的阈值范围分别为0.8-1.5 m·s−1、2.0-3.5 m·s−1和4.1-5.9 m·s−1,其组间变异系数(CV)分别为13.0%、12.9%和8.5%。平均最大比赛跑速是所有个体化速度区间阈值的显著预测因子,尤其对最高阈值解释了大量方差(调整后R²=0.72,β=0.74,p<0.001)。
讨论与分析
本研究通过无监督聚类技术,为精英俱乐部级别女子足球运动员建立了更具代表性的速度区间阈值。与Park等人基于国际顶级球队研究得出的较高阈值相比,本研究阈值相对较低,反映了俱乐部级别运动员的身体活动特征,可能更广泛适用于精英女足群体。新阈值的应用揭示了女子比赛中被低估的高强度活动量。个体化阈值的研究表明,运动员的最大比赛跑速与其速度区间阈值,特别是高层级阈值,存在强关联,这支持了将个体身体能力与强度分类相联系的观点。然而,仅依靠单一体能属性可能不足以确定整个运动强度连续体的多个速度区间。本研究提出的数据挖掘方法基于常规收集的活动数据,更具实践相关性,并可集成到分析软件中,用于定义联赛、位置、年龄或运动员特异性的阈值。
研究局限性与发展
需注意本研究的阈值源于比赛活动数据,可能受球队战术、比赛重要性、位置角色和对手水平等情境因素影响。由于匿名数据性质,未能将个体化阈值与实验室测量的体能水平或比赛位置进行关联分析。此外,新阈值基于精英运动员样本,应用于次精英运动员需谨慎。未来研究可纵向应用该聚类方法,评估个体化阈值是否随赛季中体能变化而波动,并验证这些数据驱动阈值与既定生理参数的功能相关性。
结论
本研究成功应用谱聚类方法(结合β=0.1平滑因子)为女子足球建立了团队基准和个体化速度区间阈值。团队阈值(1.12, 2.83, 5.10 m·s−1)为分析精英俱乐部级别女子足球跑动需求提供了更准确的分类标准。个体化阈值生成框架展示了数据挖掘在运动员监控中的价值,可适应于其他运动项目和人群。平均最大比赛跑速是高层级阈值个体差异的主要解释因素。这些发现强调了在标准化团队阈值基础上结合个体化方法的重要性,为聚类方法在运动员监控中的进一步应用奠定了基础。相关Python代码已公开,促进了研究透明度和方法可重复性。