研究讨论
本研究综述的目的在于对足球裁判员场地体能测试的可靠性和效度进行批判性分析。分析结果表明,现有测试能够准确评估裁判员的有氧耐力,但关于无氧耐力和短距离冲刺测试的心理测量学特征信息尚有所欠缺。此外,研究人员未找到用于评估裁判员决策能力的场地测试。这些发现能够帮助国际和国内主要体育机构更好地判断其所属裁判员的比赛准备情况,并完善裁判员培训计划以替换达到退休年龄的裁判员(Weston 等,2012)。
值得关注的是,目前大多数研究侧重于评估裁判员有氧耐力、速度和变向能力等测试的心理测量学特征,但没有研究分析生理-认知测试的效度和可靠性,即裁判员必须在极度疲劳的状态下做出正确的决策。通常情况下,裁判员平均会在 35 岁时达到最佳裁判水平,此后其体能状况便开始下降;但相对地,裁判员的决策能力反而会从那时起开始提升,使他们能够在不影响执法表现的同时节省体力(Castillo 等,2016)。现有的研究明显忽视了这一点。因此,需要针对裁判员在极度疲劳状态下的决策能力制定有效、可靠的测试方法。这类测试会同时考验裁判员的认知能力和身体素质,使两者能够随裁判员年龄的变化实现互补。这与顶尖足球运动员所表现出来的生理-认知互补相类似(Guerra 等,2019)。
在无氧耐力测试方面,只有两项测试(ARIET 和 12MRT)接受了准则效度评估,结果良好;同时,两者也表现出良好的绝对可靠度。因此,这两项测试似乎都适用于评估无氧耐力。然而,由于 12MRT 是一项连续性测试,所以它无法很好地反映比赛的间歇性特点(Krustrup,Bangsbo,2001)。事实上,2005 年,国际足联从其官方测试中移除了该项目,替换上一个间歇性测试项目(FIFA,2016)。综上,基于本研究结果,唯一可推荐的无氧耐力测试便是 ARIET。不过,针对该测试还需要进行更多的研究,毕竟研究人员只收集到一个评估其心理测量学特征的研究。
尽管有氧耐力被公认为足球裁判员取得成功的关键,但在较低强度的有氧活动中穿插进行高强度无氧活动的能力,是与比赛节奏保持同步的决定性因素(Weston 等,2012)。因此,裁判员需要具有足够效度和可靠性的无氧耐力测试。在本研究综述中,有三项测试被用于评估高强度无氧活动能力,它们都基于裁判员的反复冲刺表现。这类测试于 2016 年被引入到国际足联的测试项目中,显示出很高的聚合效度和建构效度。此外,这些测试的准确性还在于它们最符合裁判员的实际比赛要求。然而,需要指出的是,在明确推行这些测试项目之前,需要进一步研究来确认其可靠性和准则效度。
速度是精英足球裁判员的必备能力,因为裁判员每场比赛都要进行 21 到 30 次冲刺,以实现合理跑位并对比赛做出正确评估(Casajús,Castagna,2007;Weston 等,2012)。这就要求速度测试必须具有高心理测量学特征。本研究中的样本使用了 5 至 200 米不等的冲刺测试,因此它们评估的速度区间存在重要差异(Castillo 等,2016)。只有 50 米冲刺测试和 200 米1 冲刺测试进行了可靠性评估,表现出较高的绝对可靠度。没有测试接受准则效度评估。不过,这些测试总体上都具有足够的建构效度和聚合效度。基于以上结果,并考虑到在 90% 的情况下,球员的冲刺持续时间小于 5 秒且距离不足 30 米(Castillo 等,2016),较短距离的测试可能具有更高的内容效度。基于这一假设,并结合本研究综述中提到的冲刺测试的心理测量学特征,可以认为 50 米冲刺测试是评估足球裁判员速度能力的最佳测试,主要有两个原因。首先,尽管在比赛中球员每次的冲刺距离一般不到 50 米,但这毕竟是本研究的样本所分析的最短冲刺距离之一。其次,在速度测试中,只有 50 米和 200 米冲刺测试提供了绝对可靠度,且具有高聚合效度和建构效度。但同时,也有学者对 50 米冲刺测试的实用性提出质疑,认为其似乎不能很好地预测裁判员在实际比赛中的体能表现(Mallo 等,2007)。因此,需要进一步的研究来确认较短距离速度测试的可靠性和效度。
在如今的足球比赛中,裁判员每 5 到 6 秒就会改变一次运动方式(Krustrup,Bangsbo,2001),因此开展有效、可靠的变向能力测试至关重要。本研究样本仅分析了 10-8-8-10 测试和修改版灵活性 T-测试(MAT),均显示出较高的绝对可靠度和相对可靠度。此外,这两项测试都能够区分不同竞技水平和/或不同年龄段的裁判员。但是,所有的研究都未对测试的准则效度进行评估。值得注意的是,在所有测试中,变向能力都被视作一种不涉及应激反应的、可以预先计划的运动方式,所以测试都只评估了影响灵活性的体能因素。这种做法是有待商榷的。因为在开放的运动环境中,虽然灵活性的体能因素已被证实能够应对可以预先设定的运动模式(Sisic 等,2016),但灵活性的认知因素将决定个体在必须应对外部刺激时进行变向的能力(Scanlan 等,2015;Trecroci 等,2019)。因此,评估灵活性体能因素的测试可能更适用于助理裁判员(AR),其中修改版灵活性 T-测试(MAT)由于其绝对和相对可靠度以及聚合和建构效度最值得推荐。而对于场上裁判员(FR)而言,则需要进一步研究其灵活性的认知因素,以提高测试的效度和可靠性。
本研究的主要优势在于,根据笔者的了解,这是第一篇侧重于分析足球裁判员测试的心理测量学特征的综述。因此,本研究的结论对于评估裁判员体能水平的专业人士以及从事裁判员体能训练的教练们来说将会有很大帮助。
当然,本研究也存在其固有的局限性。首先,大多数样本没有报告测试的准则效度。而鉴于准则效度是唯一客观的效度衡量标准,研究人员在解读研究结果时应当考虑这一方面(Currell, Jeukendrup, 2008)。其次,本研究分析的样本主要针对来自欧洲联赛的专业裁判。高级别联赛要求裁判员具备更强的运动能力,才能跟上比赛的节奏。但不同国家的球队比赛风格和水平难免有所不同。因此,根据裁判员所执法的联赛不同,其对身体和体能的要求也会不同(Barbero-Álvarez 等, 2012)。所以,本研究样本所得的结果可能无法推广至非欧洲和/或较低级别的联赛。此外,针对助理裁判员的研究还很有限。由于他们的体能需求与场上裁判员不同(总跑动距离较短,高强度跑动较少,决策挑战更小,对灵活性体能因素的要求高于认知因素),所以现有研究尚无法针对助理裁判员提供概括性结论。因此,需要进一步研究基于助理裁判员身体需求的体能水平测试。再者,目前还没有研究对女性裁判员进行过测试评估。考虑到两性间显著的生理差异会影响女性裁判员的运动表现,并且两者在场地体能测试中使用不同的参考标准,所以现有研究结果不能适用于女性(Hunter, 2016; Lundsgaard, Kiens, 2014; Schmitz 等, 2018)。最后,本综述主要的方法学限制在于,受语言限制或因研究人员在检索过程中未纳入灰色文献,本研究可能并未穷尽所有相关研究。
原文为“ 20 米”,但查阅研究文献的实验结果后可判定这里应该是原作者的笔误。