基于裁判员场地体能测试的研究综述
Sara Bouzas-Rico, Vicente De Dios-Álvarez, David Suárez-Iglesias and Carlos Ayán-Pérez (2021)
Research in Sports Medicine, 30(4), 439-457. https://doi.org/10.1080/15438627.2021.1895787
摘要:本研究综述旨在确定足球裁判员场地体能测试的心理测量学特征。作者在电子数据库内进行检索,查找有关至少一项足球裁判员场地体能测试的可靠性和/或效度的研究。截至 2020 年 5 月,共收集到 13 项研究分析国际足联(FIFA)提出的体能测试(有氧耐力,n1 = 8;无氧耐力,n = 3;速度,n = 8),以及 7 项研究分析其它用于评估有氧耐力(n = 1)和变相能力(n = 6)的体能测试。分析结果表明,助理裁判员间歇耐力测试(ARIET)、50 米冲刺测试和修改版灵活性测试(MAT)分别是评估足球裁判员有氧耐力、速度和变相能力的最佳选择。日后的研究应当着眼于助理裁判员和女裁判员的研究缺口,以及无氧耐力和短距离速度测试的心理测量学特征研究。
关键词:效度;可靠性;测试;裁判员;足球
研究所涉及到的该类别体能测试项目数量
引言
足球运动员体能水平的不断发展和提高(Gonaus 等,2019;Milanovic 等,2017)使其在比赛中的体能负荷相应增加(Wallace,Norton,2014)。这也影响了裁判员的体能要求(Ai 等,2020)。关于职业足球裁判员在正式比赛中的活动概况和生理要求的研究表明,足球裁判是一项具有挑战性的活动(Cerqueira 等,2011)。事实上,在一场比赛中,裁判员所承受的生理压力与中场球员相近(D’Ottavio,Castagna,2002),甚至可能高于某些球员(Castillo 等,2016)。比赛级别越高,比赛节奏越快,也可能会增加对裁判员的生理要求(Stølen 等,2005)。
对裁判员来说,除去体能要求,最重要的就是决策过程。在一场比赛中,一名出色的场上裁判(FR)大约会做出 137 次可察觉的判罚和 200 次不可察觉的判罚。如果有效比赛时长占比以 56% 来计算,则意味着裁判员每分钟需做出 3 到 4 次不可察觉的判罚,其中近三分之二是由裁判员团队共同做出的(Helsen,Bultynck,2004)。因此,场上裁判员和助理裁判员都必须具备良好的体能储备,以应对比赛要求;在比赛过程中找到最理想的站位(即合适的视野范围),以做出正确的判罚。
因此,必须确保裁判员团队达到足够的体能水平。室内测试虽然能够评估标准化条件下的体能维度(即跑步机增量测试),但难以模拟间歇性运动所需的能量体系、肌肉群和活动技能的变化(Giacomo,2019)。有学者提出,室内测试没有使用恰当的比赛模拟方案,可能导致其测试结果与实际比赛表现不相符(Castagna 等,2007;O’Reilly、Wong,2012)。再者,室内测试还需要高成本的设备资源,且必须由训练有素的评估人员进行管理,这些都会影响测试结果。
基于以上原因,有必要考虑使用场地测试,将评估转移至更加真实的场景中(Chamari 等,2004)。而且,场地测试成本较低;不需要对测试官员进行大量培训;可以在单次训练中完成;对参与者更具激励作用。鉴于此,国际裁判管理机构(如国际足联、欧足联以及几个主要的国家足球协会)选择使用场地测试来系统地评估其裁判的体能状况(Weston 等,2012)。
在足球领域,关于场地体能测试的适用性和适应性的研究大部分集中在球员而非裁判员身上。尽管两者在整体生理要求上有相似之处,但裁判员的体能表现还是有一些不同(Castillo 等,2016)。例如,裁判员通常比球员年长,他们没有接受过同等强度的体能训练,在比赛中不存在有球运动,且不能被替换下场(Casajús,Castagna,2007)。因此,检验特定于足球裁判员的场地体能测试的心理测量学特征(尤其是可靠性和效度)非常重要。
在过去二十年里,越来越多的科学文献开始关注足球裁判员的生理特征,其中包括对裁判员的体格和生理参考数据、运动模式以及比赛中的生理负荷等进行回顾性研究(Barbero-Álvarez 等,2012;Castillo 等,2016;Krustrup,Bangsbo,2001;Weston,Brewer,2002)。然而,据笔者所知,针对用于量化裁判员群体的生理要求的场地体能测试,尚无一篇综述性文献收集和分析过这些测试的心理测量学特征。
总之,目前还没有任何综述文献对足球裁判员场地体能测试的心理测量学特征进行过系统、批判性的分析。基于此,本研究的目的是要全面回顾有关足球裁判员场地体能测试的可靠性和效度的所有科学研究。
研究对象与研究方法
研究设计与流程
本研究通过系统性的回顾,来分析或提供有关足球裁判员场地体能测试的可靠性和/或效度的信息。
样本收集
在 2020 年 2 月 至 2020 年 5 月期间,研究人员在 PubMed 数据库中对经同行评审的研究进行实证搜索,研究无时间限制。
首先,使用以下关键词进行检索:
[“Football” OR “Soccer”] AND [“Reliability”] AND [“Validity”] AND [“Test” OR “Fitness test”]
备选研究必须满足以下标准:
- 描述至少一项由裁判员执行的场地体能测试的可靠性和/或效度;
- 发表在经同行评审的 SCI 科学期刊中。
对属于以下类别的研究予以排除:
- 论文摘要或全文存在访问限制;
- 研究其它足球范式(美式足球、澳式足球、室内足球);
- 使用西班牙语、葡萄牙语和英语以外的语言。
样本过滤
在检索期间,一名研究人员会对收集到的研究标题和摘要进行核查。如果标题和摘要提供的信息表明该研究符合备选标准,则继续对全文进行核查。研究人员在核查过程中如有疑问,将与第二位研究人员进行商讨,得出最终结论。
数据提取
本文作者对所有被选中的研究进行了评估,提取其研究标题、作者、期刊、出版详情等信息。同时,作者还收集了测试参与者的年龄和性别信息1,进行的足球体能测试项目,以及有关其可靠性和/或效度的信息,例如被测人群的信息、被测人群的选择标准、测试的统计分析方式及其系数。不确定之处将交由第二位作者进行判断。此外,本文作者还分析了所有研究的参考文献,以求获取更多的相关研究。
如研究报告提供了该数据
研究结果
初始检索共获得 113 项研究。剔除重复结果和与本综述主要目标无关的研究后,选定 30 项研究。在浏览全文后,最终确定 20 项有关足球裁判员场地体能测试心理测量学特征的研究,以供全面分析(见图 1)。

图 1. 检索与选择研究样本的流程图
设计与样本
研究样本容量从 11 名裁判员到 2459 名裁判员不等,其中 9 项研究针对精英裁判员,4 项研究针对业余或次级精英裁判员,7 项研究针对精英和次级精英裁判员。
所有研究均未考虑女裁判员。
共有 13 项研究(见表 1)分析了国际足联场地体能测试的心理测量学特征(有氧耐力,n = 8;无氧耐力,n = 3;速度,n = 8),另有 7 项研究(见表 2)关注其它用于评估有氧耐力(n = 1)和变向能力(n = 6)的体能测试。
表 1. 国际足联裁判员场地体能测试研究一览
研究项目 | 研究目标 | 样本 | 体能测试 | 体能类别 | 可靠性 | 效度 |
---|---|---|---|---|---|---|
1. 研究主裁和助理裁判员在赛季初和赛季中的反复冲刺能力(RSA) 2. 研究裁判员年龄与其反复冲刺能力的关系 | 共 78 名男性精英裁判员 主裁 (n = 27) 一级裁判 (n = 17; 年龄 = 36.0 ± 5.6 ) 二级裁判 (n = 10; 年龄 = 26.8 ± 2.2 ) 助理裁判员 (n = 51) 一级裁判 (n = 23; 年龄 = 36.3 ± 5.1 ) 二级裁判 (n = 28; 年龄 = 31.3 ± 3.4 ) | 主裁: 反复冲刺测试(RST)(6x40m,冲刺间休息 1 分 30 秒) 助理裁判员: 反复冲刺测试(RST)(5x30m,冲刺间休息 30 秒) | 无氧耐力 | N/R1 | ||
Muniroglu and Subak (2018a) | 对比修改版的 T-测试4成绩与 10 米、30 米冲刺测试成绩 | 72 名男性业余裁判员 年龄 = 25.8 ± 3.0 | 10 米冲刺测试 30 米冲刺测试 T-测试 | 速度 灵活性 | N/R | 聚合效度: 10 米 vs 30 米 (r = 0.66; p < 0.01) 10 米 vs T-测试 (r = 0.22; p < 0.01) 30 米 vs T-测试 (r = 0.27; p < 0.01) |
Muniroglu and Subak (2018b) | 比较 5 米冲刺、10 米冲刺、30 米冲刺、箭头灵活性测试(AAT)、T-测试和伊利诺伊灵活性测试(IAT) | 72 名男性业余裁判员 年龄 = 23.5 ± 2.6 | 5 米冲刺测试 10 米冲刺测试 30 米冲刺测试 T-测试 箭头灵活性测试(AAT) 伊利诺伊灵活性测试(IAT) | 速度 灵活性 | N/R | 聚合效度: 5 米 vs 10 米 (r = 0.72; p < 0.01) 5 米 & 10 米 vs 30 米 ( r 值分别为 0.62 和 0.84; p < 0.01) 5 米 & 10 米 & 30 米 vs T-测试 ( r 值分别为 0.72; 0.42; 0.48; p < 0.01) 5 米 & 10 米 & 30 米 vs AAT ( r 值分别为 0.38; 0.57; 0.70; p < 0.01) 5 米 & 10 米 & 30 米 vs IAT ( r 值分别为 0.39; 0.60; 0.75; p < 0.01) T-测试 vs AAT & IAT ( r 值分别为 0.50; 0.61; p < 0.01) AAT vs IAT ( r = 0.79; p < 0.01) |
Sánchez-García et al. (2018) | 分析冲刺能力(40 米冲刺测试)与耐力(YYIR15)之间的关系 | 23 名男性业余裁判员 年龄 = 24 ± 5 | Yo-Yo 间歇跑测试(级别一)(YYIR1) 40 米冲刺测试 | 有氧耐力 速度 | N/R | 聚合效度: 40 米(Vmax6)vs YYIR1(距离) (r = −0.40; p < 0.05) 40 米(时间)vs YYIR1(距离) (r = −0.17; p > 0.05) 40 米(时间)vs 40 米(Vmax) (r = −0.26; p > 0.05) |
Bartha et al. (2009) | 探究国际足联体能测试能否为区分不同竞技水平的裁判员提供可靠依据 | 共 2459 名男裁判员 主裁 FIFA 级别 (n = 168) 匈牙利精英级裁判 (n = 63) 匈牙利三级裁判 (n = 201) 匈牙利州一级裁判 (n = 517) 匈牙利州二级裁判 (n = 453) 匈牙利州三级裁判 (n = 607) 助理裁判员 FIFA 级别 (n = 196) 匈牙利精英级裁判 (n = 50) 匈牙利州级裁判 (n = 204) | 12MRT7 200 米冲刺测试 50 米冲刺测试 | 有氧耐力 速度 | N/R | 建构效度: • 12MRT 能够区分不同竞技水平的主裁 (p < 0.05); • 12MRT 能够区分精英级和州级的助理裁判员 (p < 0.05); • 精英级和州级的主裁/助理裁判员在 50 米和 200 米冲刺测试中的表现存在差异。 |
Mallo, Navarro, García-Aranda & Helsen (2009) | 探究新的国际足联场地体能测试与比赛中体能表现之间的关系 | 11 名男性 FIFA 级别裁判员 年龄 = 39.2 ± 3.4 | 6x40m 冲刺测试(冲刺间休息 1 分 30 秒) 间歇跑测试 (30 秒跑 150 米,40 秒走 50 米) | 无氧耐力 | N/R | 聚合效度: • 平均冲刺成绩 (r = −0.02; p = 0.96) 和最快冲刺成绩 (r = −0.13; p = 0.74) 与比赛中的快速跑距离关系不大; • 间歇跑平均 HR8 vs 比赛中平均 HR (r = 0.42; p = 0.18) • 间歇跑平均 HR vs 比赛中 HR 超过 85% 的运动 (r = 0.38; p = 0.22) • 间歇跑恢复 HR vs 比赛中 HIA9 的时间 (r = −0.70; p = 0.04) |
Weston et al. (2009) | 探究新的国际足联裁判员体能测试能够在多大程度上监测裁判员的比赛体能水平 | 17 名男性精英裁判员 年龄 = 40.0 ± 5.1 | 6x40m 冲刺测试(冲刺间休息 90 秒) 间歇跑测试 (30 秒跑 150 米,40 秒走 50 米) | 无氧耐力 | N/R | 聚合效度: 间歇跑 HR vs TDC10 & HIR11 (r 值分别为 −0.70; −0.57; p < 0.01) 40 米最短时间 vs HIR & SD12 (r 值分别为 −0.76; −0.75; p < 0.001) 40 米平均时间 vs HIR & SD (r 值分别为 −0.77; −0.77; p < 0.01) |
Casajús & Castagna (2007) | 1. 探究年龄对生理和场地测试表现可能存在的影响 2. 确定 12MRT 在高水平裁判员中的准则效度 | 共 45 名西班牙男性精英裁判员 年龄 = 35.5 ± 4.4 年轻裁判员 (n = 15) 年龄 = 30.4 ± 1.5 中年裁判员 (n = 17) 年龄 = 35.8 ± 1.2 老龄裁判员 (n = 13) 年龄 = 40.4 ± 2.5 | 12MRT 200 米冲刺测试 50 米冲刺测试 | 有氧耐力 速度 | N/R | 建构效度: • 在 50 米冲刺测试中,老龄裁判员慢于年轻裁判员 (p < 0.001); • 在 200 米冲刺测试和 12MRT 测试中,裁判员表现无显著差异 (p > 0.05)。 准则效度: • 12MRT 测试表现与 VO2max13 相关 (r = 0.46; p = 0.002) |
Mallo et al. (2007) | 探究国际足联体能测试与比赛表现之间的关系 | 11 名男性 FIFA 级别裁判员 年龄 = 33.4 ± 3.8 | 12MRT 200 米冲刺测试 50 米冲刺测试 | 有氧耐力 速度 | N/R | 聚合效度: • 12MRT vs TDC (r = 0.23; p > 0.05) • 12MRT vs 比赛中 HIA 的时间 (r = 0.54; p = 0.06) • 50 米和 200 米冲刺成绩与比赛中的运动情况不相关 (p > 0.05) |
Castagna, Abt, D’Ottavio et al. (2005) | 探究高水平足球裁判员体能表现的年龄差异,为裁判员的选拔和训练提供参考 | 共 36 名意大利男性精英裁判员 年龄 = 37 ± 3 年轻裁判员 (n = 12) 年龄 = 33.5 ± 2.5 中年裁判员 (n = 14) 年龄 = 37.5 ± 1.0 老龄裁判员 (n = 10) 年龄 = 42.0 ± 1.0 | 12MRT 200 米冲刺测试 50 米冲刺测试 | 有氧耐力 速度 | 建构效度: • 200 米冲刺测试能够区分年轻裁判员与老龄裁判员 (p < 0.05)。在 200 米冲刺测试中,老龄裁判员慢于年轻裁判员 (p < 0.001); • 不同年龄段的裁判员在 50 米冲刺测试和 12MRT 测试中的表现无显著差异 (p > 0.05)。 聚合效度: 12MRT vs 比赛中的 HIA & SD (r 值分别为 0.51; 0.32; p < 0.05) | |
Castagna, Abt, D’Ottavio et al. (2005) | 利用仅有的两项已被证明与实际比赛体能表现相关的场地体能测试,探究不同级别裁判员的测试表现 | 共 42 名裁判员 顶级裁判员 (n = 14) 年龄 = 37.5 ± 4.5 中级裁判员 (n = 14) 年龄 = 27.8 ± 3.2 低级裁判员 (n = 14) 年龄 = 24.8 ± 1.2 | Yo-Yo 间歇跑测试(级别一)(YYIR1) 12MRT | 有氧耐力 | N/R | 建构效度: • YYIR1 能够区分不同级别的裁判员(顶级裁判员的表现优于其它级别的裁判员)(p < 0.05) 聚合效度: YYIR1 vs 12MRT 所有级别 r = 0.56; p < 0.001 顶级裁判员 r = 0.77; p < 0.001 中级裁判员 r = 0.64; p < 0.03 低级裁判员 r = 0.50; p > 0.05 |
Castagna et al. (2002) | 探究精英裁判员的场地体能测试结果与比赛体能表现的关系 | 22 名意大利男性精英裁判员 年龄 = 37.0 ± 2.4 | 12MRT 200 米冲刺测试 50 米冲刺测试 | 有氧耐力 速度 | N/R | 聚合效度: 12MRT vs 比赛中的 TDC, HIA & SD ( r 值分别为 0.71; 0.51; 0.32; p < 0.05) 200 米冲刺 vs TDC (r = −0.48, p < 0.05) 200 米冲刺表现与 HIA 和 SD 不相关 50 米冲刺 vs TDC (r = −0.38, p < 0.05) 50 米冲刺表现与 HIA 和 SD 不相关 |
Krustrup and Bangsbo (2001) | 探究间歇跑测试能否用于评估比赛体能表现 | 27 名丹麦男性精英裁判员 年龄 = 29–47(平均 38 岁) | Yo-Yo 间歇跑测试(级别一)(YYIR1) 12MRT | 有氧耐力 | 重测信度: 两周 相对可靠度: YYIR1: 变化 < 5%; 范围: 0–11% | 聚合效度: YYIR1 vs 比赛中的 HIR (r = 0.75; p < 0.05) YYIR1 vs TDC (r = 0.66; p < 0.05) 12MRT vs 比赛中的 HIR (r = 0.46; p < 0.05) 12MRT vs TDC (r = 0.48; p < 0.05) YYIR1 vs 12MRT (r = 0.75; p < 0.05) |
N/R = not reported 报告未说明
IS = ideal sprint (time) 最快冲刺时间
TS = total accumulated sprinting time 总冲刺时间
灵活性 T-测试是一种常用于评估运动员/个人向前、向后和左右移动能力的测试。https://tools.city/q-and-a/ja043l5g
YYIR1 = Yo-Yo intermittent recovery level 1 Yo-Yo 间歇跑测试(级别一)
Vmax = maximum velocity (km/h) 最大速度(千米/时)
12MRT = 12-minute run test 12 分钟跑
HR = heart rate 心率
HIA = high intensity activity (18.1 km/h-24 km/h) 高强度运动(速度达到 18.1 km/h-24 km/h)
TDC = total distance covered during match 比赛总跑动距离
HIR = high intensity running 高强度跑动
SD = sprint distance (>24 km/h) 冲刺距离(速度大于 24 km/h)
VO2max = maximal oxygen uptake 最大摄氧量
CV = coefficient of variation 变异系数
表 2. 其它裁判员场地体能测试研究一览
研究项目 | 研究目标 | 样本 | 体能测试 | 体能类别 | 可靠性 | 效度 |
---|---|---|---|---|---|---|
探究间歇高强度耐力场地测试在精英助理裁判员中的再现性和聚合效度 | 共 245 名裁判员 意大利男性裁判员 (n = 198) 甲级联赛 (Serie A) (n = 27) 乙级联赛 (Serie B) (n = 41) 职业联赛 (Lega Pro) (n = 89) 国家级裁判 (n = 41) 丹麦男性裁判员 (n = 47) 顶级联赛 (n = 17) 二级联赛 (n = 24) 三级联赛 (n = 6) | 助理裁判员间歇耐力测试(ARIET) | 有氧耐力 | 建构效度: • 甲级和乙级联赛裁判员的 ARIET 表现分别优于职业联赛裁判员 23% 和 25% (p < 0.001; AUC18 = 0.82) 聚合效度: ARIET vs YYIR1 (r = 0.95; p < 0.001) 准则效度: • ARIET vs 室内跑 VO2max (r = 0.78; p < 0.001) • YYIR1 vs 室内跑 VO2max (r = 0.71; p < 0.001) • ARIET vs 室内跑至力竭时间 (r = 0.70; p = 0.004) • YYIR1 vs 室内跑至力竭时间 (r = 0.68; p = 0.005) | ||
Castillo et al. (2019) | 1. 比较国家级主裁和助理裁判员的内外部临场反应和体能表现; 2. 探究体能指标与比赛中身体和生理反应的关系。 | 共 44 名西班牙三级男裁判员 主裁 (n = 25; 年龄 = 28 ± 7) 助理裁判员 (n = 19; 年龄 = 27 ± 8) | 修改版自由式灵活性 T-测试(MATF19) | 灵活性 | N/R | 建构效度: 裁判员的 MATF 测试表现无显著差异 (ES20: 0.36; p > 0.05) 聚合效度: MATF 测试表现与比赛中的运动不相关 (p > 0.05) |
Riiser et al. (2018) | 探究裁判员的 CODA 和 RSA 测试表现与比赛中的高强度跑动表现的关系 | 28 名男性精英裁判员 主裁 (n = 9; 年龄 = 38 ± 7) 助理裁判员 (n = 19; 年龄 = 37 ± 8) | 变向能力测试(CODA) | 灵活性 | N/R | 聚合效度: • 当把 HIR 和加速度作为比赛指标时,裁判员的比赛表现与国际足联体能测试的关联度不足以支持体能测试的聚合效度; • 在顶级裁判员和助理裁判员中,CODA 或 RSA 的测试结果与 HIR 或加速度之间存在微弱关联或没有关联 (p > 0.05)。 |
Yanci et al. (2016) | 探究西班牙足球裁判员的变向与加速能力;分析不同级别裁判员的灵活性和冲刺能力差异 | 共 41 名男性裁判员 第一组(高水平、精英级) (n = 20; 年龄 = 28.4 ± 1.3) 第二组(低水平、省级) (n = 21; 年龄 = 29.5 ± 1.8) | 修改版灵活性 T-测试(MAT21) | 灵活性 | 重测信度: N/R 相对可靠度: ICC = 0.89 绝对可靠度: CV = 4.23% | 建构效度: MAT 能够区分不同级别的裁判员,第一组测试用时小于第二组 (p < 0.01) 聚合效度: MAT vs 5 米 & 15 米 (r 值分别为 0.61; 0.77; p < 0.001) 5 米 vs 15 米 (r = 0.75; p < 0.001) |
Castillo, Yanci et al. (2016) | 1. 探究不同身份、级别和年龄的足球裁判员的身体和生理特征 2. 分析冲刺能力、变向能力和耐力之间的关系 | 共 45 名裁判员 按身份划分: 主裁 (n = 23; 年龄 = 30.0 ± 6.7) 助理裁判员 (n = 22; 年龄 = 29.2 ± 8.9) 按级别划分: 国家级 (n = 28; 年龄 = 30.0 ± 7.1) 省级 (n = 17; 年龄 = 29.1 ± 9.0) 按年龄划分: 35 岁以下 (n = 35; 年龄 = 26.3 ± 5.1) 35 岁以上 (n = 10; 年龄 = 41.2 ± 2.7) | 修改版自由式灵活性 T-测试(MATF) | 灵活性 | N/R | 建构效度: MATF、20 米冲刺、30 米冲刺和 YYIR1 测试能够区分不同年龄组的裁判员( 35 岁以上的裁判员慢于 35 岁以下的裁判员) 聚合效度: MATF vs 20 米 (r = 0.76; p = 0.001) MATF vs 30 米 (r = 0.76; p = 0.001) YYIR1 vs 20 米 (r = 0.45; p > 0.01) YYIR1 vs 30 米 (r = 0.47; p < 0.01) |
Castagna, Impellizzeri, Bazzini, Weston & Manzi (2011) | 检验一项旨在测试精英级助理裁判员变相能力的新场地测试(即 10-8-8-10 测试)的适用性 | 共 100 名意大利男性精英裁判员 甲级 & 乙级联赛 (n = 50; 年龄 = 37 ± 2.9) 职业联赛 (n = 50; 年龄 = 34 ± 2.9) | 10-8-8-10 测试 (慢跑 50 米,6 秒被动恢复,倒退慢跑 20 米,转身冲刺 10 米,走 20 米) | 灵活性 | 重测信度: 一天 相对可靠度: ICC = 0.90 绝对可靠度: (时间) 1–2 组 TEM = 0.21 2–3 组 TEM = 0.18 SWC = 0.07 | 建构效度: 经三次测试后,10-8-8-10 测试的最好成绩和平均成绩均无法区分不同级别的裁判员(p 值分别为 0.57 和 0.72) |
Harley et al. (2001) | 制定并评估一项针对特定能力的体能测试,以衡量联赛裁判员的体能水平 | 16 名裁判员 (年龄 = 36.6 ± 7.7) | 一项新的足球裁判员测试 | 局部的灵活性 | N/R | 聚合效度: 新测试 vs 多阶段体能测试的 VO2max (r = 0.73; p < 0.0005) 新测试 vs 室内跑 VO2max (r = 0.82; p < 0.0005) |
ICC = intraclass correlation coefficient 组内相关系数
TEM = typical error of measurement 典型测量误差
SWC = smallest worthwhile change 最小有意义变化
AUC = area under curve 曲线下面积
MATF = modified agility T-test free
ES = effect size 效应值
MAT = modified agility T-test 修改版灵活性 T-测试
国际足联体能测试
有氧耐力
共八个研究评估了两项有氧耐力测试的心理测量学特征。两项测试分别是 Yo-Yo 间歇跑测试(级别一)(YYIR1)和 12 分钟跑步测试(12MRT)。
有两个研究评估了测试的可靠性:YYIR1 表现出高相对可靠度(变异系数<5%)(Krustrup,Bangsbo,2001),而 12MRT 则显示出高绝对可靠度(变异系数为1.7%)(Castagna 等,2005)。此外,分别有六个研究(Castagna 等,2002;Castagna 等,2005,2005;Krustrup,Bangsbo,2001;Mallo 等,2007;Sánchez-García 等,2018)、四个研究(Casajús,Castagna,2007;Bartha 等,2009;Castagna 等,2005,2005)和一个研究(Casajús,Castgan,2007)评估了测试的聚合效度、建构效度和准则效度。聚合效度范围从 0.40(YYIR1 vs 40 米冲刺)到 0.77(YYIR1 vs 12MRT)。在建构效度方面,YYIR1 和 12MRT 能够区分精英和次级精英裁判员(p < 0.05)。12MRT 与 VO2max 的准则效度为0.46。
无氧测试
共三个研究评估了无氧测试的心理测量学特征。研究使用了两项反复冲刺能力测试(6×40 米和 5×30 米)和一项间歇跑测试来评估无氧耐力水平。
各研究的聚合效度范围从 0.38(间歇跑 HR vs 比赛 HR)到 0.77(6×40 米 vs HIR & SD)(Mallo 等,2009;Meckel 等,2020;Weston 等,2009)。在建构效度方面,不同级别的裁判员在 6×40 米测试中的表现存在差异。
速度测试
共八个研究使用了五项不同的测试来评估裁判员的速度能力(以冲刺时间为指标),包括 5 米冲刺、10 米冲刺、30 米冲刺、50 米冲刺和 200 米冲刺。
只有一个研究确定了测试的绝对可靠度:50 米冲刺 CV 0.9%、200 米冲刺 CV 1.1%(Castagna 等,2005)。在五个分析聚合效度的研究(Castagna 等,2002;Mallo 等,2007;Muniroglu,Subak,2018a,2018b;Sánchez-García 等,2018)中,效度范围从 0.38(5 米冲刺 vs AAT)到 0.84(10 米冲刺 vs 30 米冲刺)。三个研究分析了建构效度(Casajús,Castagna,2007;Bartha 等,2009;Castagna 等,2005),证实 50 米冲刺和 200 米冲刺能够区分不同等级、不同年龄的裁判员(p < 0.05)。
变向能力测试
共两个研究评估了三项变向能力测试的心理测量学特征,包括 T-测试、箭头敏捷性测试(AAT)和伊利诺伊敏捷性测试(IAT)。两个研究(Muniroglu,Subak,2018a,2018b)均未提供有关可靠性的信息,但是报告了准则效度,取值从 0.22 (T-测试 vs 10 米冲刺)到 0.79(AAT vs IAT)。
其它体能测试
心肺耐力测试
一项研究(Castagna 等,2012)对助理裁判员间歇耐力测试(ARIET)的相对可靠度进行评估,得到的组内相关系数(ICC)高达 0.98;绝对可靠度为 4.3%CV;准则效度 0.78(ARIET vs 室内跑 VO2max);聚合效度 0.95(ARIET vs YYIR1);建构效度表明 ARIET 能够区分不同竞技水平的助理裁判员(p < 0.05)。
变向能力测试
共六个研究分析了五项变向能力测试的心理测量学特征,包括修改版自由式灵活性 T-测试(MATF)、变向能力测试(CODA)、修改版灵活性 T-测试(MAT)、10-8-8-10 测试和一项新的足球裁判员测试。两个研究(Castagna 等,2011;Yanci 等,2016)分析了测试的可靠性:MAT 和 10-8-8-10 测试的相对可靠度(ICC)分别为 0.89 和 0.90,指示绝对可靠度的 TEM 值分别为 4.23%CV 和 0.21%CV。
此外,所有研究(Castagna 等,2011;Castillo 等,2016;Castillo 等,2019;Harley 等,2001;Riiser 等,2018;Yanci 等,2016)均提及测试的效度。聚合效度范围从 0.61(MAT)到 0.82(新的足球裁判员测试)。从建构效度来看,MAT 和 10-8-8-10 测试能够有效区分不同水平的裁判员,而 MATF 则与裁判员的年龄显著相关。它的测试结果随裁判员的年龄而变化;年轻裁判员的测试用时低于年龄较大的裁判员(p < 0.05)。
研究讨论
本研究综述的目的在于对足球裁判员场地体能测试的可靠性和效度进行批判性分析。分析结果表明,现有测试能够准确评估裁判员的有氧耐力,但关于无氧耐力和短距离冲刺测试的心理测量学特征信息尚有所欠缺。此外,研究人员未找到用于评估裁判员决策能力的场地测试。这些发现能够帮助国际和国内主要体育机构更好地判断其所属裁判员的比赛准备情况,并完善裁判员培训计划以替换达到退休年龄的裁判员(Weston 等,2012)。
值得关注的是,目前大多数研究侧重于评估裁判员有氧耐力、速度和变向能力等测试的心理测量学特征,但没有研究分析生理-认知测试的效度和可靠性,即裁判员必须在极度疲劳的状态下做出正确的决策。通常情况下,裁判员平均会在 35 岁时达到最佳裁判水平,此后其体能状况便开始下降;但相对地,裁判员的决策能力反而会从那时起开始提升,使他们能够在不影响执法表现的同时节省体力(Castillo 等,2016)。现有的研究明显忽视了这一点。因此,需要针对裁判员在极度疲劳状态下的决策能力制定有效、可靠的测试方法。这类测试会同时考验裁判员的认知能力和身体素质,使两者能够随裁判员年龄的变化实现互补。这与顶尖足球运动员所表现出来的生理-认知互补相类似(Guerra 等,2019)。
在无氧耐力测试方面,只有两项测试(ARIET 和 12MRT)接受了准则效度评估,结果良好;同时,两者也表现出良好的绝对可靠度。因此,这两项测试似乎都适用于评估无氧耐力。然而,由于 12MRT 是一项连续性测试,所以它无法很好地反映比赛的间歇性特点(Krustrup,Bangsbo,2001)。事实上,2005 年,国际足联从其官方测试中移除了该项目,替换上一个间歇性测试项目(FIFA,2016)。综上,基于本研究结果,唯一可推荐的无氧耐力测试便是 ARIET。不过,针对该测试还需要进行更多的研究,毕竟研究人员只收集到一个评估其心理测量学特征的研究。
尽管有氧耐力被公认为足球裁判员取得成功的关键,但在较低强度的有氧活动中穿插进行高强度无氧活动的能力,是与比赛节奏保持同步的决定性因素(Weston 等,2012)。因此,裁判员需要具有足够效度和可靠性的无氧耐力测试。在本研究综述中,有三项测试被用于评估高强度无氧活动能力,它们都基于裁判员的反复冲刺表现。这类测试于 2016 年被引入到国际足联的测试项目中,显示出很高的聚合效度和建构效度。此外,这些测试的准确性还在于它们最符合裁判员的实际比赛要求。然而,需要指出的是,在明确推行这些测试项目之前,需要进一步研究来确认其可靠性和准则效度。
速度是精英足球裁判员的必备能力,因为裁判员每场比赛都要进行 21 到 30 次冲刺,以实现合理跑位并对比赛做出正确评估(Casajús,Castagna,2007;Weston 等,2012)。这就要求速度测试必须具有高心理测量学特征。本研究中的样本使用了 5 至 200 米不等的冲刺测试,因此它们评估的速度区间存在重要差异(Castillo 等,2016)。只有 50 米冲刺测试和 200 米1 冲刺测试进行了可靠性评估,表现出较高的绝对可靠度。没有测试接受准则效度评估。不过,这些测试总体上都具有足够的建构效度和聚合效度。基于以上结果,并考虑到在 90% 的情况下,球员的冲刺持续时间小于 5 秒且距离不足 30 米(Castillo 等,2016),较短距离的测试可能具有更高的内容效度。基于这一假设,并结合本研究综述中提到的冲刺测试的心理测量学特征,可以认为 50 米冲刺测试是评估足球裁判员速度能力的最佳测试,主要有两个原因。首先,尽管在比赛中球员每次的冲刺距离一般不到 50 米,但这毕竟是本研究的样本所分析的最短冲刺距离之一。其次,在速度测试中,只有 50 米和 200 米冲刺测试提供了绝对可靠度,且具有高聚合效度和建构效度。但同时,也有学者对 50 米冲刺测试的实用性提出质疑,认为其似乎不能很好地预测裁判员在实际比赛中的体能表现(Mallo 等,2007)。因此,需要进一步的研究来确认较短距离速度测试的可靠性和效度。
在如今的足球比赛中,裁判员每 5 到 6 秒就会改变一次运动方式(Krustrup,Bangsbo,2001),因此开展有效、可靠的变向能力测试至关重要。本研究样本仅分析了 10-8-8-10 测试和修改版灵活性 T-测试(MAT),均显示出较高的绝对可靠度和相对可靠度。此外,这两项测试都能够区分不同竞技水平和/或不同年龄段的裁判员。但是,所有的研究都未对测试的准则效度进行评估。值得注意的是,在所有测试中,变向能力都被视作一种不涉及应激反应的、可以预先计划的运动方式,所以测试都只评估了影响灵活性的体能因素。这种做法是有待商榷的。因为在开放的运动环境中,虽然灵活性的体能因素已被证实能够应对可以预先设定的运动模式(Sisic 等,2016),但灵活性的认知因素将决定个体在必须应对外部刺激时进行变向的能力(Scanlan 等,2015;Trecroci 等,2019)。因此,评估灵活性体能因素的测试可能更适用于助理裁判员(AR),其中修改版灵活性 T-测试(MAT)由于其绝对和相对可靠度以及聚合和建构效度最值得推荐。而对于场上裁判员(FR)而言,则需要进一步研究其灵活性的认知因素,以提高测试的效度和可靠性。
本研究的主要优势在于,根据笔者的了解,这是第一篇侧重于分析足球裁判员测试的心理测量学特征的综述。因此,本研究的结论对于评估裁判员体能水平的专业人士以及从事裁判员体能训练的教练们来说将会有很大帮助。
当然,本研究也存在其固有的局限性。首先,大多数样本没有报告测试的准则效度。而鉴于准则效度是唯一客观的效度衡量标准,研究人员在解读研究结果时应当考虑这一方面(Currell, Jeukendrup, 2008)。其次,本研究分析的样本主要针对来自欧洲联赛的专业裁判。高级别联赛要求裁判员具备更强的运动能力,才能跟上比赛的节奏。但不同国家的球队比赛风格和水平难免有所不同。因此,根据裁判员所执法的联赛不同,其对身体和体能的要求也会不同(Barbero-Álvarez 等, 2012)。所以,本研究样本所得的结果可能无法推广至非欧洲和/或较低级别的联赛。此外,针对助理裁判员的研究还很有限。由于他们的体能需求与场上裁判员不同(总跑动距离较短,高强度跑动较少,决策挑战更小,对灵活性体能因素的要求高于认知因素),所以现有研究尚无法针对助理裁判员提供概括性结论。因此,需要进一步研究基于助理裁判员身体需求的体能水平测试。再者,目前还没有研究对女性裁判员进行过测试评估。考虑到两性间显著的生理差异会影响女性裁判员的运动表现,并且两者在场地体能测试中使用不同的参考标准,所以现有研究结果不能适用于女性(Hunter, 2016; Lundsgaard, Kiens, 2014; Schmitz 等, 2018)。最后,本综述主要的方法学限制在于,受语言限制或因研究人员在检索过程中未纳入灰色文献,本研究可能并未穷尽所有相关研究。
原文为“ 20 米”,但查阅研究文献的实验结果后可判定这里应该是原作者的笔误。
结论
在回顾现有研究的基础上,笔者建议使用助理裁判员间歇耐力测试(ARIET)、50 米冲刺测试和修改版灵活性 T-测试(MAT)来评估裁判员的心肺耐力、速度和变向能力。所得结果表明,目前仍缺乏针对助理裁判员和女性裁判员的研究,以及关于无氧耐力测试的心理测量学特征的研究。这是未来研究应当解决的一个缺口。
参考文献
-
Ai, K., Oldrich, R., Tan, H., & Xu, P. (2020). Sustainable innovation in football referee training in Czech Republic. Sustainability, 12(7), 2821. https://doi.org/10.3390/su12072821
-
Barbero-Álvarez, J. C., Boullosa, D. A., Nakamura, F. Y., Andrín, G., & Castagna, C. (2012). Physical and physiological demands of field and assistant soccer referees during America’s cup. Journal of Strength and Conditioning Research, 26(5), 1383–1388. https://doi.org/10.1519/JSC.0b013e31825183c5
-
Bartha, C., Petridis, L., Hamar, P., Puhl, S., & Castagna, C. (2009). Fitness test results of Hungarian and international-level soccer referees and assistants. Journal of Strength and Conditioning Research, 23(1), 121–126. https://doi.org/10.1519/JSC.0b013e31818ebb84
-
Casajús, J. A., & Castagna, C. (2007). Aerobic fitness and field test performance in elite Spanish soccer referees of different ages. Journal of Science and Medicine in Sport, 10(6), 382–389. https://doi.org/10.1016/j.jsams.2006.08.004
-
Castagna, C., Abt, G., & D’Ottavio, S. (2002). Relation between fitness tests and match performance in elite Italian soccer referees. Journal of Strength and Conditioning Research, 16(2), 231–235. <https://doi.org/10.1519/1533-4287(2002)016<0231>
-
Castagna, C., Abt, G., & D’Ottavio, S. (2005). Competitive-level differences in Yo-Yo intermittent recovery and twelve minute run test performance in soccer referees. Journal of Strength and Conditioning Research, 26(5), 805–809. https://doi.org/10.1519/R-14473.1
-
Castagna, C., Abt, G., & D’Ottavio, S. (2007). Physiological aspects of soccer refereeing performance and training. Sports Medicine, 37(7), 625–646. https://doi.org/10.2165/00007256-200737070-00006
-
Castagna, C., Abt, G., D’Ottavio, S., & Weston, M. (2005). Age-related effects on fitness performance in elite-level soccer referees. Journal of Strength and Conditioning Research, 19(4), 785–790. https://doi.org/10.1519/R-14984.1
-
Castagna, C., Bendiksen, M., Impellizzeri, F. M., & Krustrup, P. (2012). Reliability, sensitivity and validity of the assistant referee intermittent endurance test (ARIET) – A modified Yo-Yo IE2 test for elite soccer assistant referees. Journal of Sports Sciences, 30(8), 767–775. https://doi.org/10.1080/02640414.2012.668705
-
Castagna, C., Impellizzeri, F. M., Bizzini, M., Weston, M., & Manzi, V. (2011). Applicability of a change of direction ability field test in soccer assistant referees. Journal of Strength and Conditioning Research, 25(3), 860–866. https://doi.org/10.1519/JSC.0b013e318208ae8e
-
Castillo, D., Cámara, J., Castellano, J., & Yanci, J. (2016). Football match officials do not attain maximal sprinting speed during matches. Kinesiology, 48(2), 207–212. https://doi.org/10.26582/k.48.2.10
-
Castillo, D., Cámara, J., Lozano, D., Berzosa, C., & Yanci, J. (2019). The association between physical performance and match-play activities of field and assistants soccer referees. Research in Sports Medicine, 27(3), 283–297. https://doi.org/10.1080/15438627.2018.1534117
-
Castillo, D., Yanci, J., Casajús, J. A., & Cámara, J. (2016). Physical fitness and physiological characteristics of soccer referees. Science & Sports, 31(1), 27–35. https://doi.org/10.1016/j.scispo.2015.11.003
-
Cerqueira, M. S., Da Silva, A. I., & Marins, J. C. B. (2011). Análise do modelo de avaliação física aplicado aos árbitros de futebol pela FIFA. Revista Brasileira Medicina Do Esporte, 17(6), 425–430. https://doi.org/10.1590/S1517-86922011000600012
-
Chamari, K., Hachana, Y., Ahmed, Y. B., Galy, O., Sghaïer, F., Chatard, J. C., Hue, O., & Wisloff, U. (2004). Field and laboratory testing in young elite soccer players. British Journal of Sports Medicine, 38(2), 191–196. https://doi.org/10.1136/bjsm.2002.004374
-
Currell, K., & Jeukendrup, A. E. (2008). Validity, reliability and sensitivity of measures of sporting performance. Sports Medicine, 38(4), 297–316. https://doi.org/10.2165/00007256-200838040-00003
-
D’Ottavio, S., & Castagna, C. (2002). Analysis of match activities in elite soccer referees during actual match play. Journal of Strength and Conditioning Research, 15(2), 167–171. https://doi.org/10.1519/00124278-200105000-00003
-
FIFA. Fitness test for referees (men & women) [Internet]. 2016. Available from: https://footballwest.com.au/wp-content/uploads/2016/12/FIFA-Fitness-Tests-for-Referees-version-2016.pdf
-
Giacomo, G., Ellenbecker, T. S., & Kibler, W. B. (Eds.). (2019). Tennis Medicine: A Complete Guide to Evaluation, Treatment, and Rehabilitation. Springer.
-
Gonaus, C., Birklbauer, J., Lindinger, S. J., Stöggl, T. L., & Müller, E. (2019). Changes over a decade in anthropometry and fitness of elite Austrian youth soccer players. Frontiers in Physiology, 10, 333. https://doi.org/10.3389/fphys.2019.00333
-
Guerra, S. D. R., Rey, E., A., Kalén, A., & Lago-Peñas, C. (2019). Age-related physical and technical match performance changes in elite soccer players. Scandinavian Journal of Medicine & Science in Sports, 29(9), 1421–1427. https://doi.org/10.1111/sms.13463
-
Harley, R., Banks, R., & Doust, J. (2001). The development and evaluation of a task specific fitness test for association football referees. In W. Spinks, T. Reilly, & A. Murphy (Eds.), Science and football IV (pp. 76–80). Routledge.
-
Helsen, W., & Bultynck, J. B. (2004). Physical and perceptual-cognitive demands of top-class referee ing in association football. Journal of Sports Sciences, 22(2), 179–189. https://doi.org/10.1080/02640410310001641502
-
Hunter, S. K. (2016). The relevance of sex differences in performance fatigability. Medicine and Science in Sports and Exercise, 48(11), 2247–2256. https://doi.org/10.1249/MSS.0000000000000928
-
Krustrup, P., & Bangsbo, J. (2001). Physiological demands of top-class soccer refereeing in relation to physical capacity: Effect of intense intermittent exercise training. Journal of Sports Sciences, 19(11), 881–891. https://doi.org/10.1080/026404101753113831
-
Lundsgaard, A. M., & Kiens, B. (2014). Gender differences in skeletal muscle substrate metabolism - molecular mechanisms and insulin sensitivity. Frontiers in Endocrinology, 5, 195. https://doi.org/10.3389/fendo.2014.00195
-
Mallo, J., Navarro, E., Aranda, J. M. G., & Helsen, W. (2009). Activity profile of top-class association football referees in relation to fitness-test performance and match standard. Journal of Sports Sciences, 27(1), 9–17. https://doi.org/10.1080/02640410802298227
-
Mallo, J., Navarro, E., García-Aranda, J. M., Gilis, B., & Helsen, W. (2007). Activity profile of top-class association football referees in relation to performance in selected physical tests. Journal of Sports Sciences, 25(7), 805–813. https://doi.org/10.1080/02640410600778602
-
Meckel, Y., Balikin, K., & Eliakim, A. (2019). Pre- and mid-season repeated sprint ability of soccer referees from the first and second divisions. International Journal of Sports Science & Coaching, 15(1), 82–90. https://doi.org/10.1177/1747954119887301
-
Milanović, Z., Sporiš, G., James, N., Trajković, N., Ignjatović, A., Sarmento, H., Trecroci, A., & Mendes, B. M. B. (2017). Physiological demands, morphological characteristics, physical abilities and injuries of female soccer players. Journal of Human Kinetics, 28(60), 77–83. https://doi.org/10.1515/hukin-2017-0091
-
Muniroglu, S., & Subak, E. (2018a). A modified T-Test for football referees to test agility, quickness and sprint performances. Journal of Education and Training Studies, 6(5), 10–15. https://doi.org/10.11114/jets.v6i5.3131
-
Muniroglu, S., & Subak, E. (2018b). A comparison of 5, 10, 30 meters sprint, modified T-Test, Arrowhead and Illinois agility tests on football referees. Journal of Education and Training Studies, 6(8), 70–76. https://doi.org/10.11114/jets.v6i8.3360
-
O’Reilly, J., & Wong, S. H. S. (2012). The development of aerobic and skill assessment in soccer. Sports Medicine, 42(12), 1029–1040. https://doi.org/10.2165/11635120-000000000-00000
-
Riiser, A., Andersen, V., Castagna, C., Pettersen, S. A., Saeterbakken, A., Froyd, C., Ylvisaker, E., Naess Kjosnes, T., & Fusche Moe, V. (2018). The construct validity of the CODA and repeated sprint ability tests in football referees. International Journal of Sports Medicine, 39(8), 619–624. https://doi.org/10.1055/a-0577-4073
-
Sánchez-García, M., Sánchez-Sánchez, J., Rodríguez-Fernández, A., Solano, D., & Castillo, D. (2018). Relationships between sprint ability and endurance capacity in soccer referees. Sports, 6(2), 28. https://doi.org/10.3390/sports6020028
-
Scanlan, A. T., Tucker, P. S., & Dalbo, V. J. (2015). The importance of open- and closed-skill agility for team selection of adult male basketball players. The Journal of Sports Medicine and Physical Fitness, 55(5), 390–396.
-
Schmitz, B., Pfeifer, C., Kreitz, K., Borowski, M., Faldum, A., & Brand, S. M. (2018). The Yo-Yo intermittent tests: A systematic review and structured compendium of test results. Frontiers in Physiology, 9, 870. https://doi.org/10.3389/fphys.2018.00870
-
Sisic, N., Jelicic, M., Pehar, M., Spasic, M., & Sekulic, D. (2016). Agility performance in high-level junior basketball players: The predictive value of anthropometrics and power qualities. The Journal of Sports Medicine and Physical Fitness, 56(7–8), 884–893.
-
Stølen, T., Chamari, K., Castagna, C., & Wisløff, U. (2005). Physiology of soccer: An update. Sports Medicine, 35(6), 501–536. https://doi.org/10.2165/00007256-200535060-00004
-
Trecroci, A., Longo, S., Perri, E., Iaia, F. M., & Alberti, G. (2019). Field-based physical performance of elite and sub-elite middle-adolescent soccer players. Research in Sports Medicine, 27(1), 60–71. https://doi.org/10.1080/15438627.2018.1504217
-
Wallace, J. L., & Norton, K. I. (2014). Evolution of World Cup soccer final games 1966-2010: Game structure, speed and play patterns. Journal of Science and Medicine in Sport, 17(2), 223–228. https://doi.org/10.1016/j.jsams.2013.03.016
-
Weston, M., & Brewer, J. (2002). A study of the physiological demands of soccer refereeing. Journal of Sports Sciences, 20(1), 59–60. https://doi.org/10.1080/026404102317126164
-
Weston, M., Castagna, C., Helsen, W., & Impellizzeri, F. (2009). Relationships among field-test measures and physical match performance in elite-standard soccer referees. Journal of Sports Sciences, 27(11), 1177–1184. https://doi.org/10.1080/02640410903110982
-
Weston, M., Castagna, C., Impellizzeri, F. M., Bizzini, M., Williams, A. M., & Gregson, W. (2012). Science and medicine applied to soccer refereeing: An update. Sports Medicine, 42(7), 615–631. https://doi.org/10.2165/11632360-000000000-00000
-
Yanci, J., Los Arcos, A., Grande, I., & Casajús, J. A. (2016). Change of direction ability test differentiates higher level and lower level soccer referees. Biology of Sport, 33(2), 173–177. https://doi.org/10.5604/20831862.1198637