变向能力场地测试在足球助理裁判员中的适用性

Castagna, C., Impellizzeri, F. M., Bizzini, M., Weston, M., and Manzi, V. (2011)

Journal of Strength and Conditioning Research, 25(3), 860–866. https://doi.org/10.1519/JSC.0b013e318208ae8e

摘要:本研究旨在检验一项变向能力测试(即 10-8-8-10 测试,包括直线跑和侧滑步,总距离 36 米)在精英级足球助理裁判员(AR)中的适用性。来自意大利足球甲(Serie A)、乙(Serie B)、丙(Serie C)三级联赛的 100 名助理裁判员(甲级和乙级 ARA-B 共 50 名,丙级ARC 50 名)分别进行了 3 次独立的 10-8-8-10 测试,每两天测试一次。20 名助理裁判员专家使用问卷对测试的逻辑效度进行打分(分值由 1 至 5 代表测试相关性逐渐升高);通过比较 ARA-B 和 ARC 在 10-8-8-10 测试中的表现来检验建构效度;随机选取 64 名助理裁判员,每隔一天进行一次测试,共进行 3 次,以评估测试的短期可靠性;使用遥感光电仪测定总跑动时间作为 10-8-8-10 的测试成绩。分析结果表明,10-8-8-10 测试被认为与助理裁判员在比赛中的体能表现有“”(n = 4/20)甚至“很高”(n = 16/20)的相关性;不同竞技水平的助理裁判员之间没有明显的表现差异(p = 0.57);曲线下面积(AUC = 0.49;p = 0.87)显示 10-8-8-10 测试在识别竞技水平差异方面没有显著的敏感性;64 名随机助理裁判员的组内相关系数为 0.90(p < 0.0001),典型测量误差(测试 2 vs. 测试 3)为 0.18 秒。本研究表明,10-8-8-10 测试具有逻辑效度和良好的可靠性,测试结果与竞技水平无关。因此,本原创研究标志着识别和评估有效且可靠的助理裁判员变向能力测试的第一步。在本研究结果的强有力支持下,管理机构应当考虑将 10-8-8-10 测试纳入针对助理裁判员的体能测试方案中,以 9.67 秒为选拔精英级助理裁判员的最低标准,并在此基础上继续开展实证研究。

关键词:裁判;体能测试;冲刺;灵活性;足球

引言

任何一场足球比赛都会由一名场地裁判员(FR)所管控,场地裁判员在受指派的比赛中全权执行竞赛规则12。在比赛过程中,场地裁判员与两名助理裁判员(ARs)合作,控制和规范球员和教练的行为,而助理裁判员的主要职责是依据越位线检查球员位置,这在任何情况下都是裁判的首要任务12。场地裁判员可以在足球场内自由移动,但助理裁判员只可以沿着半场的边线移动,并在此过程中监管比赛。因此,助理裁判员跑动时需要面向球场。在判断是否越位时,裁判员最好采用侧向移动,让自己获得更好的视野。和场地裁判员一样,助理裁判员也必须跟上比赛节奏9。与场地裁判员相比,助理裁判员所面临的生理和体能要求较低13,20,21,25,但也曾有顶级助理裁判员在比赛中感到疲劳,并在赛后出现反复冲刺能力下降的情况20

在大约 90 分钟的比赛中,助理裁判员的总跑动距离约 6–8 公里,其中侧滑步约 1.2 公里,占总距离的 16%20。对顶级助理裁判员而言,每场比赛需进行 110 次高强度跑动,每次平均持续 2 秒20。有趣的是,尽管助理裁判员的活动范围仅仅是一段 50 米长的边线,但他每 5 秒就会改变一次活动方式,整场比赛下来总计会达到 1053 次活动20。鉴于精英级助理裁判员在比赛期间高频、多样的活动变化,其突然变向能力(从正向跑转为侧滑步)具有表面效度。

对助理裁判员而言,拥有良好的身体素质是实现最佳跑位和保证跑动距离的必要前提20。在比赛过程中,倒数第二名防守球员决定着越位线的位置,而助理裁判员与越位线的距离则与其冲刺能力有关20。再者,个人有氧适能也与其在比赛中进行高强度反复冲刺的能力相关联20

国际裁判管理机构(UEFA、FIFA)已经认识到对精英级助理裁判员进行体能测试的必要性。因此,在执法顶级比赛前,助理裁判员都需要参与一系列的场地测试,以评估其反复冲刺能力(6 x 40 米冲刺测试)和间歇性高强度耐力(30–40 间歇跑测试)33。然而,这些测试虽然都着重强调了助理裁判员的生理特征,但就跑动距离和运动模式来看,测试的表面效度较低33。它们只考虑直线跑动,却忽视了助理裁判员特有的侧向跑动20。而且,它们并未评估助理裁判员在比赛最困难的阶段进行突然变向、重复变向的能力及其所需覆盖的特定距离20。遗憾的是,据笔者所知,目前尚无科学期刊发表过任何一项研究来提出针对助理裁判员的变向能力测试,并检验其效度(表面效度和建构效度)和可靠性。

因此,本研究的目的是检验一项新的场地测试(即 10-8-8-10 测试)对评估精英级助理裁判员变向能力的适用性,该测试涉及正向与侧向往返跑。为此,本研究将评估 10-8-8-10 测试的建构效度和可靠性。在实验开始之前,还通过时间-动作分析(time-motion analysis)和专家调查法获取了表面效度。

研究方法

实验方法

精英级助理裁判员在全场比赛中大约会进行 1053 次活动变化,其中大部分是随比赛发展(如越位线的变化)做出的反应20。因此,助理裁判员必须针对视觉信号(如最后第二名防守队员的位置)做出反应,采取合理的变向动作;这通常要求裁判员尽全力完成连续的侧向往返跑20,21,25。研究表明,助理裁判员离越位线越近,就能拥有更好的视野,以做出正确的判罚,避免产生错误的旗语13,14。因此,变向能力应当被视为合理跑位的前提,并根据助理裁判员的实际比赛需求进行评估和训练13,14,26。变向能力也应当被视为灵活性的功能前提,针对进行中的动作采取变向反应26。在这方面,10-8-8-10 测试是首个被系统性提出的用于评估精英级助理裁判员变向能力的简易场地测试。由于灵活性和变向能力尚未建立黄金标准,因此在这一阶段,可以由专家来判断测试的比赛相关性,并通过定性比赛分析来评估 10-8-8-10 测试的信度19

10-8-8-10 测试通过研究意大利精英级助理裁判员在正式比赛中的运动模式而定性开发。在开发过程中,研究人员参考了科学报告的精英级助理裁判员平均冲刺距离与冲刺时间,并根据测试可行性进行了调整,以保证数据收集的一致性20,21,25。具体来看,考虑到助理裁判员在前期试点研究中的平均跑动时间以及时间-动作分析所得出的常规单次冲刺时间(2 秒),测试中的正向跑动距离被设定为 10 米20。而测试中的侧向往返跑则是由助理裁判员在比赛中最常用的动作演变而来,旨在与倒数第二名防守球员的位置保持一致。整个 10-8-8-10 测试采用往返跑的形式,起终点设置在同一位置,是为了贴近实际比赛需求,同时便于计时,保证测试的可行性。

在 10-8-8-10 测试中,助理裁判员首先向前冲刺 10 米,然后以 10 米终点线为参照,迅速进行一次 8 米的侧向往返跑,最后快速跑回起点,即算完成测试 (总距离 10 + 8 + 8 + 10 米 = 36 米)。在测试过程中,裁判员每次变向都必须保证前脚接触到参考线(包括 10 米和 8 米参考线)。只有遵循上述程序的测试跑才会被纳入研究分析。在开始 10-8-8-10 测试之前,所有参与者都会提前熟悉测试规则,并进行测试练习。

研究人员从两支裁判员队伍(一级&二级联赛 n = 90;三级联赛 n = 200)中各随机抽取 50 名助理裁判员进行对比分析,检验测试的建构效度。建构效度被用于评估一项测试在区分不同竞技水平的运动员方面的敏感度17,24。但对于分析过程中可能出现的准则效度差异,如果不能对可能的干扰变量进行精确控制,就很难解释该差异出现的原因28。为了控制训练对该助理裁判员群体测试可能产生的影响,研究人员有意将本实验设置在赛季准备阶段之后进行。这么做是为了避免不同级别的训练对裁判员体能表现(即 10-8-8-10 测试结果)产生差异影响。在此准备阶段,所有相关的助理裁判员都会共同参与一个训练项目,旨在提高决定执法表现的体能因素20,25。在意大利足球裁判协会(AIA)指定的专业助理裁判员体能训练讲师的帮助下,确保了参与者遵循训练日程。训练负荷以不同体能类别的训练时间为指标,包括耐力、冲刺与灵活性、反复冲刺能力以及柔韧性10,11

在本实验开始之前,研究人员首先向 20 名现役或前顶级助理裁判员发放了调查问卷,获取其对 10-8-8-10 测试的表面效度评价。调查量表使用 1–5 分的分级,代表测试与助理裁判员比赛表现的相关性(1 = 极低,2 = 低,3 = 中等,4 = 高,5 = 很高)。20 名裁判员对 10-8-8-10 测试相关性的整体评级为“高”(n = 4)和“很高”(n = 16)。

实验对象

本研究的实验对象为 100 名来自意大利足球裁判协会(AIA)的助理裁判员。他们都被任命执法 2009-2010 赛季的意甲和意乙联赛(n = 50,年龄 37 ± 2.9 岁,身高1.78 米 ± 6.9 厘米,体重 74 ± 6.9 公斤)或 Lega Pro (三级)联赛(n = 50,年龄 34 ± 2.0岁,身高 1.77 米 ± 4.9 厘米,体重 75 ± 4.9 公斤)。这些裁判员在各自级别中至少拥有 2 年执法经验,最多 8 年,并且每周至少进行 3 次专项体能训练。所有助理裁判员均在季前准备期末段( 7–8 月)举行的训练营期间接受测试。为避免在测试前几天对裁判员造成不必要的压力,这几天的训练负荷会有所降低,并考虑加入熟悉测试的训练课程。研究人员建议助理裁判员在测试前一天保持正常饮食,碳水、脂肪和蛋白质摄入分别占 60%、25% 和 15%;并在测试前 2 小时内避免吸烟或饮用含咖啡因的饮料。不过,为了避免脱水,助理裁判员可以“自由”饮用其他液体。在了解和熟悉了本研究流程所涉及的益处和风险后,所有参与者均签署了书面知情同意书。参与者可以随时选择退出研究,不会受到任何处罚。在研究开始前,机构研究委员会(AIA 技术部门-体能训练模块)已批准本实验安排。所有程序均按照《世界医学协会赫尔辛基宣言》关于临床研究的实施细则进行。

实验流程

所有测试程序均在一天中的同一时间段进行(上午 9 点至 11 点),环境条件相似(气温 23–26°C,湿度50–60%),无风力影响。10-8-8-10 测试被安排在常规热身的最后进行。热身包括 15 分钟慢跑(劳累系数2–3)、5 分钟静态拉伸和 8 分钟灵活性与冲刺练习(1,7)。每名裁判员共进行 3 次测试,每次测试间进行 2 分钟被动恢复。所有测试均在同一块通常用于体能训练的人工草皮上进行。10-8-8-10 测试表现以总用时为指标,使用遥感光电仪(Polifemo Kit Racetime2, Microgate, Bolzano, Italy)进行计时。为避免过早启动计时系统,裁判员需要将前脚放在光电束后 0.5 米处的线上准备起跑。光电束的高度设置为 0.5 米,左右间距 1.5 米。裁判员自行决定起跑时机。在整个测试过程中,测试负责人(即本研究第一作者)利用强烈的言语激励来诱发裁判员的最佳表现。

为获取 10-8-8-10 测试的可靠性,有 64 名助理裁判员每隔一天进行一次上述测试,共测试 3 次(两个测试日之间进行低强度的恢复性训练);最后利用最佳成绩和平均成绩计算测试的可靠性。

统计分析

本研究结果以“平均值 ± 标准差”表示,置信区间(CI)为 95%。使用 Shapiro-Wilk W 检验验证正态性假设;使用非配对学生 t 检验确定两个竞技水平(即 ARA-B 和 ARLP)之间是否存在显著差异;使用巴特利特检验法进行方差齐性检验;计算效应量(ES)以评估差异的显著性8

💡 Effect Size (ES) 效应量

< 0.2:差异微小;0.2~0.5:差异较小;0.5~0.8:差异中等;> 0.8:差异显著

使用组内相关系数(ICC)评估 10-8-8-10 测试的相对可靠性;参考 Hopkins15 的研究,计算典型测量误差(TEM)来评估绝对可靠性;使用受试者工作特征曲线(ROC)数据评估 10-8-8-10 测试的敏感度。为了进行 ROC 计算,裁判员根据竞技水平被分为两类(即 ARA-B 和 ARLP)。参考值数据以四分位距(IQR)的形式报告31。根据 Hopkins 等16 的论述,最小有意义变化(SWC)设定为 0.2 倍标准差;显著性水平设定为 5% (p ≤ 0.05)。

研究结果

ARA-B 组的裁判员年龄显著大于 ARLP 组(p < 0.0001;95 CI% -4.10 – -2.10;ES = 1.25)。在测试前的 6 周准备阶段,ARA-B 组和 ARLP 组在耐力、冲刺与灵活性以及反复冲刺能力方面的训练时间比没有显著差异。两组分别将 68 ± 5.1% 和 67 ± 6.8%(p = 0.34,95% CI -0.78–1.78;ES = 0.17)的时间用于耐力训练,将 15 ± 4.6% 和 14 ± 5.8%(p = 0.22,95% CI -0.81–1.81;ES = 0.19)的时间用于冲刺与灵活性训练,将 10 ± 4.3% 和 9 ± 6.8%(p = 0.44,95% CI -0.6–1.6;ES = 0.18)的时间用于反复冲刺能力训练。ARLP 组用于柔韧性训练的时间占比(9 ± 1.8%)显著高于ARA-B 组(7 ± 1.8%)(p = 0.04,95% CI 1.3–2.7,ES = 0.32)。

ARA-B 组和 ARLP 组的平均最佳成绩分别为 9.61 ± 0.45 秒和 9.66 ± 0.41 秒(p = 0.57;95% CI -0.13–0.23;ES = 0.11;n = 100)。两组裁判员所有测试的平均成绩分别为 9.81 ± 0.41 秒和 9.78 ± 0.41 秒(p = 0.72;95% CI -0.21–0.14;ES = 0.07;n = 100)。

综合两组裁判员所有测试的平均成绩,平均值为 9.74 ± 0.34 秒(95% CI 9.67–9.81),中位数为 9.79(95% CI 9.67–9.84),众数为 9.64 秒。相应地,两组裁判员最佳成绩的平均值为 9.60 ± 0.36 秒(95% CI 9.52–9.67),中位数为 9.63(95% CI 9.54–9.70),众数为 9.48 秒。

受试者工作特征分析显示,在该助理裁判员群体中,10-8-8-10 测试对于检测裁判员的竞技水平差异并不敏感,曲线下面积为 0.49(p = 0.87;95% CI 0.38–0.60;如图 1 所示)。

图 1. 10-8-8-10 测试结果的受试者工作特征(ROC)图

假设裁判员的竞技水平为二分变量,即 Serie A-B vs. Lega Pro,各 50 人;曲线下面积(AUC)= 0.49,p = 0.87;95% CI 0.38–0.60;黑色实线为受试者工作特征曲线。

10-8-8-10 测试的组内相关系数为 0.90(n = 64,p < 0.0001,95% CI 0.84–0.93)。第一次与第二次测试间的典型测量误差(TEM)为 0.21 秒(95% CI 0.18–0.24),第二次与第三次测试间的 TEM 为 0.18 秒(95% CI 0.16–0.21)。基于所有裁判员(n = 100)的平均成绩或最佳成绩进行计算,测试的最小有意义变化(SWC)均为 0.07 秒。

测试成绩的 25% 百分位数为 9.57 秒(95% CI 9.39–9.64),75% 百分位数为 9.94 秒(95% CI 9.85–10.09)(如图 2 所示)。

图 2. 10-8-8-10 测试成绩分布图(垂直黑色虚线分别代表 25% 百分位数和 75% 百分位数)

研究讨论

本研究首次在精英级助理裁判员群体中检验该变向能力测试的适用性(即建构效度和可靠性)。研究结果表明,10-8-8-10 测试无法区分不同竞技水平的助理裁判员,但拥有良好的短期可靠性。此外,从一批资深的助理裁判员专家的评价来看,10-8-8-10 测试具有很高的表面效度,测试相关度为“高”甚至“很高”。因此,本原创研究标志着识别和评估有效且可靠的助理裁判员变向能力测试的第一步。

建构效度通常被视为运动科学中测试适用性的前提28。事实上,对于该准则效度,作者通常会检查测试在区分不同竞技水平的运动人群方面的敏感度,将其视为建构18。这种准则效度特征被认为是运动科学中用于结果预测和人才选拔和识别的一种可行策略17,19,23。此外,当涉及青年和精英级运动员时,它被认为能够为训练计划提供有价值的信息29,30。不过,尽管这一准则效度确有用处,但建构效度的检测并不能支撑其本身的因果关系19,28。事实上,当对假设的定性标准(即精英与非精英级水平)进行概念化时,建构效度可能无法清晰地反映出现状态差异的原因。具体来说,竞技状态可能是不同的技术水平、训练背景和/或遗传因素等作用的结果29。因此,想要从这一特定准则效度中获取有意义的信息,必须仔细确定建构定义中的因素19,28。在本研究设计中,我们在两组助理裁判员(ARA-B 组和 ARLP 组)都完成了相似的训练计划后才进行测试,以此来控制影响建构(即竞技水平)的变量。这么做主要是为了在实验中考虑到不同的竞赛级别所导致的训练背景差异。事实上,在意大利,助理裁判员只有进入较高的国家级竞赛级别(甲级和乙级)后才算达到半职业状态,而这会显著影响其训练负荷,包括每周的训练频率、训练量和训练强度32,34。因此,测试表现的差异可能源于更多的训练付出;这在人才甄别过程中被合理地视为测试偏差。

考虑到 10-8-8-10 测试建构效度中的训练偏差,我们对参与本研究的助理裁判员群体的实验前(6周)短期训练加以控制。以不同身体机能1 的训练时长占比为参考分析训练负荷,发现除柔韧性以外,所有涉及到的体能因素都没有显著差异10,11,20,25。这为实验目的提供了支持,得以对两组来自不同竞技水平的助理裁判员施加相似的训练刺激。

结果显示,在不同竞技水平(即 ARA-B 组和 ARLP 组)之间,10-8-8-10 测试表现的均值未检测到显著差异。ROC 分析进一步支持了 10-8-8-10 测试缺乏竞技水平敏感性的结论。该分析显示用于代表敏感性和特异性之间的平衡的 AUC 值为 0.49。在足球比赛中,裁判员的竞技水平与年龄同向发展,因为对于精英级足球裁判员来说,经验是技能发展的一个属性5,27。但与此同时,足球裁判也可能会因年龄增长而导致体能表现下降3,6。许多研究表明,随着职业生涯的发展,足球裁判员年龄逐渐增长,其神经肌肉性能预计会表现出与年龄相关的损伤3,5,27。在本研究中,尽管 ARA-B 组的平均年龄明显更大,但在主要被视作神经肌肉能力的变向能力(CODA)测试中,未检测到显著差异2,26。此外,在检查汇总数据时,未发现年龄与 10-8-8-10 测试表现之间存在显著关联(n = 100,r = 0.03,p = 0.74,95% 的置信区间为 20.16 至 0.23)。这与之前研究年龄对场上裁判员的速度和爆发力的影响的结果不同3,6。尽管由于研究采用了不同的设计,很难对其进行比较,但可以推测,对训练负荷的控制可能导致了本研究中不同竞技水平的裁判员之间缺乏神经肌肉表现(即 10-8-8-10 测试结果)方面的差异3,6

这一证据表明,10-8-8-10 测试可以被用于检测不同竞技水平的助理裁判员的变向能力,并反映个人能力。这在足球裁判方面尤为重要,因为体能测试已被证明会受到训练背景和年龄等竞技水平相关变量的影响3,4,6,35。本研究的结果表明,10-8-8-10 测试的表现可以被视为一种可训练的身体能力;同时,在助理裁判员评估中可以考虑竞技水平方面的独立规范。然而,有必要开展训练研究来检验变向能力训练的负荷性质、训练量以及训练强度对 10-8-8-10 测试表现的影响。

10-8-8-10 测试的 ICC 和 TEM 计算结果反映出良好的绝对可靠性和相对可靠性。具体而言,10-8-8-10 测试表现(每隔一天测试一次)显示出大约 0.19 秒的短期变化(n = 66)。这一绝对变化幅度大于最小有意义变化的估值(~0.19 秒 vs 0.07秒)。该最小意义变化取值为汇总数据标准差的一部分,即“0.20 倍的标准差”。为了根据干预变化的影响大小检测有意义的信息,建议使用更高比例的标准差。实际上,考虑到对最小有意义变化的估算,而不是低效应(ES = 0.20)或中高效应(ES = 0.5 及以上),其检测可以超出测试噪音,以提供更合理的变化可能。

尽管本研究的结果令人鼓舞,但要将我们的发现作为精英级助理裁判员的变向能力评估标准予以实施,还应当得到进一步研究的证实。这些研究将为受干预(即训练研究)和 10-8-8-10 测试的季节性变化影响的敏感度提供佐证17,19。应通过考察不同年龄(更年轻)、不同竞技水平(初级水平)和不同性别(男性 AR vs 女性 AR)的助理裁判员的 10-8-8-10 测试表现来扩展规范值。有必要研究探讨 10-8-8-10 测试表现与助理裁判员跟随最后一名防守队员、监控越位线的能力之间可能存在的关系。然而,尽管变向能力与助理裁判员的比赛表现相关,但国际足联现行的助理裁判员体能测试程序却忽视了对该能力的评估。因此,本原创研究代表着识别和评估有效且可靠的助理裁判员变向能力测试的第一步。在本研究结果强有力的支持下,管理机构应当考虑将 10-8-8-10 测试纳入针对助理裁判员的体能测试方案中,以 9.67 秒为选拔精英级助理裁判员的最低标准,并在此基础上继续开展实证研究。

1

这些能力被认为是精英级助理裁判员表现的决定性因素,包括耐力、冲刺能力和灵活性、反复冲刺能力和柔韧性。

实际应用

变向能力被认为是提高助理裁判员特定灵活性的重要前提条件13,14,20,25。在这方面,具有逻辑有效性和良好可靠性的 10-8-8-10 测试可以成功地被用来追踪受训助理裁判员在赛季初的变向能力变化。此外,由于 10-8-8-10 测试涉及侧向往返跑,因此它还可以被用于助理裁判员训练,为帮助其在比赛期间监控越位情况提供体能准备。

考虑到 10-8-8-10 测试表现的短期差异(约 0.18 秒),测试结果差异 ≥0.18 秒即可被视为有意义的变化。≥0.07 秒而 <0.18 秒的结果差异应谨慎考虑。在根据裁判员个体间表现差异进行排序时也应当采用相同的考量。鉴于本研究涉及的人群,此报告的 10-8-8-10 测试数据可以被视为赛季开始前高水平助理裁判员的参考规范值22。对于与本研究对象类似的助理裁判员群体,10-8-8-10 测试成绩 ≤9.67 秒即应得到关注。由于国家和国际足球裁判管理机构致力于实施和评估精英级助理裁判员的灵活性训练计划,因此这些信息可能对机构具有具有重要意义。

参考文献

  1. Börg, G. Borg’s Perceived Exertion and Pain Scales. Champaign, IL: Human Kinetics, 1998.

  2. Brughelli, M, Cronin, J, Levin, G, and Chaouachi, A. Understanding change of direction ability in sport: A review of resistance training studies. Sports Med 38: 1045–1063, 2008.

  3. Casajus, JA and Castagna, C. Aerobic fitness and field test performance in elite Spanish soccer referees of different ages. J Sci Med Sport 10: 382–389, 2007.

  4. Castagna, C, Abt, G, and D’Ottavio, S. Competitive-level differences in Yo-Yo intermittent recovery and twelve minute run test performance in soccer referees. J Strength Cond Res 19: 805–809, 2005.

  5. Castagna, C, Abt, G, and D’Ottavio, S. Physiological aspects of soccer refereeing performance and training. Sports Med 37: 625–646, 2007.

  6. Castagna, C, Abt, G, D’Ottavio, S, and Weston, M. Age-related effects on fitness performance in elite-level soccer referees. J Strength Cond Res 19: 785–790, 2005.

  7. Chaouachi, A, Castagna, C, Chtara, M, Brughelli, M, Turki, O, Galy, O, Chamari, K, and Behm, DG. Effect of warm-ups involving static or dynamic stretching on agility, sprinting, and jumping performance in trained individuals. J Strength Cond Res 24: 2001–2011, 2010.

  8. Cohen, J. Statistical Power Analysis for the Behavioral Sciences. Hillsdale, NJ: Lawrence Erlbaum Associates, 1988.

  9. D’Ottavio, S and Castagna, C. Analysis of match activities in elite soccer referees during actual match play. J Strength Cond Res 15: 167–171, 2001.

  10. Esteve-Lanao, J, Foster, C, Seiler, S, and Lucia, A. Impact of training intensity distribution on performance in endurance athletes. J Strength Cond Res 21: 943–949, 2007.

  11. Esteve-Lanao, J, San Juan, AF, Earnest, CP, Foster, C, and Lucia, A. How do endurance runners actually train? Relationship with competition performance. Med Sci Sports Exerc 37: 496–504, 2005.

  12. Féderation Internationale de Football Association. Laws of the Game 2005. Zurich, Switzerland: Féderation Internationale de Football Association, 2005.

  13. Helsen, Wand Bultynck, JB. Physical and perceptual-cognitive demands of top-class refereeing in association football. J Sports Sci 22: 179–189, 2004.

  14. Helsen, W, Gilis, B, and Weston, M. Errors in judging "offside" in association football: Test of the optical error versus the perceptual flash-lag hypothesis. J Sports Sci 24: 521–528, 2006.

  15. Hopkins, WG. Measures of reliability in sports medicine and science. Sports Med 30: 1–15, 2000.

  16. Hopkins, WG, Marshall, SW, Batterham, AM, and Hanin, J. Progressive statistics for studies in sports medicine and exercise science. Med Sci Sports Exerc 41: 3–13, 2009.

  17. Impellizzeri, FM, Rampinini, E, Castagna, C, Bishop, D, Ferrari Bravo, D, Tibaudi, A, andWisloff, U. Validity of a repeated-sprint test for football. Int J Sports Med 29: 899–905, 2008.

  18. Impellizzeri, FM, Rampinini, E, Castagna, C, Bishop, D, Ferrari Bravo, D, Tibaudi, A, andWisløff, U. Validity of a repeated-sprint test for football. Int J Sports Med 29: 899–905, 2008.

  19. Impellizzeri, FM and Marcora, SM. Test validation in sport physiology: Lessons learned from clinimetrics. Int J Sports Physiol Perform 4: 269–277, 2009.

  20. Krustrup, P, Mohr, M, and Bangsbo, J. Activity profile and physiological demands of top-class soccer assistant refereeing in relation to training status. J Sports Sci 20: 861–871, 2002.

  21. Mallo, J, Navarro, E, Garcia-Aranda, JM, Gilis, B, and Helsen, W. Analysis of the kinematical demands imposed on top-class assistant referees during competitive soccer matches. J Strength Cond Res 22: 235–242, 2008.

  22. Montgomery, PG, Pyne, DB, Hopkins, WG, and Minahan, CL. Seasonal progression and variability of repeat-effort line-drill performance in elite junior basketball players. J Sports Sci 26: 543–550, 2008.

  23. Mujika, I, Santisteban, J, Impellizzeri, FM, and Castagna, C. Fitness determinants of success in men’s and women’s football. J Sports Sci 27: 107–114, 2009.

  24. Rampinini, E, Sassi, A, Azzalin, A, Castagna, C, Menaspa, P, Carlomagno, D, and Impellizzeri, FM. Physiological determinants of Yo-Yo intermittent recovery tests in male soccer players. Eur J Appl Physiol 108: 401–409, 2010.

  25. Reilly, T and Gregson, W. Special populations: The referee and assistant referee. J Sports Sci 24: 795–801, 2006.

  26. Sheppard, JM and Young, WB. Agility literature review: Classifications, training and testing. J Sports Sci 24: 919–932, 2006.

  27. Stølen, T, Chamari, K, Castagna, C, and Wisløff, U. Physiology of soccer: An update. Sports Med 35: 501–536, 2005.

  28. Thomas, JR, Nelson, JK, and Silverman, J. Research Methods in Physical Activity (5th ed.). Champaign, IL: Human Kinetics, 2005.

  29. Vaeyens, R, Lenoir, M, Williams, AM, and Philippaerts, RM. Talent identification and development programmes in sport: Current models and future directions. Sports Med 38: 703–714, 2008.

  30. Vaeyens, R, Malina, RM, Janssens, M, Van Renterghem, B, Bourgois, J, Vrijens, J, and Philippaerts, RM. A multidisciplinary selection model for youth soccer: The Ghent Youth Soccer Project. Br J Sports Med 40: 928–934, 2006.

  31. Vincent, WJ. Statistics in Kinesiology. Champaign, IL: Human Kinetics, 1995.

  32. Weston, M, Bird, S, Helsen, W, Nevill, A, and Castagna, C. The effect of match standard and referee experience on the objective and subjective match workload of English Premier League referees. J Sci Med Sport 9: 256–262, 2006.

  33. Weston, M, Castagna, C, Helsen, W, and Impellizzeri, F. Relationships among field-test measures and physical match performance in elite-standard soccer referees. J Sports Sci 27: 1177–1184, 2009.

  34. Weston, M, Castagna, C, Impellizzeri, FM, Rampinini, E, and Breivik, S. Ageing and physical match performance in English Premier League soccer referees. J Sci Med Sport 13: 96–100, 2010.

  35. Weston, M, Helsen, W, MacMahon, C, and Kirkendall, D. The impact of specific high-intensity training sessions on football referees’ fitness levels. Am J Sport Med 32: S54–S61, 2004.