Zatsiorski
Zatsiorski
Zatsiorski
Los más inofensivos son los errores del primer grupo. Ellos son fácilmente eliminados
mediante la incorporación de
las correcciones correspondientes en el resultado de la
medición.
Pertenecen segundo ante todo, los
al grupo, errores
relacionados con la imperfección del método de medición y de los aparatos de medición.
Por ejemplo, el error de la medición de la capacidad de trabajo físico con la ayuda de una
máscara para recoger el aire espirado: la máscara dificulta la respiración y el deportista, por
lo regular, muestra una capacidad de trabajo físico inferior, en comparación con su valor
real medido sin la máscara. La magnitud de este error no se puede predecir; ella depende de
las particularidades individuales del deportista y de su estado general en el momento de la
investigación.
Otro ejemplo de error sistemático de este grupo es el error relacionado con la
imperfección del equipamiento, cuando el equipo de medición aumenta o disminuye
notoriamente, el valor real de la magnitud medida, pero el valor del error resulta
desconocido.
Los errores del tercer grupo son los más peligrosos, su aparición tiene lugar tanto debido al
imperfeccionamiento del método de medición como también a las particularidades del
objeto de medición o sea, del deportista.
La lucha contra el error sistemático de la medición se lleva a cabo de diferentes maneras,
entre las cuales está la comprobación y calibración de los equipos de medición, así como el
método aleatorio.
Se denomina t a r a c i ó n (del alemán Tarieren) a la comprobación de las
indicaciones de los equipos de medición, mediante su comparación con las
indicaciones de valores modelos de las medidas (de patrones), dentro de todo el rango
de los valores posibles de la magnitud medida.
Se denomina c a 1 i b r a e i ó n a la determinación de los errores o a una corrección de
estos para un conjunto de mediciones (por ejemplo, para un juego de dinamómetros). Tanto
en la taración, como en la calibración, a la entrada del sistema de medición, en lugar del
deportista, se conecta una fuente de señal patrón de una magnitud conocida. Por ejemplo, al
tarar una instalación para la medición de los esfuerzos, en la plataforma tenso métrica se
colocan consecutivamente pesos de 10, 20, 30 kilogramos.
Se denomina m é t o d o a 1 e a t o r i o (en inglés random, aleatorio), a la transformación
del error sistemático en eventual. Este procedimiento está dirigido a la eliminación de los
errores sistemáticos desconocidos. Por el método aleatorio la medición de la magnitud
estudiada se realiza varias veces. En este caso las mediciones se organizan de tal forma, que
el factor constante que influye en el resultado de éstas, actúe en cada caso de diferente
manera. Digamos, al investigar la capacidad de trabajo físico, se puede recomendar que se
haga su medición varias veces, variando en cada una de ellas la forma de aplicación de la
carga. Al finalizar todas las mediciones, los resultados de éstas se promedian según las
reglas de la estadística matemática.
Los errores aleatorios surgen bajo la acción de diversos factores, los cuales no se pueden
decir con anterioridad, ni considerar con exactitud. Inicialmente, los errores aleatorios son
inevitables. Sin embargo, empleando los métodos de la estadística-matemática, es posible
valorar la magnitud del error aleatorio y tenerlo en cuenta al interpretar los resultados de la
medición. Sin la elaboración estadística los resultados de las mediciones no pueden
considerarse veraces.
4 FUNDAMENTOS DE LA TEORIA DE LAS PRUEBAS Vladimir Zatsiorski
FIGURA 120
La diferencia principal de la teoría de la confiabilidad de las,4 pruebas
en relación con la teoría de los errores de las mediciones, analizada en
los epígrafes 2.3 y 3.2.5, consiste en que, en la teoría de los errores la,
magnitud medida se considera invariable, mientras que en la teoría de la
confiabilidad de las pruebas, se estima que ésta varía de medición en
medición. Por ejemplo, si medimos el resultado del intento ejecutado en
el lanzamiento de la jabalina, éste está totalmente determinado, y no
puede variar en el transcurso del tiempo. Evidentemente que, en virtud
de causas aleatorias (por ejemplo, por tensión desigual de la lienza de
medición) no se puede medir con una exactitud ideal, digamos, con una
exactitud de 0,0001 mm, medir el mismo resultado. Sin embargo, al
emplear un instrumento de medición más exacto (por ejemplo, un
medidor láser de distancia) y ejecutando mediciones reiteradas (ver
3.2.5), es posible incrementar la precisión de las mediciones hasta el
nivel necesario. Además, si se nos presenta la tarea de determinar el nivel
de preparación del lanzador en determinado período del entrenamiento,
la medición más exacta de los resultados mostrados por él nos ayudará
muy poco: estos resultados variarán de un intento al otro.
Para poder analizar la idea de los métodos empleados en la
evaluación de la confiabilidad de las pruebas, analicemos un ejemplo
simplificado. Supongamos que queremos comparar los resultados de los
saltos de longitud desde el lugar de dos deportistas que han ejecutado dos
intentos. Las conclusiones deben ser exactas, por eso no podemo s
limitarnos solamente al registro de los mejores resultados. Supongamos
que cada uno de los resultados de ambos deportistas varían dentro de los
limites de FIGURA 121 10 cm en relación con la magnitud promedio, y
son iguales a FIGURA 122 220 10cmcm (es decir, 210 y 230 cm) y
FIGURA 123 320 10cm (es decir, 310 y 330 cm) respectivamente. En este
caso la conclusión evidentemente será una sola: el segundo deportista es
superior al primero. La diferencia entre sus resultados (320-220=
=100cm) es obviamente mayor que las oscilaciones casuales (±10cm). El
resultado será mucho menos definido si para esta misma variación intra
grupo (± 10 cm) la diferencia entre los investigados (variación
intergrupo) fuese pequeña. Digamos que los valores promedio fuesen
iguales a 220 cm (en un intento 210 cm y en el otro 230 cm) y 222 (212 y
232 cm respectivamente). Entonces, puede suceder que, por ejemplo, en
el primer intento, el primer deportista saltase 230 cm; y en el segundo,
solamente 212 cm; precisamente se crea la impresión de que el primero
es considerablemente más fuerte que el segundo. En el ejemplo vemos
que, la principal importancia consiste no en la variación intra grupo por
sí misma, sino en la relación que ésta guarda con las diferencias
intergrupo. Una misma variación intra grupo presenta diferente
confiabilidad cuando las diferencias entre los grupos son variables (en el
caso dado, entre los investigados, Fig., 20).
La teoría de la confiabilidad de las pruebas parte de que el resultado
de cualquier medición realizada en el hombre (xt) es la suma de dos
valores: FIGURA 124 x = x∞−x (4.1)
te
22
e
2
verdadera dispersión
FIGURA 132 r=
t
registrada dispersión
σ
FIGURA 133 r = ( 4.3)
∞
tt2
s
t
.
. 4.2.2 La evaluación de la confiabilidad a partir de los datos
experimentales
quiere evaluar la confiabilidad de la media de las tres series, por los datos del ejemplo
citado, entonces:
52 ,8 −63 ,2
h= = 69 ,0 (Ver 3,52)
¬3⎠
52 ,2 − −63 ,2 . 1 ≡ 3 ⇓
FIGURA 141
Vemos que el coeficiente obtenido no es muy elevado. Realmente los
resultados de los distintos deportistas en las diferentes series varían
considerablemente. Por ejemplo, el investigado número 5 en la primera
serie encestó 9 veces; en la segunda, 2 veces; en la tercera, 9 veces. Los
resultados del análisis de varianza también señalan que la prueba en
cuestión no puede ser empleada en esta forma para una evaluación
confiaste de la exactitud de los deportistas. La razón F para la dispersión
intergrupo (=2,48) no alcanza el nivel de consideración 0,05; por
consiguiente, los diferentes investigados, por los resultados de la
presente prueba, no se diferencian considerablemente entre sí desde el
punto de vista estadístico.
Analicemos cómo variará la confiabilidad de la prueba si utilizamos
no tres, sino, digamos, seis series. En este caso: FIGURA 142
52,8 −63,2
h= = 813,0 (Ver 3.52)−63,2. 1
¬3⎠
52,8 − ≡6⇓
La confiabilidad de la prueba aumentó
considerablemente. Para incrementar más aún la
confiabilidad de la prueba dada, es necesario
aumentar, como se dice en estos casos, la
longitud de la prueba, es decir, a la cantidad de
tiros por serie, o la cantidad de series, o ambos a
la vez. De esta manera, para evaluar la
confiabilidad es necesario, en primer lugar,
efectuar el análisis de varianza y, en segundo
lugar, calcular el coeficiente de correlación de grupo (coeficiente de
confiabilidad).
Surgen algunas complicaciones cuando tiene lugar el denominado
trend, es decir, el aumento o la disminución sistemática de los resultados
de un intento al otro (Fig. 23). En este caso, se emplean métodos más
complejos de evaluación de la confiabilidad (no se describen en el
presente libro).
En los casos en que se realizan dos intentos y ausencia de trend, las
magnitudes del coeficiente de correlación intra grupo en la práctica
coinciden con los valores del coeficiente normal de correlación entre los
resultados del primero y el segundo intento. Por eso, en estos casos, para
evaluar la confiabilidad también se puede emplear el coeficiente habitual
de correlación (en este caso él evalúa la contabilidad de uno, y no de los
dos intentos). Sin embargo, si el número de intentos repetidos en la
prueba es más de dos y (particularmente) si se emplean esquemas
complejos de aplicación de pruebas (por ejemplo, dos intentos al día
durante dos días), es necesario el cálculo del coeficiente intra grupo.
El coeficiente de confiabilidad no es un indicador absoluto en
la caracterización de la prueba. Esta coeficiente puede variar en
dependencia del grupo de investigados (principiantes y deportistas
calificados), de las condiciones de aplicación de las pruebas (si se
efectúan intentos reiterado s uno tras otro, digamos, con un
intervalo de una semana), y de otras causas. Por eso, siempre es
necesario describir cómo y con quién se efectuó la prueba.
4.1.3 La confiabilidad en el trabajo práctico con las pruebas
r
xy
r= , (4.6)
xy
a. r .r
b. xx . yy
rxy es la correlación entre los datos empíricos; rxx y ryy son las evaluaciones
de contabilidad de x y y.
Por ejemplo, si rxy = 0,60, rxx = 0,80 y ryy = 0,90, la correlación entre
los valores verdaderos es igual a 0,707.
La fórmula citada (4.6) se denomina corrección de disminución (o
fórmula Spearman-Brown). Esta se emplea constantemente en la práctica
No existe un valor concreto de la confiabilidad que permita considerar
la prueba contable en un grado determinado. Todo depende de la
importancia de las conclusiones hechas sobre la base de la aplicación de
la prueba. No obstante, en el deporte, en la mayoría de los casos, se
pueden emplear los siguientes valores aproximados: 0,95 -0,99
contabilidad excelente; 0,90 -0,94 buena; 0,80-0,89 aceptable; 0,70-0,79
mala; 0,60-0,69 dudosa para evaluaciones individuales (la prueba es
aplicable solo para caracterizar el grupo de investigados). Es posible
lograr cierto incremento de la contabilidad de la prueba, aumentando el
número de repeticiones. He aquí, por ejemplo, cómo en un experimento
aumentó la contabilidad de la prueba (lanzamiento de una granada de 350
g con carrera de impulso) a medida que aumentó el número de
repeticiones: un intento, 0,53; dos intentos, 0,72; tres intentos, 0,78;
cuatro intentos, 0,80; cinco intentos, 0,82; seis intentos, 0,84. En el
ejemplo vemos que, al principio, la contabilidad crece rápidamente, y se
hace mucho más lenta después de 3-4 intentos.
En los casos en que se hacen varias repeticiones, los resultados se
pueden determinar de varias maneras: a) por el mejor intento, b) por el
valor de la media aritmética, e) por la mediana, d) por la media de 2 ó 3
de los mejores intentos, etc. Las investigaciones han demostrado que, en
la mayoría de los casos, lo más confiable es la utilización de la media
aritmética, resulta algo menos contable la mediana y aún menos contable
el mejor intento.
Al hablar de la contabilidad de las pruebas, se distinguen su
estabilidad (posibilidad de reproducción), su grado de concordancia y su
equivalencia.
del nivel de información en general puede ser igual a cero; con la ayuda
de una prueba como ésta no será posible diferenciar a los deportistas que
hayan realizado el recorrido, digamos, en 3 min. 55 s, en 3 min 59 s; ya
que, tanto para unos, como para otros, los valores del CMO serán
elevados y aproximadamente iguales.
Los coeficientes del nivel de información dependen
considerablemente de la confiabilidad de la prueba y del criterio. La
prueba con baja contabilidad siempre es poco informativa, por eso no
tiene sentido comprobar el nivel de información de pruebas poco
confiables. La confiabilidad insuficiente del criterio también conduce a la
reducción de los coeficientes del nivel de información. Sin embargo, en
el caso dado sería incorrecto despreciar la prueba como poco
informativa, ya que el límite superior de la posible correlación de la
prueba no es 1, sino su índice de confiabilidad. Por eso es necesario
comparar el coeficiente del nivel de información con este índice. El nivel
de información real (con la corrección por la no confiabilidad del
criterio) se calcula por la fórmula:
r
r=
tc
(4.7)
tc
Los resultados mostrados por los deportistas (en particular, los resultados de las
pruebas), en primer lugar, se expresan en diferentes unidades de medida (tiempo, distancia,
etc.), y por eso no son directamente comparables entre sí; en segundo lugar, por sí mismo
no indican cuán satisfactorio es el estado del deportista (por ejemplo, el tiempo de una
carrera de 100 m igual a 12 s puede analizarse tanto como muy bueno, como muy malo, en
dependencia de quién se trate).
Por eso los resultados se transforman en evaluaciones (goles, puntos, marcas,
categorías, etcétera).
Se denomina evaluación (o evaluación pedagógica) a la medida unificada del éxito en
una tarea determinada, en el caso particular, en la prueba. El proceso de deducción (de
cálculo, de determinación) de las evaluaciones se denomina calificación.
Son ejemplo de evaluación: las tablas de puntuación para los deportes, las
evaluaciones de los resultados de las pruebas, las calificaciones de las escuelas y los centros
de enseñanza superior en cultura física y educación física, las posiciones en las
competencias y la práctica -que se justifica por sí misma del cálculo no oficial de las
puntuaciones en los juegos olímpicos. La evaluación puede ser expresada de diferentes
maneras, por ejemplo, en forma de característica cualitativa ("bien-satisfactorio-mal" o
"aprobado-desaprobado") en forma de notas, de puntos acumulados.
En todos los casos ésta presenta rasgos generales comunes. Se distinguen las
evaluaciones docentes que otorga el profesor a los alumnos en el desarrollo del proceso
docente, y las evaluaciones de calificación, que abarcan todas las demás evaluaciones (en
particular, los resultados de las competencias oficiales, de la aplicación de las pruebas,
etc.). No existe una gran diferencia entre las evaluaciones docentes y las de calificación; sin
embargo, por lo general, el procedimiento para la evaluación de calificación, como norma,
es más complejo.
En su forma completa y desarrollada, la evaluación de calificación se realiza en dos
etapas. En la primera etapa los resultados deportivos mostrados se transforman en puntos,
sobre la base de las denominadas escalas de evaluaciones (evaluación intermedia), mientras
que en la segunda etapa, después de comparar los puntos acumulados con normas
previamente establecidas, se determina la evaluación final. Por ejemplo, en los eventos
múltiples, al principio los resultados en los distintos deportes se transforman en puntos y,
posteriormente, después de su comparación con las normas de la clasificación deportiva, se
determina la evaluación final, o sea, se otorga la categoría deportiva. La secuencia de las
acciones en el proceso de evaluación se presenta en el esquema expuesto, en el cual
también se han incluido las etapas de aplicación de la prueba y medición de los resultados
de la prueba.
No en todos los casos el proceso de evaluación tiene lugar
según este esquema desarrollado. A veces los procesos de las
5.1.2 Las tablas de puntuación para los diferentes deportes y las escalas de
evaluación.
El análisis de las tablas de puntuación para algunos deportes permite introducir una
serie de conceptos necesarios para el estudio posterior de¡ curso de metrología deportiva.
El objetivo de cualquier tabla semejante es la transformación del resultado
deportivo mostrado (expresado en medidas objetivas: kilogramos, segundos, etc., el
lugar ocupado o el número y la significación de las victorias) en puntos
convencionales. La ley de transformación de los resultados deportivos en puntos se
denomina escala de evaluación. La escala puede estar dada en forma de expresión
matemática (fórmula), tabla o gráfico. En la figura 25 se muestran de manera
esquemática 4 tipos básicos de escalas que se presentan en el deporte y la educación
física.
El primer tipo son las escalas proporcionales. Este tipo de escala presupone la
adjudicación de igual número de puntos por un mismo incremento de los resultados (por
ejemplo, por cada 0,1 s de mejoría en el resultado de la carrera de 100 m se adjudican 20
puntos). Las escalas proporcionales se encuentran aprobadas en las pruebas múltiples
contemporáneas, carreras en patinaje sobre hielo, las carreras en esquíes, el biatlón en
esquíes, el biatlón convencional y otros deportes (Fig. 26).
El segundo tipo son las escalas regresivas. En este caso por un mismo incremento del
resultado, se adjudica un número cada vez menor de puntos a medida que crecen los
resultados deportivos (por ejemplo, por un incremento del resultado de la carrera de 100 m
de 15,0 a 14,9 se adicionan 20 puntos; mientras que por 0, 1 s, en el rango de 10,0 a 9,9 s,
solo 15 puntos). Estas escalas parecen ser injustas, pero en muchos casos su aplicación
resulta conveniente (ver 5.1.4). Las escalas de este tipo se encuentran aprobadas
actualmente para algunos tipos de saltos y lanzamientos de atletismo (Fig. 27).
El tercer tipo, son las escalas progresivas. Aquí, mientras mayor sea el resultado
deportivo, mayor será la adición de puntos que se confiere a su mejoramiento (por ejemplo,
por mejorar el tiempo de la carrera de
15,0 a 14,9 s se adicionan 1 0 puntos; y de 10,0 a 9,9 s, 100 puntos). Las escalas
progresivas se aplican en la natación, en algunos elementos de atletismo, en el
levantamiento de pesas (Fig. 28).
El cuarto tipo son las escalas en forma de sigma (o en forma de S). En estas escalas el
mejoramiento de los resultados en las zonas de logros muy bajos y logros muy altos se
estimula pobremente; la mayor cantidad de puntos corresponden a los resultados en la zona
media de los logros. En el deporte estas escalas no se emplean, pero se utilizan
ampliamente en la evaluación del nivel de la preparación física (por ejemplo, así se
comporta la escala de patrones del nivel de la preparación física de la población de los
EE.UU.).
1. Comparar los diferentes logros en una misma tarea (prueba, disciplina deportiva,
ejercicio, elemento de los eventos
múltiples). Por ejemplo, comparar los resultados deportivos iguales a la norma de
maestro del deporte y de la primera categoría. ¿Cuántos resultados de primera categoría
corresponden a uno de maestro del deporte?
2. 2. 2. Comparar los logros en las distintas tareas. Aquí lo principal es equiparar
las evaluaciones con los logros de igual nivel de complejidad en los diferentes tipos de
deportes, o en las diversas disciplinas de las competencias. Estos logros de igual nivel de
dificultad se denominan
equivalentes .
.
.
.
3. Determinar las normas. En los distintos casos (evaluaciones escolares, etc.) las normas
coinciden con las gradaciones de la escala.
La solución de estas tareas, íntegramente, determina el
sistema de evaluación.
Estas escalas se han denominado así, porque la medida en ellas son las desviaciones
estándares (medias cuadráticas). La más simple de las escalas estándar es la escala Z. En
esta escala los puntos conferidos son iguales a la desviación normada. En ella el resultado
promedio se evalúa como cero puntos, los resultados inferiores al valor promedio obtienen
puntos negativos, mientras que la mayoría aplastante de los resultados se ubica en un
rango que está desde -3 hasta +3. Debido a los valores negativos esta escala resulta
incómoda y se emplea muy poco.
La más popular de las escalas estándares es la escala T. Aquí el valor promedio se
iguala a 50 y el estándar a 10 puntos:
x −X
T = 50 +.10 = 50 + .10 Z (5.1)
s
donde x es el resultado mostrado; X y s ,como siempre, son la magnitud
promedio y la desviación estándar. Por ejemplo, si el valor promedio en
los saltos de longitud desde el lugar resultó igual
a 224 cm, y el estándar es 20 cm; por un resultado de 222 cm se
confieren 49 puntos, mientras que por 266 cm se dan 71 puntos
(compruebe si esto es correcto). Se sobreentiende que el hecho de igualar
el valor promedio a 50 puntos y el estándar a 10 es arbitrario. En la
práctica mundial también se emplean otras escalas stándares (tabla 24).
Puntos
100
1
(5.2)
.
resultadopeor
.
−
−
resultadomejor
.
resultadomejor
.
−
≤
•
=
Puntos
=
100
⎬⎬≤
20
15
⎬⎬≥
50
puntos
20
−
10
Las dimensiones del cuerpo (la estatura, el peso, etc.) influyen en las
posibilidades motoras de las personas. Así, las personas de estatura
elevada tienen ventaja en los saltos de altura. Evidentemente se desea
determinar normas que sean lo más justas posible, para que las
diferencias en complexión no influyan sobre ellas. La vía más simple
para esto es la elección de pruebas en las que no influyan las
particularidades de la complexión. Por ejemplo, para las niñas la
velocidad máxima de la carrera no depende de la estatura (Fig. 35),
mientras que para los niños esta dependencia existe solamente en el
período de la madurez sexual. . Si no se pueden seleccionar pruebas
similares, se hace necesario aplicar normas que tengan en consideración
no solo la edad, sino también la talla y el peso.
. En la figura 36 se da un ejemplo de nomograma para la determinación
del resultado promedio en los saltos de longitud desde el lugar, para los
niños y niñas de quince años de edad. Para determinar el resultado
promedio es necesario unir en el nomograma los valores de talla y peso
con una línea recta. El punto donde esta línea intercepta la escala de los
resultados en los saltos de longitud desde el lugar, indicará el valor
promedio de esta prueba. A estos mismos objetivos sirven los
denominados índices de clasificación (IC). Cada uno de estos índices,
empleados para la evaluación del nivel de la preparación física de los
escolares en los EE.UU. y Canadá, presenta el siguiente aspecto: IC = 20
edad (en el sistema decimal) +2,5 talla (cm) +2,0 peso (Kg.) -12.
Para cada valor del IC se ha elaborado una escala de percentiles. Al
determinar el valor del IC para un investigado por separado, se puede
evaluar su nivel de preparación física, considerando la edad, la talla y el
peso.
Esta es una escala en la cual los números no solo se encuentran ordenados por
rangos, sino que también están divididos en determinados intervalos. La
particularidad que diferencia esta escala de la de relaciones que se describirá
posteriormente, consiste en que el cero de la escala se selecciona de manera
arbitraria. Pueden servir de ejemplos el tiempo calendario (en los distintos
calendarios el conteo de los años se ha establecido sobre bases arbitrarias), el ángulo
articular (para una extensión completa del antebrazo, el ángulo de la articulación
o
cubital puede tomarse igual a cero o 180 ),
la temperatura, la energía
potencial de una carga que se levanta, el potencial del campo
eléctrico, etcétera.
Los resultados de las mediciones por la escala de orden pueden
elaborarse matemáticamente, excepto el cálculo de relaciones. Los
datos de la escala de intervalos dan respuesta a la pregunta ¿Cuánto
mayor?, pero no permiten confirmar que un valor de la magnitud
medida sea tantas veces mayor o menor que el otro. Por ejemplo, si
la temperatura aumentó de 10 a 20' C, no se puede decir que hace
dos veces más calor. .
−1
L
de aquí que la dimensión de la velocidad sea igual a = LT ,
T mientras que
−2
. La gran ventaja del SI es que, al
la dimensión de la aceleración es igual a LT
ser aplicado, muchas magnitudes físicas importantes (por ejemplo, la
energía) se expresan en las mismas unidades en sistemas de diferente
naturaleza (mecánicos, eléctricos, magnéticos, etc.): 1 joule=1
Newton. metro= volt . coulomb = ampere . Weber. Además de las
unidades de medición que forman parte del sistema, existen también
unidades fuera del sistema (hora, minuto, caballo de fuerza, calorías,
etc.). Muchas de estas unidades no pueden ser eliminadas, debido a la
comodidad de su empleo, y algunas se han conservado
históricamente. Algunas de las unidades fuera del sistema han sido
elaboradas
partiendo de las unidades básicas del sistema, pero no por el principio
decimal (por ejemplo: minuto, hora); otras en general no guardan
relación alguna con las unidades de los sistemas establecidos (caloría,
milímetro de Hg., etc.). Muchas de estas unidades fuera del sistema sería
conveniente retirar.
∆Α
∆A = % 100 .
r
A
o
A
m
Los más inofensivos son los errores del primer grupo. Ellos son
fácilmente eliminados mediante la incorporación de las
correcciones correspondientes en el resultado de la medición.
Pertenecen al segundo grupo, ante todo, los errores
relacionados con la imperfección del método de medición y de los
aparatos de medición. Por ejemplo, el error de la medición de la
capacidad de trabajo físico con la ayuda de una máscara para
recoger el aire espirado: la máscara dificulta la respiración y el
deportista, por lo regular, muestra una capacidad de trabajo físico
inferior, en comparación con su valor real medido sin la máscara.
La magnitud de este error no se puede predecir; ella depende de las
particularidades individuales del deportista y de su estado general
en el momento de la investigación.
Otro ejemplo de error sistemático de este grupo es el error
relacionado con la imperfección del equipamiento, cuando el
equipo de medición aumenta o disminuye notoriamente, el valor
real de la magnitud medida, pero el valor del error resulta
desconocido.
Los errores del tercer grupo son los más peligrosos, su aparición
tiene lugar tanto debido al imperfeccionamiento del método de
medición como también a las particularidades del objeto de
medición o sea, del deportista.
La lucha contra el error sistemático de la medición se lleva a
cabo de difer entes maneras, entre las cuales está la comprobación
y calibración de los equipos de medición, así como el método
aleatorio.
Se denomina t a r a c i ó n (del alemán Tarieren) a la
comprobación de las indicaciones de los equipos de medición,
mediante su comparación con las indicaciones de valores modelos
de las medidas (de patrones), dentro de todo el rango de los
valores posibles de la magnitud medida.
Se denomina c a 1 i b r a e i ó n a la determinación de los errores o
a una corrección de estos para un conjunto de mediciones (por
ejemplo, para un juego de dinamómetros). Tanto en la taración, como
en la calibración, a la entrada del sistema de medición, en lugar del
deportista, se conecta una fuente de señal patrón de una magnitud
conocida. Por ejemplo, al tarar una instalación para la medición de los
esfuerzos, en la plataforma tenso métrica se colocan consecutivamente
pesos de 10, 20, 30 kilogramos.
Se denomina m é t o d o a 1 e a t o r i o (en inglés random,
aleatorio), a la transformación del error sistemático en eventual. Este
procedimiento está dirigido a la eliminación de los errores
sistemáticos desconocidos. Por el método aleatorio la medición de la
magnitud estudiada se realiza varias veces. En este caso las
mediciones se organizan de tal forma, que el factor constante que
influye en el resultado de éstas, actúe en cada caso de diferente
manera. Digamos, al investigar la capacidad de trabajo físico, se
puede recomendar que se haga su medición varias veces, variando en
cada una de ellas la forma de aplicación de la carga. Al finalizar todas
las mediciones, los resultados de éstas se promedian según las reglas
de la estadística matemática.
Los errores aleatorios surgen bajo la acción de diversos factores,
los cuales no se pueden decir con anterioridad, ni considerar con
exactitud. Inicialmente, los errores aleatorios son inevitables. Sin
embargo, empleando los métodos de la estadística-matemática, es
posible valorar la magnitud del error aleatorio y tenerlo en cuenta al
interpretar los resultados de la medición. Sin la elaboración estadística
los resultados de las mediciones no pueden considerarse veraces.
.
.
...
s=σ∞+σ
2 2
(4.2)
e
e
2
varía la distribución de los resultados de la prueba (Fig. 21).
e
.
r=
t
registrada dispersión
σ
r=
∞
( 4.3)
tt2
s
t
t∞
= rtt`` (4.4)
.
. 4.2.2 La evaluación de la confiabilidad a partir de los datos
experimentales
85, 8 −15,41
conj
= = 63 , 2 (ver 3.5 1)
7 + 12
≡3 ⇓
Vemos que el coeficiente obtenido no es muy elevado. Realmente
los resultados de los distintos deportistas en las diferentes series varían
considerablemente. Por ejemplo, el investigado número 5 en la
primera serie encestó 9 veces; en la segunda, 2 veces; en la tercera, 9
veces. Los resultados del análisis de varianza también señalan que la
prueba en cuestión no puede ser empleada en esta forma para una
evaluación confiaste de la exactitud de los deportistas. La razón F para
la dispersión intergrupo (=2,48) no alcanza el nivel de consideración
0,05; por consiguiente, los diferentes investigados, por los resultados
de la presente prueba, no se diferencian considerablemente entre sí
desde el punto de vista estadístico.
Analicemos cómo variará la confiabilidad de la prueba si utilizamos
no tres, sino, digamos, seis series. En este caso:
52,8 −63,2
h= = 813,0 (Ver 3.52)−63,2. 1
¬3⎠
52,8 − ≡6⇓
La confiabilidad de la prueba aumentó
considerablemente. Para incrementar más aún la
confiabilidad de la prueba dada, es necesario
aumentar, como se dice en estos casos, la longitud
de la prueba, es decir, a la cantidad de tiros por
serie, o la cantidad de series, o ambos a la vez. De
esta manera, para evaluar la confiabilidad es
necesario, en primer lugar, efectuar el análisis de
varianza y, en segundo lugar, calcular el
coeficiente de correlación de grupo (coeficiente de
confiabilidad). Surgen algunas complicaciones
cuando tiene lugar el denominado trend, es decir,
el aumento o la disminución sistemática de los
resultados de un intento al otro (Fig. 23). En
este caso, se emplean métodos más complejos de evaluación de la
confiabilidad (no se describen en el presente libro).
En los casos en que se realizan dos intentos y ausencia de trend,
las magnitudes del coeficiente de correlación intra grupo en la práctica
coinciden con los valores del coeficiente normal de correlación entre
los resultados del primero y el segundo intento. Por eso, en estos
casos, para evaluar la confiabilidad también se puede emplear el
coeficiente habitual de correlación (en este caso él evalúa la
contabilidad de uno, y no de los dos intentos). Sin embargo, si el
número de intentos repetidos en la prueba es más de dos y
(particularmente) si se emplean esquemas complejos de aplicación de
pruebas (por ejemplo, dos intentos al día durante dos días), es
necesario el cálculo del coeficiente intra grupo.
El coeficiente de confiabilidad no es un indicador absoluto
en la caracterización de la prueba. Esta coeficiente puede variar
en dependencia del grupo de investigados (principiantes y
deportistas calificados), de las condiciones de aplicación de las
pruebas (si se efectúan intentos reiterados uno tras otro,
digamos, con un intervalo de una semana), y de otras causas. Por
eso, siempre es necesario describir cómo y con quién se efectuó
la prueba.
a. r .r
b. xx . yy
rxy es la correlación entre los datos empíricos; rxx y ryy son las
evaluaciones de contabilidad de x y y.
Por ejemplo, si rxy = 0,60, rxx = 0,80 y ryy = 0,90, la correlación entre
los valores verdaderos es igual a 0,707.
La fórmula citada (4.6) se denomina corrección de disminución (o
fórmula Spearman-Brown). Esta se emplea constantemente en la
práctica
No existe un valor concreto de la confiabilidad que permita
considerar la prueba contable en un grado determinado. Todo depende
de la importancia de las conclusiones hechas sobre la base de la
aplicación de la prueba. No obstante, en el deporte, en la mayoría de
los casos, se pueden emplear los siguientes valores aproximados: 0,95
-0,99 contabilidad excelente; 0,90 -0,94 buena; 0,80-0,89 aceptable;
0,70-0,79 mala; 0,60-0,69 dudosa para evaluaciones individuales (la
prueba es aplicable solo para caracterizar el grupo de investigados). Es
posible lograr cierto incremento de la contabilidad de la prueba,
aumentando el número de repeticiones. He aquí, por ejemplo, cómo en
un experimento aumentó la contabilidad de la prueba (lanzamiento de
una granada de 350 g con carrera de impulso) a medida que aumentó
el número de repeticiones: un intento, 0,53; dos intentos, 0,72; tres
intentos, 0,78; cuatro intentos, 0,80; cinco intentos, 0,82; seis intentos,
0,84. En el ejemplo vemos que, al principio, la contabilidad crece
rápidamente, y se hace mucho más lenta después de 3-4 intentos.
En los casos en que se hacen varias repeticiones, los resultados se
pueden determinar de varias maneras: a) por el mejor intento, b) por el
valor de la media aritméti ca, e) por la mediana, d) por la media de 2 ó
3 de los mejores intentos, etc. Las investigaciones han demostrado
que, en la mayoría de los casos, lo más confiable es la utilización de la
media aritmética, resulta algo menos contable la mediana y aún menos
contable el mejor intento.
Al hablar de la contabilidad de las pruebas, se distinguen su
estabilidad (posibilidad de reproducción), su grado de concordancia y
su equivalencia.
r= (4.7)
tc
tc
64,0 Se
encuentra
estrechamente relacionado con el nivel de información
y la confiabilidad de la prueba el concepto de su p
o s i b i 1 i d a d d i s t i n t i v a, o sea, aquella diferencia mínima
entre los investigados que se diagnostica con la ayuda de la prueba
(por su sentido, este concepto es análogo al concepto de sensibilidad
de un instrumento). La posibilidad distintiva de la prueba depende de
2. n
Los resultados mostrados por los deportistas (en particular, los resultados de las
pruebas), en primer lugar, se expresan en diferentes unidades de medida (tiempo,
distancia, etc.), y por eso no son directamente comparables entre sí; en segundo lugar,
por sí mismo no indican cuán satisfactorio es el estado del deportista (por ejemplo, el
tiempo de una carrera de 100 m igual a 12 s puede analizarse tanto como muy bueno,
como muy malo, en dependencia de quién se trate).
Por eso los resultados se transforman en evaluaciones (goles, puntos, marcas,
categorías, etcétera).
Se denomina evaluación (o evaluación pedagógica) a la medida unificada del éxito
en una tarea determinada, en el caso particular, en la prueba. El proceso de deducción
(de cálculo, de determinación) de las evaluaciones se denomina calificación.
Son ejemplo de evaluación: las tablas de puntuación para los deportes, las
evaluaciones de los resultados de las pruebas, las calificaciones de las escuelas y los
centros de enseñanza superior en cultura física y educación física, las posiciones en las
competencias y la práctica -que se justifica por sí misma del cálculo no oficial de las
puntuaciones en los juegos olímpicos. La evaluación puede ser expresada de diferentes
maneras, por ejemplo, en forma de característica cualitativa ("bien-satisfactorio-mal" o
"aprobado-desaprobado") en forma de notas, de puntos acumulados.
En todos los casos ésta presenta rasgos generales comunes. Se distinguen las
evaluaciones docentes que otorga el profesor a los alumnos en el desarrollo del proceso
docente, y las evaluaciones de calificación, que abarcan todas las demás evaluaciones
(en particular, los resultados de las competencias oficiales, de la aplicación de las
pruebas, etc.). No existe una gran diferencia entre las evaluaciones docentes y las de
calificación; sin embargo, por lo general, el procedimiento para la evaluación de
calificación, como norma, es más complejo.
En su forma completa y desarrollada, la evaluación de calificación se realiza en dos
etapas. En la primera etapa los resultados deportivos mostrados se transforman en
puntos, sobre la base de las denominadas escalas de evaluaciones (evaluación
intermedia), mientras que en la segunda etapa, después de comparar los puntos
acumulados con normas previamente establecidas, se determina la evaluación final. Por
ejemplo, en los eventos múltiples, al principio los resultados en los distintos deportes se
transforman en puntos y, posteriormente, después de su comparación con las normas de
la clasificación deportiva, se determina la evaluación final, o sea, se otorga la categoría
deportiva. La secuencia de las acciones en el proceso de evaluación se presenta en el
esquema expuesto, en el cual también se han incluido las etapas de aplicación de la
prueba y medición de los resultados de la prueba.
No en todos los casos el proceso de evaluación tiene lugar según este esquema
desarrollado. A veces los procesos de las evaluaciones intermedia y final se funden.
5.1.2 Las tablas de puntuación para los diferentes deportes y las escalas
de evaluación.
equivalentes .
.
.
.
6. Determinar las normas. En los distintos casos (evaluaciones escolares, etc.) las
normas coinciden con las gradaciones de la escala.
La solución de estas tareas, íntegramente, determina el
sistema de evaluación.
Estas escalas se han denominado así, porque la medida en ellas son las desviaciones
estándares (medias cuadráticas). La más simple de las escalas estándar es la escala Z. En
esta escala los puntos conferidos son iguales a la desviación normada. En ella el
resultado promedio se evalúa como cero puntos, los resultados inferiores al valor
promedio obtienen puntos negativos, mientras que la mayoría aplastante de los
resultados se ubica en un rango que está desde -3 hasta +3. Debido a los valores
negativos esta escala resulta incómoda y se emplea muy poco.
La más popular de las escalas estándares es la escala T. Aquí el valor promedio se
iguala a 50 y el estándar a 10 puntos:
x −X
T = 50 + . 10 = 50 + . 10 Z (5.1)
(5.2)
1
−
resultadomejor
.
resultadomejor
.
−
evaluadoresultado
.
resultadopeor
.
Puntos
=
100
Puntos
=
100
⎬⎬≤
20
15
−
1
=
⎬≥ −
50
puntos
20
10
−
Las dimensiones del cuerpo (la estatura, el peso, etc.) influyen en las
posibilidades motoras de las personas. Así, las personas de estatura
elevada tienen ventaja en los saltos de altura. Evidentemente se desea
determinar normas que sean lo más justas posible, para que las
diferencias en complexión no influyan sobre ellas. La vía más simple
para esto es la elección de pruebas en las que no influyan las
particularidades de la complexión. Por ejemplo, para las niñas la
velocidad máxima de la carrera no depende de la estatura (Fig. 35),
mientras que para los niños esta dependencia existe solamente en el
período de la madurez sexual. . Si no se pueden seleccionar pruebas
similares, se hace necesario aplicar normas que tengan en
consideración no solo la edad, sino también la talla y el peso.
. En la figura 36 se da un ejemplo de nomograma para la
determinación del resultado promedio en los saltos de longitud desde
el lugar, para los niños y niñas de quince años de edad. Para
determinar el resultado promedio es necesario unir en el nomograma
los valores de talla y peso con una línea recta. El punto donde esta
línea intercepta la escala de los resultados en los saltos de longitud
desde el lugar, indicará el valor promedio de esta prueba. A estos
mismos objetivos sirven los denominados índices de clasificación
(IC). Cada uno de estos índices, empleados para la evaluación del
nivel de la preparación física de los escolares en los EE.UU. y
Canadá, presenta el siguiente aspecto: IC = 20 edad (en el sistema
decimal) +2,5 talla (cm) +2,0 peso (Kg.) -12.
Para cada valor del IC se ha elaborado una escala de porcentiles.
Al determinar el valor del IC para un investigado por separado, se
puede evaluar su nivel de preparación física, considerando la edad, la
talla y el peso.