Analisis de Covarianza
Analisis de Covarianza
Analisis de Covarianza
Análisis de Covarianza
9.1. Introducción.
Hemos visto que el diseño de bloques es usado para eliminar el efecto de los factores
de ruido que no son controlables, dicho procedimiento es valido cuando los factores que
de las variables que causan tal ruido es cuantitativa, dicha variable es conocida como
Por lo tanto, el análisis de covarianza es una técnica estadı́stica que permite cono-
cer el efecto de una variable independiente categórica sobre una variable dependiente
cuantitativa (variable respuesta), eliminando el efecto que tiene sobre esta última otra
do medio del error y hacer que sean más difı́ciles de detectar las verdaderas diferencias
en las respuestas debidas a los tratamientos. Por lo tanto, el análisis de covarianza
205
206 Captulo 9. Anlisis de Covarianza
controlable.
i = 1, ..., a
yij = μ + αj + β(xij − x̄.. ) + εij (9.1)
j = 1, ..., n
donde
μ es la media total.
n
2
Se asume que εij ∼ N (0; σ ) e independientes entre si, β = 0, αi = 0 y que la
i=1
covariable x no está afectada por los tratamientos.
regresión.
a
n
a
n
y..2
2
Syy = (yij − ȳ.. ) = yij2 − (9.2)
i=1 j=1 i=1 j=1
an
a
n a n
x2..
Sxx = (xij − x̄.. )2 = x2ij − (9.3)
i=1 j=1 i=1 j=1
an
a
n
a
n
(x.. )(y.. )
Sxy = (xij − x̄.. )(yij − ȳ.. ) = xij yij − (9.4)
i=1 j=1 i=1 j=1
an
a
1 2
a
y2
2
Tyy = n (ȳi. − ȳ.. ) = yi. − .. (9.5)
i=1
n i=1 an
a
1 2 x2
a
2
Txx = n (x̄i. − x̄.. ) = xi. − .. (9.6)
i=1
n i=1 an
a
1
a
(x.. )(y.. )
Txy = n (x̄i. − x̄.. )(ȳi. − ȳ.. ) = (xi. )(yi. ) − (9.7)
i=1
n i=1 an
a
n
Eyy = (yij − ȳi. )2 = Syy − Tyy (9.8)
i=1 j=1
a
n
Exx = (xij − x̄i. )2 = Sxx − Txx (9.9)
i=1 j=1
a
n
Exy = (xij − x̄i. )(yij − ȳi. ) = Sxy − Txy (9.10)
i=1 j=1
Exy
μ̂ = ȳ.. ; α̂i = ȳi. − ȳ.. y β̂ =
Exx
(Exy )2
SCE = Eyy − (9.11)
Exx
Ahora supongamos que no hay ningun efecto de los tratamientos, entonces para modelar
i = 1, ..., a
yij = μ + β(xij − x̄.. ) + εij (9.13)
j = 1, ..., n
Exy
μ̂ = ȳ.. ; y β̂ =
Exx
9.2. Modelo unifactorial con una covariable 209
(Sxy )2
SCE = Syy − (9.14)
Sxx
(Sxy )2
el cual tiene an − 2 grados de libertad. En la ecuación (9.14), la cantidad Sxx
es la
Además, SCE < SCE ya que el modelo de la ecuación (9.2.1) incluye los parámetros
adicionales {αi }. Por lo tanto, la diferencia entre SCE y SCE , es decir,SCE − SCE
es una reducción en la suma de cuadrados debida a los términos {αi }, la cual tiene
hay ningún efecto de los tratamientos luego de anular el efecto de la covariable sobre
F0 = a−1
SCE
(9.15)
a(n−1)−1
resultados presentados en esta tabla son útiles también para el cálculo de las medias
Tabla 9.1: Anlisis de covarianza de un experimento de un solo factor con una covariable
Fuente de Sumas de Cuadrados Ajustados por la regresión
GL F
Variación x xy y y GL CM
Tratamiento a−1 Txx Txy Tyy
CME = SCE
a(n−1)−1
−SC
SCE E
F0 = a−1
CME
(Exy )2
Error a(n − 1) Exx Exy Tyy SCE = Eyy − Exx
a(n − 1) − 1
(Sxy )2
Total an − 1 Sxx Sxy Syy SCE = Syy − Sxx
an − 2
−SC
Tratamiento SCE − SCE a−1 SCE
a−1
E
210
9.2. Modelo unifactorial con una covariable 211
de los tratamientos es
1/2
1 (x̄i. − x̄.. )2
Sȳi.ajustada = CME + (9.17)
n Exx
(Exy )2 /Exx
F1 = (9.18)
CME
si F0 > Fα,1,a(n−1)−1 .
grosor; por consiguiente, una fibra más gruesa será por lo general más resistente que
una delgada. Los datos de este experimento se muestran en la tabla (9.2). Es evidente
que para resolver el problema debemos realizar un análisis de covarianza con el objeto
212 Captulo 9. Anlisis de Covarianza
de eliminar el efecto del grosor (x) sobre la resistencia (y). Suponiendo que la relación
i = 1, ..., a
yij = μ + αj + β(xij − x̄.. ) + εij
j = 1, ..., n
a
n
y..2 (603)2
Syy = yij2 − = 362 + 412 + ... + 322 − = 346,40
i=1 j=1
an (3)(5)
a n
x2.. (362)2
Sxx = x2ij − = 202 + 252 + ... + 152 − = 261,73
i=1 j=1
an (3)(5)
a
n
(x.. )(y.. )
Sxy = xij yij − = (20)(36) + (25)(41) + ... + (15)(32)
i=1 j=1
an
(362)(603)
= − = 282,60
(3)(5)
1 2
a
y2 1 (603)2
Tyy = yi. − .. = (2072 + 2162 + 1802 ) − = 140,40
n i=1 an 5 (3)(5)
1 2
a
x2 1 (362)2
Txx = xi. − .. = (1262 + 1302 + 1062 ) − = 66,13
n i=1 an 5 (3)(5)
1
a
(x.. )(y.. ) 1
Txy = (xi. )(yi. ) − = [(126)(207) + (130)(216) + (106)(184)]
n i=1 an 5
(362)(603)
= − = 96,00
(3)(5)
Eyy = Syy − Tyy = 346,40 − 140,40 = 206,00
(Sxy )2 186,602
SCE = Syy − = 346,40 − = 41,27
Sxx 261,73
(Exy )2 186,602
SCE = Eyy − = 206,00 − = 41,27 = 27,99
Exx 195,60
calcula como
−SC
SCE E
F0 = a−1
SCE
a(n−1)−1
13,28/2
= = 2,91
27,99/11
214 Captulo 9. Anlisis de Covarianza
Al comparar este valor con F0,10,2,11 = 2,86, se encuentra que no puede rechazarse la
hipótesis nula. Por lo tanto, no hay evidencia sólida de que las fibras producidas por
Exy 186,60
β̂ = = = 0,9540
Exx 195,60
Las medias de los tratamientos ajustadas pueden calcularse con la ecuación (9.17).
Al comparar las medias ajustadas con las medias no ajustadas de los tratamientos (las
ȳi. ), se observa que las medias ajustadas se encuentran mucho más próximas entre sı́,
9.2. Modelo unifactorial con una covariable 215
en la covariable x, ya que la técnica elimina el efecto de las variaciones en las x̄i. . Sin
tenerse una seguridad razonable de que los tratamientos no afectan los valores de xij .
mientras que en otros puede ser más dudoso. En el ejemplo tratado aquı́ puede haber
una diferencia en el diámetro de la fibra (xij ) entre las tres máquinas. En tales casos,
Cochran y Cox sugieren la posible utilidad de un análisis de varianza de los valores xij
para determinar la validez de este supuesto. Para el problema tratado aquı́, con este
procedimiento se obtiene
66,13/2
F0 = = 2,03
195,60/12
que es menor que F0,10,2,12 = 2,81, por lo que no hay razón para creer que las máquinas
producen fibras con diámetros diferentes.
sume en la tabla (9.4). En ella el análisis de covarianza se presenta como una análisis
se mide por Syy , con an − 1 grados de libertad. La fuente de variación ”regresión“ tiene
(Sxy )2
la suma de cuadrados Sxx
con un grado de libertad. Si no hubiera ninguna variable
dos del error serı́a simplemente Eyy y la suma de cuadrados de los tratamientos serı́a
Syy − Eyy = Tyy . Sin embargo, debido a la presencia de la variable concomitante, Syy
y Eyy deben ”ajustarse“ para la regresión de y sobre x, como se muestra en la tabla
216 Captulo 9. Anlisis de Covarianza
(9.4). La suma de cuadrados del error ajustada tiene a(n − 1) − 1 grados de libertad
Total Syy an − 1
9.3. Ejercicios
las cajas guardadas (x). Cada carretilla se usó cuatro veces y se obtuvieron los
2. Calcular las medias ajustadas de los tratamientos y los errores estándar de éstas
resistencia a la tensión del adhesivo cuando se aplica para unir piezas se relaciona
(y) en libras y del espesor (x) en 0.01 pulgadas para cada formulación. Los datos
apropiadas.
5. Calcular las medias ajustadas de los tratamientos y los errores estándar de éstas
se relaciona también con la dureza del ejemplar de prueba. Se hacen cinco obser-
del ejemplar (x) se muestran en la siguiente tabla. Analizar los datos usando un
7. Demostrar que en un análisis de covarianza de un solo factor con una sola covari-
1/2
1 (x̄i. − x̄.. )2
ȳi. − β̂(x̄i. − x̄.. ) ± tα/2,a(n−1)−1 CME +
n Exx
8. Demostrar que en un análisis de covarianza de un solo factor con una sola co-
tratamientos cualesquiera es
1/2
2 (x̄i. − x̄j. )2
Sȳi.ajustada −ȳj.ajustada = CME +
n Exx