Nothing Special   »   [go: up one dir, main page]

Fusionado

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 96

30

2.5 ANÁLISIS DE VARIANZA PARA UN EXPERIMENTO REALIZADO


MEDIANTE UN DISEÑO COMPLETAMENTE AL AZAR CON SUB-
MUESTREO

Una situación común en la experimentación agronómica es la de estimar ciertas características


cuantitativas dentro de las unidades experimentales. En la práctica, tales características se determinan a
partir de muestras sobre la población de elementos que existe en cada parcela o unidad experimental.

En este caso, el proceso para obtener estas características se denomina: submuestreo.


Considerando el caso más simétrico y tal vez el más útil, cuando se tienen r repeticiones para cada uno
de los t tratamientos y se toman m muestras dentro de cada unidad experimental, se tendrán en total
trm observaciones. Algunos ejemplos de submuestreo se presentan a continuación:

a) En un experimento de campo, el investigador puede no tener tiempo para cosechar


(totalmente) cada unidad experimental. De esta manera, podrá seleccionar al azar varios
cuadros por parcela y cosechar el grano en cada cuadro seleccionado. De nuevo,
describiríamos estas observaciones como “muestras dentro de unidades experimentales”.

b) En un experimento de tecnología de alimentos que implicó el almacenamiento de fresas


congeladas, se almacenaron 10 cajas (unidades experimentales) a cada cinco lapsos de
almacenamiento (tratamientos). Cuando se hicieron las determinaciones del ácido
ascórbico después del almacenamiento, se hicieron dos determinaciones en caja (muestras
dentro de unidades experimentales).

El modelo lineal apropiado para interpretar los resultados de un experimento como los
descritos es:
i = 1, 2, ... , t
1. Modelo Estadístico: Yijk = + i + ij + ijk j = 1, 2, , r
k = 1, 2,…,m

Yijk = valor de la variable de respuesta correspondiente a la k-ésima muestra sobre la unidad


experimental que lleva el tratamiento i en la repetición j.
= Media general de la variable respuesta.
i = Efecto del i-ésimo tratamiento.
ij = error experimental asociado a la ij-ésima unidad experimental.
ijk = error de muestreo dentro de la ij-ésima unidad experimental.

2. Hipótesis

Ho: i i = 1,2,. . . / i =
Ha: i i = 1,2,. . . i

3. Supuestos:

a) ij ~ NID (0, e²)


ij son los errores de parcela, y se asume que son variables aleatorias no correlacionadas, con
media 0 y varianza constante desconocida e² (varianza residual o varianza entre parcelas)
31

b) ijk~ NID (0‚ m²)


ijk son los errores de muestreo, y se consideran como variables aleatorias no correlacionadas
entre sí, ni con los errores de parcela, con media 0 y varianza constante desconocida m²
(varianza muestral o varianza dentro de parcelas)

4. Análisis de varianza

Fuentes de Grados de Cuadrados


Suma de cuadrados F
variación libertad Medios
t
Yi..2 Y...2 .1
SCtrat / gl trat
Tratamientos t 1 i 1 rm rtm F2

.2
t r Yi j. 2 t
Yi..2 .3 SCee / gl ee CM ee
Error F1
t(r 1)
Experimental i 1 j 1 m i 1 rm CM em

.4
Error de t r m t r Yij. 2 SCem / gl em
tr (m 1 ) Yi jk 2
Muestreo
i 1 j 1 k 1 i 1 j 1 m

Total
t r m
Y...2
trm 1 Yi jk 2
i 1 j 1 k 1 rtm

t r m
Y...
Y... Yijk Y...
i 1 j 1 k 1 trm

1° Pruebas preliminares de significancia


Para evaluar el efecto de submuestreo, se realiza una prueba de hipótesis:

Ho: e² =0
Ha: e² > 0,

comparando el cuadrado medio del error experimental, contra el cuadrado medio del error de
muestreo. Bajo la hipótesis nula, el cociente F1 = ( CMee / CMem ), se distribuye como una F
con t(r-1) y tr(m-1) grados de libertad. Luego se presentan dos alternativas:

Si F1 F (glee, glem, ), se rechaza Ho, indicando que el submuestreo fue efectivo, por lo que
CM trat
F2 se calcula de la siguiente forma: F2 , y se compara con el valor crítico de F(glt, glee,
CM ee
CMee
). El coeficiente de variación se obtiene así: CV 100
Y ...
32

Si F1 < F (glee, glem, ), se acepta Ho, lo cual indica que el submuestreo no fue efectivo, por lo
que los errores deben mancomunarse así:
SCee SCem
CMep ,
glee glem
CM trat
y F2 se obtiene de la siguiente manera: F2 , y se compara con: Fcrítica (glt, glep, ).
CM ep

El coeficiente de variación se obtiene de la siguiente manera:


CMep
CV 100
Y ...
Ejemplo de Aplicación

Considere los siguientes resultados, obtenidos en un experimento donde fue utilizado un DCA
con submuestreo:

Repeticiones
Tratamientos
I II III IV Yi.. Yi..
5.6 5.0 5.5 5.3
A
5.7 5.1 5.4 5.5
Yij. 11.30 10.1 10.9 10.8 43.10 5.39
6.7 4.7 5.7 6.2
B
8.7 3.7 6.5 5.8
Yij. 15.4 8.4 12.2 12.0 48 6.00
7.6 7.4 7.5 5.7
C
7.8 7.2 7.6 6.7
Yij. 15.4 14.6 15.1 12.40 57.5 7.19
148.6 6.19
t = 3 ( A, B, C)
r = 4 (I,II,III,IV)
m= 2 (submuestras) Y… Y…

Resolución del ejercicio planteado.

43.10 2 482 57.52 (148.6) 2


SCtrat 12.92
(4)(2) (4)(3)(2)

SCee 11.30 2 10.12 ... 12.40 2 43.10 2 48 2 57.5 2


15.25
2 (4) (2)
11.30 2 10.12 ... 12.40 2
SCem 5.6 2 5.72 5.0 2 ... 6.7 2 3.555
2
(148.6) 2
SCtotal 5.6 2 5.7 2 5.0 2 ... 6.7 2 31.73
(4) (3) (2)
33

RESUMEN DEL ANÁLISIS DE VARIANZA

Grados de Suma de Cuadrados F crítico


Fuentes de variación Valor de F
libertad cuadrados Medios (5%)
Tratamientos 2 12.92 6.46
Error Experimental 9 15.25 1.69 5.72* 2.80
Error de Muestreo 12 3.55 0.296
Total 23 31.73

* significativo al 0.05

Como F1 = 5.90 es F crítica (9,12,0.05) = 2.80, se procede a calcular F2 de la manera habitual,


utilizando el CMee:
CM trat 6.4629
F2 3.8144
CM ee 1.6943

Región de aceptación (o no rechazo)


de la hipótesis nula
DISTRIBUCIÓN F DE FISHER-
SNEDECOR

F (2,9,0.05) 4.26

Conclusión:

Como F2 Ft(2,9,0.05): se acepta Ho, por lo tanto todos los tratamientos producen el mismo
efecto.

CMee 1.71
CV 100 CV 100 21.13%
6.19
Y...

Nota: para obtener el valor p (p value) en MS Excel®, ingrese en el menú INSERTAR,


busque función (fx) y luego seleccione la categoría Estadísticas, y dentro de éstas DISTR.F. (X,
grados_de_libertad1, grados_de_libertad2). X es el valor al que desea evaluar la función, un número
no negativo. En X debe ingresar el valor de F2 = 3.8184, grados_de_libertad1 = 2 y
grados_de_libertad2 = 9. El valor p resultante = 0.06299081, que es mayor al valor de = 0.05;
concluyendo que todos los tratamientos producen el mismo efecto.
92

5.6 DISEÑO BLOQUES AL AZAR CON DATOS FALTANTES

Para ejemplificar esta situación, se utilizarán los datos de contenido de proteína (expresados en
porcentaje), obtenidos en el experimento sobre amaranto realizado por Alfaro Villatoro (1985).

CASO I: Supongamos que al realizar los análisis de proteína, la muestra correspondiente al


corte a 25 días en el 4º bloque fue extraviada.

Cuadro de datos

Edad al corte (días)


Bloque Y.j
25 40 60
1 30.6 22.4 13.6 66.6
2 28.5 24.1 13.1 65.7
3 29.1 26.3 15.8 71.2
4 Y14 24.3 20.2 44.5 = B
5 30.6 18.6 13.8 63.0
6 30.6 20.9 12.0 63.5
7 28.3 21.1 12.7 62.1
8 28.7 23.7 13.7 66.1
Yi. 206.4 = T 181.4 114.9 502.7 = S

a) Ho : i i= 1, 2, . . . / i =
Ha: i i =1,2, . . . / i  

b) Modelo Estadístico:
i = 1, 2, 3, . . . , t
Yij =  + i + j + ij j = 1, 2, 3, . . . , r
Siendo:

Yij = contenido de proteína (%) en la i-ésima época de corte y el j-ésimo bloque.


 = media general del contenido de proteína.
i = efecto de la i-ésima época de corte sobre el contenido de proteína
j = efecto del j-ésimo bloque sobre el contenido de proteína.
ij = error asociado a la ij-ésima unidad experimental.

c) Supuestos

ij ~ NID (0, 2)


No existe interacción bloque por época de corte

tT  rB  S
d) Estimación del dato faltante Yˆij 
(t  1) (r  1)
Siendo que:
t = número de tratamientos
T = total del tratamiento donde está el dato faltante.
r = número de repeticiones
B = total del bloque donde está el dato faltante
S = gran total.
93

Para nuestro caso tenemos que:


3(206.4)  8(44.5)  502.7
Yˆ14   33.8
(3  1) (8  1)
e) Análisis de varianza

Los cálculos para el análisis de varianza se hacen como habitualmente, con la única diferencia
de que al total y al error experimental se le resta un grado de libertad.

Incorporando la estimativa del dato faltante, tenemos que:

T = 240.2 B = 78.3 y S = 536.5, y las sumas de cuadrados son:

(536.5)2
SCtot  (30.6)2  (28.5) 2  . . .  (13.7) 2   1094.24
24
(66.6)2  (65.7)2  . . .  (66.1) 2 (536.5) 2
SCbloques    66.74
3 24

(240.2)2  (181.4)2  (114.9) 2 (536.5) 2


SCtrats    982.49
8 24

El resumen de análisis de varianza se presenta a continuación:

Grados Valor
Suma de Cuadrados Valor de
Fuentes de variación de crítico de
cuadrados medios F
libertad F
Edad al corte 2 982.49 491.24 141.98* 3.81
Bloques 7 66.74
Error Experimental 13 45.01 3.46
Total 22 1094.24

CV = 8.32 %

Conclusión: El contenido de proteína en las hojas de amaranto varía significativamente con la edad en
que la planta se corta.

f) Comparación múltiple de medias de acuerdo con el criterio de Tukey

 Para medias donde no hubo parcelas perdidas, se utiliza el comparador (W)

CMee
W  q(t , glee, ) 
r
 Cuando una de las medias a comparar es la que no tuvo pérdida de parcela, W se calcula así:

1 2 t 
W  q(t , glee, )  CMee   
2  r r (r  1)(t  1) 
94

CASO II: Supongamos ahora que por alguna razón hace falta los datos correspondientes a las
observaciones Y14 y Y35.

Cuadro de datos

Edad al corte (días)


Bloque Y.j
25 40 60
1 30.6 22.4 13.6 66.6
2 28.5 24.1 13.1 65.7
3 29.1 26.3 15.8 71.2
4 Y14 24.3 20.2 44.5
5 30.6 18.6 Y35 49.2
6 30.6 20.9 12.0 63.5
7 28.3 21.1 12.7 62.1
8 28.7 23.7 13.7 66.1
Yi. 206.4 181.4 101.1 488.9

Estimación de los datos faltantes: Y14 y Y35.

a.1) Se debe obtener una estimativa inicial para uno de los datos:

Y 1.  Y .4 (206.4 / 7)  (44.5 / 2)
Yˆ14    25.87
2 2
a.2) Luego se debe suponer que sólo hay un dato faltante y se estima con la siguiente ecuación:

T = 101.1
B = 49.2
S = 488.9 + 25.87 = 514.77

3(101.1)  8(49.2)  514.77


Yˆ35   13.01
(3  1) (8  1)

a.3) Se ignora la primera estimación de Y14 y se aplica la ecuación:

T = 206.4
B = 44.5
S = 488.9 + 13.01 = 501.91

3(206.4)  8(44.5)  501.91


Yˆ14   33.81
(3  1) (8  1)

a.4) Se repite el paso (a.2) usando la nueva estimación de Y14

T = 101.1
B = 49.2
S = 488.9 + 33.81 = 522.71
95

3(101.1)  8(49.2)  522.71


Ŷ35   12.44
(3  1) (8  1)

a.5) Se repite el paso (a.3) con Y35 =12.44

T = 206.4
B = 44.5
S = 488.9 + 12.44 = 501.34

3(206.4)  8(44.5)  501.34


Ŷ14   33.85
(3  1) (8  1)

Las estimaciones definitivas son: Yˆ14  33.85 y Yˆ35  12.44

Resumen del análisis de varianza

En el análisis de varianza la única modificación es que disminuye en dos, los grados de libertad para el
total y para el error experimental.

Grados
Suma de Cuadrados Valor de Valor crítico
Fuentes de variación de
cuadrados medios F de F
libertad
Edad al corte 2 1005.16 502.58 137.29* 3.89
Bloques 7 71.34
Error Experimental 12 43.93 3.66
Total 21 1120.43

CV = 8.58 %

Conclusión: la misma que en el caso 1.

El programa en SAS para poder obtener las estimaciones de los 2 datos faltantes, se presenta a
continuación:

DATA w1;
do trat= 1 to 3;
do bloque= 1 to 8;
input prot @;
output;
end;
end;
datalines;
30.6 28.5 29.1 0 30.6 30.6 28.3 28.7
22.4 24.1 26.3 24.3 18.6 20.9 21.1 23.7
13.6 13.1 15.8 20.2 0 12 12.7 13.7
;
/* covariable X, referente a la primera parcela perdida*/
96

data w2;
do trat= 1 to 3;
do bloque= 1 to 8;
input X @;
output;
end; end;
datalines;
0 0 0 -1 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
;
/* covariable X, referente a la segunda parcela perdida*/

data w3;
do trat= 1 to 3;
do bloque= 1 to 8;
input Y @;
output;
end; end;
datalines;
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 -1 0 0 0
;
/* Concatenación horizontal de los archivos w1, w2 y w3*/

data w; merge w1 w2 w3;


proc print data=w;
title "archivos concatenados";
run;

proc glm data=w;


class trat bloque;
model prot=trat bloque X Y/solution SS1 SS4;
run;

*********************************
Los valores de las estimaciones de los valores perdidos, proporcionadas por SAS se presentan a
continuación, compare los resultados con los obtenidos con el procedimiento presentado en el texto.

Parameter Estimate Standard Error t Value Pr > |t|


X 33.84717949 2.51165199 13.48 <.0001
Y 12.43948718 2.51165199 4.95 0.0003
CONTRASTES ORTOGONALES.

Los contrastes ortogonales se utilizan cuando se tienen un conjunto de tratamientos cualitativos con
estructura, de tal forma que es conveniente comparar un tratamiento contra el promedio de otros
tratamientos o un conjunto de tratamientos contra otro conjunto de tratamientos. Es decir, se prueban
hipótesis de la forma:

HO: 3T1 – T2 – T3 – T4 = 0 vs Hl : 3T1 – T2 – T3 – T4 ≠ 0

Esta hipótesis compara el efecto del tratamiento 1 contra el promedio de los efectos de los
tratamientos 2, 3, 4.

HO: T1 + T2 – T3 – T4 = 0 vs Hl : T1 + T2 – T3 – T4 ≠ 0

Esta hipótesis compara el efecto conjunto del tratamiento 1 y 2 contra el efecto conjunto de los
tratamientos 3 y 4.

En general se prueban hipótesis de la forma:

t t t
H 0 :   i ti =0 vs Hl :   i ti  0 ;con   i = 0
i =1 i =1 i =1

t
A la combinación lineal de tratamientos   i ti se le llama contraste, en donde los  i son los
i =1
coeficientes del contraste.
t
Dos contrastes (C1 y C2) son ortogonales si   i1 i 2 = 0
i =1
Por ejemplo, si los contrastes son:
C1 = T1 + T2 – T3 – T4
C2 = T1 – T2
C3 = T3 – T4
Entonces la tabla de coeficientes de los contrastes es:
T1 T2 T3 T4
C1 1 1 -1 -1
C2 1 -1 0 0
C3 0 0 -1 1

Los contrastes C1 y C2 son ortogonales porque:


t
  i1 i2 = 1112 +  21 22 +  31 32 +  41 42
i =1
= (1)(1) + (1)(-1) + (-1)(0) + (-1)(0) = 0

Los contrastes C1 y C3 son ortogonales porque:


t
  i2  i3 = 12 13 +  22  23 +  32  33 +  42 43
i =1
= (1)(0) + (-1)(0) + (0)(-1) + (0)(1) = 0
En un conjunto de tratamientos se pueden obtener conjunto de t-1 contrastes ortogonales.

EJEMPLO:
Consideremos un experimento donde se compararon 4 variedades de maíz con un diseño completamente al
azar.
Variedad 1. Precoz resistente.
Variedad 2. Precoz susceptible.
Variedad 3. Tardía resistente.
Variedad 4. Tardía susceptible.
Los datos del rendimiento son:
Variedades
Repetición T1 T2 T3 T4 Total
I 6 5 7 8 26
II 7 6 7 9 29
III 7 7 8 8 30
IV 8 8 9 10 35
V 7 8 9 9 33
Total 35 34 40 44 153

El análisis de varianza se calcula de acuerdo al análisis del diseño completamente al azar:

Fuentes de Gl SC CM Fcal Ftab


variación 5% 1%
Variedades 3 12.95 4.3167 4.43 3.24 5.29
Error 16 15.6 0.975
Total 19 28.55

Las hipótesis que se desean probar son:


1) H0: T1 + T2 – T3 – T4 = 0 Ts Hl : T1 + T2 – T3 – T4 ≠ 0

2) H0: T1 - T2 = 0 Ts Hl : T1 - T2 ≠ 0

3) H0: T3 – T4 = 0 Ts Hl : T3 – T4 ≠ 0

La primera hipótesis compara las variedades precoces (T1 y T2) contra tardías (T3 y T4)
La segunda hipótesis compara las dos variedades precoces (T1 vs T2) y
La tercera hipótesis compara las dos variedades tardías (T3 vs T4).

Estas hipótesis se prueban en un análisis de varianza.


La suma de cuadrados de tratamientos se particiona en tres partes, una para cada contraste. La tabla de
los contrastes es la que vimos anteriormente. La suma de cuadrados para contraste es:

C2j
SC (contrastej ) =
t
2
r  Cij
Donde: i =1
t
C j =  Cij Ti Cij = coeficiente del tratamiento i en el contraste j
i =1
Ti = Total del tratamiento i.

La suma de cuadrados son:


La tabla de análisis de varianza es:

Fuentes de Gl SC CM Fcal Ftab


Variación 5% 1%
Tratamientos 3 12.95 4.3166 4.43 4.24 5.29
C1 1 11.25 11.2500 11.54 4.49 8.53
C2 1 0.10 0.1000 0.10 4.49 8.53
C3 1 1.60 1.6000 1.64 4.49 8.53
Error 16 15.60 0.975
Total 19 28.55

El análisis de varianza muestra que el efecto conjunto de los tratamientos 1 y 2 es diferente al


efecto conjunto de los tratamientos 3 y 4. Los tratamientos 1 y 2 no son diferentes. Los
tratamientos 3 y 4 no difieren significativamente.
27

2.3 ANÁLISIS DE VARIANZA PARA UN EXPERIMENTO REALIZADO EN UN


DISEÑO COMPLETAMENTE AL AZAR DESBALANCEADO

El diseño completamente al azar es “NO BALANCEADO” (o DESBALANCEADO), cuando


los niveles del factor en estudio no poseen el mismo número de repeticiones, debido a parcelas
perdidas o a la falta de material experimental.

En este modelo, el hecho de no ser balanceado no trae alteraciones en el proceso del


ANDEVA, pero las pruebas utilizadas en las comparaciones múltiples pasan a ser apenas aproximadas.

Modelo estadístico: Yij = μ + τi + εij i = 1, 2,…, t


j = 1, 2,…, ri

t
siendo ri el número de repeticiones del tratamiento i , y ∑ r = n , el total de unidades experimentales
i =1
i

involucradas en el experimento.

Las hipótesis y los supuestos no varían, con respecto al DCA balanceado.

RESUMEN DEL ANÁLISIS DE VARIANZA

Fuentes de Grados de Cuadrados


Suma de cuadrados F
variación libertad Medios

t
Yi.2 Y..2
Tratamientos t−1 ∑
i =1 ri

n
SCtrat / gl trat CMtrat / CMee

Error t
Experimental ∑ ri − t SCtotal – SCtrat SCee / gl ee
i =1

t t ri
Y..2
Total ∑ ri − 1 ∑ ∑ Yij2 − n
i =1 i =1 j=1

t ri ri
∑ ∑ Yij ∑ Yij
t ri − i =1 j=1 − j=1
Y.. ∑ ∑ Yij Υ .. = Yi. =
t ri
i =1 j=1 ∑ ri
i =1
28

Ejemplo de Aplicación

Considere las siguientes producciones diarias (kg) de leche (con 4% de grasa) de vacas para
lactación, sometidas a la administración de raíces y tubérculos, como suplemento de invierno en la
alimentación; datos de un experimento citado por Gomes, FP (2000).

SIN MANDIOCA ARARUTA BATATA DOCE


SUPLEMENTO (Manihot esculenta) (Maranta arundinacea) (Ipomoea batata)
19.58 23.40 35.43 22.15
21.07 22.37 32.47 24.37
23.43 24.36 34.48 26.54
25.42 25.12 33.79 20.37
22.81 22.94 35.04 19.54
23.52 35.19 24.06

135.83 118.19 206.40 137.03


22.64 23.64 34.40 22.84
6 5 6 6

⎛ 135.832 118.192 206.402 137.032 ⎞ 597.452


SCtrat = ⎜ + + + ⎟− = 579.02
⎝ 6 5 6 6 ⎠ 23

597.452
( )
SCtotal = 19.582 + 21.07 2 + . . . + 24.062 −
23
= 646.06

SCee = 646.06 − 579.02 = 67.04

597.45
Y.. = = 25.98 kg
23

RESUMEN DEL ANÁLISIS DE VARIANZA

Fuentes de Grados de Suma de Cuadrados


Valor de F F(3, 19, 0.01)
variación libertad cuadrados Medios
Suplemento 3 579.02 193.01
54.68** 5.01
Error experimental 19 67.04 3.53
Total 22 646.06
** significativo al 1%

CV = 7.23%

Con un nivel de significancia de 1% se rechaza la Ho, verificándose que existe efecto de la


suplementación sobre la producción diaria de leche.
119

CAPÍTULO 7
DISEÑO CUADRADO LATINO

7.1 INTRODUCCIÓN

Este diseño también es conocido como diseño con un factor y dos restricciones en la
aleatorización. De esta forma se tiene que el control local, representado por los bloques, es organizado
de dos maneras diferentes, siendo uno organizado en el sentido de las filas (o hileras) y otro
organizado en el sentido de las columnas.

En los experimentos que se realizan en el campo, este diseño es utilizado cuando existe
necesidad de eliminar la heterogeneidad del suelo en dos direcciones perpendiculares, esto es, las filas
en una dirección y las columnas en otra dirección.

En general, un cuadrado latino para p factores, o sea, un cuadrado latino de tamaño pp, es un
cuadrado que contiene p fila y p columnas. Cada una de las p2 celdas contiene una de las p letras que
corresponden a un tratamiento, y cada letra aparece una sola vez en cada fila y en cada columna, de tal
manera que cualquier comparación de tratamientos no se vea afectada por las diferencias existentes
entre hileras o entre columnas. En este diseño el número de filas o hileras (h), el número de columnas
(c) y el número de tratamientos (t) debe ser igual.

7.1.1 Criterios de bloqueo

Se tiene un experimento planeado en un diseño cuadrado latino, con cinco tratamientos, identificados
como: A, B, C, D y E, por lo que, se deben tener cinco filas y cinco columnas. La localización de las
parcelas en el área experimental se muestra en el siguiente croquis:

Gradientes de heterogeneidad

Columna 1 Columna 2 Columna 3 Columna 4 Columna 5

Fila 1 A B C D E

Fila2 E A B C D

Fila 3 D E A B C

Fila 4 C D E A B

Fila 5 B C D E A

 Nota: Recuerde que la estructura de distribución de las unidades experimentales es conceptual y no


necesariamente física. A continuación se presentan algunos ejemplos, para ilustrar esta situación.
120

Ejemplo 7.1
Se encuentran bajo estudio el efecto que tienen cinco reactivos distintos (A, B, C, D y E) sobre
el tiempo de reacción de un proceso químico. Cada lote de material nuevo es lo suficientemente
grande para permitir que sólo se realicen cinco ensayos. Mas aún, cada ensayo tarda aproximadamente
una hora y media, por lo que solo pueden realizarse cinco ensayos por día. El investigador decide
efectuar el experimento utilizando el diseño cuadrado latino, con el fin de controlar sistemáticamente
las variables lote de material y día

La distribución de los tratamientos se muestra a continuación:

Día
Lote
1 2 3 4 5
1 A B D C E
2 C E A D B
3 B A C E D
4 D C E B A
5 E D B A C

Ejemplo 7.2
Un ingeniero industrial está investigando el efecto que tienen cuatro métodos de ensamblaje
(A, B, C y D) sobre el tiempo de ensamblaje de un componente para televisores a color. Se
seleccionaron cuatro operadores para realizar el estudio. Por otra parte, el ingeniero sabe que cada
método de ensamblaje produce fatiga, por lo que el tiempo que se tarda en el último ensamblaje puede
ser mayor que en el primero, independientemente del método. En otras palabras, se produce un patrón
en el tiempo de ensamblaje. Para controlar esta posible fuente de variación (variabilidad), el ingeniero
utilizó el diseño cuadrado latino, que aparece a continuación:

Orden de Operador
montaje 1 2 3 4
1 C D A B
2 B C D A
3 A B C D
4 D A B C

7.1.2 Aleatorización

Cuadrado Latino Reducido:

Es aquel en el cual la primera hilera y la primera columna están dispuestas en orden alfabético.

Procedimiento para la aleatorización

a. Seleccionar un cuadrado latino reducido

b. Permutar hileras aleatoriamente

c. Permutar columnas aleatoriamente

d. Asignar los tratamientos a las letras al azar.


121

Los incisos b,c,d se pueden realizar usando una tabla de números aleatorios, o bien a través de
un simple sorteo. A continuación se muestra un ejemplo de aleatorización para un cuadrado latino de
tamaño 5  5

a) Cuadrado latino reducido b) Aleatorizar filas c) Aleatorizar columnas

C1 C2 C3 C4 C5 C4 C1 C3 C2 C5
F1 A B C D E F3 C D E A B A C E D B
F2 B C D E A F1 A B C D E D A C B E
F3 C D E A B F5 E A B C D C E B A D
F4 D E A B C F2 B C D E A E B D C A
F5 E A B C D F4 D E A B C B D A E C

7.2 ANÁLISIS ESTADÍSTICO

A continuación se presentan una tabla de datos para un cuadrado latino 4 x 4:


Columnas
Total filas
Filas 1 Yi..
2 3 4
1 Y11k Y12k Y13k Y14k Y1. .
2 Y21k Y22k Y23k Y24k Y2. .
3 Y31k Y32k Y33k Y34k Y3. .
4 Y41k Y42k Y43k Y44k Y4. .
Total columnas Y. . .
Y.j. Y. 1 . Y. 2 . Y. 3 . Y. 4 . (Gran total)
siendo k = 1,2,3,4.

La tabla anterior se obtiene sin modificar el croquis de campo. Puede generarse una tabla
adicional para los tratamientos, sumando todas las veces que se repitió cada tratamiento, obteniendo
así el respectivo total (Y. . k), como se indica a continuación:

Tratamientos

1 2 3 4
Yij1 Yij2 Yij3 Yij4
Yij1 Yij2 Yij3 Yij4
Yij1 Yij2 Yij3 Yij4
Yij1 Yij2 Yij3 Yij4
Total Tratamientos
Y. . 1 Y. . 2 Y. . 3 Y. . 4
Y. . k
Media Tratamientos
y..1 y..2 y..3 y..4
y..k
122

y...
Media general = y... 
t2

7.2.1 Modelo Estadístico Matemático

Yijk = µ + Fi + Cj + k + ijk

i = 1,2,3, . . . t
j = 1,2,3, . . . t h =c = t
k =1,2,3, . . . t

siendo que:

Yijk = Valor observado correspondiente al k – ésimo tratamiento en la i-ésima fila con la j-ésima
columna.

µ = Media general de la variable de respuesta.

Fi = Efecto de la i - ésima fila en la variable dependiente y mide la separación de la media µi..


en relación a la media µ, esto es: Fi =µi..  µ; µi..= media poblacional de la i-ésima línea.

Cj = Efecto de la j - ésima columna en la variable dependiente y mide la separación de la media


µ.j. en relación a la media µ, esto es: Cj = µ.j.  µ; µ.j. = media poblacional de la j-ésima
columna.

k = Efecto del k - ésimo tratamiento en la variable dependiente y mide la separación de la


media µ..k en relación a la media µ, esto es: k = µ.j.  µ; µ..k = media poblacional del k-
ésimo tratamiento.

ijk = Error experimental asociado al valor observado Yijk.

7.2.2 Supuestos

ijk ~ NID (0, 2)

No existe interacción entre filas y tratamientos.

No existe interacción entre columnas y tratamientos.

7.2.3 Hipótesis

Ho:  = i (Todos los tratamientos producen el mismo efecto)

Ha:   i para al menos un i; i = 1,2, . . . t. (Al menos uno de los tratamientos produce efectos
distintos)
123

7.2.4 Tabla de Análisis de Varianza

FV GL SC CM Valor de F
t

Tratamientos t1 Y 2
.. k
Y..2. SCtrat/GLtrat CMtrat/CMee
k 1
 2
t t

Filas t1 Y 2
i ..
Y...2
i 1

t t2

Columnas t1 Y
j 1
2
. j.
Y...2

t t2

Error SC total (SC trat + SCH +


experimental (t 1) (t  2) SCC) SCee/GLee

Total t2  1 t t t Y..2.
  Y
i 1 j 1 k 1
2
ijk 
t2

Regla de Decisión

Rechazar Ho. sí Valor de F  Valor crítico de F (gl trat; gl error; )


No Rechazar Ho. sí Valor de F < Valor crítico de F (gl trat; gl error; )

7.2.5 Ejemplo de aplicación

En un experimento sobre evaluación de variedades de caña de azúcar realizado en Brasil,


citado por Gomes,FP (2000), fueron usadas cinco variedades: Co-290 (A), Co-421 (B), Co-419 (C),
POJ-2878 (D) y CP-3613 (E), dispuestas en un cuadrado latino de tamaño 55. Las producciones de
caña en kilogramos por parcela son dadas en la tabla siguiente:

Yi..
D 432 A 518 B 458 C 583 E 331 2322
C 724 E 478 A 524 B 550 D 400 2676
E 489 B 384 C 556 D 297 A 420 2146
B 494 D 500 E 313 A 486 C 501 2294
A 515 C 660 D 438 E 394 B 318 2325
Y.j. 2654 2540 2289 2310 1970 11763
124

Cuadro Auxiliar

Total Media
Variedad Tratamientos Tratamientos
Y. . k Y.. k
Co-290 (A) 2463 492.6
Co-421 (B) 2204 440.8
Co-419 (C) 3024 604.8
POJ-2878 (D) 2067 413.4
CP-3613 (E) 2005 401.0

11763 2352.6

(2, 463)2  . . .  (2, 005) 2 11, 7632


SCtrats    137, 488
5 25

(2,322)2  . . .  (2,325) 2 11, 7632


SCfilas    30, 480
5 25

(2, 654)2  . . .  (1,970) 2 11, 7632


SCcolumnas    55, 640
5 25

11, 7632
SCtotal  (432)2  (518)2  . . .  (318) 2   257, 724
25

SCerror  257,724 137, 488  30, 480  55,640  34,116

Resumen del análisis de varianza

Fuentes de Grados de Suma de Cuadrados F crítica


Valor de F
variación libertad cuadrados Medios (4,12,0.05)
Variedades 4 137,488 34,372 12.09* 3.26
Filas 4 30,480
Columnas 4 55,640
Error
12 34,116 2,843
Experimental
Total 24 257,724
CME 2,843
CV   100  100  11.33%
Y... 470.52

De acuerdo con los resultados del análisis de varianza, se concluye que las variedades
presentan efectos diferenciados en cuanto a la producción de caña de azúcar, por lo tanto se
recomienda efectuar el respectivo análisis post-anova.
74

CAPÍTULO 5
DISEÑO EN BLOQUES COMPLETOS AL AZAR

5.1 INTRODUCCIÓN

El diseño en bloques completos al azar (DBA) toma en cuenta los tres principios básicos de la
experimentación: repetición, aleatorización y control local. En este diseño las unidades experimentales
se distribuyen en grupos homogéneos. Cada uno de estos grupos es llamado: bloque. El número de
unidades experimentales dentro de cada bloque es igual al número de tratamientos incluidos en el
experimento. Un caso particular de diseño de bloques es el que aparece relacionado con la prueba de t
para muestras pareadas, aunque el número de tratamientos es sólo dos.

Los tratamientos son distribuidos en las unidades experimentales dentro de cada bloque
aleatoriamente, así, cada bloque irá a constituir una repetición. Este tipo de experimento es
seleccionado cuando se tienen dudas acerca de la homogeneidad del ambiente o cuando, por
experiencia, se sabe de su heterogeneidad.

5.1.1 Criterios de bloqueo

Este diseño es conveniente cuando se logra determinar un gradiente de variabilidad en un


sentido, que esté influyendo sobre los tratamientos, por ejemplo: grado de inclinación del terreno
donde se realizará el experimento, dirección del viento, gradiente de temperatura, gradiente de
fertilidad, de luminosidad, etc. Los bloques se construyen perpendiculares a la dirección del gradiente
de variabilidad.

5.1.2 Aleatorización

Se aleatorizan las tratamientos dentro de cada bloque. Debe considerarse que la aleatorización
se realizará de forma independiente para cada bloque.

Ejemplo

Suponiendo que se tiene un experimento que incluye un factor con 5 niveles (denotados con las letras
A, B, C, D y E), distribuidos en 4 bloques, y considerando que en cada bloque los niveles del factor
fueron totalmente aleatorizados, el croquis de campo quedaría de la siguiente forma:

A C D E B BLOQUE I

D A B E A BLOQUE II

D B A C E BLOQUE III

E D B A C BLOQUE IV
75

El proceso de aleatorización puede ser simplificado, utilizando el procedimiento PROC PLAN del
programa SAS, conforme se presenta a continuación, para el ejemplo anterior, 5 tratamientos en 4
bloques.

**********************************************************************************
Programa

Title "Aleatorización de los tratamientos en un DBA";


PROC Plan seed=1820403;
Factors bloques=4 parcelas=5 ORDERED;
Treatments Trat=5 RANDOM;
Output out=croquis Trat cvals= ("A" "B" "C" "D" "E");
RUN;
PROC Print DATA=croquis;
RUN;

**********************************************************************************
Salida
Aleatorización de los tratamientos en un DBA

The PLAN Procedure


Plot Factors
Factor Select Levels Order
Bloques 4 4 Random
Parcelas 5 5 Ordered

Treatment Factors
Factor Select Levels Order
Trat 5 5 Random

bloques parcelas Trat


2 1 2 3 4 5 3 1 2 4 5
4 1 2 3 4 5 2 1 5 3 4
1 1 2 3 4 5 1 2 5 4 3
3 1 2 3 4 5 5 1 4 2 3

Para realizar el proceso de aleatorización en otros diseños experimentales utilizando PROC Plan de
SAS, puede consultar el libro “Experimentação Agronômica I” de la Dra. Maria Cristina Stolf
Nogueira (2007). En el programa R también es posible realizar la aleatorización de los tratamientos.
Para ampliar esta parte puede comunicarse por email con los autores del presente texto (Ezequiel
López o Byron González).
76

El croquis de campo para este ejemplo se presenta a continuación.


Obs Bloques Parcelas Trat Obs Bloques Parcelas Trat
1 2 1 C 11 1 1 A
2 2 2 A 12 1 2 B
3 2 3 B 13 1 3 E
4 2 4 D 14 1 4 D
5 2 5 E 15 1 5 C
6 4 1 B 16 3 1 E
7 4 2 A 17 3 2 A
8 4 3 E 18 3 3 D
9 4 4 C 19 3 4 B
10 4 5 D 20 3 5 C

5.2 ANÁLISIS ESTADÍSTICO

Sea t el número de niveles del factor A (tratamientos) distribuidos en r bloques. La notación


adoptada para representar los valores de la variable de respuesta es dada en la tabla siguiente:

Repeticiones
Yi.
Tratamientos 1 2 3 ... R

1 Y11 Y12 Y13 ... Y1r Y1.


2 Y21 Y22 Y23 ... Y2r Y2.
3 Y31 Y32 Y33 ... Y3r Y3.
. . . . ... . .
. . . . ... . .
T Yt1 Yt2 Yt3 ... Ytr Yt.
Y.j Y. 1 Y. 2 Y. 3 ... Y. r Y ..
Siendo que:

t
Y. j   Yij es el total obtenido en el j-ésimo bloque o repetición
i 1

r
Yi.   Yij es el total obtenido en el i-ésimo tratamiento
j 1

t r
Y..   Yij es el total general o gran total
i 1 j 1

Y.. Yi.
Y ..  es la media general Y i.  es la media del i-ésimo tratamiento
tr r
77

5.2.1 Hipótesis a evaluar

Ho : i i = 1,2, . . . / i =
Ha: i i = 1,2, . . . / i  

5.2.2 Modelo estadístico

El modelo asociado a este diseño experimental se muestra a continuación:

i = 1, 2, 3, . . . , t
Yij =  + i + j + ij j = 1, 2, 3, . . . , r

Siendo:
Yij = variable de respuesta observada o medida en el i-ésimo tratamiento y el j-ésimo
bloque.
 = media general de la variable de respuesta
i = efecto del i-ésimo tratamiento
j = efecto del j-ésimo bloque
ij = error asociado a la ij-ésima unidad experimental.

5.2.3 Supuestos

ij ~ NID (0, 2)


No existe interacción entre bloque y tratamiento, lo que significa que un tratamiento no debe
modificar su acción (o efecto) por estar en uno u otro bloque.

5.2.4 Análisis de Varianza



FV GL SC CM Valor de F

r Y. 2j Y..2
Bloques r- 1 
j 1 t

tr

t–1 t
Yi.2 Y..2 SCtrat /gltrat CMtrat/CMee
Tratamientos 
i 1 r

tr

Error SCtotal SCtrat  SC bloque)


(t -1) (r -1) SCee /glee
experimental

t r
Y..2
Total tr – 1 
i 1

j1
Yij 
tr
2

CME
CV(%)   100
Y..
78

Regla de Decisión

Rechazar Ho. Sí el valor de F  F crítica (gl trat; gl error; )


No Rechazar Ho. Sí el valor de F < F crítica (gl trat; gl error; )

5.2.5 Ejemplo de aplicación

En un experimento se evaluó la aplicación de productos químicos para el control de nematodos.


Fueron utilizados los siguientes tratamientos:

A. Testigo absoluto (sin aplicación).


B. Oxamyl 1.5 lt (forma de aplicación: foliar)
C. Oxamyl 1.5 lt (forma de aplicación: al suelo)
D. Oxamyl 2.0 lt (forma de aplicación: foliar)
E. Carbofuran 15 gr. (aplicado al suelo)
F. Oxamyl 2.0 lt (forma de aplicación: al suelo)

Los tratamientos fueron analizados en un diseño bloques al azar con cinco repeticiones. La
variable de respuesta medida fue el número de nematodos vivos por unidad experimental. Los datos
obtenidos se presentan en la siguiente tabla:

Bloques
Yi. Y i.
Nematicidas I II III IV V
A 307 371 379 360 339 1756 351.2
B 187 192 320 243 296 1238 247.6
C 277 328 363 195 344 1507 301.4
D 115 235 248 267 256 1121 224.2
E 173 267 251 254 200 1145 229.0
F 195 131 171 253 253 1003 200.6
Y.j 1254 1524 1732 1572 1688 7770 259

Se le solicita realizar el análisis de varianza y emitir las respectivas conclusiones.

Solución:

(1756)2  (1238)2  (1507)2  (1121)2  (1145)2  (1003)2 (7770)2


SCtrat    79, 750.8
5 (5)(6)

(1254)2  (1524)2  (1732)2  (1572)2  (1688)2 (7770)2


SCbloques    23, 477.33
6 (5)(6)

(7770)2
SCtotal  (3072  3712  3792  . . .  2532 )   148,922
(5)(6)
79

Resumen del análisis de varianza

Grados de Suma de Cuadrados Valor crítico


Fuentes de variación Valor de F
libertad cuadrados medios de F
Nematicidas 5 79750.80 15950.16 6.98* 2.71
Bloques 4 23477.33 5869.33
Error Experimental 20 45693.87 2284.69
Total 29 178922.00
2284.69
CV(%)   100  18.45%
259
Conclusión: Los nematicidas evaluados producen diferente efecto en el control de nematodos.

5.3 EJERCICIOS PROPUESTOS, DBA

1. Los datos siguientes fueron obtenidos de un experimento realizado en el Departamento de


Botánica de la ESALQ/USP en 1988. Fue utilizado un diseño en bloques completos al azar, con
4 bloques y 5 tratamientos (T1 = control, T2 = Giberelina 50 ppm, T3 = Ácido naftalenoacético
100 ppm, T4 = Chlormequat 1,500 ppm y T5=Daminozide 3,000 ppm). La variable de respuesta
fue rendimiento de frutos (gramos por parcela) de la variedad de fresa (Fragaria vesca)
Campinas. Cada unidad experimental estuvo formada por dos líneas de 1.5  2.0 m, con 10
plantas. Los resultados se presentan a continuación:

Bloques
Tratamientos I II III IV Yi.
T1 374.68 459.15 306.79 350.32 1490.94
T2 524.67 281.95 294.41 405.91 1506.94
T3 329.10 258.81 294.04 443.72 1325.67
T4 164.02 378.15 297.22 275.75 1115.14
T5 451.57 417.70 348.12 351.56 1568.95

Realice el ANOVA y en caso de ser necesario una prueba post-ANOVA.

2. En un experimento de riegos en el cultivo de algodón (Gossypium hirsutum L.) se evaluaron los


siguientes tratamientos que están expresados en metros cúbicos de agua absorbidos por
hectárea: T1=5400, T2=4800, T3=4200 y T4=3600. El experimento se condujo en parcelas de
300 m2 de área útil y los resultados están expresados en kilogramos por unidad experimental.

Tratamientos
Bloques T1 T2 T3 T4 Y.j
I 68 73 53 50 244
II 86 90 62 62 300
III 68 71 46 50 235

a) Plantee el modelo y defina sus componentes


b) Defina las hipótesis y construya el cuadro de ANOVA. Utilice =0.05
c) Efectúe la prueba de Tukey para comparar las medias de los tratamientos.
14

UNIDAD 3. DISEÑO COMPLETAMENTE AL AZAR


Definiciones
El diseño completamente al azar es el más simple y utilizado de todos. Es aplicable
cuando las unidades experimentales son homogéneas y la administración del
experimento es uniforme para todas ellas. Al concluir el experimento las unidades
experimentales mostrarán diferentes resultados atribuibles en forma exclusiva a los
tratamientos aplicados.
Este diseño es muy utilizado en experimentos de laboratorio, invernadero, almácigo
y establos, en los que el material experimental (macetas, bandejas, almácigos,
animales, etc.) es muy homogéneo por prepararse en forma provisional, y porque el
experimento se conduce en condiciones ambientales controladas y uniformes para
todas las unidades experimentales.
Ventajas
Los tratamientos, en experimentos unifactoriales, pueden tener igual o diferente
número de repeticiones. Sin embargo cuando se estudia más de un factor es
recomendable tener el mismo número de repeticiones.
Es el diseño que tiene el mayor número de grados de libertad asignados al error
experimental, beneficiando la estimación del mismo y logrando una mayor precisión
en la estimación de las medias de los tratamientos y de las diferencias de éstas.
Tratamientos
En este diseño, como en cualquier otro, es muy importante seleccionar
adecuadamente los tratamientos de estudio. Tratamiento es aquello que se aplica
como se dijo antes a las unidades experimentales o la forma en que éstas son
administradas. Ahí son tratamientos razas de animales, dosis de vacunas, dosis de
fertilización, diferentes pesticidas, herbicidas, formas de riego, etc.; así como las
diferentes combinaciones que pueden hacerse con los niveles de estos factores.
Los tratamientos pueden ser escogidos o fijados por el investigador. El primer caso,
llamado modelo al azar, es relativamente frecuente en investigaciones de
mejoramiento genético, para la evaluación de poblaciones o familias. Estudios sobre
las dosis, pesticidas, sistemas de riego constituyen el segundo caso, llamado
modelo fijo. La forma de seleccionar los tratamientos no afecta el cálculo del análisis
de varianza, pero sí los cuadrados medios esperados y las pruebas de comparación
de medias.
Cualquiera que sea la forma de seleccionar los tratamientos, estos deben
corresponder a los objetivos del experimento y a las hipótesis a ser probadas.
Modelo aditivo lineal

Yij = µ +τj + εij

Diseños Experimentales. Teoría y práctica para


experimentos agropecuario
15

i = 1, …..3, b = Tratamientos
j = 1, ..., 14, c = Repeticiones
Donde:
Yij = Valor observado de una variable de respuesta, en el i-esimo
bloque, que recibe el j-ésimo cultivar.
µ = Media general del ensayo
τj = Efecto fijo del j-ésimo cultivar.
2
εij =Efecto aleatorio de los residuales; εij ~ NIID(0,σ e)
Pasos de análisis
1. Se calcula el factor de corrección C
C=G2/ Σ ri
2. Se calcula la suma de cuadrados debido al total
SCTOTAL = Yij2 – C
3. Se calcula la suma de cuadrados debido a los tratamientos de parcela grande
SCT = ΣTij2/ ri - C
4. Análisis de varianza
Este análisis permite determinar la variabilidad debida al material experimental y la
variabilidad ocasionada por los tratamientos. Estas variaciones son importantes
para estimar cuál es el efecto de los tratamientos y cuál es la diferencia entre ellos.
La variación se mide a través del Cuadrado Medio, que es la división de la suma de
cuadrados entre los grados de libertad. Las sumas de cuadrados del análisis de
varianza puede deducirse a partir del modelo lineal.

Fuente de Grados Suma de Cuadrados F


variación de Cuadrado medios
libertad s
Tratamientos (T) t-1 SCT CMT=SCT/t-1 CMT/SCE

Error Σ ri – t SCE CME=SCE/ tr-1=s2


experimental
Total Σ ri – 1 SCTOTAL

Prueba de hipótesis:
Ho: t1=t2=t3=…tn
H1: t1≠t2≠t3=…tn

Estadístico de prueba F:
F α (t-1, gl error)
Se rechaza Ho sí: Fcal ≥ F α (t-1, gl error)
Se acepta Ho sí: Fcal ≤ F α (t-1, gl error)

Diseños Experimentales. Teoría y práctica para


experimentos agropecuario
18

CAPÍTULO 2
DISEÑO COMPLETAMENTE AL AZAR

2.1 INTRODUCCIÓN

En este tipo de diseño están incluidos los principios de repetición y de aleatorización, o sea
que, es utilizado cuando no hay necesidad del control local, debido a que el ambiente experimental es
homogéneo y los tratamientos se asignan a las unidades experimentales mediante una aleatorización
completa, sin ninguna restricción.

2.1.1 Ventajas

a. La estructura del análisis estadístico es simple.


b. Permite máxima flexibilidad en cuanto al número de tratamientos y número de
repeticiones.
c. La pérdida de observaciones durante la conducción del experimento no genera dificultades
en el análisis y en la interpretación de los resultados.
d. Reúne el mayor número de grados de libertad en el residuo, en comparación con otros
diseños.

2.1.2 Inconvenientes

a. Cuando el número de unidades experimentales es muy grande es difícil encontrar lugares


grandes que presenten la homogeneidad requerida.

b. Debido a que las fuentes de variación no asociadas a los tratamientos o a los niveles del
factor en estudio, están incluidas en el residuo como variación del azar, la buena precisión
de los análisis se ve comprometida.

2.1.3 Aleatorización

Considerando un experimento con t = 5 niveles del factor A (tratamientos) y r = 4 repeticiones


para cada nivel, se tiene que el número total de unidades experimentales (parcelas) incluidas en el
experimento es t × r = 5 × 4 = 20. Las (t × r) parcelas serán aleatorizadas sin restricciones, los t niveles
del factor A en estudio con sus r repeticiones, conforme se muestra en el siguiente croquis.

A1 A4 A3 A4 A2

A4 A2 A1 A5 A3

A2 A5 A2 A1 A3

A5 A3 A4 A5 A1
19

Las respuestas obtenidas en función de la aplicación de cada nivel del factor A en estudio en
sus respectivas repeticiones pueden ser representadas por yij, que es considerada como una variable
aleatoria.

2.2 ANÁLISIS ESTADÍSTICO

A continuación se muestra la representación de las observaciones de un experimento, con un


factor con t tratamientos (o niveles) y r repeticiones.

Tratamientos Repeticiones yi.


1 2 3 ... r
1 y11 y12 y13 ... y1r y1.
2 y21 y22 y23 ... y2r y2.
3 y31 Y32 y33 ... y3r y3.
. . . . . . .
. . . . . . .
. . . . . . .
t yt1 yt2 yt3 ... ytr yt.

− Y..
2.2.1 Hipótesis Y.. =
tr

Ho: τ = τi (Todos los tratamientos producen el mismo efecto)

Ha: τ ≠ τi para al menos un i; i = 1,2, . . . t. (al menos uno de los tratamientos produce
efectos distintos)

2.2.2 Modelo Estadístico

Yij = µ + τi + εij i = 1,2, . . . t


j = 1,2, . . . r
siendo,

Yij = variable de respuesta de la ij-ésima unidad experimental

µ = media general de la variable de respuesta

τi = efecto del i - ésimo tratamiento (nivel del factor) en la variable dependiente.

εij = error experimental asociado a la ij-ésima unidad experimental

2.2.3 Supuestos

Las suposiciones que validan el análisis de varianza son:


20

a. Los errores son independientes.


b. Los errores están normalmente distribuidos con media cero y varianza constante
c. Existe homogeneidad de varianzas entre los tratamientos
d. El modelo es lineal y de efectos aditivos.

2.2.4 Descomposición de la suma de cuadrados total

El análisis de varianza es un proceso aritmético y estadístico, que consiste en descomponer la


variación total en fuentes o causas de variación. Por variación total se entiende, la variación entre las
unidades experimentales (o parcelas).

La variabilidad total de las observaciones Yij, cuando no se considera la información acerca de


los tratamientos, es medida en términos de la desviación total de cada observación, esto es, la
desviación de los Yij alrededor de la media general Y . . :

Yij − Y . . (1)
Cuando se utiliza información acerca de tratamientos, las desviaciones entre cada observación
Yij alrededor de la media estimada de su respectivo tratamiento, reflejan la incertidumbre restante en
los datos, y es dada por:

Yij − Y i. (2)
La diferencia entre las desviaciones (1) y (2) refleja la diferencia entre la media estimada de
tratamientos y la media general:

(Yij − Y . . ) − (Yij − Y i. ) = Y i. − Y . . (3)

Note que a partir de la ecuación (3), se puede descomponer la desviación total Yij − Y .. en dos
componentes:

Yij − Y . . = Y i. − Y . . + Yij − Y i. (4)

Desviación total Desviación de la media Desviación alrededor de


estimada de tratamiento la media estimada de
alrededor de la media tratamiento.
general

A partir de esto, la desviación total Yij − Y .. puede ser vista como la suma de dos componentes:

1. La desviación de la media estimada de tratamientos alrededor de la media general.

2. La desviación de Yij alrededor de la media estimada de su tratamiento, que es simplemente, el


residuo eij.
21

A partir de la ecuación (4) se pueden obtener las expresiones matemáticas utilizadas para
calcular las sumas de cuadrados de tratamientos, error experimental y total. Para realizarlo, se inicia
obteniendo la suma de cuadrados de la desviación total:

( Yij − Y . . )2 = [ ( Y i. − Y . . ) + (Yij − Y i. ) ]2

Luego, se obtiene la sumatoria de las desviaciones totales al cuadrado:

2
t r __
⎡ __ __
t r __

∑∑
i =1 j =1
(Yij − Y ..) =2
∑∑ ⎢
i =1 j =1 ⎣
(Y i . − Y ..) + (Yij − Y i. )


(5)

t r __
Como ∑∑ (Yij − Y ..)2 = Suma cuadrados total, y desarrollando el binomio de lado derecho de la
i =1 j =1
ecuación (5), ésta quedaría así:

t r
⎡ __ __ __ __ __ __

SC total = ∑∑ ⎢(Y i. − Y ..) 2 + 2(Y i. − Y ..)(Yij − Y i. ) + (Yij − Y i. ) 2 ⎥ (6)
i =1 j =1 ⎣ ⎦

Sumando primero sobre j, la ecuación (6) queda:

t ⎡ __ __ __ __ r __ r __ ⎤
SC total = ∑ ⎢r (Y i. − Y ..) 2 + 2 (Y i. − Y ..)∑ (Yij − Y i. ) + ∑ (Yij − Y i. ) 2 ⎥
i =1 ⎣ j =1 j =1 ⎦

r __ r __ Yi.
Donde: ∑ (Yij − Y i. ) = ∑ Yij − r Y i. = Yi. − r
j =1 j =1 r
= Yi. − Yi. = 0 , por tanto

__ __ r __
2 (Y i. − Y ..)∑ (Yij − Y i. ) = 0, entonces:
j =1

t __ __ t r __
SC total = r ∑ (Y i. − Y ..) 2 + ∑∑ (Yij − Y i. ) 2
i =1 i =1 j =1

Suma de cuadrados Suma de cuadrados del


de tratamientos error experimental
t __ __
SCtrat = r ∑ (Y i. − Y ..) 2
i =1
t __ __ __ __ t __ __ t __ __
= r ∑ (Y i. − 2 Y i. Y .. + Y ..2 ) = r ∑ Y i. − 2r Y ..∑ Y i. + (tr ) Y ..2 (7)
2 2

i =1 i =1 i =1
22

__ Yi . t __
Yi .2
t t
Yi .2
, r ∑ Y i. = r ∑ ∑
2
Para el primer término de la ecuación (7), como: Y i. = 2
=
r i =1 i =1 r i =1 r

__ t __ __ t Yij
En el caso del segundo término − 2 r Y .. ∑Y
i =1
i. , se sabe que Y i. = ∑
i =1 r
, se tiene que:
t r

t __ t r Yij __
∑∑ Y ij

∑Y = ∑∑
i =1 j =1
i. , y Y .. = entonces:
i =1 i =1 j =1 r tr

t r t r t r

__ t __
∑∑ Yij t r Yij ∑∑ Yij ∑∑ Y ij

− 2 r Y ..∑ Y i. = − 2 r ∑∑
i =1 j =1 i =1 j =1 i =1 j =1
= −2 =
i =1 tr i =1 j =1 r tr

2
t r ⎛ t r
t ⎞ r

∑∑ Yij ∑∑ ij Y ⎜ ∑∑ Yij ⎟
⎜ ⎟
−2
i =1 j =1 i =1 j =1
=− 2 ⎝ i =1 j =1 ⎠
tr tr

Para finalizar, analicemos el tercer término:


2
t r ⎛ t r ⎞
∑∑ Y ⎜ ∑∑ Yij ⎟
Y ..2 ⎜⎝ i =1 j =1 ⎟⎠
ij
__
Y .. i =1 j =1
__
Y ..2
Sí Y .. = = , entonces (tr ) Y ..2 = (tr ) = = , entonces:
tr tr (tr ) 2 (tr ) tr

2 2 2
⎛ t r ⎞ ⎛ t r ⎞ ⎛ t r ⎞
⎜ ∑∑ Yij ⎟ ⎜ ∑∑ Yij ⎟ ⎜ ∑∑ Yij ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
−2⎝ ⎠ + ⎝ ⎠ = − ⎝ i =1 j =1 ⎠
i =1 j =1 i =1 j =1
.
tr tr tr

La expresión de suma de cuadrados para tratamientos (o sea, entre tratamientos) queda de la siguiente
manera:

2
⎛ t r ⎞
⎜ ∑∑ Yij ⎟
Yi .2 ⎜ ⎟
− ⎝ ⎠ .
t


i =1 j =1

i =1 r tr

t r __
Para el caso de la suma de cuadrados total: ∑∑ (Yij − Y ..) 2 , se tiene al desarrollar el binomio:
i =1 j =1

⎡ t r
⎤ __ __
SCtotal = ∑∑ ⎢(Yij ) 2 − 2(Yij Y ..) + (Y ..) 2 ⎥ , y al distribuir las sumatorias:
i =1 j =1 ⎣ ⎦
23

t r __ t r __
SCtotal = ∑ ∑ Yij − 2 Y ..∑∑ Yij + tr Y ..2 , y como:
2

i =1 j =1 i =1 j =1
2
⎛ t r ⎞
⎜ ∑∑ Yij ⎟
__
Y ..2 Y ..2 ⎜⎝ i =1 j =1 ⎟⎠
(tr ) Y ..2 = (tr ) = = , la suma de cuadrados total queda:
(tr ) 2 (tr ) tr

2 2 2
⎛ t r ⎞ ⎛ t r ⎞ ⎛ t r ⎞
⎜ ∑∑ Yij ⎟ ⎜ ∑∑ Yij ⎟ ⎜ ∑∑ Yij ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
= ∑ ∑ Yij −2 ⎝ ⎠ + ⎝ i=1 j =1 ⎠ ⎝ i =1 j =1 ⎠
t r t r
= ∑ ∑ ij
2 i =1 j =1 2
SCtotal Y −
i =1 j =1 tr tr i =1 j =1 tr

La suma de cuadrados del error ( o sea, dentro de tratamientos), se obtiene por diferencia:
SCee = SCtotal – SCtrat.,
2 2
⎛ t r ⎞ ⎛ t r ⎞
⎜ ∑∑ Yij ⎟ ⎜ ∑∑ Yij ⎟
⎜ ⎟ 2 ⎜ ⎟
= ∑ ∑ Yij − ⎝ ⎠ – Yi . + ⎝ i =1 j =1 ⎠ .
t r t


2 i =1 j =1
SCee
i =1 j =1 tr i =1 r tr

t r
Yi .2 t
= ∑∑ Yij − ∑
2
SCee
i =1 j =1 i =1 r

2.2.5 Prueba de F

La estadística F es definida como la razón de dos variables aleatorias independientes con


distribución χ2 (Ji-cuadrada o Chi-Square), cada una de ellas dividida por sus respectivos grados de
libertad, o sea:
Q1 / n1
F= ,
Q2 / n 2

siendo Q1 una variable aleatoria con distribución χ2 y n1 grados de libertad y Q2 una variable aleatoria
con distribución χ2 y n2 grados de libertad, ambas independientes.

Así, considerando que SCtrat/σ2 tiene distribución χ2 con (t−1) grados de libertad, bajo Ho, y
SCeet/σ tiene distribución χ2 con t (r−1) grados de libertad y, son independientes, entonces el cociente
2

entre esas variables aleatorias, o sea:

SC trat /(t − 1) CM trat


= = Fo ,
SCee / t(r − 1) CM ee

tiene distribución F de Fisher & Snedecor con (t−1) y t (r−1) grados de libertad, bajo Ho. Ese cociente
es la estadística apropiada para evaluar la Ho, o sea: t1 = . . . = tI = 0.
24

Así, se puede decidir por el rechazo de Ho, al nivel α de significancia sí:

Fo ≥ F (α; t−1; t (r−1)),

donde F(α;t−1; t (r−1)), es el cuantil de orden (1−α) de la distribución F con (t−1) y t (r−1) grados de
libertad, como se muestra en la gráfica siguiente:

Región de aceptación (o no rechazo)


de la hipótesis nula

Región de rechazo (o no aceptación)


de la hipótesis nula

1−α

F (α; t−1; t (r−1))

Sí el valor observado de F (Fo) es superior al valor crítico F(α;t−1; t (r−1)), la Ho es rechazada, por
lo tanto se concluye que existen diferencias significativas entre los tratamientos.

2.2.6 Análisis de varianza o variación con aplicación de la prueba de F

El esquema del análisis de varianza abreviado como ANDEVA, ANOVA (ANalysis Of


VAriance) o bien ANVA; y las expresiones necesarias para la aplicación de la estadística F, para la
prueba de hipótesis se presentan en el siguiente cuadro.

Grados de
Fuentes de Suma de Cuadrados
libertad Valor de F
variación (FV) Cuadrados (SC) Medios (CM)
(gl)
t
Yi2. Y..2
t –1 ∑
i =1 r

tr SCtrat / gl trat
Tratamientos CMtrat / CMee

Error t(r-1) SCtotal – SCtrat SCee / gl ee

tr-1
t r
Y..2
Total ∑i =1
∑ Yij −
j=1
2

tr
25

Regla de Decisión

Rechazar Ho. Si Valor de F ≥ F crítico (gl trat; gl error; α)


No Rechazar Ho. Si Valor de F < F crítico (gl trat; gl error; α)

Fcrítica = Valor crítico de F encontrado en la tabla F de Fisher & Snedecor, considerando los grados
de libertad de tratamientos (v1), los grados de libertad del error (v2) y un determinado nivel
de significancia (α)

2.2.7 Coeficiente de Variación (CV)

Se le puede considerar como medida relativa de la variación que no es posible controlar en el


experimento (error experimental) y se calcula de la siguiente forma:
CM ee
CV = −
× 100
Y..

El coeficiente de variación da una idea de la precisión del experimento, a un valor alto de CV


corresponde un alto error experimental, lo cual indica que existe poca capacidad del experimento para
detectar diferencias significativas entre los tratamientos.

“De modo general, altos coeficientes de variación indican experimentos mal manejados”, pero
no siempre. El hecho de que el coeficiente de variación sea alto puede deberse no solamente al mal
manejo del experimento, sino también a:

• Tipo de variable de respuesta (escala de medición)


• Tipo de tratamientos.
• Errores en el análisis de la información, etc.

El CV puede ser utilizado para comparar la precisión experimental de variables experimentales


semejantes. Es conveniente que el investigador revise bibliografía sobre los valores de coeficiente de
variación obtenidos en cada cultivo y condición donde se realizó el experimento (por ejemplo, un valor
de CV=10% puede ser considerado un valor bajo, pero para algunas condiciones no).

Considere la siguiente situación donde se tienen las siguientes observaciones de una variable
de respuesta:

Variable de respuesta
Variable de respuesta transformada (con raíz
cuadrada)
36 6
16 4
9 3
4 2
Media 16.25 3.75
Desviación estándar 14.06 1.71
CV% 86.50 45.54

Observe que hubo una reducción del valor del CV% para la variable transformada. Por eso, el CV%
no siempre es un buen indicador de la precisión experimental (Dos Anjos, 2003)
26

2.2.8 Ejemplo de Aplicación

Una persona que realiza plantaciones forestales quiso comparar los efectos de cinco
tratamientos de preparación en el sitio sobre el crecimiento inicial en altura de plántulas de pino en el
terreno. Dispuso de 25 parcelas y aplicó cada tratamiento a cinco parcelas escogidas al azar. Entonces,
las parcelas se plantaron a mano y, al final de cinco años, se midió la altura de todos los pinos y se
calculó la altura promedio de cada parcela. Las medidas de las parcelas (en pies) fueron como sigue:

Tratamientos
A B C D E
15 16 13 11 14
14 14 12 13 12
12 13 11 10 12
13 15 12 12 10
13 14 10 11 11
Yi. 67 72 58 57 59 313

Y i. 13.4 14.4 11.6 11.4 11.8 12.52

67 2 + 722 + 582 + 57 2 + 592 3132


SCTRAT = − = 34.64
5 25

3132
SCTOTAL = 15 + 14 + . . . + 11 −
2 2 2
= 64.24
25

SCERROR = 64.24 – 34.64

Resumen del análisis de varianza

Grados de Suma de Cuadrados Valor crítico


Fuentes de variación F
libertad cuadrados Medios F
Tratamientos 4 34.64 8.66 5.85 2.87
Error Experimental 20 29.6 1.48
Total 24 64.24

CV = 9.72%

Nota: El valor crítico de F lo puede obtener directamente de la Tabla 1 del Apéndice, o en MS


Excel®, en el menú INSERTAR busque función (fx) y luego seleccione la categoría Estadísticas, y
dentro de éstas DISTR.F.INV (probabilidad, grados_de_libertad1, grados_de_libertad2). Otra manera
de poder concluir, es obteniendo el valor p (p value), si éste es menor a 0.05, se rechaza la hipótesis
nula. Para este caso valor p = 0.0027607.

Conclusión:

Los tratamientos de preparación en el sitio afectan significativamente el crecimiento inicial en


altura de plántulas de pino en el terreno; debido a que el valor de F es superior al valor crítico. Se
recomienda realizar un análisis postANDEVA para poder identificar el mejor tratamiento.
47

CAPÍTULO 3
PRUEBAS DE COMPARACIÓN MÚLTIPLE DE MEDIAS

3.1 INTRODUCCIÓN

Para poder tener una mayor comprensión sobre este tema, inicialmente se responderán algunas
interrogantes:

a) ¿Para qué se utiliza un análisis posterior al análisis de varianza?

Se requiere del uso de algún método de análisis posterior al ANOVA para contrastar diferentes
subhipótesis de interés, después que se verifica que el valor de la estadística F para alguna de las
hipótesis en la tabla de ANOVA es significativa. Cada una de las hipótesis que se rechaza en la tabla
del ANOVA, comprobada por el valor crítico respectivo de F, le corresponde una o varias subhipótesis
que se deben contrastar por un método apropiado de análisis posterior.

b) ¿Qué métodos de análisis posterior existen?

b.1) Pruebas de comparación múltiple de medias, de acuerdo con los criterios de:
 Tukey (1953)
 Duncan (1955)
 SNK (Student-Newman-Keuls). Diseñada por Newman (1939) y estudiada por Keuls
(1952)
 Bonferroni (el uso moderno de esta prueba es atribuído a Dun, O.J., 1961)
 Scheffé (1953)
 Dunnett (1955, 1964)
 Scott Knott (1974), entre otras.

b.2) Contrastes lineales ortogonales y no ortogonales

b.3) Polinomios ortogonales.

Nota: El nivel de significancia que ha sido utilizado para determinar la significancia de un valor de F
en la tabla de ANOVA, es el que debe ser utilizado para el análisis posterior.

Estos métodos se aplican “regularmente” cuando la hipótesis de igualdad de las medias de los
tratamientos en el análisis de varianza ha sido rechazada. A continuación se presenta la descripción de
algunas pruebas de comparación múltiple de medias.

3.2 COMPARACIÓN MÚLTIPLE DE MEDIAS, SEGÚN EL CRITERIO


PROPUESTO POR TUKEY

Llamado de rango estudiantizado, construido por Tukey en 1953, y conocido como la prueba
de la diferencia significativa honesta HSD (Honestly significant difference), este método sirve para
comparar las medias de los tratamientos, dos a dos, o sea, para evaluar las hipótesis:

Ho: i = j (media del tratamiento i es igual a la media del tratamiento j, con i  j)


Ha: i  j (media del tratamiento i es diferente a la media del tratamiento j, con i  j)
48

Caso I: DCA Balanceado

Ejemplo: El análisis de varianza que a continuación se presenta, corresponde a un experimento


realizado en arroz (Oryza sativa L.), en el que se evaluó nueve insecticidas para el control de larvas de
una determinada plaga. La variable de respuesta medida fue el número de larvas vivas, a la cual se le
aplicó la transformación raíz cuadrada. El diseño experimental utilizado fue completamente al azar,
con 4 repeticiones. El cuadro resumen del ANOVA se presenta a continuación:

Fuentes de Grados de Suma de Cuadrados


F Valor crítico de F
variación libertad cuadrados Medios
Insecticidas 8 46.04 5.76 4.26* 2.31
Error Experimental 27 36.43 1.35
Total 35 82.48

* significativo al 5%

Debido a que se detectaron diferencias significativas en el efecto de los insecticidas, se


aplicará la prueba de comparación múltiple de medias de acuerdo con el criterio de Tukey. El
procedimiento se detalla a continuación:

1. Se deben obtener las medias de los tratamientos

Insecticida Medias (*)


1 1.87
2 2.02
3 2.55
4 2.42
5 3.91
6 4.12
7 0.25
8 1.39
9 2.82

(*) Las medias fueron obtenidas a partir de los datos transformados.

2. Se construye una matriz de diferencias entre todos los posibles pares de medias

6 5 9 3 4 2 1 8 7
Insecticida medias
4.12 3.91 2.82 2.55 2.42 2.02 1.87 1.39 0.25
7 0.25 3.87 3.66 2.57 2.3 2.17 1.77 1.62 1.14 
8 1.39 2.73 2.52 1.43 1.16 1.03 0.63 0.48 
1 1.87 2.25 2.04 0.95 0.68 0.55 0.15 
2 2.02 2.1 1.89 0.8 0.53 0.4 
4 2.42 1.7 1.49 0.4 0.13 
3 2.55 1.57 1.36 0.27 
9 2.82 1.3 1.09 
5 3.91 0.21 
6 4.12 
49

Cada una de las diferencias (dii) fueron obtenidas con la siguiente ecuación:

dii' = Yi. -Yi.' , siendo que i  i’

3. Se calcula W, la diferencia mínima significativa a un cierto nivel de significancia (), dada


por la siguiente expresión:

CMee
W  q(t , glee, ) 
r
siendo:

q = amplitud total estudentizada. Valor encontrado en tablas y que está en función de:
 = (nivel de significancia)
t = (número de tratamientos), y
glee = (grados de libertad del error experimental)
CMee = cuadrado medio del error experimental
r = número de repeticiones de las medias de los tratamientos a ser comparadas.

Para nuestro ejemplo tenemos que al consultar la Tabla 2 del Apéndice, se obtiene:

q(9,27,0.05) = 4.774

Como en la tabla no se encuentra el valor exacto de q, se efectuó una interpolación:

glee q

20 4.90
2720 = 7
10 27 X 4.90  4.72 = 0.18

30 4.72

10 – 0.18 X = (7  0.18) / 10 = 0.126


7 – X q = 4.90 – 0.126 = 4.774

1.349
W  4.774  2.7724
4

4. Volvemos a la matriz de diferencias (Paso 2) y observamos columna por columna, si d ii


W, significa que existen diferencias significativas entre los efectos de los pares de
tratamientos, y colocamos un asterisco para resaltar esas diferencias.
50

Insecticida 6 5 9 3 4 2 1 8 7
medias 4.12 3.91 2.82 2.55 2.42 2.02 1.87 1.39 0.25
7 0.25 3.87* 3.66* 2.57 2.3 2.17 1.77 1.62 1.14 
8 1.39 2.73 2.52 1.43 1.16 1.03 0.63 0.48 
1 1.87 2.25 2.04 0.95 0.68 0.55 0.15 
2 2.02 2.1 1.89 0.8 0.53 0.4 
4 2.42 1.7 1.49 0.4 0.13 
3 2.55 1.57 1.36 0.27 
9 2.82 1.3 1.09 
5 3.91 0.21  W=2.774
6 4.12 

5. Presentación de los resultados

Insecticida Medias Grupo Tukey


6 4.12 (20) a
5 3.91 (16) a
9 2.82 (8.50) a b
3 2.55 (7.25) a b
4 2.42 (6) a b
2 2.02 (4.5) a b
1 1.87 (5.5) a b
8 1.39 (3.25) a b
7 0.25 (0.25) b

Entre ( ) aparecen los promedios de los datos originales (sin transformar).

Conclusión: la aplicación del insecticida 7 presenta los mejores resultados en cuanto al control de
larvas.

Caso II: DCA No balanceado

Se tomarán los datos del ejemplo desarrollado en la clase.

1. Matriz de diferencias

Suplemento Araruta Mandioca Batata doce Sin Supl.


Media (ri)
34.40 (6) 23.64 (5) 22.84 (6) 22.64 (6)
Sin Suplemento 22.64 (6) 11.76 * 1 0.2 
Batata Doce 22.84 (6) 11.56 * 0.8 
Mandioca 23.64 (5) 10.76 * 
Araruta 34.40 (6) 

2. Comparador de Tukey

a) Entre medias con el mismo número de repeticiones, esto es ri = ri, para i  i


51

CMee
W  q(4,19,0.05) 
r

3.53
W  3.98   3.05
6

b) Entre medias con número diferente de repeticiones, esto es: ri = 5 y ri = 6, para i  i

1 1 1
W '  q(4,19,0.05)   CMee   
2  ri ri ' 

1 1 1
W '  3.98   3.53     3.20
2 5 6

c) Presentación de los resultados

Producción media
Grupo
Suplemento diaria de leche
Tukey
(kg)
Araruta 34.40 A
Mandioca 23.64 B
Batata doce 22.84 B
Sin Supl. 22.64 B

Se concluye que el suplemento alimenticio que proporcionó la mayor producción diaria (kg) de
leche fue el suplemento preparado con la planta Araruta.

Caso III: DCA con submuestreo

Recuerde que primero se realiza una prueba de F con el error de muestreo y el error de muestreo:

CMee
F1 
CMem

Sí el valor de F1  F(glee,glem,) Sí F1 < F(glee,glem,)

CM trat CM trat
F2  F2 
CM ee CM ep

Valor crítico de F(glt,glee,) Valor crítico de F(glt,glep,)

CMee CMep
W  q(t , glee, )  W  q(t , glep , ) 
r rm
52

Nogueira (2007) indica algunas consideraciones referentes a este método:

a) El método Tukey fue basado en la distribución de la diferencia entre la menor y la mayor


estadística de orden (range) de una muestra;

b) Este método es válido en la totalidad de los contrastes de medias, dos a dos;

c) El método de Tukey es exacto, cuando los tratamientos están balanceados;

d) El método de Tukey es exacto para evaluar la mayor diferencia entre dos medias, en los demás
casos es conservador.

3.3 COMPARACIÓN MÚLTIPLE DE MEDIAS, SEGÚN EL CRITERIO DE


DUNCAN

Un procedimiento usado ampliamente para comparar todas las parejas de medias es el de la


prueba de intervalos múltiples desarrollada por Duncan (1955). La aplicación de esta prueba es más
laboriosa que la prueba de Tukey, pero se llega a resultados más detallados y se discrimina con mayor
facilidad entre los tratamientos, o sea que, la prueba de Duncan indica resultados significativos en
casos en que la prueba de Tukey no permite obtener significancia estadística. Tal como la prueba de
Tukey, la de Duncan exige, para ser exacto, que todos los tratamientos tengan el mismo número de
repeticiones.

Para el uso de esta prueba se necesitan tablas especiales (Tabla 3). A continuación se presenta
un ejemplo ilustrativo.

Orellana Najarro (2006) evaluó la selectividad de los herbicidas Acetoclor y Alaclor en seis
cultivos hortícolas en el municipio de Monjas, Jalapa. Una de las variables utilizadas fue altura de
planta (cm) 30 días después del transplante. El diseño experimental utilizado fue bloques al azar, con
3 repeticiones; el cuadrado medio del error = 18.8827 y los grados de libertad = 10. Los promedios de
los tratamientos en orden descendente son:

No. Altura
Tratamientos
tratamiento promedio
1 Sin herbicida (testigo limpio) 26.40
2 Alaclor aplicado 2 días antes del transplante 23.13
3 Alaclor aplicado 2 días después del transplante 22.07
4 Sin herbicida (testigo enmalezado) 21.80
5 Acetoclor aplicado 2 días antes del transplante 19.00
6 Acetoclor aplicado 2 días después del transplante 13.13

CMee 18.8827
El error estándar de cada promedio es: S x    2.5088. Usando la Tabla
r 3
3, para 10 grados de libertad y  = 0.05, inicialmente se calcula una amplitud total mínima
significativa (shortest significative range, en inglés) para el contraste de pares de medias, dependiendo
de la distancia entre cada par. Con estos datos se calculan los t1 comparadores, usando la ecuación:

CMee
Dp  d( p , glee, )  , p = 2, 3, . . , t (tratamientos)
r
53

Siendo:
d = amplitud total mínima significativa. Valor encontrado en tablas y que depende de:
 = (nivel de significancia)
p = distancia entre dos medias comparadas, y
glee = (grados de libertad del error experimental)
CMee = cuadrado medio del error experimental
r = número de repeticiones de las medias de los tratamientos a ser comparadas.

Las diferencias mínimas significativas para el nivel de protección  =0.05 son las siguientes:

D2 = 7.90 d0.05 (2,10) = 3.15


D3 = 8.28 d0.05 (3,10) = 3.30
D4 = 8.45 d0.05 (4,10) = 3.37
D5 = 8.61 d0.05 (5,10) = 3.43
D6 = 8.68 d0.05 (6,10) = 3.46

En la tabla siguiente se presentan las diferencias entre las medias de las variedades
confrontadas con el D respectivo.

Contrastes
entre medias de dii' = Yi. -Yi.' Distancia entre Comparador
tratamientos medias
1 2 3.27 2 7.90 n.s.
1 3 4.33 3 8.28 n.s.
1 4 4.60 4 8.45 n.s.
1 5 7.40 5 8.61 n.s.
1 6 13.27 6 8.68 *
2 3 1.06 2 7.90 n.s.
2 4 1.33 3 8.28 n.s.
2 5 4.13 4 8.45 n.s.
2 6 10.00 5 8.61 *
3 4 0.27 2 7.90 n.s.
3 5 3.07 3 8.28 n.s.
3 6 8.94 4 8.45 *
4 5 2.80 2 7.90 n.s.
4 6 8.67 3 8.28 *
5 6 5.87 2 7.90 n.s.

La presentación final queda de la siguiente forma:

Altura Grupo Duncan


Tratamientos
promedio
1 Sin herbicida (testigo limpio) 26.40 a
2 Alaclor aplicado 2 días antes del transplante 23.13 a
3 Alaclor aplicado 2 días después del transplante 22.07 a
4 Sin herbicida (testigo enmalezado) 21.80 a
5 Acetoclor aplicado 2 días antes del transplante 19.00 a b
6 Acetoclor aplicado 2 días después del transplante 13.13 b
54

3.4 MÉTODO DE DUNNETT

En varias ocasiones se ejecutan experimentos, en los que el objetivo principal es comparar


determinados tratamientos con un control o testigo, siendo las comparaciones entre los demás
tratamientos de interés secundario. Así, este método es recomendado cuando se desea evaluar un
contraste de tipo: Y  i.  a ,

donde: a = se refiere a la media poblacional del tratamiento testigo o control, y


i. = se refiere a la media poblacional del i-ésimo tratamiento o nivel del factor.

Las hipótesis a ser evaluadas son:


H 0 : i  a  0, o H 0 : i  a ,
contra
H a : i  a  0, o H a : i  a ,

para i = 1, . . . , a1. El procedimiento de Dunnett (1964) es una modificación de la prueba de t. Para


cada hipótesis se calculan las diferencias que se observan en las medias muestrales:

yi.  ya , i = 1,2 . . . , a 1.

La hipótesis nula H0 : i  a  0 es rechazada con un nivel de error tipo I según  si:

2 CMee
yi.  ya  d (a  1,gle) , y en el caso de ser desbalancedado:
r

1 1
yi.  ya  d (a  1,gle) CMee    ,
 ri ri ' 

en donde la constante d (a  1,gle) se encuentra en la Tabla 4 del Apéndice (son posibles tanto pruebas
unilaterales como bilaterales). Hay que notar que  representa el nivel de significancia conjunto
asociado a las a1 pruebas.

Ejemplo:

Se evaluaron 4 variedades de caña de azúcar: CP-722086 (utilizada como testigo), 1, 2 y 3; las


variables de respuesta medidas fueron: toneladas de caña por hectárea (TCH) y libras de azúcar por
tonelada de caña (LATC). En el ensayo se utilizó un diseño de bloques completos al azar, con 5
repeticiones. Para la variable TCH se presenta a continuación el análisis de varianza:

FV GL SC CM Fo F crítica
Variedades 3 1637.00 545.67 3.71 3.49
Bloques 4 103.30
Residuos 12 1763.50 146.96
Total 19 3503.80
CV = 10.20%
55

En este ejemplo, a = 4, a1 = 3, glee = 12, r = 5, y con un nivel de 5% de significancia se encuentra en


la Tabla 4 del Apéndice que d0.05 (3,12) = 2.68. Por lo tanto la diferencia crítica es:

2 146.96
d 0.05 (3,12)  2.68  7.67  20.55
5

En consecuencia, una variedad debe considerarse significativamente diferente del control sí la


diferencia es mayor que 20.55. Las diferencias observadas entre las medias son:

Variedad 1 vs. CP-722086: y1  ya = 132.00 – 109.8 = 22.20 *


Variedad 2 vs. CP-722086: y2  ya = 111.20 – 109.8 = 1.40
Variedad 3 vs. CP-722086: y3  ya = 122.60 – 109.8 = 12.80

Sólo la diferencia y1  ya indica una diferencia significativa al ser comparada con el testigo (control);
por lo tanto se concluye que 1  a

Ejercicio:

Relacionado con el ejercicio anterior, realice la prueba de Dunnett, usando un 5% de significancia,


para la variable LATC. Los resultados del ANOVA se presentan a continuación:

FV GL SC CM Fo Fcrítica
Variedades 3 2978.80 992.93 3.85 3.49
Bloques 4 2373.7
Resíduos 12 3094.70 257.89
Total 19 8447.2

CV 5.21 %

Las medias de las variedades son:

Variedades Promedio
CP-722086 327.6
1 303.4
2 307.6
3 294.2

3.5 EJERCICIOS PROPUESTOS

En los casos en que se presenten diferencias significativas, en los ejercicios propuestos en 2.7, realice
las pruebas de comparación múltiple de medias que considere adecuadas.
97

5.7 ANÁLISIS DE VARIANZA PARA UN DISEÑO BLOQUES AL AZAR CON


SUBMUESTREO

Con el objetivo de determinar la cantidad mínima efectiva del atrayente sintético de machos
(trimedlure) a fin de mejorar el método de detección de adultos de la mosca del mediterráneo (Ceratitis
capitata Wiedemann), se realizó un experimento utilizando trampas tipo Jackson con mechas de
algodón como dispensadores.

Los tratamientos consistieron en 0.8, 1.6, 2.6, 3.5 y 7.0 ml de trimedlure aplicados en mechas
de tamaño proporcional al volumen. Las trampas se distribuyeron en un área con mosca del
mediterráneo mediante un diseño en bloques al azar, colocando dos trampas en cada unidad
experimental. En el cuadro 1 se reportan los datos del número total de insectos capturados en cada
trampa, 16 días después de su instalación.

Cuadro 1. Número de machos de mosca del mediterráneo capturados bajo diferentes cantidades
de atrayente sexual.

Volumen de Bloques
Trimedlure Yi..
1 2 3 4 5 6 7 8 9 10
(ml)
55 25 44 63 32 100 83 93 145 110
0.8
19 13 22 13 15 81 39 23 64 80
Y1j. 74 38 66 76 47 181 122 116 209 190 1119
60 15 35 19 35 122 60 94 110 111
1.6
31 60 11 25 27 51 29 154 222 162
Y2j. 91 75 46 44 62 173 89 248 332 273 1433
62 39 14 14 39 122 77 138 228 93
2.6
51 19 40 20 71 66 41 130 97 207
Y3j. 113 58 54 34 110 188 118 268 325 300 1568
82 68 28 27 95 121 34 81 105 273
3.5
58 24 48 44 11 101 97 46 89 119
Y4j. 140 92 76 71 106 222 131 127 194 392 1551
99 12 72 88 30 117 129 46 80 128
7.0
104 44 101 222 64 59 11 79 129 104
Y5j. 203 56 173 310 94 176 140 125 209 232 1718
Y.j. 621 319 415 535 419 940 600 884 1269 1387 7389

(*) Los datos fueron tomados de la tesis de Ing Agr. Salazar Rodríguez, J.A. (1985)

1. Hipótesis
Ho : i i = 1,2, . . . / i =
Ha: i i = 1,2, . . . / i

2. Modelo Estadístico:
i = 1, 2, . . . , t
Yijk = + i + j + ij + ijk j = 1, 2, . . . , r
k = 1,2, . . . , m
98

Siendo:

Yijk = número de moscas machos de mosca del mediterráneo capturadas en el k-cuadro


muestra con el i-ésimo volumen de trimedlure y el j-ésimo bloque.
= media general del número de moscas machos.
i = efecto del i-ésimo volumen de trimedlure
j = efecto del i-ésimo bloque sobre el número de moscas machos capturadas.
ij = error experimental asociado a la ij-ésima unidad experimental (error entre).
ijk = error de muestreo asociado a la ij-ésima unidad experimental (error dentro).

3. Supuestos
ij ~ NID (0, 2)
2
ijk ~ NID (0, n )
No existe interacción bloque por época de corte
4. ANOVA

a) Número de grados de libertad

Total = trm 1 = (5)(10)(2) 1 = 99


Dosis = t 1 = 5 1 = 4
Bloques = r 1 = 10 1 = 9
Error Experimental = (r 1) (t 1) = (9) (4) = 36
Error de Muestreo = tr(m 1) = (5 10)(2 1) = 50

b) Suma de cuadrados

Y... 7389 2
FC = 545,973.21
trm (5)(10)(2)

t r m
SCtotal = Yijk 2 FC
i=1 j=1 k 1

= (552 192 252 . . . 1082 ) 545,973.21 278,381.79


t
Yi .. 2
SC trat. = i=1
FC
rm
(11192 14332 15682 15512 17182 )
= 545,973.21 10,096.74
(10)(2)

t
Y. j .2
SC bloques = i=1
FC
tm
(6212 3192 . . . 1387 2 )
= 545,973.21 122,086.69
(10)(2)
99

t r
Yij .2
i=1 j 1
SCee = FC SCtrat SCbloques
m
(742 382 . . . 2322 )
= 545,973.21 10,096.74 122,086.69 62,833.80
2

Resumen del análisis de varianza

Fuentes de Grados de Suma de Cuadrado


Valor de F
variación libertad cuadrados medios
Dosis 4 10,096.74 2,524.185 F2 = 1.485 NS
Bloques 9 122,086.69
Error
36 62,833.80 1,745.39 F1 = 1.0467NS
Experimental
Error de Muestreo 50 83,374.50 1,667.496
Total 99 278,391.79
* significativo al 5% de significancia.

CMee 1745.39
F1 1.0467 Valor crítico de F1(36,50,0.05)= 1.65
CMem 1667.496

1º Pruebas preliminares de significancia

Como F1 < F (glee, glem, ), se acepta Ho: e² = 0, lo cual indica que el submuestreo no fue
efectivo o no es importante en este experimento. Por lo que los errores deben mancomunarse de la
siguiente manera:

SCee SCem 62833.8 83374.5


CMep 1700.097
glee glem 36 50

2º. Prueba definitiva.

CM trat 2524.85
F2 1.485 Valor crítico de F2(4,86,0.05)= 2.40
CM ep 1700.097

CMep 1700.097
CV 100 100 55.80%
73.89
Y ...

¿Cómo obtener las variâncias estimadas?


Una manera es utilizando el método de los momentos (o ANOVA)

2 CMee CMem 1745.39 1667.496 2


e 38.95 e d 1667.496
k 2
100

5.8 PROGRAMA EN SAS PARA EL ANÁLISIS DE UN EXPERIMENTO EN UN


DISEÑO BLOQUES COMPLETOS AL AZAR, CON SUBMUESTREO

OPTIONS nodate nonumber;


DATA dbam;
INPUT dos rep nm;
CARDS; Otra alternativa, es digitando luego del conjunto de datos, esta parte
0.8 1 55 del programa:
0.8 1 19
1.6 1 60 PROC GLM DATA=dbam;
1.6 1 31 CLASS dos rep;
MODEL nm=dos rep dos*rep/SS1;
2.6 1 62 RANDOM dos*rep/TEST;/*se define el error experimental
2.6 1 51 como la interacción (dos*rep)*/
3.5 1 82 RUN;
3.5 1 58
7 1 99 O digitar:
7 1 104
.. .. .. /*Análisis de Varianza para un Modelo Mixto*/
.. .. .. PROC MIXED DATA=dbam;
.. .. .. CLASS dos rep;
MODEL nm = dos rep; /*se colocan los efectos fijos
.. .. .. involucrados en el modelo*/
0.8 10 110 RANDOM dos*rep; /*por defecto el error de submuestreo
0.8 10 80 es el que aparece en la salida como error*/
1.6 10 111 RUN;
1.6 10 162
2.6 10 93
2.6 10 207
3.5 10 273
3.5 10 119
7 10 128
7 10 104
;
PROC glm;
CLASS dos rep; /*con submuestreo*/
MODEL nm =rep dos rep*dos/SS1;
TEST h=dos E=rep*dos; /*rep*dos representa el error experimental*/
RUN;
PROC glm;
TITLE "mancomunando errores";/*sin efecto de submuestreo*/
CLASS dos rep;
MODEL nm=rep dos/ss1;
RUN;
Diseño y Análisis de
Experimentos de un
solo Factor
Diseño y Análisis de Experimentos de un solo
Factor

Un experimento unifactorial es un experimento


simple que consiste en un número limitado de
tratamientos pertenecientes a un factor
determinado.
Ejemplos de experimentos unifactoriales:

❑ Diferentes variedades de un cultivo.

❑ Diferentes niveles de plaguicida.

Diferentes genotipos de animales.

Diferentes cepas de bacterias u hongos.

Diferentes tipos de cosechadoras o tractores.


Experimentos de
un solo factor

DCA DBCA DCL

18/12/20. Experimentación agrícola – D. Sc. Ali William Canaza Cayo


Diseño Cuadrado
Latino

(DCL)
Diseño Cuadrado Latino es uno de los diseños

experimentales más utilizados en la

investigación agrícola, particularmente en

experimentos de campo.
✓ Las unidades experimentales son
heterogéneas en dos direcciones.
✓ Las unidades experimentales se agrupan o
aleatorizan en dos bloques llamados: bloques
filas y bloques columnas
✓ Las filas y las columnas se asignan al azar por
separado e independientemente.
▪ Cada tratamiento se encuentra una vez en
cada fila y en cada columna.
▪ El número de tratamiento es igual al número
de filas, número de columnas y número de
replica. T = R = C = r
▪ El número total de unidades experimentales =
T * T o R * R o C * C o r * r = r 2.
▪ Los tratamientos están representados por
letras latinas (A,B,… Z).
▪ Así, este diseño se llama DCL.
Variación total

Variación Variación Variación Variación Error

Tratamiento Fila Columna Experimental


Ventajas del DCL:

Simple de usar.

análisis estadístico sencillo.

Mas eficiente que el DBCA.


Desventajas del DCL:

Debe usarse cuando el número de tratamientos

varia entre 4 y 8.
Usos del DCL:

✓ Experimentos de invernadero.

✓ Experimentos de campo.
Modelo Matemático del DBCA:

Donde:
Variable respuesta
Media General
Efecto de Fila
Efecto de Columna
Ffecto de Tratamiento
Un ejemplo:
Problema de Investigación:

.Un ingeniero agrónomo desea estudiar la

eficiencia de cuatro cosechadoras de trigo sobre las

pérdidas del cabezal en el campo y decide emplear

el DCL.
▪ En la cosecha, el ingeniero pensó que la
velocidad de la cosechadora (km/h) y la
velocidad de la bobina (r/min) podría afectar
las pérdidas del cabezal (alimentado).
▪ Entonces, las unidades experimentales se
dividieron en fila para corregir la velocidad de
la cosechadora y en la columna para corregir
la velocidad de la bobina.
Objetivo del experimento:

Determinar la eficiencia de cuatro cosechadoras de


trigo sobre la pérdida de los cabezales.
Hipótesis:
Hipótesis nula: No hay diferencias significativas entre las
cuatro cosechadoras de trigo en las pérdidas de cabezal.

Hipótesis alternativa: existen diferencias significativas


entre las cuatro cosechadoras de trigo en las pérdidas de
cabezal.
Aleatorización y diseño del experimento:

Gradiente en la velocidad de la cosechadora

Gradiente en la velocidad de la bobina


Identificación de la variación
Columnas

Filas
b) Distribución de los tratamientos mediante el uso de
letras latinas
Columnas

Filas
c) Distribución aleatoria de columnas
Columnas

Filas
d) Distribución aleatoria de filas
Organización y colección de datos
Tabla de filas y columnas
Columna (Veloc. cosechadora) Total de
5 km/h 6 km/h 7 km/h 8 km/h filas

5 r/min A=6 C=2 D=3 B=4 15


10
Fila D=2 B=3 C=4 A=6 15
r/min
(Veloc 15
bobina) r/min B=3 D=4 A=7 C=6 20

20
C=4 A=7 B=6 D=7 24
r/min
Total de columnas 15 16 20 23 74
Table of treatments
Columna (Veloc. cosechadora)

5 6 7 8 Total media
km/h km/h km/h km/h tratamiento

Cosechadora 1 6 7 7 6 26 6.5
Cosechadora 2 3 3 6 4 16 4
Cosechadora 3 4 2 4 6 16 4
Cosechadora 4 2 4 3 7 16 4
Gran total 74
4.625
Prueba de hipótesis: Pasos para el analisis
de varianza:
1) Suma de cuadrados
2) G rados de libertad
3) Cuadrado medio
4) Valores de F
5) Table de analisis de varianza (tabla ANOVA)
6) Prueba de significancia
7) Conclusion general
8) Resumen de resultados
1) Suma de cuadrados:
Antes del cálculo de la suma de cuadrados, en
primer lugar se calcula el factor de corrección
(C) de la siguiente manera:
Suma de cuadrados (SS) para el total:
Suma de cuadrados para filas (SSR):
Suma de cuadrados para columnas (SSC):
Suma de cuadrados para tratamientos (SST):
Suma de cuadrados para el error (SSE):
2) Grados de libertad:
Grados de libertad (DF) para el total:

Grados de libertad para filas (DFR):

Grados de libertad para columnas (DFC):


Grados de libertad para tratamientos (DFT):

Grados de libertad para el error (DFE):


3) Cuadrado medio(MS):
Cuadrado medio para filas (MSR):

Cuadrado medio para columnas (MSC):


Cuadrado medio para treatamientos (MST):

Cuadrado medio para el error (MSE):


4) Valores de F
Valor de F calculado para filas

Valor de F calculado para columnas

Valor de F calculado para tratamientos


Valor de F tabulado

Valor de F Tabulado para filas, columnas y

tratamientos
5) Tabla ANOVA:

F-tab
FV GL SC CM F-cal
0.05 0.01
Filas 3 14.25 4.75 6.333* 4.76 9.78
Columnas 3 10.25 3.417 4.556Ns 4.76 9.78
Tratamientos 3 18.75 6.25 8.333* 4.76 9.78
Error
6 4.5 0.75
experimental
Total 15 47.75
6) Prueba de significancia

Dado que el valor f calculado para las filas


(6.333) es mayor que el valor f tabulado para
filas (4.76) al nivel de significancia 0.05, la
hipótesis nula es rechazada.
6) Prueba de significancia

Dado que el valor de F calculado para


columnas (4.556) es menor que el F tabulado
para columnas (4.76) al nivel de significancia
0.05, la hipotesis nula es acepteda.
Dado que el valor de F calculado para
tratamientos (8.333) es mayor que el valor f
tabulado para tratamientos (4.76) al nivel de
significancia 0.05, la hipótesis nula es
rechazada.
7) Conclusión general :

• Las filas fueron eficientes para eliminar la


variación en las unidades experimentales
debido a la velocidad de la cosechadora.
• Las columnas no fueron eficientes para
eliminar la variación en las unidades
experimentales debido a la velocidad de la
bobina.
• Existen diferencias significativas entre las
cuatro cosechadoras de trigo en cuanto a las
pérdidas del cabezal.
8) Resumen de resultados:
Error estándar (SE±) =

Coeficiente de variación (CV%) =


Table. 1. Effect of four combine harvesters of
wheat on header losses

Treatments Harvester 1 Harvester 2 Harvester 3 Harvester 4

Mean of
6.5 4.0 4.0 4.0
treatment

SE± 0.433

CV % 18.725

7/1/2019 Design and Analysis of Agricultural Experiments - Dr. Awadallah Belal Dafaallah 44
7
Pérdida (kg/veloc.) 6
5
4
3
2
1
0

Cosechadora Cosechadora Cosechadora Cosechadora


1 2 3 4
Tipo de cosechadora

Fig. 1. Efecto de cuatro cosechadoras de trigo sobre


las pérdidas del cabezal

También podría gustarte