Pruebas de hipótesis de una y dos muestras1
Manuel Correa Giraldo
Escuela de Administración
Universidad EAFIT
Organización y Gerencia
1
Basado en [Lind et al., 2015]
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
1 / 46
Contenido
1
Introducción
2
¿Qué es una hipótesis estadı́stica y cómo se prueba?
3
Procedimiento para probar una hipótesis
4
Pruebas de significancia de una y dos colas
5
Valor p en la prueba de hipótesis
6
Pruebas relacionadas con proporciones
7
Error Tipo II
8
Pruebas de hipótesis de dos muestras
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
2 / 46
Introducción
Una hipótesis es una declaración relativa a una población.
En el sistema legal estadounidense, una persona es inocente hasta que se prueba
su culpabilidad. Un jurado plantea como hipótesis que una persona a la que se le
imputa un crimen es inocente, y someten esta hipótesis a verificación, para lo
cual revisan la evidencia y escuchan el testimonio antes de llegar a un veredicto.
Un paciente visita al médico y acusa varios sı́ntomas. Con base en ellos, el
médico indicará ciertos exámenes de diagnóstico; en seguida, de acuerdo con los
sı́ntomas y los resultados de los exámenes, determina el tratamiento.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
3 / 46
Contenido
1
Introducción
2
¿Qué es una hipótesis estadı́stica y cómo se prueba?
3
Procedimiento para probar una hipótesis
4
Pruebas de significancia de una y dos colas
5
Valor p en la prueba de hipótesis
6
Pruebas relacionadas con proporciones
7
Error Tipo II
8
Pruebas de hipótesis de dos muestras
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
4 / 46
¿Qué es una hipótesis y una pruba de hipótesis?
Hipótesis estadı́stica
Afirmación relativa a un parámetro de la población sujeta a verificación.
Prueba de hipótesis estadı́stica
Procedimiento basado en evidencia de la muestra y la teorı́a de la probabilidad para
determinar si la hipótesis es una afirmación razonable.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
5 / 46
Contenido
1
Introducción
2
¿Qué es una hipótesis estadı́stica y cómo se prueba?
3
Procedimiento para probar una hipótesis
4
Pruebas de significancia de una y dos colas
5
Valor p en la prueba de hipótesis
6
Pruebas relacionadas con proporciones
7
Error Tipo II
8
Pruebas de hipótesis de dos muestras
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
6 / 46
Procedimiento de cinco pasos para probar una hipótesis
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
7 / 46
Procedimiento de cinco pasos para probar una hipótesis
Ejemplo
Jamestown Steel Company fabrica y arma escritorios y otros muebles para oficina en
diferentes plantas en el oeste del estado de Nueva York. La producción semanal del
escritorio modelo A325 en la planta de Fredonia tiene una distribución normal, con
una media de 200 y una desviación estándar de 16. Hace poco, con motivo de la
expansión del mercado, se introdujeron nuevos métodos de producción y se contrató
a más empleados. El vicepresidente de fabricación pretende investigar si hubo algún
cambio en la producción semanal del escritorio modelo A325. En otras palabras, ¿la
cantidad media de escritorios que se produjeron en la planta de Fredonia es diferente
de 200 escritorios semanales con un nivel de significancia de 0.01?
La cantidad media de escritorios que se produjeron el año pasado (50 semanas, pues
la planta cerró 2 semanas por vacaciones) es de 203.5.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
8 / 46
Paso 1: Se establece la hipótesis nula y la hipótesis alternativa
Hipótesis nula (H0 )
Enunciado relativo al valor de un parámetro poblacional que se formula con el fin de
probar evidencia numérica.
Hipótesis alternativa (H1 )
Enunciado que se acepta si los datos de la muestra ofrecen suficiente evidencia para
rechazar la hipótesis nula.
Observaciones:
Cabe hacer hincapié en que, si la hipótesis nula no se rechaza con base en los
datos de la muestra, no es posible decir que la hipótesis nula sea verdadera. En
otras palabras, el hecho de no rechazar una hipótesis no prueba que H0 sea
verdadera, sino que no rechazamos H0 .
La hipótesis alternativa describe lo que se concluirá si se rechaza la hipótesis
nula.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
9 / 46
Paso 2: Se selecciona un nivel de significancia
Después de establecer las hipótesis nula y alternativa, el siguiente paso consiste en
determinar el nivel de significancia.
Nivel de significancia
Probabilidad de rechazar la hipótesis nula cuando es verdadera.
El nivel de significancia se expresa con la letra griega alfa, α. En ocasiones también
se conoce como nivel de riesgo. Éste quizá sea un término más adecuado porque se
trata del riesgo que se corre al rechazar la hipótesis nula cuando es verdadera.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
10 / 46
Paso 2: Se selecciona un nivel de significancia
Error tipo I
Rechazar la hipótesis nula, H0 , cuando es verdadera.
La probabilidad esta determinada por:
α = P (error tipo I) = P (rechazarH0 |H0 es verdadera)
(1)
Error tipo II
Aceptar la hipótesis nula cuando es falsa.
La probabilidad esta determinada por:
β = P (error tipo II) = P (dejar de rechazarH0 |H0 es falsa)
(2)
Potencia de la prueba
La potencia de una prueba es la probabilidad de rechazar H0 dada una alternativa
especifica verdadera.
Potencia = 1 − β = P (rechazarH0 |H0 es falsa).
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
(3)
11 / 46
Paso 2: Se selecciona un nivel de significancia
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
12 / 46
Paso 3: Se selecciona el estadı́stico de prueba
Hay muchos estadı́sticos de prueba. En este curso se utilizan z y t como estadı́sticos
de prueba. Otros estadı́sticos de prueba son F y χ2 , conocida como jicuadrada, para
cocientes de varianzas y la varianza de una muestra.
Estadı́stico de prueba
Valor, determinado a partir de la información de la muestra, para determinar si se
rechaza la hipótesis nula.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
13 / 46
Paso 3: Se selecciona el estadı́stico de prueba
Estadı́stico de prueba para µ cuando σ es conocida
z=
X̄ − µ
√
σ/ n
(4)
El valor z se basa en la distribución muestral de X̄ que sigue la distribución normal
cuando la muestra es razonablemente
√ grande, con una media µX̄ igual a µ y una
desviación estándar σX̄ igual a σ/ n
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
14 / 46
Paso 3: Se selecciona el estadı́stico de prueba
Estadı́stico de prueba para µ cuando σ es desconocida
t=
X̄ − µ
√
s/ n
(5)
El valor t se basa en la distribución t de Student con n − 1 grados de libertad.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
15 / 46
Paso 4: Se formula la regla de decisión
Regla de decisión
Una regla de decisión es un enunciado sobre las condiciones especı́ficas en que se
rechaza la hipótesis nula y aquellas en las que no se rechaza. La región o área de
rechazo define la ubicación de todos esos valores que son tan grandes o tan pequeños
que la probabilidad de que ocurran en una hipótesis nula verdadera es muy remota
Valor crı́tico
Punto de división entre la región en que se rechaza la hipótesis nula y aquella en la
que se acepta
.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
16 / 46
Paso 4: Se formula la regla de decisión
Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de
significancia de 0.05
Observaciones
El área en que se acepta la hipótesis nula se localiza a la izquierda de 1.65. En
breve se explicará la forma de obtener el valor de 1.65.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
17 / 46
Paso 4: Se formula la regla de decisión
Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de
significancia de 0.05
Observaciones
El área de rechazo se encuentra a la derecha de 1.65.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
17 / 46
Paso 4: Se formula la regla de decisión
Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de
significancia de 0.05
Observaciones
Se aplica una prueba de una sola cola (este hecho también se explicará más
adelante).
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
17 / 46
Paso 4: Se formula la regla de decisión
Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de
significancia de 0.05
Observaciones
Se eligió el nivel de significancia de 0.05.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
17 / 46
Paso 4: Se formula la regla de decisión
Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de
significancia de 0.05
Observaciones
La distribución muestral del estadı́stico z tiene una distribución normal.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
17 / 46
Paso 4: Se formula la regla de decisión
Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de
significancia de 0.05
Observaciones
El valor 1.65 separa las regiones en que se rechaza la hipótesis nula y en la que
se acepta.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
17 / 46
Paso 4: Se formula la regla de decisión
Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de
significancia de 0.05
Observaciones
El valor de 1.65 es el valor crı́tico.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
17 / 46
Paso 5: Se toma una decisión
El quinto y último paso en la prueba de hipótesis consiste en calcular el estadı́stico
de la prueba, comparándola con el valor crı́tico, y tomar la decisión de rechazar o no
la hipótesis nula.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
18 / 46
Contenido
1
Introducción
2
¿Qué es una hipótesis estadı́stica y cómo se prueba?
3
Procedimiento para probar una hipótesis
4
Pruebas de significancia de una y dos colas
5
Valor p en la prueba de hipótesis
6
Pruebas relacionadas con proporciones
7
Error Tipo II
8
Pruebas de hipótesis de dos muestras
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
19 / 46
Prueba de hipótesis para la media de una población normal con
varianza conocida
Para la media de una población se puede formular las siguientes hipótesis:
Hipótesis nula:
El estadı́stico de prueba que deberá usarse para la media de una sóla población
conociendose las varianzas es:
z=
Hipótesis
alternativa
Manuel Correa Giraldo (EAFIT)
x̄ − µ
√
σ/ n
(6)
Región de rechazo para la prueba de nivel
α
Pruebas de hipótesis
2 de octubre de 2017
20 / 46
Prueba de hipótesis para la media de una población normal con
varianza conocida
Para la media de una población se puede formular las siguientes hipótesis:
Hipótesis nula:
H0 : µ ≤ µ 0
El estadı́stico de prueba que deberá usarse para la media de una sóla población
conociendose las varianzas es:
z=
Hipótesis
alternativa
H 1 : µ > µ0
Manuel Correa Giraldo (EAFIT)
x̄ − µ
√
σ/ n
(6)
Región de rechazo para la prueba de nivel
α
z ≥ zα (prueba de cola superior)
Pruebas de hipótesis
2 de octubre de 2017
20 / 46
Prueba de hipótesis para la media de una población normal con
varianza conocida
Para la media de una población se puede formular las siguientes hipótesis:
Hipótesis nula:
H0 : µ ≤ µ 0
H0 : µ ≥ µ 0
El estadı́stico de prueba que deberá usarse para la media de una sóla población
conociendose las varianzas es:
z=
Hipótesis
alternativa
H 1 : µ > µ0
H 1 : µ < µ0
Manuel Correa Giraldo (EAFIT)
x̄ − µ
√
σ/ n
(6)
Región de rechazo para la prueba de nivel
α
z ≥ zα (prueba de cola superior)
z ≤ −zα (prueba de cola inferior)
Pruebas de hipótesis
2 de octubre de 2017
20 / 46
Prueba de hipótesis para la media de una población normal con
varianza conocida
Para la media de una población se puede formular las siguientes hipótesis:
Hipótesis nula:
H0 : µ ≤ µ 0
H0 : µ ≤ µ 0
H0 : µ = µ 0
El estadı́stico de prueba que deberá usarse para la media de una sóla población
conociendose las varianzas es:
z=
Hipótesis
alternativa
H 1 : µ > µ0
H 1 : µ < µ0
H1 : µ 6= µ0
Manuel Correa Giraldo (EAFIT)
x̄ − µ
√
σ/ n
(6)
Región de rechazo para la prueba de nivel
α
z ≥ zα (prueba de cola superior)
z ≤ −zα (prueba de cola inferior)
z ≥ zα/2 o z ≤ −zα/2 (prueba de dos colas)
Pruebas de hipótesis
2 de octubre de 2017
20 / 46
Prueba de hipótesis para la media de una población normal con
varianza conocida
Ejemplo
Suponga que el vicepresidente desea saber si hubo un incremento de la cantidad de
unidades que se armaron. ¿Puede concluir, debido al mejoramiento de los métodos de
producción, que la cantidad media de escritorios que se ensamblaron en las pasadas
50 semanas fue superior a 200?
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
21 / 46
Prueba de hipótesis para la media de una población normal con
varianza conocida
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
22 / 46
Contenido
1
Introducción
2
¿Qué es una hipótesis estadı́stica y cómo se prueba?
3
Procedimiento para probar una hipótesis
4
Pruebas de significancia de una y dos colas
5
Valor p en la prueba de hipótesis
6
Pruebas relacionadas con proporciones
7
Error Tipo II
8
Pruebas de hipótesis de dos muestras
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
23 / 46
Valor p en la prueba de hipótesis
El valor p proporciona una medida intuitiva de la fuerza de la evidencia en los datos
en contra de H0
Definición valor p
El valor p es la probabilidad, calculada suponiendo que la hipótesis nula es cierta, de
obtener un valor del estadı́stico de prueba por lo menos tan contradictorio para H0
como el valor calculado a partir de la muestra disponible.
Tener en cuenta:
1
El valor p es una probabilidad.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
24 / 46
Valor p en la prueba de hipótesis
El valor p proporciona una medida intuitiva de la fuerza de la evidencia en los datos
en contra de H0
Definición valor p
El valor p es la probabilidad, calculada suponiendo que la hipótesis nula es cierta, de
obtener un valor del estadı́stico de prueba por lo menos tan contradictorio para H0
como el valor calculado a partir de la muestra disponible.
Tener en cuenta:
1
El valor p es una probabilidad.
2
Esta probabilidad se calcula suponiendo que la hipótesis nula es cierta.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
24 / 46
Valor p en la prueba de hipótesis
El valor p proporciona una medida intuitiva de la fuerza de la evidencia en los datos
en contra de H0
Definición valor p
El valor p es la probabilidad, calculada suponiendo que la hipótesis nula es cierta, de
obtener un valor del estadı́stico de prueba por lo menos tan contradictorio para H0
como el valor calculado a partir de la muestra disponible.
Tener en cuenta:
1
El valor p es una probabilidad.
2
Esta probabilidad se calcula suponiendo que la hipótesis nula es cierta.
3
¡Tenga cuidado: el valor p no es la probabilidad de que H0 sea cierta, ni es la
probabilidad de error!
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
24 / 46
Valor p en la prueba de hipótesis
El valor p proporciona una medida intuitiva de la fuerza de la evidencia en los datos
en contra de H0
Definición valor p
El valor p es la probabilidad, calculada suponiendo que la hipótesis nula es cierta, de
obtener un valor del estadı́stico de prueba por lo menos tan contradictorio para H0
como el valor calculado a partir de la muestra disponible.
Tener en cuenta:
1
El valor p es una probabilidad.
2
Esta probabilidad se calcula suponiendo que la hipótesis nula es cierta.
3
¡Tenga cuidado: el valor p no es la probabilidad de que H0 sea cierta, ni es la
probabilidad de error!
4
Para determinar el valor p, primero se debe decidir qué valores del estadı́stico de
prueba son al menos tan contradictorios para H0 como el valor obtenido de la
muestra.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
24 / 46
Valor p en la prueba de hipótesis
Cuanto menor sea el valor de p, es mayor la evidencia que hay en los datos de la
muestra en contra de la hipótesis nula y la hipótesis alternativa. Es decir, H0 debe
ser rechazada a favor de H1 , cuando el valor p es suficientemente pequeño. Pero,
¿Qué es suficientemente pequeño?
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
25 / 46
Valor p en la prueba de hipótesis
Cuanto menor sea el valor de p, es mayor la evidencia que hay en los datos de la
muestra en contra de la hipótesis nula y la hipótesis alternativa. Es decir, H0 debe
ser rechazada a favor de H1 , cuando el valor p es suficientemente pequeño. Pero,
¿Qué es suficientemente pequeño?
Regla de decisión basada en el valor p
Se selecciona un nivel de significancia α (error tipo I deseado para la probabilidad).
A continuación,
Rechazar H0 si el valor p ≤ α
No rechazar H0 si el valor p > α
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
25 / 46
Valor p en la prueba de hipótesis
Cuanto menor sea el valor de p, es mayor la evidencia que hay en los datos de la
muestra en contra de la hipótesis nula y la hipótesis alternativa. Es decir, H0 debe
ser rechazada a favor de H1 , cuando el valor p es suficientemente pequeño. Pero,
¿Qué es suficientemente pequeño?
Regla de decisión basada en el valor p
Se selecciona un nivel de significancia α (error tipo I deseado para la probabilidad).
A continuación,
Rechazar H0 si el valor p ≤ α
No rechazar H0 si el valor p > α
De esta manera. Si el valor p excede el nivel de significancia elegido, la hipótesis nula
no se puede rechazar a este nivel. Pero si el valor p es igual o menor que α, entonces
hay pruebas suficientes para justificar el rechazo de H0 .
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
25 / 46
Valor p en la prueba de hipótesis
Ejemplo
Calcular el valor p para el ejemplo de la cantidad de escritorios producidos a la
semana en Fredonia e interpretar.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
26 / 46
Valor p en la prueba de hipótesis
Ejemplo
Calcular el valor p para el ejemplo de la cantidad de escritorios producidos a la
semana en Fredonia e interpretar.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
26 / 46
Valor p en la prueba de hipótesis
Ejemplo
Calcular el valor p para el ejemplo de la cantidad de escritorios producidos a la
semana en Fredonia e interpretar.
Interpretación de la evidencia en contra de H0
Si el valor p es menor que:
0.10, hay cierta evidencia de que H0 no es verdadera.
0.05, hay evidencia fuerte de que H0 no es verdadera.
0.01, hay evidencia muy fuerte de que H0 no es verdadera.
0.001, hay evidencia extremadamente fuerte de que H0 no es verdadera.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
26 / 46
Prueba de hipótesis para la media de una población normal con
varianza desconocida
Para la media de una población se puede formular las siguientes hipótesis:
Hipótesis nula:
El estadı́stico de prueba que deberá usarse para la media de una sóla población
desconociendose las varianzas es:
t=
Hipótesis
alternativa
Manuel Correa Giraldo (EAFIT)
x̄ − µ
√
s/ n
(7)
Región de rechazo para la prueba de nivel
α
Pruebas de hipótesis
2 de octubre de 2017
27 / 46
Prueba de hipótesis para la media de una población normal con
varianza desconocida
Para la media de una población se puede formular las siguientes hipótesis:
Hipótesis nula:
H 0 : µ ≤ µ0
El estadı́stico de prueba que deberá usarse para la media de una sóla población
desconociendose las varianzas es:
t=
Hipótesis
alternativa
H 1 : µ > µ0
Manuel Correa Giraldo (EAFIT)
x̄ − µ
√
s/ n
(7)
Región de rechazo para la prueba de nivel
α
t ≥ tα,n−1 (prueba de cola superior)
Pruebas de hipótesis
2 de octubre de 2017
27 / 46
Prueba de hipótesis para la media de una población normal con
varianza desconocida
Para la media de una población se puede formular las siguientes hipótesis:
Hipótesis nula:
H 0 : µ ≤ µ0
H 0 : µ ≥ µ0
El estadı́stico de prueba que deberá usarse para la media de una sóla población
desconociendose las varianzas es:
t=
Hipótesis
alternativa
H 1 : µ > µ0
H 1 : µ < µ0
Manuel Correa Giraldo (EAFIT)
x̄ − µ
√
s/ n
(7)
Región de rechazo para la prueba de nivel
α
t ≥ tα,n−1 (prueba de cola superior)
t ≤ −tα,n−1 (prueba de cola inferior)
Pruebas de hipótesis
2 de octubre de 2017
27 / 46
Prueba de hipótesis para la media de una población normal con
varianza desconocida
Para la media de una población se puede formular las siguientes hipótesis:
Hipótesis nula:
H 0 : µ ≤ µ0
H 0 : µ ≤ µ0
H 0 : µ = µ0
El estadı́stico de prueba que deberá usarse para la media de una sóla población
desconociendose las varianzas es:
t=
Hipótesis
alternativa
H 1 : µ > µ0
H 1 : µ < µ0
H1 : µ 6= µ0
Manuel Correa Giraldo (EAFIT)
x̄ − µ
√
s/ n
(7)
Región de rechazo para la prueba de nivel
α
t ≥ tα,n−1 (prueba de cola superior)
t ≤ −tα,n−1 (prueba de cola inferior)
t ≥ tα/2,n−1 o t ≤ −tα/2,n−1 (prueba de dos
colas)
Pruebas de hipótesis
2 de octubre de 2017
27 / 46
Prueba de hipótesis para la media de una población normal con
varianza desconocida
Ejemplo
El departamento de quejas de McFarland Insurance Company informa que el costo
medio para tramitar una queja es de $60. Una comparación en la industria demostró
que esta cantidad es mayor que en las demás compañı́as de seguros, ası́ que la
compañı́a tomó medidas para reducir gastos. Para evaluar el efecto de las medidas de
reducción de gastos, el supervisor del departamento de quejas seleccionó una muestra
aleatoria de 26 quejas atendidas el mes pasado. La información de la muestra aparece
a continuación.
¿Es razonable concluir que el costo medio de atención de una queja ahora es menor a
$60 con un nivel de significancia de 0.01?
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
28 / 46
Prueba de hipótesis para la media de una población normal con
varianza desconocida
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
29 / 46
Prueba de hipótesis para la media de una población normal con
varianza desconocida
Ejemplo
La longitud media de una pequeña barra de contrapeso es de 43 milı́metros. Al
supervisor de producción le preocupa que hayan cambiado los ajustes de la máquina
de producción de barras. Solicita una investigación al departamento de ingenierı́a,
que selecciona una muestra aleatoria de 12 barras y las mide. Los resultados aparecen
en seguida, expresados en milı́metros.
¿Es razonable concluir que cambió la longitud media de las barras? Utilice el nivel de
significancia 0.02.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
30 / 46
Prueba de hipótesis para la media de una población normal con
varianza desconocida
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
31 / 46
Contenido
1
Introducción
2
¿Qué es una hipótesis estadı́stica y cómo se prueba?
3
Procedimiento para probar una hipótesis
4
Pruebas de significancia de una y dos colas
5
Valor p en la prueba de hipótesis
6
Pruebas relacionadas con proporciones
7
Error Tipo II
8
Pruebas de hipótesis de dos muestras
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
32 / 46
Prueba de hipótesis para la proporción de una población
Para la proporción de una población, se supone que se satisfacen los supuestos binomiales, se
puede formular las siguientes hipótesis:
Hipótesis nula:
El estadı́stico de prueba que deberá usarse para la proporción de una sóla población es:
p̂ − p
z= q
(8)
p(1−p)
n
Hipótesis
alternativa
Manuel Correa Giraldo (EAFIT)
Región de rechazo para la prueba de nivel
α
Pruebas de hipótesis
2 de octubre de 2017
33 / 46
Prueba de hipótesis para la proporción de una población
Para la proporción de una población, se supone que se satisfacen los supuestos binomiales, se
puede formular las siguientes hipótesis:
Hipótesis nula:
H0 : p ≤ p0
El estadı́stico de prueba que deberá usarse para la proporción de una sóla población es:
p̂ − p
z= q
(8)
p(1−p)
n
Hipótesis
alternativa
H1 : p > p 0
Manuel Correa Giraldo (EAFIT)
Región de rechazo para la prueba de nivel
α
z ≥ zα (prueba de cola superior)
Pruebas de hipótesis
2 de octubre de 2017
33 / 46
Prueba de hipótesis para la proporción de una población
Para la proporción de una población, se supone que se satisfacen los supuestos binomiales, se
puede formular las siguientes hipótesis:
Hipótesis nula:
H0 : p ≤ p0
H0 : p ≥ p0
El estadı́stico de prueba que deberá usarse para la proporción de una sóla población es:
p̂ − p
z= q
(8)
p(1−p)
n
Hipótesis
alternativa
H1 : p > p 0
H1 : p < p 0
Manuel Correa Giraldo (EAFIT)
Región de rechazo para la prueba de nivel
α
z ≥ zα (prueba de cola superior)
z ≤ −zα (prueba de cola inferior)
Pruebas de hipótesis
2 de octubre de 2017
33 / 46
Prueba de hipótesis para la proporción de una población
Para la proporción de una población, se supone que se satisfacen los supuestos binomiales, se
puede formular las siguientes hipótesis:
Hipótesis nula:
H0 : p ≤ p0
H0 : p ≤ p0
H0 : p = p0
El estadı́stico de prueba que deberá usarse para la proporción de una sóla población es:
p̂ − p
z= q
(8)
p(1−p)
n
Hipótesis
alternativa
H1 : p > p 0
H1 : p < p 0
H1 : p 6= p0
Manuel Correa Giraldo (EAFIT)
Región de rechazo para la prueba de nivel
α
z ≥ zα (prueba de cola superior)
z ≤ −zα (prueba de cola inferior)
z ≥ zα/2 o z ≤ −zα/2 (prueba de dos colas)
Pruebas de hipótesis
2 de octubre de 2017
33 / 46
Prueba de hipótesis para la proporción de una población
Ejemplo
Suponga que a partir de las elecciones anteriores en un estado, para que sea electo un
candidato a gobernador, es necesario que gane por lo menos 80 % de los votos de la
zona norte. El gobernador de turno está interesado en evaluar sus posibilidades de
volver al cargo y hace planes para llevar a cabo una encuesta de 2 000 votantes
registrados en esa región. Un sondeo reveló que 1 550 pensaban votar por el
gobernador de turno. Aplique el procedimiento para probar hipótesis y evalúe las
posibilidades de que el gobernador se reelija.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
34 / 46
Contenido
1
Introducción
2
¿Qué es una hipótesis estadı́stica y cómo se prueba?
3
Procedimiento para probar una hipótesis
4
Pruebas de significancia de una y dos colas
5
Valor p en la prueba de hipótesis
6
Pruebas relacionadas con proporciones
7
Error Tipo II
8
Pruebas de hipótesis de dos muestras
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
35 / 46
Error Tipo II
Recuerde que el nivel de significancia, identificado con el sı́mbolo α, es la
probabilidad de que la hipótesis nula se rechace cuando es verdadera. Esto recibe el
nombre de error tipo I.
En un caso de prueba de hipótesis también existe la posibilidad de que no se rechace
una hipótesis nula cuando en realidad es falsa. Es decir, se acepta una hipótesis nula
falsa. Esto recibe el nombre de error tipo II. La probabilidad de un error tipo II se
identifica con la letra griega beta (β).
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
36 / 46
Error Tipo II
Ejemplo
Western Wire Products compra barras de acero para hacer clavijas. La experiencia
indica que la fuerza media de tensión de las cargas que llegan es de 10 000 psi, y que
la desviación estándar, σ, es de 400 psi. Con el fin de tomar una decisión sobre las
cargas de barras de acero que llegan, el fabricante establece la siguiente regla para
que el inspector de control de calidad se apegue a ella:
Tome una muestra de 100 barras de acero. Si la fuerza media se encuentra entre
9922 y 10078 psi con un nivel de significancia de 0.05, acepte el lote. De lo contrario,
debe rechazarlo.
Suponga que la media poblacional desconocida de un lote que llega, designada µ, es
en realidad de 9 900 psi. ¿Cuál es la probabilidad de que el inspector de control de
calidad no rechace la carga (error tipo II)?
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
37 / 46
Error Tipo II
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
38 / 46
Contenido
1
Introducción
2
¿Qué es una hipótesis estadı́stica y cómo se prueba?
3
Procedimiento para probar una hipótesis
4
Pruebas de significancia de una y dos colas
5
Valor p en la prueba de hipótesis
6
Pruebas relacionadas con proporciones
7
Error Tipo II
8
Pruebas de hipótesis de dos muestras
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
39 / 46
Pruebas de hipótesis de dos muestras: muestras independientes
Prueba sobre dos medias con varianzas conocidas
Si se está probando:
H0 : µ1 = µ 2
H1 : µ1 6= µ2
El estadı́stico de prueba que deberá usarse para comparar las medias de dos
tratamientos conociendose las varianzas es:
x¯1 − x¯2
z0 = q 2
σ2
σ1
+ n22
n1
(9)
Donde x¯1 y x¯2 son las medias de muestras aleatorias independientes de tamaños n1 y
n2 de poblaciones con varianzas conocidas σ12 y σ22 , respectivamente.
Si ambas poblaciones son normales, o si los tamaños de las muestras son lo
suficientemente grandes para aplicar el teorema del lı́mite central, z0 se distribuye
como N (0, 1).
H0 se rechazarı́a si |z0 | > zα/2 , donde zα/2 es el punto porcentual α/2 superior de la
distribución normal estándar.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
40 / 46
Pruebas de hipótesis de dos muestras: muestras independientes
Ejemplo
Los clientes de los supermercados FoodTown tienen una opción al pagar por sus compras.
Pueden pagar en una caja registradora normal operada por un cajero, o emplear el nuevo
procedimiento: Fast Lane. Cuando eligen la primera alternativa, un empleado registra cada
artı́culo, lo pone en una banda transportadora pequeña de donde otro empleado lo toma y lo
pone en una bolsa, y después en el carrito de vı́veres. En el procedimiento Fast Lane, el
cliente registra cada artı́culo, lo pone en una bolsa y coloca las bolsas en el carrito. Este
procedimiento está diseñado para reducir el tiempo que los clientes pierden en la fila de la
caja. El aparato de Fast Lane se acaba de instalar en la sucursal de la calle Byrne de
FoodTown. La gerente de la tienda desea saber si el tiempo medio de pago con el método
tradicional es mayor que con Fast Lane, para lo cual reunió la información siguiente sobre la
muestra. El tiempo se mide desde el momento en que el cliente ingresa a la fila hasta que sus
bolsas están en el carrito. De aquı́ que el tiempo incluye tanto la espera en la fila como el
registro. ¿Cuál es el valor p?
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
41 / 46
Pruebas de hipótesis de dos muestras: muestras independientes
Prueba sobre dos medias con varianzas deconocidas y diferentes
Suponga que se está probando:
H0 : µ1 = µ 2
H1 : µ1 6= µ2
Bajo el supuesto de que las varianzas son desconocidas e idénticas. El estadı́stico de
prueba que deberá usarse para comparar las medias de dos tratamientos es:
t0 =
(x¯1 − x¯2 )
q
sp n11 + n12
(10)
Dónde: x¯1 y x¯2 son las medias muestrales
n1 y n2 los tamaños de las muestras. y s2p es una estimación de la varianza común
σ12 = σ22 = σ 2 , calculada a partir de:
s2p =
(n1 − 1) s21 + (n2 − 1) s22
n1 + n2 − 2
(11)
Sabiendo que s21 y s22 son las varianzas muestrales.
Para determinar si deberá rechazarse H0 : µ1 = µ2 . Se compara t0 con la distribución
t con n1 + n2 − 2 grados de libertad.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
42 / 46
Pruebas de hipótesis de dos muestras: muestras independientes
Ejemplo:
Owens Lawn Care, Inc., fabrica y ensambla podadoras de césped que envı́a a distribuidores
instalados en Estados Unidos y Canadá. Se han propuesto dos procedimientos distintos para
el montaje del motor al chasis de la podadora. La pregunta es: ¿existe una diferencia entre
ellos con respecto al tiempo medio para montar los motores al chasis de las podadoras? El
primer procedimiento lo desarrolló Herb Welles, un antiguo empleado de Owens (designado
como procedimiento 1), y el otro lo desarrolló William Atkins, vicepresidente de ingenierı́a
de Owens (designado como procedimiento 2). Para evaluar los dos métodos, se decidió
realizar un estudio de tiempos y movimientos. Se midió el tiempo de montaje en una
muestra de cinco empleados según el método de Welles y seis con el método de Atkins. Los
resultados, en minutos, aparecen a continuación. ¿Hay alguna diferencia entre los tiempos
medios de montaje? Utilice un nivel de significancia de 0.10 y suponga que las dos
poblaciones tienen desviaciones estándares iguales.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
43 / 46
Pruebas de hipótesis de dos muestras: muestras independientes
Prueba sobre dos medias con varianzas deconocidas y diferentes
Suponga que se está probando:
H0 : µ1 = µ 2
H1 : µ1 6= µ2
En este caso el estadistico de prueba es:
x¯1 − x¯2
t0 = q 2
s2
s1
+ n22
n1
(12)
La distribución t es una buena aproximación de t0 si se usa:
gl =
s2
1
n1
(s21 /n1 )2
n1 −1
+
+
s2
2
n2
2
(13)
(s22 /n2 )2
n2 −1
para los grados de libertad.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
44 / 46
Pruebas de hipótesis de dos muestras: muestras independientes
Ejemplo
El personal en un laboratorio de pruebas del consumidor evalúa la absorción de toallas de
papel. Se desea comparar un conjunto de toallas de una marca con un grupo similar de
toallas de otra marca. De cada una de ellas se sumerge una pieza del papel en un tubo con un
fluido, se deja que el papel escurra en una charola durante dos minutos y después se evalúa
la cantidad de lı́quido que el papel absorbió de la charola. Una muestra aleatoria de 9 toallas
de papel de la primera marca absorbió las cantidades siguientes de lı́quido en milı́metros.
Una muestra aleatoria independiente de 12 toallas de la otra marca absorbió las cantidades
siguientes de lı́quido en milı́metros.
Utilice el nivel de significancia de 0.10 y pruebe si existe una diferencia entre las cantidades
medias de lı́quido que absorbieron los dos tipos de toallas.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
45 / 46
Referencias I
Lind, D. A. M., Wathen, W. G., Lind, S. A. D. A., Marchal, W. G., and Wathen, S. A.
(2015).
Estadı́stica aplicada a los negocios y la economı́a.
McGraw-Hill,, 16 edition.
Manuel Correa Giraldo (EAFIT)
Pruebas de hipótesis
2 de octubre de 2017
46 / 46