Nothing Special   »   [go: up one dir, main page]

Semana 11 Prueba Hipotesis

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 48

Unidad 3 – Sesión 11

FACULTAD DE COMERCIO
Estudios Generales EXTERIOR Y
RELACIONES INTERNACIONALES

PRUEBA DE HIPOTESIS

• Conceptos
• Importancia
• Ejemplos

ESTADISTICA II
JUAN JOSE SILVA NUÑEZ
Prueba de Hipótesis
Identificación de estadígrafos
• En sesiones anteriores se ha mostrado cómo
puede estimarse un parámetro de una
población a partir de los datos contenidos en
una muestra.
• Puede encontrarse ya sea un sólo número
(estimador puntual) o un intervalo de valores
posibles (intervalo de confianza)
• Sin embargo, muchos problemas de ingeniería,
ciencia, y administración, requieren que se tome
una decisión entre aceptar o rechazar una
proposición sobre algún parámetro de la población.
• Esta proposición recibe el nombre de Hipótesis.
• Este es uno de los aspectos más útiles de la
inferencia estadística, puesto que muchos tipos de
problemas de toma de decisiones, pruebas o
experimentos en el mundo de la ingeniería, pueden
formularse como problemas de prueba de tesis
Definición
• Tenemos que empezar por definir que es una
“hipótesis” y que es “prueba de hipótesis”.
Hipótesis:
• Es una aseveración de una población
elaborado con el propósito de poner aprueba,
para verificar si la afirmación es razonable se
usan datos.
• En el análisis estadístico se hace una
aseveración, es decir, se plantea una hipótesis,
después se hacen las pruebas para verificar la
aseveración o para determinar que no es
verdadera.
• Por tanto, la prueba de hipótesis es un
procedimiento basado en la evidencia muestral y
la teoria de probabilidad; se emplea para
determinar si la hipótesis es una afirmación
razonable.
Prueba de una hipótesis:
• se realiza mediante un procedimiento sistemático de
cinco paso:

• Siguiendo este procedimiento sistemático, al llegar al


paso cinco se puede o no rechazar la hipótesis, pero
debemos de tener cuidado con esta determinación ya
que en la consideración de estadística no proporciona
evidencia de que algo sea verdadero. Esta prueba
aporta una clase de prueba más allá de una duda
razonable. Analizaremos cada paso en detalle
Contenidos
• Establecimiento de una hipótesis nula y
alterna
• Errores tipo I y II
• Pruebas uni y bilaterales sobre la media
• Prueba de hipótesis y toma de decisiones
Tipos de hipótesis
• En la prueba de hipótesis se comienza
proponiendo una hipótesis tentativa acerca de
un parámetro poblacional
• A la hipótesis tentativa se le denomina hipótesis
nula (H0)
• La hipótesis alternativa es la opuesta de lo que
se afirma en H0 y se representa por Ha
• El procedimiento de prueba de hipótesis
comprende el uso de datos de una muestra
para probar las 2 aseveraciones propuestas
• Es necesario practicar para poder formular
hipótesis en forma correcta
• Las formas de H0 y Ha van a depender de la
aplicación en la cual deseamos realizar la
prueba
• La prueba de hipótesis es una demostración
de contradicción
• Se presentan generalmente 3 tipos de
situaciones en los cuales debemos establecer
hipótesis:
– Prueba de hipótesis en Investigación
– Prueba de validez de una afirmación
– Prueba en casos de toma de decisiones
• Resumen de formas para hipótesis nula y
alterna ( valor de interés)
H 0 :   0 H 0 :   0 H 0 :   0

H a :   0 H a :   0 H a :   0

– La igualdad siempre aparece vinculada al la


hipótesis nula
– Una forma de facilitar la selección de la forma
adecuada de las hipótesis es asignando lo que se
quiere demostrar a la Ha
Nivel de significancia

• Probabilidad de rechazar la hipótesis nula


cuando es verdadera. Se le denota mediante
la letra griega α, también es denominada
como nivel de riesgo, este termino es mas
adecuado ya que se corre el riesgo de
rechazar la hipótesis nula, cuando en
realidad es verdadera. Este nivel esta bajo el
control de la persona que realiza la prueba.
• Si suponemos que la hipótesis planteada es
verdadera, entonces, el nivel de significación
indicará la probabilidad de no aceptarla, es
decir, estén fuera de área de aceptación. El
nivel de confianza (1-α), indica la
probabilidad de aceptar la hipótesis
planteada, cuando es verdadera en la
población
Grafica de prueba de
hipotesis
Una operación en una línea de producción debe llenar
cajas con detergente hasta un peso promedio de 300
gr. Periódicamente se selecciona una muestra de cajas
llenas. Si los datos de la muestra llevan a la conclusión
de que les falta o sobra detergente, se debe parar la
línea de producción, y hacer los ajustes necesarios

1. Formule la hipótesis nula H0 y alterna Ha , H1


2. Comente la conclusión y la decisión cuando no
se puede rechazar H0
Ejemplo:
• Empecemos con un ejemplo, suponga que se
tiene interés en la rapidez de combustión de un
agente propulsor sólido utilizado en los sistemas
de salida de emergencia para la tripulación de
aeronaves. El interés se centra sobre la rapidez de
combustión promedio. De manera específica, el
interés recae en decir si la rapidez de
combustión promedio es o no 50 cm/s. Esto
puede expresarse de manera formal como dos
alternativas o hipótesis:

Ho: μ = 50 cm/s La rapidez promedio sí es de 50 cm/s


H1: μ ≠ 50 cm/s La rapidez promedio no es de 50 cm/s
• Ho: μ = 50 cm/s La rapidez promedio sí es de 50 cm/s

• La proposición Ho:μ = 50 cm/s se conoce como hipótesis


nula (PENSAR: NO HAY DIFERENCIA) , mientras que la
proposición

• H1: μ ≠ 50 cm/s La rapidez promedio no es de 50 cm/s

• H1:μ≠50 cm/s, recibe el nombre de hipótesis alternati


• va (PENSAR: SÍ HAY DIFERENCIA).
Error tipo I y II
• Las hipótesis nula y alterna son
aseveraciones sobre la población que
compiten entre sí
• No siempre es posible que las conclusiones
sean verdaderas o correctas

H0 verdadera Ha verdadera

Aceptar H0 Conclusión
Error tipo II
Correcta

Rechazar H0 Conclusión
Error tipo I
Correcta
• No se puede eliminar la posibilidad de errores en la
prueba de hipótesis, pero si es posible considerar su
probabilidad
• Se define como:
 =probabilidad de cometer un error tipo I
 =probabilidad de cometer error tipo II
• La máxima probabilidad permisible se le llama nivel
de significancia para la prueba. Los valores
acostumbrados son de 0.05 y 0.01
• En la mayoría de las aplicaciones se controla la
probabilidad de cometer error tipo I, luego existe la
incertidumbre con respecto al error tipo II
• Si los datos muéstrales son consistentes con
H0 se adopta en la práctica la conclusión de
“no rechazar H0”, ya que de esta forma
evitamos el riesgo de cometer error tipo II
• La conclusión de “aceptar H0” se toma sólo
cuando se haya determinado el error tipo II
Suponga que se va a implantar un nuevo
método de producción si una prueba de
hipótesis respalda la conclusión de que con ese
método se reduce la media del costo de
operación por hora
1.Enuncie las hipótesis nula y alterna si la media del
costo para el método actual de producción es de $220
por hora
2.¿Cuál es el error de tipo I en este caso y sus
consecuencias?
3.¿Cuál es el error tipo II en este caso y sus
consecuencias?
Ejemplo de aceptación de
hipótesis
Pruebas unilaterales para la
media
Muestra Grande
• En este caso (n>30) se asume distribución normal
• Para pruebas de hipótesis acerca de la media de una
población se emplea el estadígrafo z

z
 X  
/ n
• Se determina si la desviación del valor numérico en
estudio es lo suficiente para justificar el rechazo de la
hipótesis nula
• La probabilidades 0.05 y 0.01 de cometer
error tipo I están relacionadas con un valor
de z de –1.645 y –2.33 respectivamente
• Luego se debe rechazar H0 si el valor de z es
menor a –1.645 o –2.33 dependiendo del
nivel de significancia
• El valor z establece el límite de la región de
rechazo denominada valor crítico
Definición de hipótesis
/2=0.025 /2=0.025

-1.96 0 1.96
-z z
• Resumen de pruebas unilaterales sobre
media de una población. Si n30
=0.05 =0.01

-1.645 0 2.33 z
Rechazar H0 Rechazar H0
Muestra Pequeña
• En este caso (n < 30) se asume que la población
tiene una distribución normal
• Con distribución t se pueden hacer inferencias acerca
de la media de la población
X  0
t
s/ n

• Para este estadígrafo se debe considerar los grados


de libertad asociados al tamaño de la muestra (n-1)
para definir el valor crítico que llevará al rechazo de
H0. Por las características de la tabla resulta
complicado calcular el valor de p por lo que se
expresa en intervalos
Ejemplo 1:
Después de realizar un estudio extensivo se sabe que una
nueva variedad de Gerbera presenta para ciertas condiciones
de invernadero 25 tallos por planta. Sin embargo después de
establecer 40 parcelas bajo las mismas condiciones en ese
invernadero se encontró un promedio de 20 tallos por planta
con una σ de 2.0.

Hipótesis a Dato
probar
Ha: 20 < s
µo=25 µ = 20 σ = 2.0 n = 40
25
Z0.05 = -1.64
Ho: 20 ≥ 20 25
25 Z
Obtener el
2
40
estadístico Z
 5.0
x  0 Z
Z  0.3162

n Z  15.81
Determinar la región de
rechazo
Z<-Z0.05
-15.81 < -1.64

En este sentido, Z es
menor que -Zα
Z=- -Zα=-1.64
15.81

Por lo tanto se rechaza Ho y se puede concluir a un nivel


de probabilidad del 0.05 que la nueva variedad presenta
menos de 25 tallos por planta.
Ejempl
Se
o 2sabe que con la aplicación de cierto aminoácido la longitud
del botón floral en rosa es de 6.5 cm. Sin embargo el fabricante
del aminoácido afirma que la longitud puede ser mayor, para
probar su hipótesis aplica el aminoácido a 64 plantas y
encuentra una longitud promedio de 7.8 cm con una σ de 1.2
cm.

¿Puede afirmar el fabricante a un nivel de significancia del 0.01


que la aplicación del aminoácido aumente la longitud del botón
floral en rosa?.
Hipótesis a Dato
probar s
µo=6.5 µ = 7.8 σ = 1.2 n = 64
Ha: 7.8 >
6.5 Z0.01= 2.33
7.8  6.5
Ho: 7.8 ≤ Z
1.2
5.0
Obtener el 64
x  0
estadístico Z Z  1.3
 Z
n 0.15
Z  8.66
Determinar la región de rechazo en función de
H0.

Z > Z0.01
11.76 >
2.33

En este sentido, Z es
mayor que Zα
Z0.01=2.3 Z=11.7
3 6

Por lo tanto se rechaza Ho y se puede concluir a un


nivel de probabilidad del 0.01 que el fabricante puede
afirmar que el aminoácido incrementa la longitud del
botón floral en rosa.
Pruebas de hipótesis referentes a una media con
tamaño de muestra reducido (n<30) y/o varianza
poblacional desconocida.
Un caso de mayor interés desde el punto de vista aplicado se
da cuando se tienen tamaños de muestra reducidos (n<30). En
estos casos se debe sustituir al estadístico Z por el estadístico
t en donde:

x 
tc 
S
n

En este sentido, sí se desea contrastar la media de una


muestra aleatoria de una población normalmente distribuida
en contra de una valor particular (µ0). Las regiones de rechazo
para los tres tipos de hipótesis nula que se pueden formular
estarían dadas de la siguiente forma:
26 27 30 32 28 25
30 29 32 28 26
Hipótesis a Datos
probar
Ha: 28.45 > µo=25 x= 28.45 S = 2.38 n = 11 t0.01 (10
25 g.l)= 2.33

Ho: 28.45 ≤
25
Obtener el
estadístico t
x 
t 
c
S t > t0.01
n
4.8 >
28.45 25 1.812
t 
c
2.38
11 t0.01=1.812 Tc=4.
3.45 8
t 
c
0.7175 Por lo tanto se rechaza Ho y se puede
t  4.8
c
concluir a un nivel de probabilidad del
0.01 la nueva variedad produce más flores
Ejemplo 2
Un investigador afirma que una variedad de girasol presenta un
contenido aproximado de aceite del 5 %. Para verificar esta
aseveración se analizaron 15 muestras de semilla, las cuales
presentaron un contenido promedio de aceite de 4.6 % con una
varianza de 0.64 %.
i) Establezca la Ho y Ha
ii) Realice la prueba de hipótesis a un nivel de significancia del 1
%.
iii) A que conclusión llegaría después de efectuar la prueba.
Hipótesis a
probar
Ha: 4.6% < 5.0%
Datos
Ho: 4.6% > 5.0%

µo=5.0 x= 4.6 S = 0.8 n = 15


t0.01 (14 g.l)= -2.624
Obtener el
Establecer la región de
estadístico t
rechazo en términos de
4.6  5.0 H0:
x  t 
t  c
0.8
c
S 15
n  0.4
t 
c
0.2065
t  1.936
c

t0.01, 14 g.l = Tc=-


-2.62 1.93
tc >
t0.01
-1.93 >
-2.62concluir a un
Por lo tanto se no rechaza Ho y se puede
nivel de probabilidad del 0.01 que la variedad de girasol
efectivamente presenta el 5% de aceite.
Ejemplo:
El jefe de la Biblioteca Especializada de la Facultad de Ingeniería
Eléctrica y Electrónica de la UNAC manifiesta que el número
promedio de lectores por día es de 350. Para confirmar o no este
supuesto se controla la cantidad de lectores que utilizaron la
biblioteca durante 30 días. Se considera el nivel de significancia
de 0.05
Día Usuarios Día Usuarios Día Usuario
1 356 11 305 21 429
2 427 12 413 22 376
3 387 13 391 23 328
4 510 14 380 24 411
5 288 15 382 25 397
6 290 16 389 26 365
7 320 17 405 27 405
8 350 18 293 28 369
9 403 19 276 29 429
10 329 20 417 30 364
Solución:
Se trata de un problema con una media poblacional: muestra
grande y desviación estándar poblacional desconocida.

Paso 01: Seleccionamos la hipótesis nula y la hipótesis


alternativa
Ho: μ═350
Ha: μ≠ 350

Paso 02: Nivel de confianza o significancia 95%


α═0.05
Paso 03: Calculamos o determinamos el valor estadístico de
prueba
Media 372.8
Error típico 9.56951578
Mediana 381
Moda 405
Desviación estándar 52.4143965
Varianza de la muestra 2747.26897
Curtosis 0.36687081
Coeficiente de asimetría 0.04706877
Rango 234
Mínimo 276
Máximo 510
Suma 11184
Cuenta 30
Nivel de confianza (95.0%) 19.571868
Paso 04: Formulación de la regla de decisión.
La regla de decisión la formulamos teniendo en cuenta que esta
es una prueba de dos colas, la mitad de 0.05, es decir 0.025,
esta en cada cola. el área en la que no se rechaza Ho esta entre
las dos colas, es por consiguiente 0.95. El valor critico para
0.05 da un valor de Zc = 1.96.
Por consiguiente la regla de decisión: es rechazar la hipótesis
nula y aceptar la hipótesis alternativa, si el valor Z calculado no
queda en la región comprendida entre -1.96 y +1.96. En caso
contrario no se rechaza la hipótesis nula si Z queda entre -1.96
y +1.96.
Paso 05: Toma de decisión.
En este ultimo paso comparamos el estadístico de prueba
calculado es igual a Z = 2.38 y lo comparamos con el valor
critico de Zc = 1.96. Como el estadístico de prueba calculado
cae a la derecha del valor critico de Z, se rechaza Ho. Por tanto
no se confirma el supuesto del Jefe de la Biblioteca.
Una muestra aleatoria de 64 bolsas de
hojuelas de maíz pesan, en promedio 5.23
onzas con una desviación estándar de 0.24
onzas. El fabricante quiere poner en la
etiqueta que el peso promedio es de 5.5
onzas. Probar la hipótesis de que μ≥5.5
onzas contra la hipótesis alternativa, μ< 5. 5
onzas con un nivel de significancia de 0.05
Solucion:
Datos:
μ= 5.5 onzas
s= 0.24 onzas
= 5.23 onzas
n = 64
α = 0.05
Prueba de hipótesis
Ho: μ ≥ 5.5 onzas
H1: μ < 5.5 onzas
  
Regla de decisión:
Si Z ≥ -1.645 No se rechaza Ho
Si Z < -1.645 Se rechaza Ho

Justificación y decisión:
Como –9 < -1.645 por lo tanto se rechaza Ho y se concluye con un
nivel de significancia del 0.05 que las bolsas de hojuelas de maíz
pesan en promedio menos de 5.5 onzas.

También podría gustarte