Nothing Special   »   [go: up one dir, main page]

Academia.eduAcademia.edu

Pruebas de hipótesis de una y dos muestras 1

Pruebas de hipótesis de una y dos muestras1 Manuel Correa Giraldo Escuela de Administración Universidad EAFIT Organización y Gerencia 1 Basado en [Lind et al., 2015] Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 1 / 46 Contenido 1 Introducción 2 ¿Qué es una hipótesis estadı́stica y cómo se prueba? 3 Procedimiento para probar una hipótesis 4 Pruebas de significancia de una y dos colas 5 Valor p en la prueba de hipótesis 6 Pruebas relacionadas con proporciones 7 Error Tipo II 8 Pruebas de hipótesis de dos muestras Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 2 / 46 Introducción Una hipótesis es una declaración relativa a una población. En el sistema legal estadounidense, una persona es inocente hasta que se prueba su culpabilidad. Un jurado plantea como hipótesis que una persona a la que se le imputa un crimen es inocente, y someten esta hipótesis a verificación, para lo cual revisan la evidencia y escuchan el testimonio antes de llegar a un veredicto. Un paciente visita al médico y acusa varios sı́ntomas. Con base en ellos, el médico indicará ciertos exámenes de diagnóstico; en seguida, de acuerdo con los sı́ntomas y los resultados de los exámenes, determina el tratamiento. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 3 / 46 Contenido 1 Introducción 2 ¿Qué es una hipótesis estadı́stica y cómo se prueba? 3 Procedimiento para probar una hipótesis 4 Pruebas de significancia de una y dos colas 5 Valor p en la prueba de hipótesis 6 Pruebas relacionadas con proporciones 7 Error Tipo II 8 Pruebas de hipótesis de dos muestras Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 4 / 46 ¿Qué es una hipótesis y una pruba de hipótesis? Hipótesis estadı́stica Afirmación relativa a un parámetro de la población sujeta a verificación. Prueba de hipótesis estadı́stica Procedimiento basado en evidencia de la muestra y la teorı́a de la probabilidad para determinar si la hipótesis es una afirmación razonable. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 5 / 46 Contenido 1 Introducción 2 ¿Qué es una hipótesis estadı́stica y cómo se prueba? 3 Procedimiento para probar una hipótesis 4 Pruebas de significancia de una y dos colas 5 Valor p en la prueba de hipótesis 6 Pruebas relacionadas con proporciones 7 Error Tipo II 8 Pruebas de hipótesis de dos muestras Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 6 / 46 Procedimiento de cinco pasos para probar una hipótesis Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 7 / 46 Procedimiento de cinco pasos para probar una hipótesis Ejemplo Jamestown Steel Company fabrica y arma escritorios y otros muebles para oficina en diferentes plantas en el oeste del estado de Nueva York. La producción semanal del escritorio modelo A325 en la planta de Fredonia tiene una distribución normal, con una media de 200 y una desviación estándar de 16. Hace poco, con motivo de la expansión del mercado, se introdujeron nuevos métodos de producción y se contrató a más empleados. El vicepresidente de fabricación pretende investigar si hubo algún cambio en la producción semanal del escritorio modelo A325. En otras palabras, ¿la cantidad media de escritorios que se produjeron en la planta de Fredonia es diferente de 200 escritorios semanales con un nivel de significancia de 0.01? La cantidad media de escritorios que se produjeron el año pasado (50 semanas, pues la planta cerró 2 semanas por vacaciones) es de 203.5. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 8 / 46 Paso 1: Se establece la hipótesis nula y la hipótesis alternativa Hipótesis nula (H0 ) Enunciado relativo al valor de un parámetro poblacional que se formula con el fin de probar evidencia numérica. Hipótesis alternativa (H1 ) Enunciado que se acepta si los datos de la muestra ofrecen suficiente evidencia para rechazar la hipótesis nula. Observaciones: Cabe hacer hincapié en que, si la hipótesis nula no se rechaza con base en los datos de la muestra, no es posible decir que la hipótesis nula sea verdadera. En otras palabras, el hecho de no rechazar una hipótesis no prueba que H0 sea verdadera, sino que no rechazamos H0 . La hipótesis alternativa describe lo que se concluirá si se rechaza la hipótesis nula. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 9 / 46 Paso 2: Se selecciona un nivel de significancia Después de establecer las hipótesis nula y alternativa, el siguiente paso consiste en determinar el nivel de significancia. Nivel de significancia Probabilidad de rechazar la hipótesis nula cuando es verdadera. El nivel de significancia se expresa con la letra griega alfa, α. En ocasiones también se conoce como nivel de riesgo. Éste quizá sea un término más adecuado porque se trata del riesgo que se corre al rechazar la hipótesis nula cuando es verdadera. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 10 / 46 Paso 2: Se selecciona un nivel de significancia Error tipo I Rechazar la hipótesis nula, H0 , cuando es verdadera. La probabilidad esta determinada por: α = P (error tipo I) = P (rechazarH0 |H0 es verdadera) (1) Error tipo II Aceptar la hipótesis nula cuando es falsa. La probabilidad esta determinada por: β = P (error tipo II) = P (dejar de rechazarH0 |H0 es falsa) (2) Potencia de la prueba La potencia de una prueba es la probabilidad de rechazar H0 dada una alternativa especifica verdadera. Potencia = 1 − β = P (rechazarH0 |H0 es falsa). Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 (3) 11 / 46 Paso 2: Se selecciona un nivel de significancia Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 12 / 46 Paso 3: Se selecciona el estadı́stico de prueba Hay muchos estadı́sticos de prueba. En este curso se utilizan z y t como estadı́sticos de prueba. Otros estadı́sticos de prueba son F y χ2 , conocida como jicuadrada, para cocientes de varianzas y la varianza de una muestra. Estadı́stico de prueba Valor, determinado a partir de la información de la muestra, para determinar si se rechaza la hipótesis nula. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 13 / 46 Paso 3: Se selecciona el estadı́stico de prueba Estadı́stico de prueba para µ cuando σ es conocida z= X̄ − µ √ σ/ n (4) El valor z se basa en la distribución muestral de X̄ que sigue la distribución normal cuando la muestra es razonablemente √ grande, con una media µX̄ igual a µ y una desviación estándar σX̄ igual a σ/ n Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 14 / 46 Paso 3: Se selecciona el estadı́stico de prueba Estadı́stico de prueba para µ cuando σ es desconocida t= X̄ − µ √ s/ n (5) El valor t se basa en la distribución t de Student con n − 1 grados de libertad. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 15 / 46 Paso 4: Se formula la regla de decisión Regla de decisión Una regla de decisión es un enunciado sobre las condiciones especı́ficas en que se rechaza la hipótesis nula y aquellas en las que no se rechaza. La región o área de rechazo define la ubicación de todos esos valores que son tan grandes o tan pequeños que la probabilidad de que ocurran en una hipótesis nula verdadera es muy remota Valor crı́tico Punto de división entre la región en que se rechaza la hipótesis nula y aquella en la que se acepta . Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 16 / 46 Paso 4: Se formula la regla de decisión Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de significancia de 0.05 Observaciones El área en que se acepta la hipótesis nula se localiza a la izquierda de 1.65. En breve se explicará la forma de obtener el valor de 1.65. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 17 / 46 Paso 4: Se formula la regla de decisión Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de significancia de 0.05 Observaciones El área de rechazo se encuentra a la derecha de 1.65. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 17 / 46 Paso 4: Se formula la regla de decisión Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de significancia de 0.05 Observaciones Se aplica una prueba de una sola cola (este hecho también se explicará más adelante). Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 17 / 46 Paso 4: Se formula la regla de decisión Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de significancia de 0.05 Observaciones Se eligió el nivel de significancia de 0.05. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 17 / 46 Paso 4: Se formula la regla de decisión Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de significancia de 0.05 Observaciones La distribución muestral del estadı́stico z tiene una distribución normal. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 17 / 46 Paso 4: Se formula la regla de decisión Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de significancia de 0.05 Observaciones El valor 1.65 separa las regiones en que se rechaza la hipótesis nula y en la que se acepta. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 17 / 46 Paso 4: Se formula la regla de decisión Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de significancia de 0.05 Observaciones El valor de 1.65 es el valor crı́tico. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 17 / 46 Paso 5: Se toma una decisión El quinto y último paso en la prueba de hipótesis consiste en calcular el estadı́stico de la prueba, comparándola con el valor crı́tico, y tomar la decisión de rechazar o no la hipótesis nula. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 18 / 46 Contenido 1 Introducción 2 ¿Qué es una hipótesis estadı́stica y cómo se prueba? 3 Procedimiento para probar una hipótesis 4 Pruebas de significancia de una y dos colas 5 Valor p en la prueba de hipótesis 6 Pruebas relacionadas con proporciones 7 Error Tipo II 8 Pruebas de hipótesis de dos muestras Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 19 / 46 Prueba de hipótesis para la media de una población normal con varianza conocida Para la media de una población se puede formular las siguientes hipótesis: Hipótesis nula: El estadı́stico de prueba que deberá usarse para la media de una sóla población conociendose las varianzas es: z= Hipótesis alternativa Manuel Correa Giraldo (EAFIT) x̄ − µ √ σ/ n (6) Región de rechazo para la prueba de nivel α Pruebas de hipótesis 2 de octubre de 2017 20 / 46 Prueba de hipótesis para la media de una población normal con varianza conocida Para la media de una población se puede formular las siguientes hipótesis: Hipótesis nula: H0 : µ ≤ µ 0 El estadı́stico de prueba que deberá usarse para la media de una sóla población conociendose las varianzas es: z= Hipótesis alternativa H 1 : µ > µ0 Manuel Correa Giraldo (EAFIT) x̄ − µ √ σ/ n (6) Región de rechazo para la prueba de nivel α z ≥ zα (prueba de cola superior) Pruebas de hipótesis 2 de octubre de 2017 20 / 46 Prueba de hipótesis para la media de una población normal con varianza conocida Para la media de una población se puede formular las siguientes hipótesis: Hipótesis nula: H0 : µ ≤ µ 0 H0 : µ ≥ µ 0 El estadı́stico de prueba que deberá usarse para la media de una sóla población conociendose las varianzas es: z= Hipótesis alternativa H 1 : µ > µ0 H 1 : µ < µ0 Manuel Correa Giraldo (EAFIT) x̄ − µ √ σ/ n (6) Región de rechazo para la prueba de nivel α z ≥ zα (prueba de cola superior) z ≤ −zα (prueba de cola inferior) Pruebas de hipótesis 2 de octubre de 2017 20 / 46 Prueba de hipótesis para la media de una población normal con varianza conocida Para la media de una población se puede formular las siguientes hipótesis: Hipótesis nula: H0 : µ ≤ µ 0 H0 : µ ≤ µ 0 H0 : µ = µ 0 El estadı́stico de prueba que deberá usarse para la media de una sóla población conociendose las varianzas es: z= Hipótesis alternativa H 1 : µ > µ0 H 1 : µ < µ0 H1 : µ 6= µ0 Manuel Correa Giraldo (EAFIT) x̄ − µ √ σ/ n (6) Región de rechazo para la prueba de nivel α z ≥ zα (prueba de cola superior) z ≤ −zα (prueba de cola inferior) z ≥ zα/2 o z ≤ −zα/2 (prueba de dos colas) Pruebas de hipótesis 2 de octubre de 2017 20 / 46 Prueba de hipótesis para la media de una población normal con varianza conocida Ejemplo Suponga que el vicepresidente desea saber si hubo un incremento de la cantidad de unidades que se armaron. ¿Puede concluir, debido al mejoramiento de los métodos de producción, que la cantidad media de escritorios que se ensamblaron en las pasadas 50 semanas fue superior a 200? Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 21 / 46 Prueba de hipótesis para la media de una población normal con varianza conocida Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 22 / 46 Contenido 1 Introducción 2 ¿Qué es una hipótesis estadı́stica y cómo se prueba? 3 Procedimiento para probar una hipótesis 4 Pruebas de significancia de una y dos colas 5 Valor p en la prueba de hipótesis 6 Pruebas relacionadas con proporciones 7 Error Tipo II 8 Pruebas de hipótesis de dos muestras Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 23 / 46 Valor p en la prueba de hipótesis El valor p proporciona una medida intuitiva de la fuerza de la evidencia en los datos en contra de H0 Definición valor p El valor p es la probabilidad, calculada suponiendo que la hipótesis nula es cierta, de obtener un valor del estadı́stico de prueba por lo menos tan contradictorio para H0 como el valor calculado a partir de la muestra disponible. Tener en cuenta: 1 El valor p es una probabilidad. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 24 / 46 Valor p en la prueba de hipótesis El valor p proporciona una medida intuitiva de la fuerza de la evidencia en los datos en contra de H0 Definición valor p El valor p es la probabilidad, calculada suponiendo que la hipótesis nula es cierta, de obtener un valor del estadı́stico de prueba por lo menos tan contradictorio para H0 como el valor calculado a partir de la muestra disponible. Tener en cuenta: 1 El valor p es una probabilidad. 2 Esta probabilidad se calcula suponiendo que la hipótesis nula es cierta. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 24 / 46 Valor p en la prueba de hipótesis El valor p proporciona una medida intuitiva de la fuerza de la evidencia en los datos en contra de H0 Definición valor p El valor p es la probabilidad, calculada suponiendo que la hipótesis nula es cierta, de obtener un valor del estadı́stico de prueba por lo menos tan contradictorio para H0 como el valor calculado a partir de la muestra disponible. Tener en cuenta: 1 El valor p es una probabilidad. 2 Esta probabilidad se calcula suponiendo que la hipótesis nula es cierta. 3 ¡Tenga cuidado: el valor p no es la probabilidad de que H0 sea cierta, ni es la probabilidad de error! Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 24 / 46 Valor p en la prueba de hipótesis El valor p proporciona una medida intuitiva de la fuerza de la evidencia en los datos en contra de H0 Definición valor p El valor p es la probabilidad, calculada suponiendo que la hipótesis nula es cierta, de obtener un valor del estadı́stico de prueba por lo menos tan contradictorio para H0 como el valor calculado a partir de la muestra disponible. Tener en cuenta: 1 El valor p es una probabilidad. 2 Esta probabilidad se calcula suponiendo que la hipótesis nula es cierta. 3 ¡Tenga cuidado: el valor p no es la probabilidad de que H0 sea cierta, ni es la probabilidad de error! 4 Para determinar el valor p, primero se debe decidir qué valores del estadı́stico de prueba son al menos tan contradictorios para H0 como el valor obtenido de la muestra. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 24 / 46 Valor p en la prueba de hipótesis Cuanto menor sea el valor de p, es mayor la evidencia que hay en los datos de la muestra en contra de la hipótesis nula y la hipótesis alternativa. Es decir, H0 debe ser rechazada a favor de H1 , cuando el valor p es suficientemente pequeño. Pero, ¿Qué es suficientemente pequeño? Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 25 / 46 Valor p en la prueba de hipótesis Cuanto menor sea el valor de p, es mayor la evidencia que hay en los datos de la muestra en contra de la hipótesis nula y la hipótesis alternativa. Es decir, H0 debe ser rechazada a favor de H1 , cuando el valor p es suficientemente pequeño. Pero, ¿Qué es suficientemente pequeño? Regla de decisión basada en el valor p Se selecciona un nivel de significancia α (error tipo I deseado para la probabilidad). A continuación, Rechazar H0 si el valor p ≤ α No rechazar H0 si el valor p > α Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 25 / 46 Valor p en la prueba de hipótesis Cuanto menor sea el valor de p, es mayor la evidencia que hay en los datos de la muestra en contra de la hipótesis nula y la hipótesis alternativa. Es decir, H0 debe ser rechazada a favor de H1 , cuando el valor p es suficientemente pequeño. Pero, ¿Qué es suficientemente pequeño? Regla de decisión basada en el valor p Se selecciona un nivel de significancia α (error tipo I deseado para la probabilidad). A continuación, Rechazar H0 si el valor p ≤ α No rechazar H0 si el valor p > α De esta manera. Si el valor p excede el nivel de significancia elegido, la hipótesis nula no se puede rechazar a este nivel. Pero si el valor p es igual o menor que α, entonces hay pruebas suficientes para justificar el rechazo de H0 . Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 25 / 46 Valor p en la prueba de hipótesis Ejemplo Calcular el valor p para el ejemplo de la cantidad de escritorios producidos a la semana en Fredonia e interpretar. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 26 / 46 Valor p en la prueba de hipótesis Ejemplo Calcular el valor p para el ejemplo de la cantidad de escritorios producidos a la semana en Fredonia e interpretar. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 26 / 46 Valor p en la prueba de hipótesis Ejemplo Calcular el valor p para el ejemplo de la cantidad de escritorios producidos a la semana en Fredonia e interpretar. Interpretación de la evidencia en contra de H0 Si el valor p es menor que: 0.10, hay cierta evidencia de que H0 no es verdadera. 0.05, hay evidencia fuerte de que H0 no es verdadera. 0.01, hay evidencia muy fuerte de que H0 no es verdadera. 0.001, hay evidencia extremadamente fuerte de que H0 no es verdadera. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 26 / 46 Prueba de hipótesis para la media de una población normal con varianza desconocida Para la media de una población se puede formular las siguientes hipótesis: Hipótesis nula: El estadı́stico de prueba que deberá usarse para la media de una sóla población desconociendose las varianzas es: t= Hipótesis alternativa Manuel Correa Giraldo (EAFIT) x̄ − µ √ s/ n (7) Región de rechazo para la prueba de nivel α Pruebas de hipótesis 2 de octubre de 2017 27 / 46 Prueba de hipótesis para la media de una población normal con varianza desconocida Para la media de una población se puede formular las siguientes hipótesis: Hipótesis nula: H 0 : µ ≤ µ0 El estadı́stico de prueba que deberá usarse para la media de una sóla población desconociendose las varianzas es: t= Hipótesis alternativa H 1 : µ > µ0 Manuel Correa Giraldo (EAFIT) x̄ − µ √ s/ n (7) Región de rechazo para la prueba de nivel α t ≥ tα,n−1 (prueba de cola superior) Pruebas de hipótesis 2 de octubre de 2017 27 / 46 Prueba de hipótesis para la media de una población normal con varianza desconocida Para la media de una población se puede formular las siguientes hipótesis: Hipótesis nula: H 0 : µ ≤ µ0 H 0 : µ ≥ µ0 El estadı́stico de prueba que deberá usarse para la media de una sóla población desconociendose las varianzas es: t= Hipótesis alternativa H 1 : µ > µ0 H 1 : µ < µ0 Manuel Correa Giraldo (EAFIT) x̄ − µ √ s/ n (7) Región de rechazo para la prueba de nivel α t ≥ tα,n−1 (prueba de cola superior) t ≤ −tα,n−1 (prueba de cola inferior) Pruebas de hipótesis 2 de octubre de 2017 27 / 46 Prueba de hipótesis para la media de una población normal con varianza desconocida Para la media de una población se puede formular las siguientes hipótesis: Hipótesis nula: H 0 : µ ≤ µ0 H 0 : µ ≤ µ0 H 0 : µ = µ0 El estadı́stico de prueba que deberá usarse para la media de una sóla población desconociendose las varianzas es: t= Hipótesis alternativa H 1 : µ > µ0 H 1 : µ < µ0 H1 : µ 6= µ0 Manuel Correa Giraldo (EAFIT) x̄ − µ √ s/ n (7) Región de rechazo para la prueba de nivel α t ≥ tα,n−1 (prueba de cola superior) t ≤ −tα,n−1 (prueba de cola inferior) t ≥ tα/2,n−1 o t ≤ −tα/2,n−1 (prueba de dos colas) Pruebas de hipótesis 2 de octubre de 2017 27 / 46 Prueba de hipótesis para la media de una población normal con varianza desconocida Ejemplo El departamento de quejas de McFarland Insurance Company informa que el costo medio para tramitar una queja es de $60. Una comparación en la industria demostró que esta cantidad es mayor que en las demás compañı́as de seguros, ası́ que la compañı́a tomó medidas para reducir gastos. Para evaluar el efecto de las medidas de reducción de gastos, el supervisor del departamento de quejas seleccionó una muestra aleatoria de 26 quejas atendidas el mes pasado. La información de la muestra aparece a continuación. ¿Es razonable concluir que el costo medio de atención de una queja ahora es menor a $60 con un nivel de significancia de 0.01? Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 28 / 46 Prueba de hipótesis para la media de una población normal con varianza desconocida Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 29 / 46 Prueba de hipótesis para la media de una población normal con varianza desconocida Ejemplo La longitud media de una pequeña barra de contrapeso es de 43 milı́metros. Al supervisor de producción le preocupa que hayan cambiado los ajustes de la máquina de producción de barras. Solicita una investigación al departamento de ingenierı́a, que selecciona una muestra aleatoria de 12 barras y las mide. Los resultados aparecen en seguida, expresados en milı́metros. ¿Es razonable concluir que cambió la longitud media de las barras? Utilice el nivel de significancia 0.02. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 30 / 46 Prueba de hipótesis para la media de una población normal con varianza desconocida Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 31 / 46 Contenido 1 Introducción 2 ¿Qué es una hipótesis estadı́stica y cómo se prueba? 3 Procedimiento para probar una hipótesis 4 Pruebas de significancia de una y dos colas 5 Valor p en la prueba de hipótesis 6 Pruebas relacionadas con proporciones 7 Error Tipo II 8 Pruebas de hipótesis de dos muestras Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 32 / 46 Prueba de hipótesis para la proporción de una población Para la proporción de una población, se supone que se satisfacen los supuestos binomiales, se puede formular las siguientes hipótesis: Hipótesis nula: El estadı́stico de prueba que deberá usarse para la proporción de una sóla población es: p̂ − p z= q (8) p(1−p) n Hipótesis alternativa Manuel Correa Giraldo (EAFIT) Región de rechazo para la prueba de nivel α Pruebas de hipótesis 2 de octubre de 2017 33 / 46 Prueba de hipótesis para la proporción de una población Para la proporción de una población, se supone que se satisfacen los supuestos binomiales, se puede formular las siguientes hipótesis: Hipótesis nula: H0 : p ≤ p0 El estadı́stico de prueba que deberá usarse para la proporción de una sóla población es: p̂ − p z= q (8) p(1−p) n Hipótesis alternativa H1 : p > p 0 Manuel Correa Giraldo (EAFIT) Región de rechazo para la prueba de nivel α z ≥ zα (prueba de cola superior) Pruebas de hipótesis 2 de octubre de 2017 33 / 46 Prueba de hipótesis para la proporción de una población Para la proporción de una población, se supone que se satisfacen los supuestos binomiales, se puede formular las siguientes hipótesis: Hipótesis nula: H0 : p ≤ p0 H0 : p ≥ p0 El estadı́stico de prueba que deberá usarse para la proporción de una sóla población es: p̂ − p z= q (8) p(1−p) n Hipótesis alternativa H1 : p > p 0 H1 : p < p 0 Manuel Correa Giraldo (EAFIT) Región de rechazo para la prueba de nivel α z ≥ zα (prueba de cola superior) z ≤ −zα (prueba de cola inferior) Pruebas de hipótesis 2 de octubre de 2017 33 / 46 Prueba de hipótesis para la proporción de una población Para la proporción de una población, se supone que se satisfacen los supuestos binomiales, se puede formular las siguientes hipótesis: Hipótesis nula: H0 : p ≤ p0 H0 : p ≤ p0 H0 : p = p0 El estadı́stico de prueba que deberá usarse para la proporción de una sóla población es: p̂ − p z= q (8) p(1−p) n Hipótesis alternativa H1 : p > p 0 H1 : p < p 0 H1 : p 6= p0 Manuel Correa Giraldo (EAFIT) Región de rechazo para la prueba de nivel α z ≥ zα (prueba de cola superior) z ≤ −zα (prueba de cola inferior) z ≥ zα/2 o z ≤ −zα/2 (prueba de dos colas) Pruebas de hipótesis 2 de octubre de 2017 33 / 46 Prueba de hipótesis para la proporción de una población Ejemplo Suponga que a partir de las elecciones anteriores en un estado, para que sea electo un candidato a gobernador, es necesario que gane por lo menos 80 % de los votos de la zona norte. El gobernador de turno está interesado en evaluar sus posibilidades de volver al cargo y hace planes para llevar a cabo una encuesta de 2 000 votantes registrados en esa región. Un sondeo reveló que 1 550 pensaban votar por el gobernador de turno. Aplique el procedimiento para probar hipótesis y evalúe las posibilidades de que el gobernador se reelija. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 34 / 46 Contenido 1 Introducción 2 ¿Qué es una hipótesis estadı́stica y cómo se prueba? 3 Procedimiento para probar una hipótesis 4 Pruebas de significancia de una y dos colas 5 Valor p en la prueba de hipótesis 6 Pruebas relacionadas con proporciones 7 Error Tipo II 8 Pruebas de hipótesis de dos muestras Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 35 / 46 Error Tipo II Recuerde que el nivel de significancia, identificado con el sı́mbolo α, es la probabilidad de que la hipótesis nula se rechace cuando es verdadera. Esto recibe el nombre de error tipo I. En un caso de prueba de hipótesis también existe la posibilidad de que no se rechace una hipótesis nula cuando en realidad es falsa. Es decir, se acepta una hipótesis nula falsa. Esto recibe el nombre de error tipo II. La probabilidad de un error tipo II se identifica con la letra griega beta (β). Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 36 / 46 Error Tipo II Ejemplo Western Wire Products compra barras de acero para hacer clavijas. La experiencia indica que la fuerza media de tensión de las cargas que llegan es de 10 000 psi, y que la desviación estándar, σ, es de 400 psi. Con el fin de tomar una decisión sobre las cargas de barras de acero que llegan, el fabricante establece la siguiente regla para que el inspector de control de calidad se apegue a ella: Tome una muestra de 100 barras de acero. Si la fuerza media se encuentra entre 9922 y 10078 psi con un nivel de significancia de 0.05, acepte el lote. De lo contrario, debe rechazarlo. Suponga que la media poblacional desconocida de un lote que llega, designada µ, es en realidad de 9 900 psi. ¿Cuál es la probabilidad de que el inspector de control de calidad no rechace la carga (error tipo II)? Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 37 / 46 Error Tipo II Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 38 / 46 Contenido 1 Introducción 2 ¿Qué es una hipótesis estadı́stica y cómo se prueba? 3 Procedimiento para probar una hipótesis 4 Pruebas de significancia de una y dos colas 5 Valor p en la prueba de hipótesis 6 Pruebas relacionadas con proporciones 7 Error Tipo II 8 Pruebas de hipótesis de dos muestras Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 39 / 46 Pruebas de hipótesis de dos muestras: muestras independientes Prueba sobre dos medias con varianzas conocidas Si se está probando: H0 : µ1 = µ 2 H1 : µ1 6= µ2 El estadı́stico de prueba que deberá usarse para comparar las medias de dos tratamientos conociendose las varianzas es: x¯1 − x¯2 z0 = q 2 σ2 σ1 + n22 n1 (9) Donde x¯1 y x¯2 son las medias de muestras aleatorias independientes de tamaños n1 y n2 de poblaciones con varianzas conocidas σ12 y σ22 , respectivamente. Si ambas poblaciones son normales, o si los tamaños de las muestras son lo suficientemente grandes para aplicar el teorema del lı́mite central, z0 se distribuye como N (0, 1). H0 se rechazarı́a si |z0 | > zα/2 , donde zα/2 es el punto porcentual α/2 superior de la distribución normal estándar. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 40 / 46 Pruebas de hipótesis de dos muestras: muestras independientes Ejemplo Los clientes de los supermercados FoodTown tienen una opción al pagar por sus compras. Pueden pagar en una caja registradora normal operada por un cajero, o emplear el nuevo procedimiento: Fast Lane. Cuando eligen la primera alternativa, un empleado registra cada artı́culo, lo pone en una banda transportadora pequeña de donde otro empleado lo toma y lo pone en una bolsa, y después en el carrito de vı́veres. En el procedimiento Fast Lane, el cliente registra cada artı́culo, lo pone en una bolsa y coloca las bolsas en el carrito. Este procedimiento está diseñado para reducir el tiempo que los clientes pierden en la fila de la caja. El aparato de Fast Lane se acaba de instalar en la sucursal de la calle Byrne de FoodTown. La gerente de la tienda desea saber si el tiempo medio de pago con el método tradicional es mayor que con Fast Lane, para lo cual reunió la información siguiente sobre la muestra. El tiempo se mide desde el momento en que el cliente ingresa a la fila hasta que sus bolsas están en el carrito. De aquı́ que el tiempo incluye tanto la espera en la fila como el registro. ¿Cuál es el valor p? Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 41 / 46 Pruebas de hipótesis de dos muestras: muestras independientes Prueba sobre dos medias con varianzas deconocidas y diferentes Suponga que se está probando: H0 : µ1 = µ 2 H1 : µ1 6= µ2 Bajo el supuesto de que las varianzas son desconocidas e idénticas. El estadı́stico de prueba que deberá usarse para comparar las medias de dos tratamientos es: t0 = (x¯1 − x¯2 ) q sp n11 + n12 (10) Dónde: x¯1 y x¯2 son las medias muestrales n1 y n2 los tamaños de las muestras. y s2p es una estimación de la varianza común σ12 = σ22 = σ 2 , calculada a partir de: s2p = (n1 − 1) s21 + (n2 − 1) s22 n1 + n2 − 2 (11) Sabiendo que s21 y s22 son las varianzas muestrales. Para determinar si deberá rechazarse H0 : µ1 = µ2 . Se compara t0 con la distribución t con n1 + n2 − 2 grados de libertad. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 42 / 46 Pruebas de hipótesis de dos muestras: muestras independientes Ejemplo: Owens Lawn Care, Inc., fabrica y ensambla podadoras de césped que envı́a a distribuidores instalados en Estados Unidos y Canadá. Se han propuesto dos procedimientos distintos para el montaje del motor al chasis de la podadora. La pregunta es: ¿existe una diferencia entre ellos con respecto al tiempo medio para montar los motores al chasis de las podadoras? El primer procedimiento lo desarrolló Herb Welles, un antiguo empleado de Owens (designado como procedimiento 1), y el otro lo desarrolló William Atkins, vicepresidente de ingenierı́a de Owens (designado como procedimiento 2). Para evaluar los dos métodos, se decidió realizar un estudio de tiempos y movimientos. Se midió el tiempo de montaje en una muestra de cinco empleados según el método de Welles y seis con el método de Atkins. Los resultados, en minutos, aparecen a continuación. ¿Hay alguna diferencia entre los tiempos medios de montaje? Utilice un nivel de significancia de 0.10 y suponga que las dos poblaciones tienen desviaciones estándares iguales. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 43 / 46 Pruebas de hipótesis de dos muestras: muestras independientes Prueba sobre dos medias con varianzas deconocidas y diferentes Suponga que se está probando: H0 : µ1 = µ 2 H1 : µ1 6= µ2 En este caso el estadistico de prueba es: x¯1 − x¯2 t0 = q 2 s2 s1 + n22 n1 (12) La distribución t es una buena aproximación de t0 si se usa: gl =  s2 1 n1 (s21 /n1 )2 n1 −1 + + s2 2 n2 2 (13) (s22 /n2 )2 n2 −1 para los grados de libertad. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 44 / 46 Pruebas de hipótesis de dos muestras: muestras independientes Ejemplo El personal en un laboratorio de pruebas del consumidor evalúa la absorción de toallas de papel. Se desea comparar un conjunto de toallas de una marca con un grupo similar de toallas de otra marca. De cada una de ellas se sumerge una pieza del papel en un tubo con un fluido, se deja que el papel escurra en una charola durante dos minutos y después se evalúa la cantidad de lı́quido que el papel absorbió de la charola. Una muestra aleatoria de 9 toallas de papel de la primera marca absorbió las cantidades siguientes de lı́quido en milı́metros. Una muestra aleatoria independiente de 12 toallas de la otra marca absorbió las cantidades siguientes de lı́quido en milı́metros. Utilice el nivel de significancia de 0.10 y pruebe si existe una diferencia entre las cantidades medias de lı́quido que absorbieron los dos tipos de toallas. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 45 / 46 Referencias I Lind, D. A. M., Wathen, W. G., Lind, S. A. D. A., Marchal, W. G., and Wathen, S. A. (2015). Estadı́stica aplicada a los negocios y la economı́a. McGraw-Hill,, 16 edition. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 46 / 46