Pruebas de hipótesis de una y dos muestras 1

Pruebas de hipótesis de una y dos muestras1 Manuel Correa Giraldo Escuela de Administración Universidad EAFIT Organización y Gerencia 1 Basado en [Lind et al., 2015] Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 1 / 46 Contenido 1 Introducción 2 ¿Qué es una hipótesis estadı́stica y cómo se prueba? 3 Procedimiento para probar una hipótesis 4 Pruebas de significancia de una y dos colas 5 Valor p en la prueba de hipótesis 6 Pruebas relacionadas con proporciones 7 Error Tipo II 8 Pruebas de hipótesis de dos muestras Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 2 / 46 Introducción Una hipótesis es una declaración relativa a una población. En el sistema legal estadounidense, una persona es inocente hasta que se prueba su culpabilidad. Un jurado plantea como hipótesis que una persona a la que se le imputa un crimen es inocente, y someten esta hipótesis a verificación, para lo cual revisan la evidencia y escuchan el testimonio antes de llegar a un veredicto. Un paciente visita al médico y acusa varios sı́ntomas. Con base en ellos, el médico indicará ciertos exámenes de diagnóstico; en seguida, de acuerdo con los sı́ntomas y los resultados de los exámenes, determina el tratamiento. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 3 / 46 Contenido 1 Introducción 2 ¿Qué es una hipótesis estadı́stica y cómo se prueba? 3 Procedimiento para probar una hipótesis 4 Pruebas de significancia de una y dos colas 5 Valor p en la prueba de hipótesis 6 Pruebas relacionadas con proporciones 7 Error Tipo II 8 Pruebas de hipótesis de dos muestras Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 4 / 46 ¿Qué es una hipótesis y una pruba de hipótesis? Hipótesis estadı́stica Afirmación relativa a un parámetro de la población sujeta a verificación. Prueba de hipótesis estadı́stica Procedimiento basado en evidencia de la muestra y la teorı́a de la probabilidad para determinar si la hipótesis es una afirmación razonable. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 5 / 46 Contenido 1 Introducción 2 ¿Qué es una hipótesis estadı́stica y cómo se prueba? 3 Procedimiento para probar una hipótesis 4 Pruebas de significancia de una y dos colas 5 Valor p en la prueba de hipótesis 6 Pruebas relacionadas con proporciones 7 Error Tipo II 8 Pruebas de hipótesis de dos muestras Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 6 / 46 Procedimiento de cinco pasos para probar una hipótesis Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 7 / 46 Procedimiento de cinco pasos para probar una hipótesis Ejemplo Jamestown Steel Company fabrica y arma escritorios y otros muebles para oficina en diferentes plantas en el oeste del estado de Nueva York. La producción semanal del escritorio modelo A325 en la planta de Fredonia tiene una distribución normal, con una media de 200 y una desviación estándar de 16. Hace poco, con motivo de la expansión del mercado, se introdujeron nuevos métodos de producción y se contrató a más empleados. El vicepresidente de fabricación pretende investigar si hubo algún cambio en la producción semanal del escritorio modelo A325. En otras palabras, ¿la cantidad media de escritorios que se produjeron en la planta de Fredonia es diferente de 200 escritorios semanales con un nivel de significancia de 0.01? La cantidad media de escritorios que se produjeron el año pasado (50 semanas, pues la planta cerró 2 semanas por vacaciones) es de 203.5. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 8 / 46 Paso 1: Se establece la hipótesis nula y la hipótesis alternativa Hipótesis nula (H0 ) Enunciado relativo al valor de un parámetro poblacional que se formula con el fin de probar evidencia numérica. Hipótesis alternativa (H1 ) Enunciado que se acepta si los datos de la muestra ofrecen suficiente evidencia para rechazar la hipótesis nula. Observaciones: Cabe hacer hincapié en que, si la hipótesis nula no se rechaza con base en los datos de la muestra, no es posible decir que la hipótesis nula sea verdadera. En otras palabras, el hecho de no rechazar una hipótesis no prueba que H0 sea verdadera, sino que no rechazamos H0 . La hipótesis alternativa describe lo que se concluirá si se rechaza la hipótesis nula. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 9 / 46 Paso 2: Se selecciona un nivel de significancia Después de establecer las hipótesis nula y alternativa, el siguiente paso consiste en determinar el nivel de significancia. Nivel de significancia Probabilidad de rechazar la hipótesis nula cuando es verdadera. El nivel de significancia se expresa con la letra griega alfa, α. En ocasiones también se conoce como nivel de riesgo. Éste quizá sea un término más adecuado porque se trata del riesgo que se corre al rechazar la hipótesis nula cuando es verdadera. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 10 / 46 Paso 2: Se selecciona un nivel de significancia Error tipo I Rechazar la hipótesis nula, H0 , cuando es verdadera. La probabilidad esta determinada por: α = P (error tipo I) = P (rechazarH0 |H0 es verdadera) (1) Error tipo II Aceptar la hipótesis nula cuando es falsa. La probabilidad esta determinada por: β = P (error tipo II) = P (dejar de rechazarH0 |H0 es falsa) (2) Potencia de la prueba La potencia de una prueba es la probabilidad de rechazar H0 dada una alternativa especifica verdadera. Potencia = 1 − β = P (rechazarH0 |H0 es falsa). Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 (3) 11 / 46 Paso 2: Se selecciona un nivel de significancia Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 12 / 46 Paso 3: Se selecciona el estadı́stico de prueba Hay muchos estadı́sticos de prueba. En este curso se utilizan z y t como estadı́sticos de prueba. Otros estadı́sticos de prueba son F y χ2 , conocida como jicuadrada, para cocientes de varianzas y la varianza de una muestra. Estadı́stico de prueba Valor, determinado a partir de la información de la muestra, para determinar si se rechaza la hipótesis nula. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 13 / 46 Paso 3: Se selecciona el estadı́stico de prueba Estadı́stico de prueba para µ cuando σ es conocida z= X̄ − µ √ σ/ n (4) El valor z se basa en la distribución muestral de X̄ que sigue la distribución normal cuando la muestra es razonablemente √ grande, con una media µX̄ igual a µ y una desviación estándar σX̄ igual a σ/ n Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 14 / 46 Paso 3: Se selecciona el estadı́stico de prueba Estadı́stico de prueba para µ cuando σ es desconocida t= X̄ − µ √ s/ n (5) El valor t se basa en la distribución t de Student con n − 1 grados de libertad. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 15 / 46 Paso 4: Se formula la regla de decisión Regla de decisión Una regla de decisión es un enunciado sobre las condiciones especı́ficas en que se rechaza la hipótesis nula y aquellas en las que no se rechaza. La región o área de rechazo define la ubicación de todos esos valores que son tan grandes o tan pequeños que la probabilidad de que ocurran en una hipótesis nula verdadera es muy remota Valor crı́tico Punto de división entre la región en que se rechaza la hipótesis nula y aquella en la que se acepta . Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 16 / 46 Paso 4: Se formula la regla de decisión Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de significancia de 0.05 Observaciones El área en que se acepta la hipótesis nula se localiza a la izquierda de 1.65. En breve se explicará la forma de obtener el valor de 1.65. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 17 / 46 Paso 4: Se formula la regla de decisión Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de significancia de 0.05 Observaciones El área de rechazo se encuentra a la derecha de 1.65. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 17 / 46 Paso 4: Se formula la regla de decisión Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de significancia de 0.05 Observaciones Se aplica una prueba de una sola cola (este hecho también se explicará más adelante). Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 17 / 46 Paso 4: Se formula la regla de decisión Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de significancia de 0.05 Observaciones Se eligió el nivel de significancia de 0.05. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 17 / 46 Paso 4: Se formula la regla de decisión Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de significancia de 0.05 Observaciones La distribución muestral del estadı́stico z tiene una distribución normal. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 17 / 46 Paso 4: Se formula la regla de decisión Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de significancia de 0.05 Observaciones El valor 1.65 separa las regiones en que se rechaza la hipótesis nula y en la que se acepta. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 17 / 46 Paso 4: Se formula la regla de decisión Distribución muestral del estadı́stico z; prueba de una cola a la derecha; nivel de significancia de 0.05 Observaciones El valor de 1.65 es el valor crı́tico. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 17 / 46 Paso 5: Se toma una decisión El quinto y último paso en la prueba de hipótesis consiste en calcular el estadı́stico de la prueba, comparándola con el valor crı́tico, y tomar la decisión de rechazar o no la hipótesis nula. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 18 / 46 Contenido 1 Introducción 2 ¿Qué es una hipótesis estadı́stica y cómo se prueba? 3 Procedimiento para probar una hipótesis 4 Pruebas de significancia de una y dos colas 5 Valor p en la prueba de hipótesis 6 Pruebas relacionadas con proporciones 7 Error Tipo II 8 Pruebas de hipótesis de dos muestras Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 19 / 46 Prueba de hipótesis para la media de una población normal con varianza conocida Para la media de una población se puede formular las siguientes hipótesis: Hipótesis nula: El estadı́stico de prueba que deberá usarse para la media de una sóla población conociendose las varianzas es: z= Hipótesis alternativa Manuel Correa Giraldo (EAFIT) x̄ − µ √ σ/ n (6) Región de rechazo para la prueba de nivel α Pruebas de hipótesis 2 de octubre de 2017 20 / 46 Prueba de hipótesis para la media de una población normal con varianza conocida Para la media de una población se puede formular las siguientes hipótesis: Hipótesis nula: H0 : µ ≤ µ 0 El estadı́stico de prueba que deberá usarse para la media de una sóla población conociendose las varianzas es: z= Hipótesis alternativa H 1 : µ > µ0 Manuel Correa Giraldo (EAFIT) x̄ − µ √ σ/ n (6) Región de rechazo para la prueba de nivel α z ≥ zα (prueba de cola superior) Pruebas de hipótesis 2 de octubre de 2017 20 / 46 Prueba de hipótesis para la media de una población normal con varianza conocida Para la media de una población se puede formular las siguientes hipótesis: Hipótesis nula: H0 : µ ≤ µ 0 H0 : µ ≥ µ 0 El estadı́stico de prueba que deberá usarse para la media de una sóla población conociendose las varianzas es: z= Hipótesis alternativa H 1 : µ > µ0 H 1 : µ < µ0 Manuel Correa Giraldo (EAFIT) x̄ − µ √ σ/ n (6) Región de rechazo para la prueba de nivel α z ≥ zα (prueba de cola superior) z ≤ −zα (prueba de cola inferior) Pruebas de hipótesis 2 de octubre de 2017 20 / 46 Prueba de hipótesis para la media de una población normal con varianza conocida Para la media de una población se puede formular las siguientes hipótesis: Hipótesis nula: H0 : µ ≤ µ 0 H0 : µ ≤ µ 0 H0 : µ = µ 0 El estadı́stico de prueba que deberá usarse para la media de una sóla población conociendose las varianzas es: z= Hipótesis alternativa H 1 : µ > µ0 H 1 : µ < µ0 H1 : µ 6= µ0 Manuel Correa Giraldo (EAFIT) x̄ − µ √ σ/ n (6) Región de rechazo para la prueba de nivel α z ≥ zα (prueba de cola superior) z ≤ −zα (prueba de cola inferior) z ≥ zα/2 o z ≤ −zα/2 (prueba de dos colas) Pruebas de hipótesis 2 de octubre de 2017 20 / 46 Prueba de hipótesis para la media de una población normal con varianza conocida Ejemplo Suponga que el vicepresidente desea saber si hubo un incremento de la cantidad de unidades que se armaron. ¿Puede concluir, debido al mejoramiento de los métodos de producción, que la cantidad media de escritorios que se ensamblaron en las pasadas 50 semanas fue superior a 200? Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 21 / 46 Prueba de hipótesis para la media de una población normal con varianza conocida Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 22 / 46 Contenido 1 Introducción 2 ¿Qué es una hipótesis estadı́stica y cómo se prueba? 3 Procedimiento para probar una hipótesis 4 Pruebas de significancia de una y dos colas 5 Valor p en la prueba de hipótesis 6 Pruebas relacionadas con proporciones 7 Error Tipo II 8 Pruebas de hipótesis de dos muestras Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 23 / 46 Valor p en la prueba de hipótesis El valor p proporciona una medida intuitiva de la fuerza de la evidencia en los datos en contra de H0 Definición valor p El valor p es la probabilidad, calculada suponiendo que la hipótesis nula es cierta, de obtener un valor del estadı́stico de prueba por lo menos tan contradictorio para H0 como el valor calculado a partir de la muestra disponible. Tener en cuenta: 1 El valor p es una probabilidad. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 24 / 46 Valor p en la prueba de hipótesis El valor p proporciona una medida intuitiva de la fuerza de la evidencia en los datos en contra de H0 Definición valor p El valor p es la probabilidad, calculada suponiendo que la hipótesis nula es cierta, de obtener un valor del estadı́stico de prueba por lo menos tan contradictorio para H0 como el valor calculado a partir de la muestra disponible. Tener en cuenta: 1 El valor p es una probabilidad. 2 Esta probabilidad se calcula suponiendo que la hipótesis nula es cierta. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 24 / 46 Valor p en la prueba de hipótesis El valor p proporciona una medida intuitiva de la fuerza de la evidencia en los datos en contra de H0 Definición valor p El valor p es la probabilidad, calculada suponiendo que la hipótesis nula es cierta, de obtener un valor del estadı́stico de prueba por lo menos tan contradictorio para H0 como el valor calculado a partir de la muestra disponible. Tener en cuenta: 1 El valor p es una probabilidad. 2 Esta probabilidad se calcula suponiendo que la hipótesis nula es cierta. 3 ¡Tenga cuidado: el valor p no es la probabilidad de que H0 sea cierta, ni es la probabilidad de error! Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 24 / 46 Valor p en la prueba de hipótesis El valor p proporciona una medida intuitiva de la fuerza de la evidencia en los datos en contra de H0 Definición valor p El valor p es la probabilidad, calculada suponiendo que la hipótesis nula es cierta, de obtener un valor del estadı́stico de prueba por lo menos tan contradictorio para H0 como el valor calculado a partir de la muestra disponible. Tener en cuenta: 1 El valor p es una probabilidad. 2 Esta probabilidad se calcula suponiendo que la hipótesis nula es cierta. 3 ¡Tenga cuidado: el valor p no es la probabilidad de que H0 sea cierta, ni es la probabilidad de error! 4 Para determinar el valor p, primero se debe decidir qué valores del estadı́stico de prueba son al menos tan contradictorios para H0 como el valor obtenido de la muestra. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 24 / 46 Valor p en la prueba de hipótesis Cuanto menor sea el valor de p, es mayor la evidencia que hay en los datos de la muestra en contra de la hipótesis nula y la hipótesis alternativa. Es decir, H0 debe ser rechazada a favor de H1 , cuando el valor p es suficientemente pequeño. Pero, ¿Qué es suficientemente pequeño? Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 25 / 46 Valor p en la prueba de hipótesis Cuanto menor sea el valor de p, es mayor la evidencia que hay en los datos de la muestra en contra de la hipótesis nula y la hipótesis alternativa. Es decir, H0 debe ser rechazada a favor de H1 , cuando el valor p es suficientemente pequeño. Pero, ¿Qué es suficientemente pequeño? Regla de decisión basada en el valor p Se selecciona un nivel de significancia α (error tipo I deseado para la probabilidad). A continuación, Rechazar H0 si el valor p ≤ α No rechazar H0 si el valor p > α Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 25 / 46 Valor p en la prueba de hipótesis Cuanto menor sea el valor de p, es mayor la evidencia que hay en los datos de la muestra en contra de la hipótesis nula y la hipótesis alternativa. Es decir, H0 debe ser rechazada a favor de H1 , cuando el valor p es suficientemente pequeño. Pero, ¿Qué es suficientemente pequeño? Regla de decisión basada en el valor p Se selecciona un nivel de significancia α (error tipo I deseado para la probabilidad). A continuación, Rechazar H0 si el valor p ≤ α No rechazar H0 si el valor p > α De esta manera. Si el valor p excede el nivel de significancia elegido, la hipótesis nula no se puede rechazar a este nivel. Pero si el valor p es igual o menor que α, entonces hay pruebas suficientes para justificar el rechazo de H0 . Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 25 / 46 Valor p en la prueba de hipótesis Ejemplo Calcular el valor p para el ejemplo de la cantidad de escritorios producidos a la semana en Fredonia e interpretar. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 26 / 46 Valor p en la prueba de hipótesis Ejemplo Calcular el valor p para el ejemplo de la cantidad de escritorios producidos a la semana en Fredonia e interpretar. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 26 / 46 Valor p en la prueba de hipótesis Ejemplo Calcular el valor p para el ejemplo de la cantidad de escritorios producidos a la semana en Fredonia e interpretar. Interpretación de la evidencia en contra de H0 Si el valor p es menor que: 0.10, hay cierta evidencia de que H0 no es verdadera. 0.05, hay evidencia fuerte de que H0 no es verdadera. 0.01, hay evidencia muy fuerte de que H0 no es verdadera. 0.001, hay evidencia extremadamente fuerte de que H0 no es verdadera. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 26 / 46 Prueba de hipótesis para la media de una población normal con varianza desconocida Para la media de una población se puede formular las siguientes hipótesis: Hipótesis nula: El estadı́stico de prueba que deberá usarse para la media de una sóla población desconociendose las varianzas es: t= Hipótesis alternativa Manuel Correa Giraldo (EAFIT) x̄ − µ √ s/ n (7) Región de rechazo para la prueba de nivel α Pruebas de hipótesis 2 de octubre de 2017 27 / 46 Prueba de hipótesis para la media de una población normal con varianza desconocida Para la media de una población se puede formular las siguientes hipótesis: Hipótesis nula: H 0 : µ ≤ µ0 El estadı́stico de prueba que deberá usarse para la media de una sóla población desconociendose las varianzas es: t= Hipótesis alternativa H 1 : µ > µ0 Manuel Correa Giraldo (EAFIT) x̄ − µ √ s/ n (7) Región de rechazo para la prueba de nivel α t ≥ tα,n−1 (prueba de cola superior) Pruebas de hipótesis 2 de octubre de 2017 27 / 46 Prueba de hipótesis para la media de una población normal con varianza desconocida Para la media de una población se puede formular las siguientes hipótesis: Hipótesis nula: H 0 : µ ≤ µ0 H 0 : µ ≥ µ0 El estadı́stico de prueba que deberá usarse para la media de una sóla población desconociendose las varianzas es: t= Hipótesis alternativa H 1 : µ > µ0 H 1 : µ < µ0 Manuel Correa Giraldo (EAFIT) x̄ − µ √ s/ n (7) Región de rechazo para la prueba de nivel α t ≥ tα,n−1 (prueba de cola superior) t ≤ −tα,n−1 (prueba de cola inferior) Pruebas de hipótesis 2 de octubre de 2017 27 / 46 Prueba de hipótesis para la media de una población normal con varianza desconocida Para la media de una población se puede formular las siguientes hipótesis: Hipótesis nula: H 0 : µ ≤ µ0 H 0 : µ ≤ µ0 H 0 : µ = µ0 El estadı́stico de prueba que deberá usarse para la media de una sóla población desconociendose las varianzas es: t= Hipótesis alternativa H 1 : µ > µ0 H 1 : µ < µ0 H1 : µ 6= µ0 Manuel Correa Giraldo (EAFIT) x̄ − µ √ s/ n (7) Región de rechazo para la prueba de nivel α t ≥ tα,n−1 (prueba de cola superior) t ≤ −tα,n−1 (prueba de cola inferior) t ≥ tα/2,n−1 o t ≤ −tα/2,n−1 (prueba de dos colas) Pruebas de hipótesis 2 de octubre de 2017 27 / 46 Prueba de hipótesis para la media de una población normal con varianza desconocida Ejemplo El departamento de quejas de McFarland Insurance Company informa que el costo medio para tramitar una queja es de $60. Una comparación en la industria demostró que esta cantidad es mayor que en las demás compañı́as de seguros, ası́ que la compañı́a tomó medidas para reducir gastos. Para evaluar el efecto de las medidas de reducción de gastos, el supervisor del departamento de quejas seleccionó una muestra aleatoria de 26 quejas atendidas el mes pasado. La información de la muestra aparece a continuación. ¿Es razonable concluir que el costo medio de atención de una queja ahora es menor a $60 con un nivel de significancia de 0.01? Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 28 / 46 Prueba de hipótesis para la media de una población normal con varianza desconocida Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 29 / 46 Prueba de hipótesis para la media de una población normal con varianza desconocida Ejemplo La longitud media de una pequeña barra de contrapeso es de 43 milı́metros. Al supervisor de producción le preocupa que hayan cambiado los ajustes de la máquina de producción de barras. Solicita una investigación al departamento de ingenierı́a, que selecciona una muestra aleatoria de 12 barras y las mide. Los resultados aparecen en seguida, expresados en milı́metros. ¿Es razonable concluir que cambió la longitud media de las barras? Utilice el nivel de significancia 0.02. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 30 / 46 Prueba de hipótesis para la media de una población normal con varianza desconocida Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 31 / 46 Contenido 1 Introducción 2 ¿Qué es una hipótesis estadı́stica y cómo se prueba? 3 Procedimiento para probar una hipótesis 4 Pruebas de significancia de una y dos colas 5 Valor p en la prueba de hipótesis 6 Pruebas relacionadas con proporciones 7 Error Tipo II 8 Pruebas de hipótesis de dos muestras Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 32 / 46 Prueba de hipótesis para la proporción de una población Para la proporción de una población, se supone que se satisfacen los supuestos binomiales, se puede formular las siguientes hipótesis: Hipótesis nula: El estadı́stico de prueba que deberá usarse para la proporción de una sóla población es: p̂ − p z= q (8) p(1−p) n Hipótesis alternativa Manuel Correa Giraldo (EAFIT) Región de rechazo para la prueba de nivel α Pruebas de hipótesis 2 de octubre de 2017 33 / 46 Prueba de hipótesis para la proporción de una población Para la proporción de una población, se supone que se satisfacen los supuestos binomiales, se puede formular las siguientes hipótesis: Hipótesis nula: H0 : p ≤ p0 El estadı́stico de prueba que deberá usarse para la proporción de una sóla población es: p̂ − p z= q (8) p(1−p) n Hipótesis alternativa H1 : p > p 0 Manuel Correa Giraldo (EAFIT) Región de rechazo para la prueba de nivel α z ≥ zα (prueba de cola superior) Pruebas de hipótesis 2 de octubre de 2017 33 / 46 Prueba de hipótesis para la proporción de una población Para la proporción de una población, se supone que se satisfacen los supuestos binomiales, se puede formular las siguientes hipótesis: Hipótesis nula: H0 : p ≤ p0 H0 : p ≥ p0 El estadı́stico de prueba que deberá usarse para la proporción de una sóla población es: p̂ − p z= q (8) p(1−p) n Hipótesis alternativa H1 : p > p 0 H1 : p < p 0 Manuel Correa Giraldo (EAFIT) Región de rechazo para la prueba de nivel α z ≥ zα (prueba de cola superior) z ≤ −zα (prueba de cola inferior) Pruebas de hipótesis 2 de octubre de 2017 33 / 46 Prueba de hipótesis para la proporción de una población Para la proporción de una población, se supone que se satisfacen los supuestos binomiales, se puede formular las siguientes hipótesis: Hipótesis nula: H0 : p ≤ p0 H0 : p ≤ p0 H0 : p = p0 El estadı́stico de prueba que deberá usarse para la proporción de una sóla población es: p̂ − p z= q (8) p(1−p) n Hipótesis alternativa H1 : p > p 0 H1 : p < p 0 H1 : p 6= p0 Manuel Correa Giraldo (EAFIT) Región de rechazo para la prueba de nivel α z ≥ zα (prueba de cola superior) z ≤ −zα (prueba de cola inferior) z ≥ zα/2 o z ≤ −zα/2 (prueba de dos colas) Pruebas de hipótesis 2 de octubre de 2017 33 / 46 Prueba de hipótesis para la proporción de una población Ejemplo Suponga que a partir de las elecciones anteriores en un estado, para que sea electo un candidato a gobernador, es necesario que gane por lo menos 80 % de los votos de la zona norte. El gobernador de turno está interesado en evaluar sus posibilidades de volver al cargo y hace planes para llevar a cabo una encuesta de 2 000 votantes registrados en esa región. Un sondeo reveló que 1 550 pensaban votar por el gobernador de turno. Aplique el procedimiento para probar hipótesis y evalúe las posibilidades de que el gobernador se reelija. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 34 / 46 Contenido 1 Introducción 2 ¿Qué es una hipótesis estadı́stica y cómo se prueba? 3 Procedimiento para probar una hipótesis 4 Pruebas de significancia de una y dos colas 5 Valor p en la prueba de hipótesis 6 Pruebas relacionadas con proporciones 7 Error Tipo II 8 Pruebas de hipótesis de dos muestras Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 35 / 46 Error Tipo II Recuerde que el nivel de significancia, identificado con el sı́mbolo α, es la probabilidad de que la hipótesis nula se rechace cuando es verdadera. Esto recibe el nombre de error tipo I. En un caso de prueba de hipótesis también existe la posibilidad de que no se rechace una hipótesis nula cuando en realidad es falsa. Es decir, se acepta una hipótesis nula falsa. Esto recibe el nombre de error tipo II. La probabilidad de un error tipo II se identifica con la letra griega beta (β). Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 36 / 46 Error Tipo II Ejemplo Western Wire Products compra barras de acero para hacer clavijas. La experiencia indica que la fuerza media de tensión de las cargas que llegan es de 10 000 psi, y que la desviación estándar, σ, es de 400 psi. Con el fin de tomar una decisión sobre las cargas de barras de acero que llegan, el fabricante establece la siguiente regla para que el inspector de control de calidad se apegue a ella: Tome una muestra de 100 barras de acero. Si la fuerza media se encuentra entre 9922 y 10078 psi con un nivel de significancia de 0.05, acepte el lote. De lo contrario, debe rechazarlo. Suponga que la media poblacional desconocida de un lote que llega, designada µ, es en realidad de 9 900 psi. ¿Cuál es la probabilidad de que el inspector de control de calidad no rechace la carga (error tipo II)? Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 37 / 46 Error Tipo II Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 38 / 46 Contenido 1 Introducción 2 ¿Qué es una hipótesis estadı́stica y cómo se prueba? 3 Procedimiento para probar una hipótesis 4 Pruebas de significancia de una y dos colas 5 Valor p en la prueba de hipótesis 6 Pruebas relacionadas con proporciones 7 Error Tipo II 8 Pruebas de hipótesis de dos muestras Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 39 / 46 Pruebas de hipótesis de dos muestras: muestras independientes Prueba sobre dos medias con varianzas conocidas Si se está probando: H0 : µ1 = µ 2 H1 : µ1 6= µ2 El estadı́stico de prueba que deberá usarse para comparar las medias de dos tratamientos conociendose las varianzas es: x¯1 − x¯2 z0 = q 2 σ2 σ1 + n22 n1 (9) Donde x¯1 y x¯2 son las medias de muestras aleatorias independientes de tamaños n1 y n2 de poblaciones con varianzas conocidas σ12 y σ22 , respectivamente. Si ambas poblaciones son normales, o si los tamaños de las muestras son lo suficientemente grandes para aplicar el teorema del lı́mite central, z0 se distribuye como N (0, 1). H0 se rechazarı́a si |z0 | > zα/2 , donde zα/2 es el punto porcentual α/2 superior de la distribución normal estándar. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 40 / 46 Pruebas de hipótesis de dos muestras: muestras independientes Ejemplo Los clientes de los supermercados FoodTown tienen una opción al pagar por sus compras. Pueden pagar en una caja registradora normal operada por un cajero, o emplear el nuevo procedimiento: Fast Lane. Cuando eligen la primera alternativa, un empleado registra cada artı́culo, lo pone en una banda transportadora pequeña de donde otro empleado lo toma y lo pone en una bolsa, y después en el carrito de vı́veres. En el procedimiento Fast Lane, el cliente registra cada artı́culo, lo pone en una bolsa y coloca las bolsas en el carrito. Este procedimiento está diseñado para reducir el tiempo que los clientes pierden en la fila de la caja. El aparato de Fast Lane se acaba de instalar en la sucursal de la calle Byrne de FoodTown. La gerente de la tienda desea saber si el tiempo medio de pago con el método tradicional es mayor que con Fast Lane, para lo cual reunió la información siguiente sobre la muestra. El tiempo se mide desde el momento en que el cliente ingresa a la fila hasta que sus bolsas están en el carrito. De aquı́ que el tiempo incluye tanto la espera en la fila como el registro. ¿Cuál es el valor p? Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 41 / 46 Pruebas de hipótesis de dos muestras: muestras independientes Prueba sobre dos medias con varianzas deconocidas y diferentes Suponga que se está probando: H0 : µ1 = µ 2 H1 : µ1 6= µ2 Bajo el supuesto de que las varianzas son desconocidas e idénticas. El estadı́stico de prueba que deberá usarse para comparar las medias de dos tratamientos es: t0 = (x¯1 − x¯2 ) q sp n11 + n12 (10) Dónde: x¯1 y x¯2 son las medias muestrales n1 y n2 los tamaños de las muestras. y s2p es una estimación de la varianza común σ12 = σ22 = σ 2 , calculada a partir de: s2p = (n1 − 1) s21 + (n2 − 1) s22 n1 + n2 − 2 (11) Sabiendo que s21 y s22 son las varianzas muestrales. Para determinar si deberá rechazarse H0 : µ1 = µ2 . Se compara t0 con la distribución t con n1 + n2 − 2 grados de libertad. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 42 / 46 Pruebas de hipótesis de dos muestras: muestras independientes Ejemplo: Owens Lawn Care, Inc., fabrica y ensambla podadoras de césped que envı́a a distribuidores instalados en Estados Unidos y Canadá. Se han propuesto dos procedimientos distintos para el montaje del motor al chasis de la podadora. La pregunta es: ¿existe una diferencia entre ellos con respecto al tiempo medio para montar los motores al chasis de las podadoras? El primer procedimiento lo desarrolló Herb Welles, un antiguo empleado de Owens (designado como procedimiento 1), y el otro lo desarrolló William Atkins, vicepresidente de ingenierı́a de Owens (designado como procedimiento 2). Para evaluar los dos métodos, se decidió realizar un estudio de tiempos y movimientos. Se midió el tiempo de montaje en una muestra de cinco empleados según el método de Welles y seis con el método de Atkins. Los resultados, en minutos, aparecen a continuación. ¿Hay alguna diferencia entre los tiempos medios de montaje? Utilice un nivel de significancia de 0.10 y suponga que las dos poblaciones tienen desviaciones estándares iguales. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 43 / 46 Pruebas de hipótesis de dos muestras: muestras independientes Prueba sobre dos medias con varianzas deconocidas y diferentes Suponga que se está probando: H0 : µ1 = µ 2 H1 : µ1 6= µ2 En este caso el estadistico de prueba es: x¯1 − x¯2 t0 = q 2 s2 s1 + n22 n1 (12) La distribución t es una buena aproximación de t0 si se usa: gl = s2 1 n1 (s21 /n1 )2 n1 −1 + + s2 2 n2 2 (13) (s22 /n2 )2 n2 −1 para los grados de libertad. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 44 / 46 Pruebas de hipótesis de dos muestras: muestras independientes Ejemplo El personal en un laboratorio de pruebas del consumidor evalúa la absorción de toallas de papel. Se desea comparar un conjunto de toallas de una marca con un grupo similar de toallas de otra marca. De cada una de ellas se sumerge una pieza del papel en un tubo con un fluido, se deja que el papel escurra en una charola durante dos minutos y después se evalúa la cantidad de lı́quido que el papel absorbió de la charola. Una muestra aleatoria de 9 toallas de papel de la primera marca absorbió las cantidades siguientes de lı́quido en milı́metros. Una muestra aleatoria independiente de 12 toallas de la otra marca absorbió las cantidades siguientes de lı́quido en milı́metros. Utilice el nivel de significancia de 0.10 y pruebe si existe una diferencia entre las cantidades medias de lı́quido que absorbieron los dos tipos de toallas. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 45 / 46 Referencias I Lind, D. A. M., Wathen, W. G., Lind, S. A. D. A., Marchal, W. G., and Wathen, S. A. (2015). Estadı́stica aplicada a los negocios y la economı́a. McGraw-Hill,, 16 edition. Manuel Correa Giraldo (EAFIT) Pruebas de hipótesis 2 de octubre de 2017 46 / 46

Log In

Pruebas de hipótesis de una y dos muestras 1

Related papers

Related papers