Science">
Estadistica Inferencial
Estadistica Inferencial
Estadistica Inferencial
VILLAHERMOSA
Materia:
Estadística inferencial
ALUMNO
HUGO UZIEL GARCIA LOPEZ Docente:
Raúl Martínez Ramón
NUM DE CONTROL
21300821 Nombre de la unidad:
Pruebas de hipótesis con dos muestras y
FECHA
varias muestras con datos categóricos.
28-04-23
ESTADÍSTICA INFERENCIAL
UNIDAD 5
EQ. 5
Se utiliza una prueba z de dos proporciones para probar la diferencia entre dos
proporciones de población.
Dónde:
1
En contraste con la
distribución de
2
Para cualquier tamaño
de N tomando una
mediciones individuales,
población con media,
una distribución
muestra es una los valores de la media
distribución de muestra varían de una
probabilidad que se muestra a otra. Esta
aplica a los valores variabilidad sirve de
posibles de una base para la
estadística muestra distribución muestral.
5.4
PRUEBA DE INDEPENDECNIA (JI-
CUADRADA)
Como es habitual, la hipótesis nula (H0) indica que ambas variables son
independientes, mientras que la hipótesis alternativa (H1) indica que las
variables tienen algún grado de asociación o relación.
Criterio de aceptación de Ho
El criterio para aceptar Ho es:
-Si χ2 < χ2crítico, se acepta Ho, de lo contrario se rechaza
5.5 PRUEBAS
DE
CONTIGENCIAS
(JI-CUADRADA)
Las tablas de contingencia:
Paso 5 Interpretacion
Como no se cumple con la
regla de decision no
rechazamos H0 quien
rechaza es HI por lo que se
tiene evidencia estadistica
de que la proporcion de
adultos es igual que la
proporcion de niños que
califican el nuevo pastel
como excelente
5.7 APLICACIONES
La principal función es facilitar el estudio de datos a partir de una escala menor e
interpretarlos para atribuir las conclusiones a una escala mayor de datos. A partir de esto,
grandes bloques de información pueden ser analizados mediante la observación de sólo
una parte de ellos.
Además, permite realizar pronósticos de posibles futuros eventos, lo que facilita definir
rutas de acción tempranas en caso de que se puedan presentar problemas o para mejorar,
de manera incremental, un aspecto con respecto al tiempo.
EJERCICIO 2
Este ejercicio consiste en determinar si las ventas de mes a mes del producto
twice del año 2016 de la empresa JYP, tienen una distribucion uniforme
EJERCICIO 3
Vamos a examinar con más atención el ejemplo de los snacks en el cine. Supongamos que recogemos datos de 600 personas
en nuestro cine. Para cada persona, sabemos el tipo de película que vieron y si compraron snacks o no.
Vamos a empezar por responder a esto: ¿Es la prueba de independencia de ji cuadrado un método apropiado para evaluar la
relación entre el tipo de película y las compras de snacks?
Tenemos una muestra aleatoria simple de 600 personas que han visto una película en nuestro cine. Cumplimos este
requisito.
Nuestras variables son el tipo de película y si se compraron o no snacks. Ambas variables son categóricas. Cumplimos
este requisito.
El último requisito es que haya más de cinco valores esperados para cada combinación de las dos variables. Para
confirmarlo, tenemos que saber los conteos totales para cada tipo de película y los de si se compraron o no snacks. Por
ahora, supondremos que cumplimos este requisito y lo comprobaremos más adelante.
Parece que, en efecto, hemos seleccionado un método válido. (Aún tenemos que comprobar que se esperen más de cinco
valores para cada combinación.)
Todos los conteos esperados para nuestros datos son mayores que cinco, de manera que cumplimos el
requisito para aplicar la prueba de independencia.
Antes de calcular la estadística de la prueba, vamos a echar un vistazo de nuevo a la tabla de
contingencia.
Los conteos esperados utilizan los totales de fila y de columna. Si miramos cada una de las celdas,
veremos que algunos de los conteos esperados son próximos a los reales, pero la mayoría no.
Si no hay relación alguna entre el tipo de película y las compras de snacks, los conteos real y esperado
serán similares. Si hay relación, los conteos real y esperado serán diferentes.
Un error habitual con los conteos esperados es limitarse a dividir la suma total por el número de
celdas. En el caso de nuestros datos de películas, es 600 / 8 = 75. Esto no es correcto.
Sabemos los totales de fila y de columna. Estos son fijos y no pueden cambiar para nuestros datos. Los
valores esperados se basan en los totales de fila y columna, no solo en la suma total.
Hacer la prueba
La idea básica al calcular la estadística de la prueba es comparar los resultados esperados y los reales,
en función de los totales de fila y columna que tenemos en los datos. Primero calculamos la diferencia
entre conteos reales y esperados para cada combinación de película-snacks. Luego calculamos su
cuadrado.
Hacer la prueba
La idea básica al calcular la estadística de la prueba es
comparar los resultados esperados y los reales, en función
de los totales de fila y columna que tenemos en los datos.
Primero calculamos la diferencia entre conteos reales y
esperados para cada combinación de película-snacks. Luego
calculamos su cuadrado. Elevarlos al cuadrado le da la
misma importancia a las combinaciones con más y con
menos valores reales que los esperados. A continuación,
dividimos por el valor esperado de la combinación.
Sumamos estos valores para cada combinación película-
snacks. Esto nos da la estadística de la prueba.
Por último, para obtener la estadística de la prueba, sumamos los números de la última fila para cada celda:
3,29 + 3,52 + 5,81 + 6,21 + 12,65 + 13,52 + 9,68 + 10,35 = 65,03
Para tomar nuestra decisión, comparamos la estadística de la prueba con un valor de la distribución ji cuadrado. Esta actividad tiene cinco
fases:
1. En primer lugar, decidimos qué riesgo estamos dispuestos a asumir de extraer la conclusión de que las dos variables no son independientes.
Para los datos de las películas, hemos decidido antes de nuestra recopilación de datos que estamos dispuestos a asumir un riesgo del 5 % de
decir que las dos variables –Tipo de película y Compra de snacks– no son independientes cuando en realidad sí lo son. En lenguaje de
estadísticas, establecemos el nivel de significación, α , en 0,05.
2. Calculamos una estadística de prueba. Como se muestra arriba, nuestra estadística de prueba es 65,03.
3. Hallamos el valor crítico de la distribución ji cuadrado según nuestros grados de libertad y nuestro nivel de significación. Este es el valor
esperado si las dos variables son independientes.
4. Los grados de libertad dependen del número de filas y de columnas que tengamos. Los grados de libertad (gl) se calculan como:
5. df=(r−1)×(c−1)df=(�−1)×(�−1)
En la fórmula, r es el número de filas, y c es el número de columnas de nuestra tabla de contingencia. A partir de nuestro ejemplo, con Tipo de
película en la filas y Compra de snacks en las columnas, tenemos:
df=(4−1)×(2−1)=3×1=3df=(4−1)×(2−1)=3×1=3
Llegamos a la conclusión de que hay alguna relación entre el tipo de película y las compras de snacks. El propietario del cine no puede hacer
una estimación de la cantidad de snacks que debe comprar independientemente del tipo de películas que se proyecten. En vez de eso, el
propietario debe pensar en el tipo de películas que se proyectan al estimar las compras de snacks.
EJERCICIO 4
El número de alumnos por semana que sufren algún tipo de accidente en un
colegio durante 36 semanas del periodo escolar es la siguiente:
Paso 4: Leer la pregunta 1 y revisar cual de los conceptos se debe usar para obtener lo pedido. Para
responder la pregunta se debe realizar una prueba de bondad de ajuste donde las hipótesis deben
ser: 0 H : Los datos se ajustan a la distribución de Poisson v/s : HI Los datos no se ajustan a la
distribución de Poisson. Paso 5: Realizar la prueba siguiendo los seis pasos. P1: Plantear hipótesis.
Hipótesis nula 0 H : Los datos se ajustan a la distribución de Poisson v/s Hipótesis alternativa : HA
Los datos no se ajustan a la distribución de Poisson
Paso 5: Realizar la prueba siguiendo los seis pasos. P1: Plantear hipótesis.
Hipótesis nula 0 H : Los datos se ajustan a la distribución de Poisson v/s
Hipótesis alternativa : HA Los datos no se ajustan a la distribución de Poisson
EJERCICIO 5
Una empresa minera hizo un estudio para verificar si el tipo de trabajo se
relaciona con el grado de silicosis de los trabajadores. Para lo cual se elige una
muestra aleatoria de 300 trabajadores y se clasifican en la tabla siguiente:
Chi-Cuadrado = 38,2484
Grados de libertad = 6
p-valor = 0,00000100449
Significa que, los cambios en las regiones implican cambios en las cantidades
vendidas de los productos, o viceversa.
EJERCICIO 8
Se sabe con un nivel de confianza del 90% que la proporción de discos defectuosos que no pasan la
prueba en esa población está entre 0.0237 y0.0376
Esto da por resultado dos valores, (0.029, 0.071). Con un nivel de confianza del95% se sabe que la
proporción de pulas defectuosas de esta compañía está entre 0.029 y 0.071. Si se requiere un menor
error con un mismo nivel de confianza sólo se necesita aumentar el tamaño de la muestra.
Solución:
p=x/n=20/400=0.05
z(0.95)=1.96
EJERCICIO 9
Con referencia a la encuesta Enctrans.sav se quiere comprobar si la proporción de
alumnos con vehículo difiere significativamente entre los grupos definidos según
el género.
La hipótesis nula del contraste es ; siendo la proporción poblacional de hombres
con vehículo y la proporción poblacional de mujeres con vehículo.
Con la secuencia Analizar > Estadísticos Descriptivos > Tablas de contingencia se
accede al cuadro de diálogo donde se indica que la variable a contrastar es
Vehículo y que la variable de agrupación es el Género, y se selecciona la opción
Chi-cuadrado en Estadísticos. Al aceptar se obtiene el siguiente cuadro de
resultados.
Si es cierto que la proporción de propietarios de vehículo es la misma en los dos
grupos, , la estimación de es la proporción de propietarios de vehículo para el
total de alumnos de la muestra, es decir, 39/114=0,3421.
Dado que hay miles de residentes en cada condado, llevaría demasiado tiempo y
sería demasiado costoso recorrer y encuestar a cada residente individual en cada
condado.