Science">
Sesión 11 - Prueba Chi Cuadrado
Sesión 11 - Prueba Chi Cuadrado
Sesión 11 - Prueba Chi Cuadrado
HABITOS DE FUMAR
SEXO TOTAL
SI NO
FEMENINO Distribución
Distribución Conjunta
Marginal
MASCULINO
Tamaño de
TOTAL Distribución Marginal
Muestra
INDEPENDENCIA DE VARIABLES
Se dice que la variable “Y” se distribuye independientemente de la
variable “X” si para todas las frecuencias conjuntas fij se cumple:
f i. f. j
Oij Eij
n
TABLA DE CONTINGENCIA
Tabla de contingencia (de “k” filas y “m” columnas)
Oij: denota a las frecuencias observadas. Es el número de casos observados clasificados en la fila i de la columna j
Eij: denota a las frecuencias esperadas. Es el número de casos esperados correspondientes a la fila i de la columna j
n: Número total de datos.
CONTENIDO
INDEPENDENCIA DE DISTRIBUCIÓN CHI
VARIABLES CUADRADO
PRUEBA CHI -
CUADRADO
2
k m
ijO
E ij 2
i 1 j 1 Eij
𝜒 2(𝑇𝑎𝑏𝑙𝑎) = 𝜒 2( 𝑔𝑙, 𝛼 )= 𝜒(2( 𝑖 −1 ) ( 𝑗 − 1) ; 𝛼 )
k: Representa el número de filas.
m: Representa el número de columnas.
i: Representa la posición de la fila
j: Representa la posición de la Columna
Eij: Representa la frecuencia esperada para la celda situada en la fila i columna j.
Oij: Representa la frecuencia efectiva observada para esa celda.
Distribución Chi-cuadrada (2)
1. La distribución 2 tiene grados de libertad (k-1)(m-1)
2. No tiene valores negativos. El valor mínimo es 0.
3. Todas las curvas son asimétricas
4. Cuando aumentan los grados de libertad, las curvas son
menos elevadas y más extendidas a la derecha.
5. Se utiliza para evaluar asociación entre variables
cualitativas medidas en escala nominal u ordinal.
PRUEBA DE INDEPENDENCIA DE VARIABLES
Prueba de Independencia, consistente en comprobar si
dos VARIABLES CUALITATIVAS están
relacionadas entre sí (por ejemplo: ¿la satisfacción
está relacionado con la atención del cliente?).
1) Planteamiento de la hipótesis
Ho: Las variables X e Y son independientes.
H1 : Las variables X e Y no son independientes. (X e Y están relacionados)
i 1 j 1 Eij
Donde tiene una distribución chi cuadrado con ( k 1)(m 1) grados de libertad
2
No consume 20 10 30
Total 60 40 100
ALIMENTO SEXO Total
ECOLOGICO
O
Masculino
O Femenino
Consume
Eij
40 i . . 30
j 70
No consume 20 n 10 30
Total 60 40 100
k
x 2
m O
ij Eij
2
40 42 30 28 20 18 10 12
2
2
2
2
0.794
i 1 j 1 Eij 42 28 18 12
Pasos de una Prueba de hipótesis:
1) Planteamiento de la Hipótesis
Ho: El consumo de alimento ecológico es independiente al sexo de los individuos.
H1 : El consumo de alimento ecológico no es independiente al sexo de los individuos
0.794 3,841
X
2
r c O
ij eij
2
X 2
Oij :Frecuencia Observada
c , r 1 c 1
i 1 j 1 eij eij :Frecuencia Esperada
2 1. Analizar.
3
2. Estadísticos descriptivos.
3. Tablas de contingencia
PASOS EN EL SPSS
PASOS PARA UNA PRUEBA DE INDEPENDENCIA DE
DOS VARIABLES
(O PRUEBA CHI-CUADRADO)
1) Planteamiento de la Hipótesis
Ho: Las variables X e Y son independientes.
H1 : Las variables X e Y no son independientes. (X e Y están relacionados)
Sabiendo:
p Se acepta la Hipótesis Nula (Ho)
p Se rechaza la Hipótesis Nula (Ho)
Ejemplo con reporte de SPSS
Es el valor de
p = 0.373
PRUEBA DE HIPÓTESIS DE CHI
CUADRADO
3. Establecer la regla y
Como p = 0,373 > α=0,05
toma de decisión Entonces no se rechaza la hipótesis nula . Por
lo tanto las variables consumo de alimentos
ecológicos y el sexo son independientes.
EJEMPLO 2
Un equipo de investigación de la EAP de Ingeniería Ambiental de la UCV desea
conocer la asociación entre el estrés y el rendimiento académico de los
estudiantes del III ciclo, construyéndose una tabla de contingencia de 2 filas por
2 columnas. De acuerdo a los resultados del SPSS que se muestran a
continuación, ¿existirá asociación entre el estrés y el rendimiento académico? La
prueba se realizó con α=0.05
Es el valor
Pruebas de chi-cuadrado
de p = 0,007
Valor gl Sig. asintótica
(bilateral)
Años de experiencia
Remuneración Total
A B C D
Bajo 4 11 9 14 38
Medio 12 9 8 4 33
Alto 10 6 7 6 29
Total 26 26 24 24 n=100
CASO APLICATIVO: EXPERIENCIA
LABORAL
Años de experiencia
Remuneración Total
A B C D
Bajo 4 11 9 14 38
Medio 12 9 8 4 33
Alto 10 6 7 6 29
Total 26 26 24 24 n=100
X
2
3 4 O
ij eij
2
4 9.88
2
11 9.88
2
...
6 6.96
2
0.10
c
i 1 j 1 eij 9.88 9.88 6.96
O r 3
ij eij
3 4 2
X c2 10.814
i 1 j 1 eij c4
X 02 10.64 X c2 10.814
6.- Conclusión
Al nivel del 5% de significancia, ¿se puede inferir que la calidad del producto es independiente
de la línea de producción?
CASO APLICATIVO: PROCESO
Calidad del
PRODUCTIVO
Línea de producción
Total
producto Línea 1 Línea 2 Línea 3
C1 40 90 70 200
C2 50 60 60 170
C3 60 50 20 130
Total 150 200 150 n=500
X
2
3 4 O
ij eij
2
40 60
2
90 80
2
...
20 39
2
0.05
c
i 1 j 1 eij 60 80 39
O r 3
ij eij
3 3 2
X c2 32.773
i 1 j 1 eij c3
X 02 9.49 X c2 32.773
6.- Conclusión
https://www.youtube.com/watch?v=Vq_XVxivnko https://youtu.be/_HxWIln8waQ
Prueba Chi Cuadrado en IBM SPSS: Tutorial
https://www.youtube.com/watch?v=DFizVLh7Nkk
Gracias por tu esfuerzo..!!