Science">
Nothing Special   »   [go: up one dir, main page]

Sesión 11 - Prueba Chi Cuadrado

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 42

Sesión 11

Prueba de independencia para dos


variables cualitativas: Chi-cuadrado
Considerando el razonamiento científico. (Uso de software estadístico o EXCEL).
OBJETIVOS DE LA SESIÓN

Al finalizar la sesión el estudiante estará en la capacidad de:


• Analizar una tabla de contingencia.
• Diferenciar entre una frecuencia observada y esperada.
• Realizar la prueba de hipótesis chi-cuadrada de la independencia en
una tabla de contingencia.
ESTADÍSTICO CHI-CUADRADO
CONTENIDO

Cuadro Bivariado: También llamadas


tablas de contingencias.
Son aquellas tablas de datos referentes
a dos variables. En las cabecera de las
filas va las categorías o valores de la
variable X y en las columnas por los de
la variable Y.
En las casillas de la tabla, va las
frecuencias o número de elementos que
reúnen a la vez las dos categorías o
valores de las dos variables que se
cruzan en cada casilla.
ESTRUCTURA DE LA DISTRIBUCION DE FRECUENCIAS PARA DOS
VARIABLES.

HABITOS DE FUMAR
SEXO TOTAL
SI NO
FEMENINO Distribución
Distribución Conjunta
Marginal
MASCULINO
Tamaño de
TOTAL Distribución Marginal
Muestra

INDEPENDENCIA DE VARIABLES
Se dice que la variable “Y” se distribuye independientemente de la
variable “X” si para todas las frecuencias conjuntas fij se cumple:
f i.  f. j
Oij  Eij 
n
TABLA DE CONTINGENCIA
Tabla de contingencia (de “k” filas y “m” columnas)

Oij: denota a las frecuencias observadas. Es el número de casos observados clasificados en la fila i de la columna j
Eij: denota a las frecuencias esperadas. Es el número de casos esperados correspondientes a la fila i de la columna j
n: Número total de datos.
CONTENIDO
INDEPENDENCIA DE DISTRIBUCIÓN CHI
VARIABLES CUADRADO

PRUEBA CHI -
CUADRADO

 
2
k m
ijO
 E ij  2

i 1 j 1 Eij
  𝜒 2(𝑇𝑎𝑏𝑙𝑎) = 𝜒 2( 𝑔𝑙, 𝛼 )= 𝜒(2( 𝑖 −1 ) ( 𝑗 − 1) ; 𝛼 )
k: Representa el número de filas.
m: Representa el número de columnas.
i: Representa la posición de la fila
j: Representa la posición de la Columna
Eij: Representa la frecuencia esperada para la celda situada en la fila i columna j.
Oij: Representa la frecuencia efectiva observada para esa celda.
Distribución Chi-cuadrada (2)
1. La distribución 2 tiene grados de libertad (k-1)(m-1)
2. No tiene valores negativos. El valor mínimo es 0.
3. Todas las curvas son asimétricas
4. Cuando aumentan los grados de libertad, las curvas son
menos elevadas y más extendidas a la derecha.
5. Se utiliza para evaluar asociación entre variables
cualitativas medidas en escala nominal u ordinal.
PRUEBA DE INDEPENDENCIA DE VARIABLES
Prueba de Independencia, consistente en comprobar si
dos VARIABLES CUALITATIVAS están
relacionadas entre sí (por ejemplo: ¿la satisfacción
está relacionado con la atención del cliente?).

Estamos interesados en determinar si dos cualidades o


variables referidas a individuos de una población
están relacionadas. En este caso estamos interesados
en ver la relación existente entre dos variables de una
misma población
PRUEBA DE INDEPENDENCIA DE VARIABLES

Esta prueba se usa cuando el interés es determinar


si dos variables cualitativas están asociadas.

- Si no existe asociación entre las dos variables se dice que


son independientes.

- Dos variables son independientes cuando la distribución de una


de ellas no depende de la distribución de la otra.
PASOS PARA UNA PRUEBA DE INDEPENDENCIA DE DOS VARIABLES
(O PRUEBA CHI-CUADRADO)

1) Planteamiento de la hipótesis
Ho: Las variables X e Y son independientes.
H1 : Las variables X e Y no son independientes. (X e Y están relacionados)

2) Fijar el nivel de significación   0.01, 0.05, ó 0.10


3) Determinar el estadístico de prueba
Se utiliza
k
2   
m O
ij  E ij  2

i 1 j 1 Eij
Donde  tiene una distribución chi cuadrado con ( k  1)(m  1) grados de libertad
2

4) Establecer las regiones de Rechazo (R.R) y de Aceptación (R.A.)


5) Decisión: Decidir si el valor calculado de la estadística de prueba pertenece o
no a la región de rechazo
6) Conclusión
1) EJEMPLO:
Supóngase que se dispone de dos variables, la primera el sexo
(masculino o femenino) y la segunda si consume o no
alimentos ecológicos. Se ha observado esta pareja de
variables en una muestra aleatoria de 100 individuos. Se
puede emplear una tabla de contingencia para expresar la
relación entre estas dos variables, del siguiente modo:

ALIMENTO SEXO Total


ECOLOGICO Masculino Femenino
Consume 40 30 70

No consume 20 10 30
Total 60 40 100
ALIMENTO SEXO Total
ECOLOGICO
O
Masculino
O Femenino
Consume
Eij 
40 i . . 30
j 70

No consume 20 n 10 30
Total 60 40 100

E11 = (70 x 60) / 100 = 42


E12 = (70 x 40) / 100 = 28
E21 = (30 x 60) / 100 = 18
E22 = (30 x 40) / 100 = 12

k
x 2  
m O
ij  Eij 
2


 40  42  30  28  20  18 10  12
2

2

2

2
 0.794
i 1 j 1 Eij 42 28 18 12
Pasos de una Prueba de hipótesis:
1) Planteamiento de la Hipótesis
Ho: El consumo de alimento ecológico es independiente al sexo de los individuos.
H1 : El consumo de alimento ecológico no es independiente al sexo de los individuos

2) Fijar el nivel de significación


  0,05
3) Determinar el estadística de prueba
Se utiliza k l
Oij  Eij  2
2  
i 1 j 1
Eij x 2  0.794
x20, 05;1  3,841

4) Establecer las regiones de Rechazo (R.R) y de Aceptación (R.A.)

0.794 3,841

5) Decisión: Como el valor calculado pertenece a la región de aceptación entonces no


rechazamos Ho
6) Conclusión: Las variables X e Y son independientes, quiere decir que
los alimentos ecológicos y el sexo son independientes.
Calculo manual
𝑋 2 𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 > 𝑋 2 𝑡𝑎𝑏𝑙𝑎 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑟𝑒𝑐ℎ𝑎𝑧𝑜 𝐻𝑜
PRUEBA CHI CUADRADO DE
La
INDEPENDENCIA
prueba χ² de Pearson es considerada como una prueba no
paramétrica. Sirve para analizar la relación de dependencia o
independencia entre dos variables de tipo cualitativo o categórico.
La fórmula que da el estadístico es la siguiente:

X  
2
r c O
ij  eij 
2

X 2
Oij :Frecuencia Observada
c   ,  r 1 c 1  
i 1 j 1 eij eij :Frecuencia Esperada

Los grados de libertad gl vienen dados por : gl= (r-1)(c-1). Donde r es el


número de filas y c el de columnas.
PRUEBA CHI CUADRADO DE
INDEPENDENCIA
El planteamiento de las Hipótesis será:

H 0:La var iables X e Y son independientes.


H1:La var iables X e Y son dependientes.
o

Ho: Las var iables X e Y no están relacio nadas


H 1: Las var iables X e Y si est án relacio nadas
REPORTE EN EL
SPSS
PASOS EN EL SPSS
1

2 1. Analizar.
3
2. Estadísticos descriptivos.
3. Tablas de contingencia
PASOS EN EL SPSS
PASOS PARA UNA PRUEBA DE INDEPENDENCIA DE
DOS VARIABLES
(O PRUEBA CHI-CUADRADO)

1) Planteamiento de la Hipótesis
Ho: Las variables X e Y son independientes.
H1 : Las variables X e Y no son independientes. (X e Y están relacionados)

2) Fijar el nivel de significación   0,05   0,1   0,01

3) Establecer la Regla y toma de Decisiones

Sabiendo:
p Se acepta la Hipótesis Nula (Ho)
p  Se rechaza la Hipótesis Nula (Ho)
Ejemplo con reporte de SPSS

Supóngase que se dispone de dos variables, la primera el sexo (masculino o


femenino) y la segunda que recoge si consume o no alimentos ecológicos. Se ha
observado esta pareja de variables en una muestra aleatoria de 100 individuos.
Se puede emplear el resultado de la prueba Chi cuadrado para expresar la
relación entre estas dos variables, del siguiente modo:

Es el valor de
p = 0.373
PRUEBA DE HIPÓTESIS DE CHI
CUADRADO

H0: El consumo de alimentos ecológicos y el


sexo son independientes
1. Plantear la Hipótesis
H1: El consumo de alimentos ecológicos y el
sexo no son independientes

2. Especificar el nivel de α=0,05


significancia

3. Establecer la regla y
Como p = 0,373 > α=0,05
toma de decisión Entonces no se rechaza la hipótesis nula . Por
lo tanto las variables consumo de alimentos
ecológicos y el sexo son independientes.
EJEMPLO 2
Un equipo de investigación de la EAP de Ingeniería Ambiental de la UCV desea
conocer la asociación entre el estrés y el rendimiento académico de los
estudiantes del III ciclo, construyéndose una tabla de contingencia de 2 filas por
2 columnas. De acuerdo a los resultados del SPSS que se muestran a
continuación, ¿existirá asociación entre el estrés y el rendimiento académico? La
prueba se realizó con α=0.05

Es el valor
Pruebas de chi-cuadrado
de p = 0,007
Valor gl Sig. asintótica
(bilateral)

Chi-cuadrado de Pearson ,131a 1 ,007

Corrección por continuidad ,048 1 ,827

Asociación lineal por lineal ,130 1 ,718

N de casos válidos 195


a. 0 casillas (0,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 46,26.
PASOS PARA UNA PRUEBA DE INDEPENDENCIA DE
DOS VARIABLES
(O PRUEBA CHI-CUADRADO)

H0: El estrés y el rendimiento académico son


independientes
1. Plantear la Hipótesis
H1: El estrés y el rendimiento académico no
son independientes

2. Especificar el nivel de α=0,05


significancia

3. Establecer la regla y Como p = 0,007 < α=0,05


toma de decisión Entonces se rechaza la hipótesis nula . Por lo
tanto las variables no son independientes.
Conclusión:
  Con un nivel de significancia de 0.05 existe
evidencia estadística para rechazar y concluir que el
estrés es dependiente con el rendimiento académico
CASO APLICATIVO: EXPERIENCIA
LABORAL
CASO APLICATIVO: EXPERIENCIA
LABORAL
En una empresa se desea estudiar si existe una dependencia entre el nivel
de las remuneraciones y los años de experiencia del personal de su planta
de profesionales. Con este objeto, se clasifican las remuneraciones,
según su monto en tres categorías: bajo, medio y alto, y los años de
experiencia de acuerdo a su número en cuatro categorías: A, B, C y D. A
nivel de 10%, ¿hay alguna relación entre los años de experiencia y las
remuneraciones que perciben los 100 empleados de la empresa?

Años de experiencia
Remuneración Total
A B C D
Bajo 4 11 9 14 38
Medio 12 9 8 4 33
Alto 10 6 7 6 29
Total 26 26 24 24 n=100
CASO APLICATIVO: EXPERIENCIA
LABORAL
Años de experiencia
Remuneración Total
A B C D
Bajo 4 11 9 14 38
Medio 12 9 8 4 33
Alto 10 6 7 6 29
Total 26 26 24 24 n=100

1.- Se establecen las hipótesis nula y alternativa.


H 0:Años de exp eriencia y las remuneraciones del personal profesional
de la empresa son independientes.
H1:Años de exp eriencia y las remuneraciones del personal profesional
de la empresa son dependientes.

2.- Se selecciona un nivel de significancia.   0.10


CASO APLICATIVO: EXPERIENCIA
LABORAL
3.- Se identifica y calcula el estadístico de la prueba.

X  
2
3 4 O
ij  eij 
2

 X 2 ,  r 1 c 1  


Datos :
c
eij
i 1 j 1
  0.10
e11 
 26 38  9.88 e12 
 26 38  9.88 ; e13 
 24 38  9.12
100
;
100 100 r 3
e14 
 24 38  9.12 ; e21 
 26 33  8.58 ; e   26 38  8.58 c4
22
100 100 100
e23 
 24 33  7.92 ; e24 
 24 33  7.92 ; e   26 29  7.54
31
100 100 100
e32 
 26 29  7.54 ; e33 
 24 29  6.96 ; e   24 29  6.96
34
100 100 100
CASO APLICATIVO: EXPERIENCIA
LABORAL
3.- Se identifica y calcula el estadístico de la prueba.
El valor del estadístico de prueba es:
Datos :
X  
2
3 4 O
ij  eij 
2


 4  9.88
2

 11  9.88
2
 ... 
 6  6.96
2
  0.10
c
i 1 j 1 eij 9.88 9.88 6.96
O r 3
ij  eij 
3 4 2

X c2    10.814
i 1 j 1 eij c4

El grado de libertad asociado al estadígrafo de


contraste es:
 r  1 c  1   3  1 4  1  6
PUNTOS CRÍTICOS CON ESTADÍSTICO DE PRUEBA
“CHI-CUADRADO”
Nivel de significancia:  = 0.10
4.- Graficar las
regiones de rechazo y
aceptación; a la vez
Grados de
también ubicar en el
Libertad: gl = grafico los valores
6
encontrados en la
parte (3).

Punto Crítico : RA:Re gión de aceptación


X 2 ,  r 1 c 1   RR:Re gión de re chazo
X 20.10,  31 41   RA RR
X 20.10,6   10.64
PUNTOS CRÍTICOS CON ESTADÍSTICO DE PRUEBA
“CHI-CUADRADO”

5.- Tomar la decisión de aceptar o rechazar Ho.


Se rechaza la hipótesis nula

X 02  10.64  X c2  10.814

6.- Conclusión

Al 90% de confianza, se concluye que la remuneración es dependiente


de los años de experiencia.
CASO APLICATIVO: PROCESO
PRODUCTIVO
CASO APLICATIVO: PROCESO
PRODUCTIVO
Quinientos artículos se escogieron al azar del total de artículos producidos. Estos se
clasificaron según su calidad: 1, 2 y 3y según la su línea de producción: 1, 2, 3, como se indica
en la siguiente tabla:
Calidad del Línea de producción
Total
producto Línea 1 Línea 2 Línea 3
C1 40 90 70 200
C2 50 60 60 170
C3 60 50 20 130
Total 150 200 150 n=500

Al nivel del 5% de significancia, ¿se puede inferir que la calidad del producto es independiente
de la línea de producción?
CASO APLICATIVO: PROCESO
Calidad del
PRODUCTIVO
Línea de producción
Total
producto Línea 1 Línea 2 Línea 3
C1 40 90 70 200
C2 50 60 60 170
C3 60 50 20 130
Total 150 200 150 n=500

1.- Se establecen las hipótesis nula y alternativa.


H 0:La calidad del producto y la línea de producción son independientes.
H1:La calidad del producto y la línea de producción son dependientes.

2.- Se selecciona un nivel de significancia.   0.05


CASO APLICATIVO: PROCESO
PRODUCTIVO
3.- Se identifica y calcula el estadístico de la prueba.

X  
2
3 4 O
ij  eij 
2

 X 2 ,  r 1 c 1   Datos :


c
i 1 j 1 eij
 200150  60  200 200  80  200150  60   0.05
e11  ; e12  ; e13 
500 500 500 r 3
e21 
170150  51 ; e22 
170 200  68 ; e  170150  51
500 500
23
500 c3
e31 
130150  39 ; e32 
130 200  52 ; e  130150  39
33
500 500 500
CASO APLICATIVO: PROCESO
PRODUCTIVO
3.- Se identifica y calcula el estadístico de la prueba.
El valor del estadístico de prueba es:
Datos :
X  
2
3 4 O
ij  eij 
2


 40  60 
2

 90  80 
2
 ... 
 20  39 
2
  0.05
c
i 1 j 1 eij 60 80 39
O r 3
ij  eij 
3 3 2

X c2    32.773
i 1 j 1 eij c3

El grado de libertad asociado al estadígrafo de


contraste es:
 r  1 c  1   3  1 3  1  4
PUNTOS CRÍTICOS CON ESTADÍSTICO DE PRUEBA
“CHI-CUADRADO”
Nivel de significancia:  = 0.10
4.- Graficar las
regiones de rechazo y
aceptación; a la vez
Grados de
también ubicar en el
Libertad: gl = grafico los valores
6
encontrados en la
parte (3).

Punto Crítico : RA:Re gión de aceptación


X 2 ,  r 1 c 1   RR:Re gión de re chazo
X 20.05,  31 31   RA RR
X 20.10, 6   9.49
9.49
CASO APLICATIVO: PROCESO
PRODUCTIVO
5.- Tomar la decisión de aceptar o rechazar Ho.
Se rechaza la hipótesis nula

X 02  9.49  X c2  32.773

6.- Conclusión

Al 95% de confianza, se concluye que las variables calidad y línea de


producción no son independientes.
Prueba Chi Cuadrado en Excel: Tutorial

https://www.youtube.com/watch?v=Vq_XVxivnko https://youtu.be/_HxWIln8waQ
Prueba Chi Cuadrado en IBM SPSS: Tutorial

https://www.youtube.com/watch?v=DFizVLh7Nkk
Gracias por tu esfuerzo..!!

También podría gustarte