Science">
Guia Chi Cuadrado
Guia Chi Cuadrado
Guia Chi Cuadrado
Chi-cuadrado con
SPSS
El contraste Chi-cuadrado es adecuado para probar la existencia de una
diferencia significativa entre un número observado de objetos o respuesta
de categorías (sean nominales u ordinales) y un número esperado. Nos
indica si existe o no relación entre las variables, pero no indica el grado o el
tipo de relación: es decir, no indica el porcentaje de influencia de una
variable sobre la otra o la variable que causa la influencia.
CHI-CUADRADO -2-
CONTRASTE CHI-CUADRADO
CONCEPTO
Se utiliza cuando los datos puntualizan las variables cualitativas (nominal u ordinal), mediante
categorías numéricas. El procedimiento tabula una variable en categorías y calcula un estadístico
de Chi-cuadrado.
Ejemplo los niños pueden clasificarse de acuerdo con los modos más frecuentes de sus juegos, o
una clasificación de personas puede dividirlas con respecto a su opinión, definiéndolas como “a
favor de” “indiferentes a” “opuestos a”, para permitir que el investigador prueba la hipótesis.
Puede aplicarse una prueba paramétrica o no paramétrica, para cada caso el SPSS los diferencia,
de modo que en su menú están ubicadas en lugares distintos. La paramétrica asume que los datos
siguen una distribución normal, en tanto que la prueba no paramétricas no requieren supuestos
sobre la forma de la distribución subyacente.
CHI-CUADRADO PRUEBA PARAMÉTRICA (PARA MÁS DE UNA VARIABLE)
El investigador en su tarea, se interesa en el número de sujetos, objetos o respuestas que se
clasifican en diferentes categorías. Chi-cuadrado, nos indica si existe o no relación entre las
variables, pero no indica el grado o el tipo de relación (cuál es el valor de influencia de una
variable sobre la otra, la variable que causa la influencia o el signo para fijar si la relación es
directa o inversa). Así, de relacionar el Estrés con el desempeño del trabajador, el indicador podría
fijarnos que sí están relacionados, pero cuidado: podría ser que el estrés de acuerdo a sus datos,
favorece al desempeño de manera importante, estos dos aspectos últimos no son determinados
por la prueba.
Esta prueba de bondad de ajuste compara en tablas de doble entrada, las frecuencias observadas
y esperadas en cada categoría para contrastar que todas las categorías responden a una
distribución normal.
Para poder realizar la prueba es necesario que se prevea desde el inicio de la toma de datos las
escalas a utilizar de modo tal que la muestra tenga que garantizar que las frecuencias esperadas
para cada categoría deberán ser 1 mínimamente. No más de un 20% de las categorías deberán
tener frecuencias esperadas menores que 5. La reducción de categorías para forzar los resultados
por lo general resultan en malas prácticas, por lo que no se aconseja, de hacerse tener cuidado
para evaluar si el proceso es lógico (tiene que demostrarse que las escalas son reducibles).
El análisis se realiza para más de una variable, se utiliza para determinar si en tablas de doble
entrada se presentan variaciones estadísticamente significativas respecto de la hipótesis nula (ver
Ejercicios 1, 2 y 3).
Opción SPSS: Analizar / Estadísticos descriptivos / Tablas de contingencia, clic al botón Estadísticos
y allí seleccionar Chi-cuadrado.
Se debe tener bastante cuidado en las Frecuencias Esperadas que el SPSS lo lista, si dentro de la
CHI-CUADRADO -3-
En el SPSS, se ingresa codificando las filas y columnas y su frecuencia, como una tabla del modo
siguiente:
A B FRE_CIA
1 1 80
1 2 15
2 1 12
2 2 40
Pruebas de chi-cuadrado
Valor gl Sig. asintótica Sig. exacta Sig. exacta
(bilateral) (bilateral) (unilateral)
Chi-cuadrado de Pearson 53,636a 1 ,000
Corrección por continuidadb 51,057 1 ,000
Razón de verosimilitudes 55,319 1 ,000
Estadístico exacto de Fisher ,000 ,000
Asociación lineal por lineal 53,271 1 ,000
N de casos válidos 147
a. 0 casillas (0,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 19,46.
b. Calculado sólo para una tabla de 2x2.
La nota al pie de la Tabla anterior fija que no hay el problema de la restricción respecto a número
de casillas que deben tener una frecuencia esperada mayor o igual a 5. El estadístico por ser una
tabla de 2 x 2, es la Corrección por continuidad, que al tener una significación asintótica (bilateral)
< 0.05, comprueba que las variables están relacionadas.
Conclusión: A un 95% de confianza, se comprueba la Hipótesis Alternativa (H1), estableciendo que
la persona que emigra del campo por no tener trabajo, se quedará viviendo en la ciudad a pesar
de no tener trabajo ya que la misma situación de imposibilidad de generar ingresos, la tendrá si
retorna a su tierra.
2. Un estudio de mercado investiga respecto a que si la zona de residencia está relacionado o
influye con el que los hogares adquieran en un centro comercial, los resultados son:
Tabla de contingencia Zona de residencia * Compra - Dicótoma
CHI-CUADRADO -6-
Compra - Dicótoma
No Si Total
Zona de Periferia 22 4 26
residencia Centro 2 12 14
Total 24 16 40
La hipótesis nula y la hipótesis del investigador son:
H0: La zona de residencia NO explica el que se sea comprador.
H1: L a zona de residencia SI explica el que se sea comprador.
El SPSS, efectúa la prueba y se establece por el estadístico de corrección por continuidad que
ambas variables están relacionadas (sig. < 0.05), aceptando H1. Tal como se advirtió antes no nos
fija el cuánto y de parte de quién, podría ser que los compradores más identificados sean los de la
zona centro o de la periferia, el análisis podría ser por ejemplo con la Curva COR, pero el objetivo
de la presente Guía no es desarrollarlo.
Pruebas de chi-cuadrado
Valor gl Sig. asintótica Sig. exacta Sig. exacta
(bilateral) (bilateral) (unilateral)
Chi-cuadrado de Pearson 18,755a 1 ,000
Corrección por continuidadb 15,939 1 ,000
Razón de verosimilitudes 20,033 1 ,000
Estadístico exacto de Fisher ,000 ,000
Asociación lineal por lineal 18,286 1 ,000
N de casos válidos 40
a. 0 casillas (0,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 5,60.
b. Calculado sólo para una tabla de 2x2.
3. Se supone que la ideología política influye en la elección de los medios de prensa que se leen.
En razón de ello, se supone que la gente de derecha escoge DX, que los de centro derecha leen
CDX, lo de centro leen CX, los de centro izquierda leen CIX y los de izquierda IX. Para ello se
construye un instrumento que permita establecer la ideología, y se toma una muestra al azar,
obteniendo el siguiente resultado.
H0: La ideología política NO influye en la elección de los medios de prensa que se leen.
H1: La ideología política SI influye en la elección de los medios de prensa que se leen.
La prueba en el SPSS, como se comprueba en la Tabla siguiente, fija que ambas variables están
relacionadas, con lo que se acepta que la ideología política SI influye en la elección de los medios
de prensa que se leen.
Pruebas de chi-cuadrado
H0: Los compradores en los shoppings NO pertenecen a una clase social específica.
H1: Los compradores en los shoppings SI pertenecen a una clase social específica.
Procedimiento en el SPSS:
a) Ingresar la información en una variable, los valores de la variable son: 1 Baja, 2 Media-Baja, 3
Media, 4 Media-Alta, 5 Alta, la medida se asume por considerar diferencia de ingresos como
Ordinal.
b) Analizar / Pruebas no paramétricas / Una muestra, se apertura una ventana de diálogo,
asegurarse que en la pestaña “Campos” está seleccionada la variable en análisis, en la pestaña
“Objetivo”, seleccionar el botón: comparar automáticamente datos ….., “Ejecutar”. El
resultado es:
Para probar la hipótesis nula se asume que se trataría de una distribución uniforme, es decir que
las frecuencias para cada clase social son iguales a 10 (50/5), por lo que tienen probabilidad de
ocurrencia iguales 0.20 (10/50), lo que se muestra a continuación en una Tabla, la significación al
no ser <= 0.05, sino > 0.05, se acepta la hipótesis nula.
5. Volver a resolver el ejercicio anterior, si los datos son los siguientes: (los datos son muy
evidentes, pero lo que se desea es explorar las opciones en el SPSS):
La forma como el software plantea la Hipótesis Nula permite efectuar una interpretación más
adecuada a los resultados, se establece que la distribución de los clientes por clase no es
uniforme, hay diferencias de frecuencia entre ellas. Las hipótesis deberían ser:
H0: Las categorías de Clase Social se producen con probabilidades iguales. H1:
Las categorías de Clase Social se producen con probabilidades desiguales.
6. A partir del planteamiento en el Ejercicio 4, asuma que los datos corresponden a un estudio
efectuado hace 2 años, para el presente año se efectúa otro estudio los resultados se
presentan a continuación, se desea conocer si el patrón de compra se ha modificado.
Se comprueba que a pesar de haber observaciones con frecuencias diferentes, se establece que el
patrón histórico se mantiene.