Science">
Nothing Special   »   [go: up one dir, main page]

Guia Chi Cuadrado

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 10

CHI-CUADRADO -1-

Universidad Católica Los Ángeles de Chimbote

Chi-cuadrado con
SPSS
El contraste Chi-cuadrado es adecuado para probar la existencia de una
diferencia significativa entre un número observado de objetos o respuesta
de categorías (sean nominales u ordinales) y un número esperado. Nos
indica si existe o no relación entre las variables, pero no indica el grado o el
tipo de relación: es decir, no indica el porcentaje de influencia de una
variable sobre la otra o la variable que causa la influencia.
CHI-CUADRADO -2-

CONTRASTE CHI-CUADRADO
CONCEPTO
Se utiliza cuando los datos puntualizan las variables cualitativas (nominal u ordinal), mediante
categorías numéricas. El procedimiento tabula una variable en categorías y calcula un estadístico
de Chi-cuadrado.
Ejemplo los niños pueden clasificarse de acuerdo con los modos más frecuentes de sus juegos, o
una clasificación de personas puede dividirlas con respecto a su opinión, definiéndolas como “a
favor de” “indiferentes a” “opuestos a”, para permitir que el investigador prueba la hipótesis.
Puede aplicarse una prueba paramétrica o no paramétrica, para cada caso el SPSS los diferencia,
de modo que en su menú están ubicadas en lugares distintos. La paramétrica asume que los datos
siguen una distribución normal, en tanto que la prueba no paramétricas no requieren supuestos
sobre la forma de la distribución subyacente.
CHI-CUADRADO PRUEBA PARAMÉTRICA (PARA MÁS DE UNA VARIABLE)
El investigador en su tarea, se interesa en el número de sujetos, objetos o respuestas que se
clasifican en diferentes categorías. Chi-cuadrado, nos indica si existe o no relación entre las
variables, pero no indica el grado o el tipo de relación (cuál es el valor de influencia de una
variable sobre la otra, la variable que causa la influencia o el signo para fijar si la relación es
directa o inversa). Así, de relacionar el Estrés con el desempeño del trabajador, el indicador podría
fijarnos que sí están relacionados, pero cuidado: podría ser que el estrés de acuerdo a sus datos,
favorece al desempeño de manera importante, estos dos aspectos últimos no son determinados
por la prueba.
Esta prueba de bondad de ajuste compara en tablas de doble entrada, las frecuencias observadas
y esperadas en cada categoría para contrastar que todas las categorías responden a una
distribución normal.
Para poder realizar la prueba es necesario que se prevea desde el inicio de la toma de datos las
escalas a utilizar de modo tal que la muestra tenga que garantizar que las frecuencias esperadas
para cada categoría deberán ser 1 mínimamente. No más de un 20% de las categorías deberán
tener frecuencias esperadas menores que 5. La reducción de categorías para forzar los resultados
por lo general resultan en malas prácticas, por lo que no se aconseja, de hacerse tener cuidado
para evaluar si el proceso es lógico (tiene que demostrarse que las escalas son reducibles).
El análisis se realiza para más de una variable, se utiliza para determinar si en tablas de doble
entrada se presentan variaciones estadísticamente significativas respecto de la hipótesis nula (ver
Ejercicios 1, 2 y 3).
Opción SPSS: Analizar / Estadísticos descriptivos / Tablas de contingencia, clic al botón Estadísticos
y allí seleccionar Chi-cuadrado.
Se debe tener bastante cuidado en las Frecuencias Esperadas que el SPSS lo lista, si dentro de la
CHI-CUADRADO -3-

ventana de “Tablas de contingencia”, se ingresa al botón “Casillas”, activar “Esperado” (ver


CHI-CUADRADO -4-

restricciones en Tabla anteriormente presentada).


Se asume que los datos son una muestra aleatoria. Las frecuencias esperadas para cada categoría
deberán ser 1 como mínimo. No más de un 20% de las categorías deberán tener frecuencias
esperadas menores que 5. El SPSS al efectuar la prueba evalúa su cumplimiento, si bien efectúa la
prueba, señala cual es el resultado evaluativo de ésta condición, corresponde al investigador
adoptar la medida correspondiente, así se señala:
CASOS
Tabla de 2x2
Chi-cuadrado Otras Tablas m x n
Frec. Esp. < 5 Frec. Esp. >= 5
Chi-cuadrado de Pearson X
Corrección por continuidad (Yates) X
Razón de verosimilitud X
Estadístico exacto de Fisher X
En el caso de que el
No debe ser de
porcentaje de
una tabla que
Frecuencias Esperadas
resulte de perder
Advertencia < 5 supere el 20%, el
columnas o filas
estadístico de Pearson
en una tabla
debe ser interpretado
mayor (*).
con cautela.
(*) Se debe entender que en este caso no se debe tener ninguna frecuencia esperada menor que 5
(No< 5). Y si se redujo las filas o columnas, necesariamente la Frecuencia Esperada debe ser >5.
En una prueba Paramétrica, el interés es conocer si las variables están relacionadas, no hay el
interés de conocer si siguen determinado comportamiento en cuanto a sus frecuencias. De
acuerdo a la hipótesis nula (H0) las variaciones en la variable independiente no tienen
correspondencia con las variaciones que pudiere haber de la variable dependiente. Es decir que
existe “independencia estadística”. Las variaciones que pudiese encontrarse se deberían a
factores aleatorios, ajenos a la variable independiente.
H0: Las variables NO están relacionadas.
H1: Las variables SI están relacionadas.
EJERCICIOS PRUEBA PARAMÉTRICA
1. Torres (1992, pág. 269). De acuerdo a una investigación, se específica, al 95% de confianza:
Tabla de contingencia A * B

¿Continuará viviendo en la ciudad a


pesar de no tener trabajo estable?
SI NO Total
¿Ha emigrado Ud. de la zona SI 80 15 95
rural por falta de trabajo? NO 12 40 52
Total 92 55 147
CHI-CUADRADO -5-

En el SPSS, se ingresa codificando las filas y columnas y su frecuencia, como una tabla del modo
siguiente:

A B FRE_CIA
1 1 80
1 2 15
2 1 12
2 2 40

Las hipótesis son:


H0: El que la persona emigre de la zona rural por falta de trabajo NO está relacionado al que
continuará viviendo en la ciudad a pesar de no tener trabajo estable.
H1: El que la persona emigre de la zona rural por falta de trabajo SI está relacionado al que
continuará viviendo en la ciudad a pesar de no tener trabajo estable.
En el SPSS, con Datos / Ponderar casos, luego con: Analizar / Estadísticos descriptivos / Tablas de
contingencia, clic al botón Estadísticos y allí seleccionar Chi-cuadrado, se obtiene:

Pruebas de chi-cuadrado
Valor gl Sig. asintótica Sig. exacta Sig. exacta
(bilateral) (bilateral) (unilateral)
Chi-cuadrado de Pearson 53,636a 1 ,000
Corrección por continuidadb 51,057 1 ,000
Razón de verosimilitudes 55,319 1 ,000
Estadístico exacto de Fisher ,000 ,000
Asociación lineal por lineal 53,271 1 ,000
N de casos válidos 147
a. 0 casillas (0,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 19,46.
b. Calculado sólo para una tabla de 2x2.

La nota al pie de la Tabla anterior fija que no hay el problema de la restricción respecto a número
de casillas que deben tener una frecuencia esperada mayor o igual a 5. El estadístico por ser una
tabla de 2 x 2, es la Corrección por continuidad, que al tener una significación asintótica (bilateral)
< 0.05, comprueba que las variables están relacionadas.
Conclusión: A un 95% de confianza, se comprueba la Hipótesis Alternativa (H1), estableciendo que
la persona que emigra del campo por no tener trabajo, se quedará viviendo en la ciudad a pesar
de no tener trabajo ya que la misma situación de imposibilidad de generar ingresos, la tendrá si
retorna a su tierra.
2. Un estudio de mercado investiga respecto a que si la zona de residencia está relacionado o
influye con el que los hogares adquieran en un centro comercial, los resultados son:
Tabla de contingencia Zona de residencia * Compra - Dicótoma
CHI-CUADRADO -6-

Compra - Dicótoma
No Si Total
Zona de Periferia 22 4 26
residencia Centro 2 12 14
Total 24 16 40
La hipótesis nula y la hipótesis del investigador son:
H0: La zona de residencia NO explica el que se sea comprador.
H1: L a zona de residencia SI explica el que se sea comprador.
El SPSS, efectúa la prueba y se establece por el estadístico de corrección por continuidad que
ambas variables están relacionadas (sig. < 0.05), aceptando H1. Tal como se advirtió antes no nos
fija el cuánto y de parte de quién, podría ser que los compradores más identificados sean los de la
zona centro o de la periferia, el análisis podría ser por ejemplo con la Curva COR, pero el objetivo
de la presente Guía no es desarrollarlo.

Pruebas de chi-cuadrado
Valor gl Sig. asintótica Sig. exacta Sig. exacta
(bilateral) (bilateral) (unilateral)
Chi-cuadrado de Pearson 18,755a 1 ,000
Corrección por continuidadb 15,939 1 ,000
Razón de verosimilitudes 20,033 1 ,000
Estadístico exacto de Fisher ,000 ,000
Asociación lineal por lineal 18,286 1 ,000
N de casos válidos 40
a. 0 casillas (0,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 5,60.
b. Calculado sólo para una tabla de 2x2.

3. Se supone que la ideología política influye en la elección de los medios de prensa que se leen.
En razón de ello, se supone que la gente de derecha escoge DX, que los de centro derecha leen
CDX, lo de centro leen CX, los de centro izquierda leen CIX y los de izquierda IX. Para ello se
construye un instrumento que permita establecer la ideología, y se toma una muestra al azar,
obteniendo el siguiente resultado.

Medio de Centro- Centro-


Derecha Centro Izquierda Total
Prensa derecha izquierda
DX 34 12 08 05 02 61
CDX 32 31 24 28 20 135
CX 15 55 68 61 34 233
CIX 21 18 17 25 21 102
IX 10 08 15 25 43 101
Total 112 124 132 144 120 632
CHI-CUADRADO -7-

H0: La ideología política NO influye en la elección de los medios de prensa que se leen.
H1: La ideología política SI influye en la elección de los medios de prensa que se leen.

La prueba en el SPSS, como se comprueba en la Tabla siguiente, fija que ambas variables están
relacionadas, con lo que se acepta que la ideología política SI influye en la elección de los medios
de prensa que se leen.

Pruebas de chi-cuadrado

Valor gl Sig. asintótica


(bilateral)
Chi-cuadrado de Pearson 144,472a 16 ,000
Razón de verosimilitudes 132,295 16 ,000
Asociación lineal por lineal 69,031 1 ,000
N de casos válidos 632
a. 0 casillas (0,0%) tienen una frecuencia esperada inferior a 5. La
frecuencia mínima esperada es 10,81.

CHI-CUADRADO PRUEBA NO PARAMÉTRICA (UNA SOLA VARIABLE)


A diferencia del caso anterior (prueba paramétrica), ésta vez se establece a que podrían obedecer
a determinado comportamiento, suposición a partir de la teoría, de la suposición del investigador
o producto de otras investigaciones.
Esta prueba de bondad de ajuste compara las frecuencias observadas y esperadas en cada
categoría para contrastar que todas las categorías contengan la misma proporción de valores o
que cada categoría contenga una proporción de valores especificada por el usuario. Es adecuado
para probar la existencia de una diferencia significativa entre un número observado de objetos o
respuesta de cada categoría y un número esperado.
Es aplicado a una sola variable. Sirve para determinar si los datos obtenidos para una variable
presentan variaciones estadísticamente significativas respecto a la hipótesis nula (ver Ejercicios 4,
5 y 6).
EJERCICIOS PRUEBA NO PARAMÉTRICA
4. Se supone que los compradores en los shoppings pertenecen a las clases altas de la sociedad.
Para eso tomamos una muestra de 50 casos, de manera aleatoria, a quienes indagamos sobre
su pertenencia social (para ello debemos tener un instrumento que nos permita inferir a qué
clase social pertenecen). Los resultados nos arrojan lo siguiente:

Clase Baja Media-Baja Media Media-Alta Alta Total


Frecuencia 8 9 10 11 12 50

Se plantean las siguientes hipótesis:


CHI-CUADRADO -8-

H0: Los compradores en los shoppings NO pertenecen a una clase social específica.
H1: Los compradores en los shoppings SI pertenecen a una clase social específica.
Procedimiento en el SPSS:
a) Ingresar la información en una variable, los valores de la variable son: 1 Baja, 2 Media-Baja, 3
Media, 4 Media-Alta, 5 Alta, la medida se asume por considerar diferencia de ingresos como
Ordinal.
b) Analizar / Pruebas no paramétricas / Una muestra, se apertura una ventana de diálogo,
asegurarse que en la pestaña “Campos” está seleccionada la variable en análisis, en la pestaña
“Objetivo”, seleccionar el botón: comparar automáticamente datos ….., “Ejecutar”. El
resultado es:

Para probar la hipótesis nula se asume que se trataría de una distribución uniforme, es decir que
las frecuencias para cada clase social son iguales a 10 (50/5), por lo que tienen probabilidad de
ocurrencia iguales 0.20 (10/50), lo que se muestra a continuación en una Tabla, la significación al
no ser <= 0.05, sino > 0.05, se acepta la hipótesis nula.

Clase Baja Media-Baja Media Media-Alta Alta Total


Frecuencia 8 9 10 11 12 50
Frecuencia 10 10 10 10 10 50
Probabilidad 0.20 0.20 0.20 0.20 0.20 1.00

5. Volver a resolver el ejercicio anterior, si los datos son los siguientes: (los datos son muy
evidentes, pero lo que se desea es explorar las opciones en el SPSS):

Clase Baja Media-Baja Media Media-Alta Alta Total


Frecuencia 2 9 11 12 16 50
Si bien posteriormente se mejora su redacción fundamentados en los resultados de la prueba
fijados por el SPSS, las hipótesis inicialmente planteadas son:
H0: Los compradores en los shoppings NO pertenecen a una clase social específica.
H1: Los compradores en los shoppings SI pertenecen a una clase social específica.
Con el resultado que se obtiene y se presenta a continuación, se rechaza la Hipótesis Nula y se
acepta la Hipótesis Alternativa, los compradores pertenecen a una clase social específica.
CHI-CUADRADO -9-

La forma como el software plantea la Hipótesis Nula permite efectuar una interpretación más
adecuada a los resultados, se establece que la distribución de los clientes por clase no es
uniforme, hay diferencias de frecuencia entre ellas. Las hipótesis deberían ser:
H0: Las categorías de Clase Social se producen con probabilidades iguales. H1:
Las categorías de Clase Social se producen con probabilidades desiguales.

6. A partir del planteamiento en el Ejercicio 4, asuma que los datos corresponden a un estudio
efectuado hace 2 años, para el presente año se efectúa otro estudio los resultados se
presentan a continuación, se desea conocer si el patrón de compra se ha modificado.

Clase Baja Media-Baja Media Media-Alta Alta Total


Frecuencia - Anterior 8 9 10 11 12 50
Frecuencia - Actual 6 8 11 10 15 50

H0: Las categorías de Clase Social no mantiene el patrón anterior.


H1: Las categorías de Clase Social si mantienen el patrón anterior.
Esta vez accediendo a: Analizar / Pruebas no paramétricas / Una muestra, en la pestaña superior
de la ventana de diálogo se va a configuración, presentado:

Marcando al igual que aparece en la figura anterior “Personalizar pruebas”, seleccionando


“Comparar …..”, en “Opciones”, ingrese las categorías que corresponden a las clases (1, 2, 3, 4 y 5)
y los valores de contraste que corresponden a las nuevas frecuencias observadas:
Clase – Frecuencia Actual: 1 - 6, 2 - 8, 3 - 11, 4 - 10, 5 – 15
CHI-CUADRADO - 10
-

Se “Acepta” y luego se “Ejecuta”, el resultado es:

Se comprueba que a pesar de haber observaciones con frecuencias diferentes, se establece que el
patrón histórico se mantiene.

También podría gustarte