Science">
ACFrOgC9d8jIpNCtJteZrjIPYlAePDCSEUIaxHtdfGg0uQNLhXl9b3UehcA3YiL4E z8kdec3dQ99w96jxy9HYCwhhbtVyUL27OI6HdbpvvjLhlQz0KC CH COywYz340iJgbtL8J IsVv3Yi ZD
ACFrOgC9d8jIpNCtJteZrjIPYlAePDCSEUIaxHtdfGg0uQNLhXl9b3UehcA3YiL4E z8kdec3dQ99w96jxy9HYCwhhbtVyUL27OI6HdbpvvjLhlQz0KC CH COywYz340iJgbtL8J IsVv3Yi ZD
ACFrOgC9d8jIpNCtJteZrjIPYlAePDCSEUIaxHtdfGg0uQNLhXl9b3UehcA3YiL4E z8kdec3dQ99w96jxy9HYCwhhbtVyUL27OI6HdbpvvjLhlQz0KC CH COywYz340iJgbtL8J IsVv3Yi ZD
Este tipo de variables según la escala de medición son llamadas nominales, también
se le conoce como variables cualitativas categóricas, donde no existe jerarquía.
Para evaluar la longitud de la asociación entre dos variables categóricas o
cualitativas se necesita conocer la medidas de Asimetría ( la distribución de
frecuencias puede ser, asimetría a la derecha o izquierda y simétrica).
Se considera la asociación de las variables frente a las distribuciones de frecuencia
simétricas. De caso contrario la asimetría genera medidas de tamaño.
Podemos definir la asociación entre dos variables como la intensidad con la que unas
categorías de una variable diferencian las frecuencias obtenidas en el cruce con la
otra.
Ejemplo: Nos permitiría saber si el sexo de una persona es un factor determinante en que dicha
persona fume o no fume.
La Chi-cuadrado (χ 2 ), cuyo cálculo nos permitirá determinar si los niveles de una variable
cualitativa influyen en los niveles de la otra variable nominal analizada.
¿Cómo podemos determinar si existe una relación de dependencia o independencia entre las
variables analizadas?
Donde
• Eij : es la frecuencia( el valor) esperada o teóricas.
• Nnij:es la observada de la muestra.
Ejemplo:
Se desea estudiar dos atributos (FUMA Y SEXO) y cada uno de ellos tiene dos niveles.
SEXO
X/Y HOMBRE MUJER fi.
SI 65 58 123
FUMA NO 43 67 110
f.j 108 125 233
Calculando( χ 2 )
Por lo tanto, no existe independencia entre las variables quiere decir que el sexo de una
persona infleye en que sea fumadora o no.
Desventaja:
El Chi cuadrado además de determinar si son significativas estadísticamente las
diferencias, el problema es que el valor no es estándar, depende de las frecuencias
y del tamaño de la tabla.
Este coeficiente consiste en hacer la raíz cuadrada del chi cuadrado dividida por el número
total de casos de la tabla a fin de eliminar el problema de las frecuencias altas.
Ф = √( χ 2 / n)
Su valor oscila entre 0 < Ф < 1 como se puede observar es igual al coeficiente de Pearson
para las tablas de 2*2, pero si la tabla es mayor no tiene máximo (Se recomienda no usar para
tablas de contingencia mayor de 2 x 2).
4.42
Ф = √ =
233
𝑋2
𝑉 = √𝑛(𝑡−1) Donde t es el mínimo de las filas y columnas. (t = mín (f,c) )
La interpretación:
- Consiste en la variación de (0≤V≤1).
- V = 0 ausencia de relación
- V = 1 presencia de relación perfecta
4.42
Para el ejercicio anterior. 𝑉 = √233(2−1)
𝑋2
𝐶= √
χ2 + n
Plantea a su vez el problema de que nunca llega a valer uno ni siquiera con asociación perfecta
en tablas cuadradas, I es el mínimo (filas , columnas), su valor máximo es:
(𝐼 − 1)
𝑪 𝑚á𝑥𝑖𝑚𝑜 = √
I
Interpretación:
Para los valores de C = 0 no existe relación, C = 1 presencia de relación.
Ejemplo
¿Desearía escoger el departamento como segunda residencia? se han cruzado las dos variables.
Las posibles respuestas a la pregunta son: (i) no; (ii) sí, cuando me jubile, (iii) no lo sabe. Los
lugares de estancia(Y) se han clasificado en las siguientes zonas: (1) Lima; (2) Cusco (3)
Chimbote (4) Trujillo.
Frecuencias Observadas
X/Y Chimbote Cusco Trujillo
No 104 573 27
Si, cuando me 13 39 50
jubile.
No lo sabe 383 1153 303
Frecuencias Esperadas
Solución:
χ 2 = (104-63)2/ 63+ (573-319)2/ 319+ (27-32)2/ 32+ (13-125)2/ 125+ (39-490)2/ 490+ (50-
93)2/ 93+ (383-92)2/92+1153-139)2 /139+ (303-58)2/ 58
=
C=
C aj =
El presente coeficiente en forma porcentual nos indica la asociación entre las variables.
Asimismo se puede utilizar para tablas de diferentes categorías, no necesariamente cuadrada.
Esta transformación que se presenta sirve para ajustar C, que varía entre (0y1)
independientemente de las dimensiones de la tabla.
𝐶 𝐶
𝐶∗ = =
𝐶𝑚á𝑥𝑖𝑚𝑜
√𝐼 − 1
𝐼
OBSERVACIÒN:
Se debe considerar el coeficiente C como de 𝑪∗ la interpretación no es intuitiva, Pearson lo
considera una aproximación al coeficiente de correlación (r) , y puede ser considerado como
un porcentaje de su máxima variación posible, debe tenerse en cuenta que cuanto menor sea
las dimensiones de la tabla, más se alejará C de uno, cosa que no sucede con C*. Para tablas
de dos por dos el valor máximo de C es de 0.71.
2
𝑋2
𝑇 =
𝑛√(𝑘 − 1)(𝑝 − 1)
Siendo k y p las dimensiones de la tabla de contingencia. Este coeficiente varía entre cero y
uno:
- Si T2 = 0, hay independencia entre las variables bajo estudio.
- Si T2 = 1, existe asociación total entre las variables.
Ejercicio:
Calcular los coeficientes chi cuadrado y el de Chuprov. Para las siguientes tablas de
contingencia. En las tablas se puede observar que son las mismas variables donde la primera
tabla n=10 y en la segunda n=100, se considera que debe haber el mismo grado de asociación
ya que además las frecuencias relativas coinciden.
X/Y CASADO SOLTERO VIUDO fi.
HOMBRE 2 0 1 3
MUJER 0 3 4 7
f.j 2 3 5 10
Solución:
En la primera tabla se tiene:
eij CASADO SOLTERO VIUDO
HOMBRE 0.6 0.9 1.5
MUJER 1.4 2.1 3.5
Luego 𝑋 2 = 6.2
Luego 𝑋 2 = 62
Sin embargo, el coeficiente de contingencia 𝑋 2 toma valores distintos, lo que nos da una idea
de su problema.
6.2
𝑇2 = = 0.4384
10√(1)(2)
62
𝑇2 = = 0.4384
100√(1)(2)
Este coeficiente permite medir la relación entre las variables(X,Y).Mide la relación entre los
rengos asignados a una variable y los rangos asignados a la otra variable.
6 ∑ 𝑑𝑖2
𝑟𝑠 = 1 − [ ]
𝑛(𝑛2 − 1)
Solución:
Se desea medir asociación o correlación. Las calificaciones de la educación formal de las
madres están dadas en una medición cualitativa, pero tienen una escala ordinal, por lo cual es
posible ordenarlas en rangos.
∑ 𝑑𝑖2 = 4 + 9 + 4 + 4 + 4 + 1 = 26
6 ∗ 26
𝑟𝑠 = 1 − [ ] = 0.6905
8(63)