Nothing Special   »   [go: up one dir, main page]

Analisis de Datos Categoricos

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 51

David Martín González

UAT
26/02/2021
SESIÓN III: Competitividad en las
Operaciones: Análisis de Datos Categóricos.
COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS
1- Introducción.
A diferencia de los contrastes de hipótesis para variables
cuantitativas, en las pruebas de hipótesis a realizar en este tema
vamos a usar datos de nivel nominal y ordinal.

Estas pruebas están libres de suposiciones con respecto a la


distribución de la población de origen. Es decir, no es necesario que
se suponga que la población sigue la distribución normal. Dichas
pruebas libres de distribución son de aplicación relativamente fácil
y, por lo general, los cálculos son mínimos. En estas pruebas, el
estadístico obtenido se distribuye como una Ji-Cuadrada, cuyas
características son:
•Tiene sesgo positivo.
•Es no negativa.
•Se basa en grados de libertad.
•Cuando los grados de libertad cambian, una nueva distribución se
crea.
COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS

df = 3

df = 5
df = 10

c2
COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS
2- Prueba de Bondad de Ajuste.

Frecuencias Esperadas Iguales


El objetivo de la Prueba de la Bondad de Ajuste es
comparar un conjunto de frecuencias observado con
un conjunto de frecuencias esperado. Sean fo y fe las
frecuencias observadas y esperadas, respectivamente:
• H0: No hay diferencia entre las frecuencias
observadas y esperadas.
• H1: Hay una diferencia entre las frecuencias
observadas y esperadas.
COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS

El estadístico de prueba es:

é ( f o - f e )2 ù
c 2
= å ê
êë fe
ú
úû

El valor crítico es un valor de ji-cuadrada con (k-1)


grados de libertad, donde k es el número de
categorías.
COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS

EJEMPLO 1:

La información siguiente muestra el número de


empleados ausentes por día de la semana en una
fábrica grande. ¿En un nivel de significancia del .05,
hay una diferencia en ausentismo por día de la
semana?
COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS

Día Frecuencia
Lunes 120

Martes 45

Miércoles 60

Jueves 90

Viernes 130

Total 445
COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS

• Suponga la frecuencia esperada igual:

(120 + 45 + 60 + 90 + 130) / 5 = 89

• Los grados de libertad son (5-1)=4.

• El valor crítico es 9.488.


COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS

Día Frecuencia Esperado (fo – fe)2/fe

Lunes 120 89 10.80

Martes 45 89 21.75

Miércoles 60 89 9.45

Jueves 90 89 0.01

Viernes 130 89 18.89

Total 445 445 60.90


COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS

• Debido a que el valor calculado de ji-cuadrada es


mayor que el valor crítico, se rechaza H0.

• Concluimos que hay una diferencia en el número de


trabajadores ausentes por día de la semana.
COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS

Frecuencias Esperadas Diferentes

El objetivo de la Prueba de la Bondad de Ajuste es comparar


un conjunto de frecuencias observado con un conjunto de
frecuencias esperado. La prueba de la Ji-Cuadrada, también
puede utilizarse si las frecuencias esperadas no son iguales.

Sean fo y fe las frecuencias observadas y esperadas,


respectivamente:
• H0: No hay diferencia entre las frecuencias observadas y
esperadas.
• H1: Hay una diferencia entre las frecuencias observadas
y esperadas.
COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS

EJEMPLO 2:

La oficina del censo (USA) indicó que 63.9% de la


población está casada, 7.7% viuda, 6.9% divorciada (y
no vuelta a casar), y 21.5% soltera (nunca casados).
Una muestra de 500 adultos del área de Filadelfia
demostró que 310 fueron casados, 40 viudos, 30
divorciados, y 120 solteros. ¿En un nivel de significancia
del .05 podemos concluir que el área de Filadelfia es
diferente de USA como un todo?
COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS

Estado fo fe (fo – fe)2/fe

Casados 310 319.5 .2825

Viudos 40 38.5 .0584

Divorciados 30 34.5 .5870

Solteros 120 107.5 1.4535

Total 500 500 2.3814


COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS

Paso 1: H0: La distribución no ha cambiado


H1: La distribución ha cambiado

Paso 2: H0: es rechazada si c2 >7.815, df = 3, α = .05

Paso 3: c2 = 2.3814

Paso 4: No se rechaza la hipótesis nula. La distribución con


respecto al estado civil en Filadelfia no es diferente
del resto de los Estados Unidos.
COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS

Limitaciones de la Ji-Cuadrada

Si hay una frecuencia esperada inusitadamente pequeña en una


celda de la tabla, la ji-cuadrada puede llevar a una conclusión
errónea. La frecuencia esperada aparece en el denominador del
estadístico, y la división entre un número muy pequeño produce un
cociente demasiado grande. Se aplican 2 reglas respecto a las
frecuencias de celda pequeñas.

1) Sí sólo hay 2 celdas, la frecuencia esperada en cada celda debe


ser mayor ó igual a 5.

2) Para más de 2 celdas, no debe aplicarse la ji-cuadrada , si más


del 20% de las celdas tienen frecuencias esperadas menores que
5.
COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS
Prueba de Jarque Bera. Utilización de la prueba de bondad de
ajuste para probar normalidad
• Esta prueba investiga si las frecuencias observadas en una
distribución de frecuencias coincide con un conjunto de
frecuencias esperadas que tienen una distribución normal.

• El procedimiento es determinar la media y la desviación


estándar de la distribución de frecuencias.

• Calcule el valor z para el límite más bajo y el límite más alto de


la clase para cada clase.

• Determine fe por cada categoría.

• Utilice la prueba de bondad de ajuste con ji-cuadrada para


determinar si la fo coincide con la fe .
COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS
COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS
COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS
COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS
COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS

22.8 22.8
COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS

EJEMPLO 3
Una muestra de 500 donaciones a la fundación de la
artritis se publica en la distribución de frecuencias
siguiente. ¿Es razonable concluir que la distribución
está normalmente distribuida con un media de $10 y
una desviación estándar de $2? Utilice el nivel de
significancia del .05.

NOTA: La Media y Desviación Estándar proporcionadas, se han estimado a


partir de la muestra de observaciones
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS

Para calcular la fe para la primera clase, primero


determine el valor z.
X -µ 6 - 10
z= = = -2.00
s 2
COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS
n Encuentre la probabilidad de un valor z menor de
-2.00
P( z < -2.00) = 0.5000 - .4772 = .0228
n La frecuencia esperada es la probabilidad de un
valor z menor que -2.00 veces el tamaño de las
muestras.

f e = (.0228)(500) = 11.4

Las otras frecuencias esperadas se calculan en forma


similar.
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS

Cantidad gastada fe Área fo (fo –fe)2 / fe

<$6 20 .02 11.40 6.49

$6 a $8 60 .14 67.95 .93

$8 a $10 140 .34 170.65 5.50

$10 a $12 120 .34 170.65 15.03

$12 a $14 90 .14 67.95 7.16

>$14 70 .02 11.40 301.22

Total 500 500 336.33


COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS

Paso 1: H0: Las observaciones siguen la


distribución normal.
H1: Las observaciones no siguen la
distribución normal.
Paso 2: H0: es rechazada si c2 es mayor que 7.815.
Hay 3 grados de libertad y α es .05.
Paso 3: El valor calculado de c2 es 336.33.
Paso 4: H0: es rechazada. Las observaciones no
siguen la distribución normal.
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS


3- Análisis de contingencia.

• Una tabla de contingencia se utiliza para investigar si dos


rasgos o características están relacionados.

• Cada observación es clasificada de acuerdo a dos criterios.

• Utilizamos el procedimiento usual de prueba de hipótesis.

• Los grados de libertad son iguales a: (número de filas -


1)(números de columnas -1).

• Se calcula la frecuencia esperada como: frecuencia esperada


= (fila total)(columna total)/gran total.
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS


COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS

siguiente
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS


COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS

R
A RR
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS

EJEMPLO 4

¿Hay una relación entre la localización de un accidente


y el género de la persona implicada en el accidente?
Una muestra de 150 accidentes que publicó la policía
fue clasificada por tipo y género. ¿En el nivel de .05 de
significancia, podemos concluir que género y
localización del accidente están relacionados?
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS

SEXO TRABAJO HOGAR OTRO TOTAL

HOMBRE 60 20 10 90

MUJER 20 30 10 60
TOTAL 80 50 20 150

La frecuencia esperada para la intersección de trabajar-


varón se calcula como (90)(80)/150=48. Similarmente,
usted puede calcular las frecuencias esperadas para las
otras celdas.
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS

Paso 1: H0: género y localización no están


relacionados.
H1: género y localización están
relacionados.
Paso 2: H0: es rechazada si el valor calculado de
c2 es mayor que 5.991. Hay (3-1)(2-1) = 2
grados de libertad.
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS

Paso 3: Encuentre el valor de c2

c 2
=
(60 - 48) 2
+ ... +
(10 - 8) 2
= 16.667
48 8

Paso 4: H0: es rechazada. El género y la localización


están relacionados.
COMPETITIVIDAD EN LAS OPERACIONES
ANALISIS DE DATOS CATEGÓRICOS
4- Ejercicios.

1- Un panadero vende pasteles de diferentes sabores. Desea


determinar cuál sabor es el favorito entre su clientela. Una muestra
de 200 clientes reveló lo siguiente:

Sabor Frecuencia
Chocolate blanco 62
Chocolate negro 55
Marmoleado 45
Fresa 38

¿Es razonable concluir que existe una diferencia en la proporción de


clientes que les gusta cada uno de los sabores? Utilice el .05 nivel de
significancia.
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS

2- 200 personas seleccionadas al azar de varios niveles de dirección


fueron entrevistadas para conocer su interés sobre problemas
ambientales. La información fue organizada en la siguiente tabla. Para
el .01 nivel de significancia, ¿es razonable concluir que existe una
relación entre el nivel de dirección y el interés sobre problemas
ambientales?

Nivel de dirección No le interesa Le interesa poco Le interesa


Director ejecutivo 15 13 12
Dirección general 20 19 21
Supervisor 35 28 37
ESTADÍSTICA INFERENCIAL Y PRONÓSTICO
ANALISIS DE DATOS CATEGÓRICOS
3-
Un almacén encuentra que el tiempo de entrega de los pedidos por parte de su proveedor es
aleatorio; el proveedor alega que siempre entrega su mercancía en 7 días o menos. Para evitar el
debate el gerente del almacén hizo un muestreo de las últimas entregas y obtuvo la siguiente
información:

Demuestre a partir de la prueba de bondad del ajuste, si los datos se pueden modelar a
partir de una distribución de probabilidad normal. Hallamos la media y la varianza
muéstrales aplicando las formulas para datos agrupados. MEDIA =8,46 y S=2.52
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS

4- Se recopiló información acerca de los sueldos anuales de


profesores de tiempo completo en 160 colegios universitarios. Se
utilizó un programa informático de estadística, y se determinó a
partir de la muestra, que el Pago Medio era (54.03) miles de dólares
y que la desviación estándar era de 13.76.

¿Podemos hablar de que


se da una distribución
Normal con un nivel de
significancia del 5%?
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS

5- Se afirma, que entre los clientes de una tienda especializada en


pantalones de mezclilla, hay el mismo número de hombres que de
mujeres. Se observa una muestra aleatoria de 40 clientes, en donde
25 son hombres y 15 mujeres. Pruebe la hipótesis nula, de que el
número de clientes hombres y mujeres es igual, con un 5% de nivel
de significancia.

6- En el ejercicio anterior, contraste la hipótesis al 5% de nivel de


significancia, de que el número de hombres es 4 veces más que el
número de mujeres.
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS

7- La siguiente tabla, presenta el número promedio de lesiones por


mil-horas trabajador de una muestra de 50 empresas extraída de una
muestra específica. La media muestral de esta variable es 2.32 y la
desviación estándar muestral es 0.42. Al 5% de nivel de
significancia, probar si esta variable tiene una distribución normal:
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS

8- La tabla siguiente, presenta la reacción de los votantes a un nuevo


plan de impuesto sobre la propiedad de acuerdo con la afiliación
partidista. A partir de estos datos, justifique si existe ó no relación
alguna, entre la afiliación partidista y la reacción al plan de
impuestos al 1% de nivel de significancia.
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS

9- -
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS

10-
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS

11-
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS


12- - La siguiente Tabla muestra la distribución de una muestra
aleatoria de 400 truchas cafés de un gran río, según la longitud y el
sector del río donde fueron encontradas:

Pruebe la hipótesis de que existe alguna relación entre la longitud de


las truchas y el sector del río donde fueron extraídas usando un nivel
de significación del 5%.
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS


13- -
COMPETITIVIDAD EN LAS OPERACIONES

ANALISIS DE DATOS CATEGÓRICOS


14- -
La parte de
imagen con el
COMPETITIVIDAD EN LAS OPERACIONES
identificador de
relación rId2 no
se encontró en
el archivo.
ANALISIS DE DATOS CATEGÓRICOS
5- Bibliografía

1. Anderson D. R., Sweeney, D. J. & Williams T. A. (2008).


Estadística para administración y economía. México:CENGAGE.

2. Black, K. (2005). Estadística en los negocios. México: CECSA


Kazmier, L. J. (2006). Estadística aplicada a administración y
economía. México: McGraw-Hill.

3. Levin, R. & Rubin, D. (2004). Estadística para administración y


economía. México: Pearson Educación.

4. Lind, D., Marchal, W. & Wathen, S. (2008). Estadística aplicada


a los negocios y la economía. México: McGraw-Hill.
La parte de
imagen con el
COMPETITIVIDAD EN LAS OPERACIONES
identificador de
relación rId2 no
se encontró en
el archivo. ANALISIS DE DATOS CATEGÓRICOS

También podría gustarte