Mathematics">
Nothing Special   »   [go: up one dir, main page]

SEMANA 3 - 4 Medidas de Dispersión

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 25

ESTADÍSTICA Y

PROBABILIDADES
Semana 3 - 4 Medidas de Dispersión
Definición

▸ Las medidas de variabilidad permiten entender la


distribución de los datos respecto a un punto (unos
puntos) de referencia. No existe una única medida que
resuma qué tan dispersos están los datos y por tanto
para su estudio se acude a diferentes medidas que
permitan su adecuado análisis.

3
Para el correcto análisis de datos no solo es importante saber la tendencia general
de los datos, también lo es determinar que tan separados están los datos unos de
otros.
▸ Ejemplo: la bolsa de valores BVA tiene información actualizada de la venta de acciones de la Empresa
“ A y la Empresa B. Para ambas empresas se ha dado una tendencia que en promedio esta alrededor de
los 500 USD. Los comisionistas deciden realizar un análisis gráfico de la distribución que han tenido
los datos tienen como resultado

4
¿Por qué es importante entender la dispersión de los
datos? Por ejemplo…

Los analistas financieros están preocupados por la dispersión de las ganancias de una
empresa. Las ganancias ampliamente dispersas —que van desde extremadamente
altas a extremadamente bajas e incluso a niveles negativos— son indicativas de un
riesgo mayor para los accionistas y para los acreedores que las ganancias que
permanecen relativamente estables.

Los expertos en el control de la calidad analizan la dispersión de los niveles de calidad de


un producto. Una medicina cuya pureza promedio es buena, pero que oscila desde
muy pura hasta muy impura puedeser peligrosa para la vida humana.
▸ RANGO: medida de variación más sencilla, esta asociada con la
amplitud del conjunto de datos. Es el valor resultante de restar el
valor más grande menos el valor más pequeño del conjunto de
datos.

Rango = !"á$ - Xmín

Ø No toma en cuenta cómo se distribuyen los datos entre el valor más


pequeño y el valor más grande.

Ø No indica si los valores están distribuidos de manera uniforme a lo


largo de los datos; si se agrupan cerca de la mitad, o si se agrupan
cerca de un extremo o de ambos

Ø Es sensible a los valores extremos

6
Varianza

La varianza y su medida conexa, la


desviación estándar, son probablemente las

1 estadísticas más importantes. Se utilizan


para medir la variabilidad, pero, como
descubrirá, desempeñan un papel vital en
casi todos los procedimientos de inferencia
estadística.
VARIANZA Y DESVIACIÓN ESTÁNDAR:
Se define como la suma de las diferencias alrededor de la media elevadas al cuadrado,
dividido entre el tamaño de la muestra menos 1.
Ʃ "/ − µ 2
! 2
Ʃ(Xi − ") .2 =
2
# = 1
, −1
Muestral Poblacional
s2 = Varianza muestral. σ2 = Varianza de la población.
X = Valor de cada observación de la muestra X = Valor de una observación de la población
"! = Media de la muestra. μ = Media aritmética de la población.
n = número de observaciones en la muestra N = numero de observaciones de la población.

Desviación estándar Desviación estándar

∑8 !
567 9: ; 9
< Ʃ "−µ 2

S = = ;>
.=
1

8
Desviación estándar
Ø Permite observar como un conjunto de datos se agrupa o
distribuye alrededor de la media
Ø Está dada en unidades lineales, su interpretación es
directa porque se da en la misma unidad de medidas
Ø Cuanto más pequeña es la magnitud de la desviación
estándar menor es la dispersión del conjunto de datos
respecto al promedio.
Ø Es sensible a datos atípicos
Ø Es un valor no negativo

9
Ø PARA CALCULAR LA VARIANZA POBLACIONAL O
MUESTRAL Y LA DESVIACIÓN ESTÁNDAR POBLACIONAL
O MUESTRAL:

Ø Calcule las diferencias de cada valor y la media


Ø Eleve al cuadrado cada diferencia
Ø Sume las diferencias elevadas al cuadrado
Ø Divida el total entre N, si es poblacional, o n-1, si es muestral,
para obtener la varianza
Ø Calcule la raíz cuadrada de la varianza para obtener la
desviación estándar.
10
La consistencia es el sello de un buen golfista. Los fabricantes de equipos de golf están constantemente
buscando formas de mejorar sus productos. Supongamos que una innovación reciente está diseñada
para mejorar la consistencia de sus usuarios. Como prueba, se le pidió a un golfista que hiciera 150 tiros


con un hierro 7, 75 de los cuales fueron golpeados con su palo actual y 75 con el nuevo e innovador hierro
7. Se midieron y registraron las distancias. ¿Qué hierro 7 es más consistente? Analice los resultados

11
Tenemos los siguientes datos, los cuales representan salarios mensuales
(expresados en millones de pesos) de una muestra de gerentes en dos
empresas. Usted tiene la opción de elegir trabajar en una de ellas. ¿Cuál elegiría
y por qué?

Empresa A 34.5 30.7 32.9 36.0 34.1 34.0 32.3


Empresa B 34.0 27.5 31.6 39.7 35.3 34.7 31.7

12
EMPRESA A EMPRESA B EMPRESA A EMPRESA B EMPRESA A EMPRESA B
Xi- X Xi-X ̅ (Xi-X ̅)2 (Xi-X ̅)2
1 34,5 34 1 0,5 1 0,25
2 30,7 27,5 -2,8 -6 7,84 36
3 32,9 31,6 -0,6 -1,9 0,36 3,61
4 36 39,7 2,5 6,2 6,25 38,44
5 34,1 35,3 0,6 1,8 0,36 3,24
6 34 34,7 0,5 1,2 0,25 1,44
7 32,3 31,7 -1,2 -1,8 1,44 3,24
17,5 86,22
Media 33,5 33,5
Varianza 2,92 14,37
Desviación 1,71 3,79
CV 5,10% 11,32%

13

Para interpretar la dispersión absoluta, se construyen intervalos
alrededor del promedio. Con esto se determina en dónde se sitúan
los valores de una distribución de frecuencia en relación con la
media aritmética. Esto se puede lograr utilizando:

• Teorema de Chebyshev
▹ Regla Empírica

14
Teorema de Chevyshev
Nos permite determinar la mínima porción de valores que se encuentran a cierta
cantidad de desviaciones estándares de la media.
El matemático ruso P. L. Chebyshev (1821-1894) estableció un teorema, que señala
que independientemente de la forma de la distribución:

(X ± 2S) Al menos el 75% de los datos

( X ± 3S) Al menos el 89% de los datos

15
Teorema de Chebyshev
Determina la proporción mínima de valores que se encuentran en un número
específico de desviaciones estándares en relación a la media.

1
1 − K = cualquier número mayor que 1
#2
%
Para k =2 se tendrá que 1 − = 0.75 . Se espera por tanto que no menos del 75%
&'
este dentro de una desviación estándar.
%
Para k =3 se tendrá que 1 − ' = 0.89 . Se espera por tanto que no menos del 89%
-
este dentro de una desviación estándar.

16
Regla Empírica

17
Consideraciones
• A > dispersión en los datos > el valor del rango, la varianza y la
desviación estándar.
• A < dispersión en los datos < será el valor del rango, la varianza y la
desviación estándar.
• Si no hay variación en los datos el rango, la varianza y la
desviación estándar serán = a cero.
• Ninguna de estas medidas de dispersión puede ser negativa

18
Dispersión relativa: Coeficiente de variación

• Coeficiente de Variación:

▹ Es una medida relativa de variación que se expresa como porcentaje.


Mide la dispersión de los datos con respecto a la media.
▹ Es igual a la desviación estándar dividida entre la media multiplicada
por 100%

!"
CV = $#
* 100

19
Dispersión relativa: Coeficiente de variación
!"
CV = $#
* 100
▹ Es especialmente útil para comparar dos o más conjunto de
datos, con el fin de determinar cual de ellas tiene menor o mayor
variabilidad relativa.

▹ Su uso es necesario cuando las distribuciones estudiadas están


dadas en unidades de medidas diferentes.

▹ O cuando, expresadas en la misma unidad, nos interesa


determinar la variación respecto a una base.

20
Dispersión relativa: Coeficiente de variación
• Suele señalarse que, si el coeficiente de variación esta entre:

▹ 0% y 5% la dispersión de los datos es mínima.


▹ 5 % y 15% la dispersión de los datos es moderada
▹ Superior a 15% la dispersión de los datos es alta

• La relación entre el coeficiente de variación y la dispersión de un


conjunto de datos es directa
• Es un valor no negativo.
• Es sensible a valores atípicos
21
EMPRESA A EMPRESA B EMPRESA A EMPRESA B EMPRESA A EMPRESA B
Xi- X Xi-X ̅ (Xi-X ̅)2 (Xi-X ̅)2
1 34,5 34 1 0,5 1 0,25
2 30,7 27,5 -2,8 -6 7,84 36
3 32,9 31,6 -0,6 -1,9 0,36 3,61
4 36 39,7 2,5 6,2 6,25 38,44
5 34,1 35,3 0,6 1,8 0,36 3,24
6 34 34,7 0,5 1,2 0,25 1,44
7 32,3 31,7 -1,2 -1,8 1,44 3,24
17,5 86,22
Media 33,5 33,5
Varianza 2,92 14,37
Desviación 1,71 3,79
CV 5,10% 11,32%

22
CALORIAS kcal AZÚCAR gr. Los siguientes datos muestran la
Marca A 80 6 cantidad de calorías para 7 marcas de
Marca B 100 2 barras energéticas:
Marca C 100 4
Calcule la varianza y la desviación
Marca D 110 4 estándar y el Coeficiente de variación
Marca E 130 4
¿Qué muestran los datos?
Marca F 190 11
¿Cómo comparan las variaciones?
Marca G 200 10

23
Calorías Azúcar Calorías Azúcar
CALORIAS AZÚCAR
Xi -"
! Xi -"
! (Xi-"
! )2 (Xi-"
! )2
kcal gr.
Marca A 80 6 -50 0,143 2500 0,020
Marca B 100 2 -30 -3,857 900 14,878
Marca C 100 4 -30 -1,857 900 3,449
Marca D 110 4 -20 -1,857 400 3,449
Marca E 130 4 0 -1,857 0 3,449
Marca F 190 11 60 5,143 3600 26,449
Marca G 200 10 70 4,143 4900 17,163
13200 68,857
Media 130 5,86
Varianza 2200 11,48
Desv 46,90 3,39
CV 36,1% 57,8%

24
BIBLIOGRAFÍA
• Anderson, D., Sweeny, D., Williams, T. (2008) : Estadística para administración y economía.
Cengage Learning. Décima edición. México.

• Levine, D. Krenbiel, T. y Bereson, M (2014): Estadística para administración. Ed. Pearson.


Sexta edición. México.

• Lind & Marshall (2008): Estadística Aplicada a los negocios y economía. McGraw-Hill
Interamericana

• Sosa, J., Ospina, L., Berdugo, E. (2012). Estadística Descriptiva y Probabilidades.


Universidad Externado de Colombia. Bogotá.

• Martínez, C. (2011): Estadística Básica aplicada. Ecoe ediciones. Cuarta edición. Bogotá.
25

También podría gustarte