GUIA-estadistidca Descriptiva
GUIA-estadistidca Descriptiva
GUIA-estadistidca Descriptiva
Aprende 1. ̅)
Media aritmética ( 𝒙
Se define como el cociente (división) entre la suma de los valores de los datos, en el total de datos. Por lo general
esta definición es para datos NO tabulados.
Ejemplo 1.
Las notas obtenidas por 5 estudiantes son: 5,6 ; 6,8 ; 4,2 ; 5,7 ; 6,5. La media aritmética es:
5,6 + 6,8 + 4,2 + 5,7 + 6,5 28,8
𝑋̅ = = = 5,76
5 5
RESPUESTA: Debido a que trabajamos notas, solo debemos trabajar con 1 decimal, la media
aritmética es 5,8
Resuelve 1. Calcula la media aritmética de cada uno de los grupos presentados, recuerda
tener en cuenta la pertinencia del número obtenido como resultado.
1. Un grupo comenta la cantidad de hermanos que tienen: [2, 3, 2, 5, 2, 3, 4, 4]
2. En un grupo familiar, comentan sus edades: [20, 25, 30, 13, 15, 25, 40, 27, 25]
3. Se habla de los kilos de arroz que se consumen en casa al mes [1, 4, 5, 6, 7, 8, 9, 2, 4, 2, 10, 1, 4]
Ejemplo 1.
Si la cantidad de datos es par, existen dos datos centrales, por tanto debes hallar el valor medio
entre ambos.
Se presentan los siguientes datos: [2, 5, 2, 3, 4, 4]
Se ordenan de menor a mayor [2, 2, 3, 5, 4, 4] y se identifican los valores centrales [2, 2, 3, 5, 4, 4]
3+5
𝑀𝑒 = =4
2
Ejemplo 2.
Si la cantidad de datos es impar, existirá solo un dato central, siendo aquel la mediana.
Se presentan los siguientes datos: [1, 7, 5, 7, 8, 3, 4]
Se ordenan de menor a mayor [1, 3, 4, 5, 7, 7, 8] y se identifica el valor central [1, 3, 4, 5, 7, 7, 8]
𝑀𝑒 = 5
3. [1, 4, 5, 6, 7, 8, 9, 2, 4, 2, 10, 1, 4] 4. [20, 25, 30, 13, 15, 25, 40, 27, 25]
Ejemplo 1.
Se presentan los siguientes datos [1, 3, 4, 5, 5, 7, 7, 8]
Se identifican aquellos valores con mayor frecuencia, [5, 5] y [7, 7]
Ya que 5 y 7 se repiten (en la misma cantidad) ambos son moda de los datos presentados.
𝑀𝑜 = 5 𝑦 7
3. [1, 4, 5, 6, 7, 8, 9, 2, 4, 2, 10, 1, 4] 4. [20, 25, 30, 13, 15, 25, 40, 27, 25]
2
Lección II. Medidas de dispersión
Las medidas de dispersión indican cuan cercanos o alejados están los datos de un valor central, por lo general la
media aritmética. Muestran el grado de variabilidad de los datos (cuan confiable son). Por lo general las medidas
de dispersión se trabajan de forma contextualizada, en problemas matemáticos comparando dos grupos de datos.
Ejemplo 1.
A continuación se presentan las notas de dos grupos de personas, calculamos sus medidas de
dispersión para compararlos.
Las notas son 6,4 5,8 6,8 6,2 6,5
1. Primero debemos calcular el promedio de los datos, 𝑥̅ = 6,34 como es una nota, trabajamos con
6,4
2. Luego calculamos el rango. Al dato máximo (6,8) debemos restarle el dato mínimo (5,8)
𝑅 = 6,8 − 5,8 = 1,0
3. Para hallar el resto de los datos, trabajaremos en una tabla.
Notas Grupo |𝒙𝒊 − ̅
𝒙| ̅ )𝟐
(𝒙𝒊 − 𝒙
A valor absoluto, de la diferencia entre el dato y el
Se calcula el cuadrado de la diferencia anterior
promedio.
6,4 |6,4 − 6,4| = 0 02 = 0
5,8 |5,8 − 6,4| = 0,6 0,62 = 0,36
6,8 |6,8 − 6,4| = 0,4 0,42 = 0,16
6,2 |6,2 − 6,4| = 0,2 0,22 = 0,04
6,5 |6,5 − 6,4| = 0,1 0,12 = 0,01
4. Para hallar la desviación media debemos sumar los valores de la primera columna y dividirlo
en la cantidad de datos (5)
0 + 0,6 + 0,4 + 0,2 + 0,1 1,3
𝐷𝑥̅ = = = 0,26
5 5
5. Para hallar la varianza debemos sumar los valores de la segunda columna y dividirlo en la
cantidad de datos (5)
0 + 0,36 + 0,16 + 0,04 + 0,01 0,57
𝜎2 = = = 11,4
5 5
6. Para hallar la desviación estándar debemos calcular la raíz de la varianza
𝜎 = √11,4 = 3,376388 …
Para trabajar de una forma acotada, trabajaremos con 2 decimales, (redondear si es
necesario), por lo tanto la desviación estándar es: 3,38
7. Por último, para el coeficiente de variación debemos dividir la desviación estándar por el
promedio.
3,38
𝐶𝑉 = = 0,528125 ≈ 0,53
6,4
RESPUESTA: al obtener una deviación estándar de 3,38 eso nos indica cuan disperso están
las notas del promedio. Comprender que mientras más bajo la desviación estándar es aún
más confiable será el promedio como indicador estadístico.
3
Resuelve 5. A continuación se presentan 2 grupos de datos, calcula sus medidas de
tendencia central e indica “cual es más confiable”
Roberto es entrenador de 2 ciclistas, y te presenta los tiempos (en minutos) de los entrenamientos que
demoran en recorrer la misma pista.
Ciclista 1: 12, 9, 8, 9, 10, 11, 9, 7
Ciclista 2: 11, 8, 7, 10, 10, 10, 8, 10
CICLISTA 1
Tiempos
(en minutos) |𝒙𝒊 − 𝒙
̅| ̅ )𝟐
(𝒙𝒊 − 𝒙
12
9
8
9
10
11
9
7
∑=
CICLISTA 2
Tiempos
(en minutos) |𝒙𝒊 − 𝒙
̅| ̅ )𝟐
(𝒙𝒊 − 𝒙
11
8
7
10
10
10
8
10
∑=
2. Según tus cálculos, ¿A que ciclista escogerías para una futura carrera, por qué?
4
Lección III. Datos agrupados
Entendemos que a medida que la cantidad de datos recogidos para realizar un estudio estadístico se mayor, será
más difícil realizar los cálculos. Sacar el promedio de 5 notas será sencillo en comparación si calculamos las notas
de 500 personas. Para ello existe la agrupación de datos, y con ello, nuevas formas de calcular la media, mediana
y moda para una gran cantidad de datos.
Se estudiarán dos tipos de tablas:
Ejemplo 1.
Tabla por frecuencia: Es una gran cantidad de datos, pero las respuestas son limitadas.
CANTIDAD DE
FRECUENCIA
HERMANOS
0 6
1 5
2 7
TOTAL 18
De la tabla se entiende: 18 personas respondieron la encuesta, 6 personas tienen 0 hermanos, 5
tienen solo 1 y 7 personas tienen 2.
Ejemplo 2.
Tabla por intervalos: Es una gran cantidad de datos, y existe un abanico muy amplio de
respuestas.
5
Lección IV. Medidas de tendencia central datos agrupados
Como ya se mencionó para lograr calcular la media mediana y moda al trabajar con tablas, debemos trabajar de
una forma distinta, para ello se presentarán las siguientes formulas.
FORMULARIO ( II )
∑ 𝑥 ∙ 𝑓𝑖
Media: Corresponde a la suma de: la multiplicación de 𝑥̅ =
cada dato (o marca de clase, en tablas de intervalo) 𝑛
por su frecuencia. Dividido en el total de datos. 𝑥: 𝑑𝑎𝑡𝑜 𝑜 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒
𝑓𝑖 : 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝑠𝑢𝑏𝑔𝑟𝑢𝑝𝑜
𝑛: 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
𝑛
− 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖 + 2
Mediana: Recordar que la mediana se encuentra en la
mitad de los datos, por ello, debemos ubicar la mitad ∙𝐴
de los datos e indicar en que subgrupo se encuentra. 𝑓𝑖
Luego se utiliza la fórmula para clarificar e indicar el 𝐿𝑖 : 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒𝑙 𝑠𝑢𝑏𝑔𝑟𝑢𝑝𝑜
𝑓𝑖 : 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝑠𝑢𝑏𝑔𝑟𝑢𝑝𝑜
valor exacto del valor.
𝐹𝑖−1 : 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑑𝑒𝑙 𝑠𝑢𝑏𝑔𝑟𝑢𝑝𝑜 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟
𝐴: 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑠𝑢𝑔𝑓𝑟𝑢𝑝𝑜
𝑓𝑖 − 𝐹𝑖−1
Moda: Recordar que la moda es aquel valor que mas se 𝑀𝑜 = 𝐿𝑖 + ∙𝐴
repite, por ello debemos trabajar con aquel subgrupo (𝑓𝑖 − 𝐹𝑖−1 ) + (𝑓𝑖 − 𝐹𝑖+1 )
que tenga mayor frecuencia. 𝐹𝑖−1 : 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑑𝑒𝑙 𝑠𝑢𝑏𝑔𝑟𝑢𝑝𝑜 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟
𝐹𝑖+1 : 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑑𝑒𝑙 𝑠𝑢𝑏𝑔𝑟𝑢𝑝𝑜 𝑝𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟
Resuelve 7. A continuación se presentará una tabla extendida, la cual debes llenar con los
datos solicitados, de ese modo podremos calcular la media, mediana y moda.
Masa corporal de un grupo curso
Masa corporal (Kg) x Frecuencia (f) Frecuencia acumulada (F)
Media de
Cantidad de datos clasificado en cada
Datos en grupos cada Acumular la frecuencia de cada subgrupo
subgrupo
grupo
[40, 50[ 9
[50, 60[ 11
[60, 70[ 19
[70, 80[ 23
[80, 90[ 17
[90, 100] 11
Media:
∑ 𝒙 ∙ 𝒇𝒊
̅=
𝒙
𝒏
𝒙: 𝒅𝒂𝒕𝒐 𝒐 𝒎𝒂𝒓𝒄𝒂 𝒅𝒆 𝒄𝒍𝒂𝒔𝒆
𝒇𝒊 : 𝒇𝒓𝒆𝒄𝒖𝒆𝒏𝒄𝒊𝒂 𝒅𝒆𝒍 𝒔𝒖𝒃𝒈𝒓𝒖𝒑𝒐
𝒏: 𝒕𝒐𝒕𝒂𝒍 𝒅𝒆 𝒅𝒂𝒕𝒐𝒔
Mediana:
𝑛
− 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖 + 2 ∙𝐴
𝑓𝑖
𝐿𝑖 : 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒𝑙 𝑠𝑢𝑏𝑔𝑟𝑢𝑝𝑜
𝑓𝑖 : 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝑠𝑢𝑏𝑔𝑟𝑢𝑝𝑜
𝐹𝑖−1 : 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑑𝑒𝑙 𝑠𝑢𝑏𝑔𝑟𝑢𝑝𝑜 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟
𝐴: 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑠𝑢𝑔𝑓𝑟𝑢𝑝𝑜
Moda:
𝑓𝑖 − 𝐹𝑖−1
𝑀𝑜 = 𝐿𝑖 + ∙𝐴
(𝑓𝑖 − 𝐹𝑖−1 ) + (𝑓𝑖 − 𝐹𝑖+1 )
𝐹𝑖−1 : 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑑𝑒𝑙 𝑠𝑢𝑏𝑔𝑟𝑢𝑝𝑜 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟
𝐹𝑖+1 : 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑑𝑒𝑙 𝑠𝑢𝑏𝑔𝑟𝑢𝑝𝑜 𝑝𝑜𝑠𝑡𝑒𝑟𝑖𝑜𝑟
6
Lección V. Medidas de dispersión datos agrupados
FORMULARIO ( I )
Rango: corresponde a la diferencia entre el mayor y el menor de los
datos de la distribución. 𝑅 = 𝑥𝑚á𝑥 − 𝑥𝑚í𝑛
Desviación media: corresponde a la media aritmética de los valores
absolutos de las desviaciones. En esta instancia se debe trabajar
∑|𝑚𝑐𝑖 − 𝑥̅ |
𝐷𝑥̅ =
con la marca de clase. 𝑛
Varianza: corresponde a la media aritmética de los cuadrados de las
desviaciones de los n datos. Se expresa en unidades cuadradas. 2
∑(𝑚𝑐𝑖 − 𝑥̅ )2
𝜎 =
𝑛
Desviación estándar: se obtiene extrayendo la raíz cuadrada de la
varianza. Se expresa en la misma unidad que la variable, por lo que
nos puede dar una idea más cercana de los dispersos que el conjunto.
𝜎 = √𝜎 2
Coeficiente de variación: permite realizar comparaciones entre 𝜎
conjuntos con respecto a la dispersión de sus datos, e incluso entre 𝐶𝑉 =
variables que se miden con diferentes unidades de medida. |𝑥̅ |
Cantidad de Frecuencia
medicamentos
[0, 200[ 12
[200, 400[ 15
[400, 600[ 20
[600, 800[ 45 Es necesario tener una desviación
[800, 1000] 21 estándar menor a 200, de lo
contrario tendremos problemas en
la organización y logística
[0, 200[ 12
[200, 400[ 15
[400, 600[ 20
[600, 800[ 45
[800, 1000] 21
∑= ∑= ∑=
7
EJERCICIOS
Resuelve 9. Resuelve cada uno de los ejercicios presentados.
1. Medidas de Tendencia Central
Tobías juega fútbol en uno de los equipos de su comuna. Los puntos obtenidos por los
equipos en el campeonato de apertura de la comuna han sido los siguientes:
12, 10, 22, 18, 7, 14, 15, 17, 18, 20, 21, 20, 10, 10, 11, 15
Determina:
a. El promedio de los puntos.
2. Medidas de Dispersión
En el colegio de Antonia la premiación anual será la segunda semana de diciembre, los
profesores junto a la UTP del colegio deben escoger al alumno de excelencia académica,
los postulantes son, Marco, Antonia y María José cuyas notas se muestran en la siguiente
tabla:
Determina:
a. El promedio de cada alumno.