ESTADISTICA
ESTADISTICA
ESTADISTICA
Permite conocer las características de una población y así poder tomar las
decisiones más acertadas para resolver los problemas presentes en ésta.
Muestra
Es una parte de la población o universo.
Cuando el estudio que se realiza es sobre toda la población se llama censo, si sólo
se toma una muestra, el estudio se llama muestreo.
Una muestra es considerada representativa de la población cuando ésta fue extraída
al azar. Por lo tanto, se pueden considerar válidas todas las conclusiones a las cuales
se ha llegado mediante el análisis de la misma.
1
Variables estadísticas
Son cuantitativas cuando las características se expresan mediante números. Ejemplo: peso,
número de hermanos, edades de alumnos de un curso, etc.
La variable continúa
La variable discreta
Ejemplo:
EJERCICIOS DE FIJACIÓN
1) Conceptualizo
a) Estadística: __________________________________________________________________
2
b. Profesión que te gusta._______________________________________________________
c. Goles marcados por tu equipo en la última temporada.________________________
d. Número de alumnos de tu Colegio.____________________________________________
e. El color de los ojos de tus compañeros de clase. ______________________________
f. Número de hijos de una familia_______________________________________________
g. Salario de una persona_______________________________________________________
Técnicas de Muestreo
La muestra debe seleccionarse de tal manera que sea representativa de la
población. Hay varias formas para elegir una muestra. Estas formas son las
técnicas del muestreo.
Con esta técnica se escogen al azar algunos elementos de la población, teniendo toda la
misma posibilidad de ser seleccionados para la muestra. Para determinar la muestra a
3
través de esta técnica, se asigna a cada elemento de la población un número y luego se
realiza un sorteo hasta completar la cantidad deseada.
Ejemplo:
𝑁
Es el intervalo de selección
𝑛
Ejemplo:
Una empresa tiene 500 facturas numeradas del 1 al 500 que deben pasar por el
proceso de auditoría, sobre la base de muestras. Se desea tomar 50 muestras.
500: 50 = 10 es el intervalo de selección
Se sortea el primer elemento de la muestra de entre los 10 primeros.
Por ejemplo, el número sorteado es 7.
Los demás se obtendrán por el intervalo de selección 10.
7, 17, 21, 28, etc.
c) Muestreo estratificado
Ejemplo:
4
Mujeres 18 18 .100
: 40%
45
Total 45
Ejemplo:
Muestreo no probabilístico
Es un procedimiento mediante el cual la selección de la muestra queda librada al criterio
del seleccionador.
Ejercicios de Fijación
Resuelve los siguientes problemas
1) En una población formada por 100 elementos y queremos extraer una muestra de 25
elementos. Utiliza el muestreo sistemático.
2) En una fábrica que consta de 600 trabajadores queremos tomar una muestra de 20.
Sabemos que hay 200 trabajadores en la sección A, 150 en la B, 150 en la C y 100 en la D.
5
c. Si los elementos de una población se escogen a intervalos uniformes, a partir
de una lista ordenada de muestreo aleatorio es sistemático
d. Cuando los elementos de una población se clasifican en subgrupos o
estratos, el muestreo no es estratificados
* Una emisora radial ha realizado una encuesta sobre un nuevo programa. En la tabla
de abajo se ilustra el puntaje entre 1 y 5 que un grupo de 100 oyentes asignó al mismo.
Puntajes N° de personas
1 15
2 10
3 5
4 40
5 30
Total 100
6
* Una concesionaria de automóviles tiene registrados a 2550 clientes y realizó una
encuesta sobre la preferencia de compra con relación al color (rojo, blanco y azul) y en
relación con el número de puertas (dos o cuatro). Fueron encuestados 200 clientes.
Contesto:
*En una Institución de 500 alumnos se ha realizado una investigación sobre el número
de horas semanales que cada estudiante práctica algún deporte, encuestado a 50
estudiantes elegidos al azar. El resultado se registra en la tabla siguiente:
Se desea hacer un estudio referente a si los niños de una escuela poseen las vacunas
recomendadas. Se decidió estratificar la población por nivel escolar (1°, 2° y 3° ciclos),
seleccionando alumnos de manera aleatoria de cada estrato. Este método se llama muestreo
estratificado proporcional. ( )
Un procedimiento para asegurarse de que todos los individuos de una población tengan la
misma oportunidad de ser elegidos para la muestra se llama muestreo aleatorio simple. ( )
Todos los miembros de una asociación de 200 asociados tienen un número de ficha que va
del 001 al 200. Se desea conocer las preferencias políticas de los miembros. Se entrevistó a
uno de cada diez, comenzando por el 006, 016, 026, 036. Este método se llama muestreo
estratificado proporcional. ( )
Muestreo - Censo
*En el colegio se desea realizar una actividad por el día de la primavera y se pregunta a un
grupo de estudiantes qué preferirían hacer. Es:
*Se investiga la formación académica de todos los padres de los alumnos del curso. Es:
7
*Se determina la clasificación por edades de los alumnos de un curso. Es:
*En una empresa desean controlar mil facturas archivadas por fecha de operación. Para ello
toman todas las facturas terminadas en cincuenta. Es:
Para investigar el grupo sanguíneo más común entre mis parientes más cercanos he
confeccionado la siguiente lista de mis primos.
8
b. Luego extraigo una muestra de tamaño 10 por el método de muestreo sistemático.
*Se desea estudiar el número promedio de caries en niños de 10 años de una escuela. Como
se supone que esta variable depende del nivel socioeconómico de los niños. Utilizo el método
de muestreo estratificado proporcional para extraer una muestra de tamaño 60. Para ello tengo
en cuenta los datos preliminares recogidos en la tabla siguiente:
Elevado 5
Medio 40
Bajo 55
*La siguiente tabla ilustra la cantidad de habitantes por barrios de la comunidad “Lapacho”
Barrios
% 50 24 26 100
Elijo una muestra de 500 personas de esa comunidad utilizando el muestreo estratificado
proporcional y completo el cuadro:
Barrios
N° de habitantes
seleccionados
500
9
*En una fábrica trabajan 1000 hombres y 500 mujeres. El gerente desea entrevistar a 120
obreros ¿Cuántos hombres y cuántas mujeres debe entrevistar?
MEDICIÓN
Escala de medida
A las diferentes formas de clasificar los datos según las características de los
mismos se denomina escala de medida o niveles de medición.
Variable aleatoria
Se denomina variable aleatoria o variable de probabilidad a aquella que puede
asumir determinados valores de un conjunto dado con unas probabilidades dadas.
Es una función que asigna un valor numérico a cada resultado del espacio muestral.
Generalmente las variables aleatorias las representamos con las letras x, y, z.
Ejemplo:
- Sea x la variable aleatoria que se obtiene al lanzar un dado al aire
Clases de escalas
10
Escalas nominales
La clasificación es considerada la operación más sencilla y básica en toda
ciencia. Al clasificar agrupamos los elementos en categorías o clases teniendo en
cuenta ciertas características. En la escala nominal, las categorías no expresan orden
o jerarquía. Tampoco se pueden hacer operaciones aritméticas entre los elementos
que la componen.
Ejemplo:
- Género de las y los alumnos:
1. Niña.
2. Varón.
Ejemplo:
- Rango militar.
Escalas de intervalos
Existen orden y jerarquía entre las categorías, además se pueden establecer
intervalos iguales en la medición. El cero en esta medición es arbitrario, es decir, no
existe un punto de partida.
Ejemplo:
- La temperatura del día.
Ejemplo:
- Número de hijos.
- Antigüedad en el trabajo.
Ejercicios de Fijación
1) Define las siguientes palabras:
Medición:………………………………………………………………………………………………………
……………………………………………………………………………………………………………………
…………
Escala de Medida:…………………………………………………………………………………………….
……………………………………………………………………………………………………………………
……
11
c. El peso de de los desechos de los hogares (…………………………………)
d. La clasificación en una competencia de fútbol entre los alumnos de los cursos 2º y 3º
(…………………………………)
Una vez que se hayan obtenido los datos, surge la necesidad de organizarlos y
clasificarlos para una mejor interpretación.
Una distribución de frecuencias o simplemente tabla de frecuencias es una
ordenación de los datos en clases o categorías con las frecuencias correspondientes
a cada una.
Datos agrupados
Cuando se tiene una gran cantidad de datos es conveniente agruparlos en intervalos
para facilitar la interpretación.
Datos no agrupados
Cuando el número de datos no es muy elevado, éstos no necesitan agruparse en
intervalos.
FRECUENCIAS
Frecuencia absoluta (fa): es el número de veces que se repite un dato en una muestra. En
nuestra tabla, por ejemplo, se observa que 4 alumnos están aplazados, es decir obtuvieron
la calificación 1.
12
Frecuencia relativa (fr): es el cociente o razón entre la frecuencia absoluta de cada
dato y el número total de datos. Representa la parte del total que corresponde a cada dato,
siendo la suma total igual a la unidad.
Frecuencia porcentual (fp): indica qué porcentaje del total corresponde a cada dato.
Se obtiene multiplicando por 100 la frecuencia relativa. La suma de las frecuencias
porcentuales es igual a 100. En nuestro ejemplo, podemos decir que 16 % obtuvieron 1.
Ejemplo:
En un curso de 25 alumnos, 4 alumnos obtuvieron 1 en Matemática, 6 alumnos
obtuvieron 2, 7 alumnos obtuvieron 3, 5 alumnos obtuvieron 4 y 3 alumnos
obtuvieron 5. Para poder estudiar mejor los datos, se disponen los mismos en una
tabla de distribución de frecuencias.
Notas Frecuencia Frecuencia Frecuencia Frecuencia
Absoluta Relativa Porcentual Acumulada
fab fr fp fac
1 4 0,16 16 4
2 6 0,24 24 10
3 7 0,28 28 17
4 5 0,20 20 22
5 3 0,12 12 25
TOTALES 25 1 100
Ejercicios de Fijación
1 Conceptualizo
TOTALES
13
Frecuencias: absoluta, relativa, porcentual y acumulada para datos agrupados
Si el número de datos es muy elevado, es conveniente distribuirlos en clases o
categorías para así determinar cuáles corresponden a cada clase.
Para facilitar la construcción de la tabla es necesario ordenar los datos en forma
creciente o decreciente.
Rango o recorrido
Es la diferencia entre el dato mayor y el dato menor.
Intervalo de clase
Se denomina así a cada clase, categoría o intervalo en que se divide el conjunto
de datos.
Límites de clase
Constituyen los números que son extremos de cada intervalo de clase. Cada
intervalo de clase tiene dos límites: el límite inferior de clase (LI) y el límite
superior de clase (LS).
Para asegurarse que todos los datos queden incluidos dentro del intervalo, si el
valor de la amplitud es un número fraccionario, se aproxima al entero superior.
Para construir una tabla de distribución de frecuencias se deben considerar los
siguientes pasos
1. Se ordena los datos, pudiendo utilizarse para ello una hoja de recuento.
2. Se calcula el rango.
3. Se determina la amplitud de clase.
4. Se determina los límites inferiores y superiores de las clases.
5. Se determina la frecuencia correspondiente a cada clase.
6. Se calcula las marcas de clase.
Ejemplo:
14
33 24 11 29 18 37 26 31 25 18
b) Se determina el rango.
R= Ls – Li R = 49 – 11 = 38
c) Se selecciona la amplitud del intervalo. Antes se debe decidir el número de intervalos que
se desea. Por ejemplo: se trabajará con 6 clases.
38
𝑖 = 6 = 6,3 i = 7
d) Se construye la tabla de frecuencias: absoluta, relativa, porcentual, acumulada,
incluyendo además marca de clase y límites reales.
Ejercicios de Fijación
b) Construyo una distribución de frecuencia con los datos de los puntajes correspondientes
de una prueba de matemática en la facultad. Con tamaño de clase de 10
47 49 52 54 46 52 36 33 54 45 53 49 50 58
55 35 52 60 39 47 35 53 51 49 58 32 50 54
55 45 53 44 51 49 38 57 46 52 45 38
TOTALES
15
GRÁFICOS ESTADÍSTICOS
Las representaciones gráficas son importantes porque a través de ellas se puede visualizar
con mayor facilidad el comportamiento de una variable estadística.
Actualmente son muy utilizados por los medios de comunicación porque atraen la atención
del observador o lector.
Existen varios tipos de gráficos, aquí se trabajará con los histogramas, polígono de
frecuencias y ojivas.
Histogramas
Ejemplo:
Teniendo en cuenta el ejemplo anterior, referente a los puntajes obtenidos en una prueba
de Estadística, elaboro un histograma.
Polígono de frecuencias
16
Grafico Circular
Puntaje % Medida de
angulo
11 – 17 15 54º
18 – 24 10 36º
25 – 31 37 133º
32 – 38 32 115º
39 – 45 3 11º
46 – 52 3 11º
Totales 100 360º
Ejercicios de Fijación
a) Ordena.
b) Elabora una tabla de frecuencias en las que se incluyan: frecuencia absoluta, absoluta
acumulada, relativa y acumulada.
c) Dibuja un diagrama de barras con frecuencias absolutas acumuladas y un polígono de
frecuencias absolutas.
d) ¿Qué porcentaje de alumnos son hijos únicos?
e) ¿Cuántos alumnos tienen más de un hermano?
17
HISTOGRAMA
Un histograma es una representación gráfica de una variable en forma de barras.
Se utilizan para variables continuas o para variables discretas, con un gran número de
datos, y que se han agrupado en clases.
En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del
intervalo, y por altura, la frecuencia absoluta de cada intervalo.
La superficie de cada barra es proporcional a la frecuencia de
los valores representados.
POLÍGONO DE FRECUENCIA
Para construir el polígono de frecuencia se toma la marca de clase que coincide con
el punto medio de cada rectángulo.
Ejercicios de Fijación
1) Las puntuaciones obtenidas por un grupo en una prueba han sido:
15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13.
Construir la tabla de distribución de frecuencias y dibuja el histograma
y polígono de frecuencias.
MEDIDAS DE CENTRALIZACIÓN
Son valores numéricos que nos informan del nivel general medio de los datos que se
están ordenando o procesando.
Son tres las medidas de tendencia central:
Media
Mediana
Moda
1- Media aritmética: Es el promedio o resultado de la suma de todos los datos dividido
por la cantidad total de datos. Su valor es representativo de la muestra o población.
(𝑋̅ )
2- Mediana: (Me): Es el valor central de un conjunto ordenado de datos. Es un valor tal
que la mitad de los datos son menores o iguales a él, para ello ordenamos
previamente los mismos en forma creciente:
Cuando la cantidad de datos es impar: elegimos el valor del medio.
Cuando la cantidad de datos es par: la mediana es el promedio de los datos que
ocupan las posiciones centrales, dividido por 2.
3 – Moda: Es el valor que se presenta con mayor frecuencia. En una distribución de
frecuencias pueden existir dos o más modas y pueden no existir si todos los datos tienen
la misma frecuencia. (Mo).
18
MEDIDAS DE TENDENCIA CENTRAL CON DATOS NO AGRUPADOS:
Ejemplos:
* La cantidad de leche consumida por 10 familias en un mes (en litros) es:
15 20 35 30 18 32 16 18 25 20
Utilizo los datos de la muestra para calcular:
a. La Media b. La Mediana c. La Moda
Símbolos:
∑ = Sumatoria o sigma
𝑓𝑖 = frecuencia
19
EJEMPLO:
N° de Calce fi xi xi. fi fac
30 – 32 6 31 186 6
33 – 35 10 34 340 16
36 – 38 17 37 629 33
39 - 41 5 40 200 38
42 - 44 2 43 86 40
N = 40 1.441
Determino: Media, Mediana y Mo.
Datos: ∑ 𝑥𝑖 . 𝑓𝑖
N/2= 20 𝑋̅ =
Li= 36 𝑁
𝑓𝑎𝑎 =16
𝑓𝑀𝑒 = 17 𝑁
−𝑓𝑎𝑎
𝑓𝑠𝑖𝑔 = 38 2
𝑀𝑒 = 𝐿𝑖 + ( ).i
i= 3 𝑓𝑀𝑒
𝑓𝑠𝑖𝑔
𝑀𝑜 = 𝐿𝑖 + ( ) .𝑖
𝑓𝑎𝑛𝑡 + 𝑓𝑠𝑖𝑔
1441
𝑋̅ = = = 36
40
20−16 4
𝑀𝑒 = 36 + ( ) . 3 = 36 + ( ) . 3= 36 + 0,7= 36,7 ≅ 37
17 17
Ejercicios de Fijación
1) Determino: Media, Mediana y Mo. Represento gráficamente las tres medidas halladas
Pesos en Kgs. fi xi xi. fi fac
59 - 63 3
64 - 68 5
69 - 73 9
74 - 78 12
79 - 83 5
84 - 88 4
89 - 93 2
N=
Hallo la media, mediana y moda. Las calificaciones obtenidas por María en la segunda etapa del
año escolar: 3,5,1,2,4,4,3,5,5,1,2,2,3,4. Grafica utilizando el grafico circular
20
MEDIDAS DE POSICIÓN
Si los valores ordenados de una variable deben ser divididos en grupos de igual tamaño, se
utilizan los cuartiles.
Los cuantiles más utilizados son los cuartiles, deciles y percentiles.
*Cuartiles: Son valores que dividen los datos ordenados en forma creciente en cuatro partes
de igual tamaño. Se tienen tres cuartiles, ya que el cuarto corresponde al 100%.
El primer cuartil (Q1), es el valor tal que el 25% de las observaciones son menores y 75 % de los
datos son mayores.
El segundo cuartil (Q2), corresponde a la mediana, 50% de las observaciones son menores y 50%
son mayores.
El tercer cuartil (Q3), es el valor por tal que el 75% de los observaciones son menores y 25% de
los datos son mayores.
Fórmula:
𝑘 .𝑛
( 4 )−𝑓𝑎𝑎
𝑄𝑘 = 𝐿𝑖 + .𝑖 Donde:
𝑓𝑄𝑘
K : número del cuartil (primero, segundo, tercero).
Li : límite real inferior de la clase donde se encuentra el cuartil.
faa : frecuencia acumulada anterior a la frecuencia acumulada del intervalo donde se
encuentra el cuartil K.
fQk: frecuencia absoluta del intervalo donde se encuentra.
i : amplitud del intervalo.
N : número de datos.
Deciles: Son valores que dividen los datos ordenados en forma creciente en diez partes
iguales. Se tienen 9 deciles, ya que el décimo corresponde al 100%.
Fórmula
𝑘 .𝑛
( 10 )−𝑓𝑎𝑎
𝐷𝑘 = 𝐿𝑖 +
𝑓𝑄𝑘
* Percentiles: Son valores que dividen los datos ordenados en forma creciente en cien partes
iguales.
Fórmula:
𝑘 .𝑛
(100)−𝑓𝑎𝑎
𝑃𝑘 = 𝐿𝑖 + .𝑖
𝑓𝑄𝑘
Ejemplo:
La siguiente tabla registra los puntajes obtenidos en una prueba de Estadística.
21
Puntajes Marca de xi Frecuencia absoluta Frecuencia acumulada
X Clase Fa fac
11 – 17 14 6 6
18 – 24 21 4 10
25 – 31 28 15 25
32 – 38 35 13 38
39 – 45 42 1 39
46 – 52 49 1 40
Totales 40
Desarrollo:
a) Cálculo de Q2
𝑘 .𝑛
Datos: ( )−𝑓𝑎𝑎
4
N=40
𝑄𝑘 = 𝐿𝑖 + .𝑖
𝑓𝑄𝑘
k= 2
𝑘 . 𝑛 2.40 20−10
= = 20 𝑄2 = 25 + .5 = 25 + 3,3 = 28,3
15
4 4
x Fa Fac
25 – 31 15 25
b) Cálculo de D7
𝑘 .𝑛
Datos: ( )−𝑓𝑎𝑎
10
N=40
𝐷𝑘 = 𝐿𝑖 + .𝑖
𝑓𝑄𝑘
k= 7
𝑘 . 𝑛 7.40 28−25
= = 28 𝐷7 = 32 + .5 = 32 + 1,15 = 33,15
13
10 10
x Fa Fac
32 – 38 13 38
c) Cálculo de P75
Datos: 𝑘 .𝑛
N=40 ( )−𝑓𝑎𝑎 30−25
100
k= 75
𝑃𝑘 = 𝐿𝑖 + .𝑖 𝑃75 = 32 + .5 = 32 + 1,9 = 33,9
𝑓𝑄𝑘 13
𝑘 . 𝑛 75.40
= = 30 x Fa Fac
100 100
32 – 38 13 38
El 75% obtuvieron 33,9 puntos en la prueba de Estadística.
22
Ejercicio de Fijación
Se ha tomado una muestra de 231 personas que entre 20 y 50 años ha culminado sus estudios
primarios en Paraguay y se presenta la siguiente distribución por edades. Calculo Cuartil
segundo, decil tercero y percentil 37.
X Fa fac
20 – 25 41 41
25 – 30 123 164
30 – 35 44 208
35 – 40 13 221
40 – 45 7 228
45 – 50 3 231
231
23