Nothing Special   »   [go: up one dir, main page]

ESTADISTICA

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 23

INTRODUCCIÓN

A diario se escuchan frases como:


- “El promedio de calificaciones de los alumnos del 2° curso es 3 (tres)”.
- “Las estadísticas muestran que el desempleo ha ido incrementándose en los
últimos años”.
- “El porcentaje de suicidios en adolescentes es preocupante”.
Las frases mencionadas anteriormente son ejemplos de situaciones donde la
Estadística se encuentra presente. La Estadística se ocupa de recolectar datos
numéricos referentes a hechos, para poder establecer comparaciones y realizar
predicciones que puedan ser de utilidad para la solución de problemas que se
presentan en diversos ámbitos.
La Estadística se ha convertido en una ciencia imprescindible con numerosas
aplicaciones en Educación, Medicina, Industria, Ciencias Sociales, Ciencias Básicas,
etc.

La Estadística es la parte de la Matemática que se encarga de recolectar, clasificar,


ordenar, analizar e interpretar datos.

Algunas razones por las que se debe estudiar la Estadística son:

 Constituye una forma de comunicación entre el mundo de la ciencia y la


tecnología. Numerosos estudios e investigaciones especializadas contienen
resultados basados en el análisis estadístico.

 Ofrece un conjunto de técnicas y procedimientos para el análisis cualitativo y


cuantitativo de los fenómenos y hechos que se presentan.

 Constituye la “tecnología del método científico”. Mediante la Estadística se


puede realizar una investigación rigurosa.

 Como toda información, permite la resolución de problemas.

 Permite conocer las características de una población y así poder tomar las
decisiones más acertadas para resolver los problemas presentes en ésta.

Población estadística o universo


Es el conjunto formado por las personas, animales, plantas o cosas de los cuales se
quiere estudiar alguna propiedad o característica.

La población puede ser:


 Finita: cuando se puede determinar el número de elementos que posee.
 Infinita: cuando no es posible determinar la cantidad de elementos que posee.

Muestra
Es una parte de la población o universo.
Cuando el estudio que se realiza es sobre toda la población se llama censo, si sólo
se toma una muestra, el estudio se llama muestreo.
Una muestra es considerada representativa de la población cuando ésta fue extraída
al azar. Por lo tanto, se pueden considerar válidas todas las conclusiones a las cuales
se ha llegado mediante el análisis de la misma.

Individuo: se denomina individuo a cada elemento de la población en estudio.

1
Variables estadísticas

Son el conjunto de características de los elementos de la población en estudio. Estas


variables pueden ser cualitativas o cuantitativas.

Son cualitativas cuando las características no se expresan mediante números.


Ejemplo: color de ojos, libros preferidos, etc.

Son cuantitativas cuando las características se expresan mediante números. Ejemplo: peso,
número de hermanos, edades de alumnos de un curso, etc.

Las variables cuantitativas se clasifican en continuas y discretas

La variable continúa

Es aquella que teóricamente puede tomar cualquier valor dentro de un intervalo


dado. Generalmente se obtienen por medición. Ejemplo: la estatura de alumnos, el
tiempo empleado en hacer una extracción de un cajero.

La variable discreta

Se expresa con números enteros y generalmente se obtienen por conteo. Ejemplo:


número de hijos, cantidad de personas que ingresan a un negocio.

Ejemplo:

A una consultora le encargan hacer un estudio sobre la intención de voto de los


ciudadanos de Asunción en las elecciones presidenciales. La consultora toma un
grupo de 800 personas en edad de votar y sobre él analiza la variable. De los 800
encuestados, 80 tienen intención de votar por el partido X.
 Población estadística: ciudadanos de Asunción en edad de votar.
 Muestra: 800 personas en edad de votar.
 Individuo: un ciudadano en edad de votar.
 Variable estadística: intención de votos (cualitativa).

EJERCICIOS DE FIJACIÓN

1) Conceptualizo

a) Estadística: __________________________________________________________________

2) Pareo según el tipo de subdivisión de la estadística al que corresponda

a. Volumen mensual de rentas de pares


de calzado. Estadística Descriptiva

b. Probabilidad: tubos producidos en


una fábrica.

c. Recopila, ordena, analiza e interpreta


Estadística Inferencial
datos numéricos.

3) Indica que variables son cualitativas y cuales cuantitativas:

a. Comida Favorita. ____________________________________________________________

2
b. Profesión que te gusta._______________________________________________________
c. Goles marcados por tu equipo en la última temporada.________________________
d. Número de alumnos de tu Colegio.____________________________________________
e. El color de los ojos de tus compañeros de clase. ______________________________
f. Número de hijos de una familia_______________________________________________
g. Salario de una persona_______________________________________________________

4) De las siguientes variables indica cuáles son discretas y cuales continúas.

a. Número de acciones vendidas cada día en la Bolsa._____________________________


b. Temperaturas registradas cada hora en un observatorio._______________________
c. Período de duración de un automóvil._________________________________________
d. El diámetro de las ruedas de varios coches.____________________________________
e. Número de hijos de 50 familias._______________________________________________
f. Censo anual de los españoles._________________________________________________
g. Velocidad de un automóvil___________________________________________________
h. Cantidad de alumnos del 1er Año de tu Colegio________________________________

5) Leo los siguientes enunciados e identifico la población, muestra y variable


estadística.

a– Para conocer la opinión de los usuarios de móviles diesel, sobre la suba de


combustibles. Se entrevistaron a 600 de ellos.
Población:……………………………………………………………………………………………
Muestra:………………………………………………………………………………………………
Variable estadística:……………………………………………………………………………….

b- Se ha realizado un estudio sobre las preferencias de las carreras universitarias de


los jóvenes de un colegio de 540 alumnos. Se entrevistaron a 47 estudiantes.
Población:……………………………………………………………………………………………
Muestra:………………………………………………………………………………………………
Variable estadística:……………………………………………………………………………….

Técnicas de Muestreo
La muestra debe seleccionarse de tal manera que sea representativa de la
población. Hay varias formas para elegir una muestra. Estas formas son las
técnicas del muestreo.

Importancia de trabajar con una muestra


A menudo se emplea el uso de la muestra por las siguientes razones:
Tiempo: es más fácil trabajar con una muestra si se dispone de poco tiempo.
Costo: por razones económicas, generalmente se hace casi imposible trabajar con
toda la población.
Imposibilidad física: en determinadas ocasiones existe la imposibilidad de trabajar
con toda la población. Por ejemplo, las aves de una determinada región.
Facilidad: se facilitan las operaciones.
Muestreo probabilístico o aleatorio: Es un procedimiento mediante el cual
todos los individuos de la población tienen la posibilidad de ser escogidos
para la muestra.
Procedimientos básicos para la obtención de muestras aleatorias

a) Muestreo aleatorio simple

Con esta técnica se escogen al azar algunos elementos de la población, teniendo toda la
misma posibilidad de ser seleccionados para la muestra. Para determinar la muestra a

3
través de esta técnica, se asigna a cada elemento de la población un número y luego se
realiza un sorteo hasta completar la cantidad deseada.

Ejemplo:

Se investiga la opinión de un curso respecto a la realización del proyecto de limpieza


del aula. No se quiere preguntar a cada estudiante del curso, pero sí asegurar que
la opinión recibida refleje el pensamiento del curso.

Se asigna a cada uno de los elementos de la población un número.


Se realiza un sorteo para obtener al azar la muestra.
b) Muestreo sistemático

En esta técnica previamente se observa si los elementos están ordenados de


alguna manera, luego se determina el intervalo de selección.

Para determinar el intervalo de selección, se halla la relación entre el número


total (N) de la población y el número (n) del tamaño de la muestra que se
quiere tomar.

𝑁
Es el intervalo de selección
𝑛

El primer elemento de la muestra se sortea de este intervalo de selección, los


demás se obtendrán a intervalos uniformes.

Ejemplo:

Una empresa tiene 500 facturas numeradas del 1 al 500 que deben pasar por el
proceso de auditoría, sobre la base de muestras. Se desea tomar 50 muestras.
500: 50 = 10 es el intervalo de selección
Se sortea el primer elemento de la muestra de entre los 10 primeros.
Por ejemplo, el número sorteado es 7.
Los demás se obtendrán por el intervalo de selección 10.
7, 17, 21, 28, etc.

c) Muestreo estratificado

Esta técnica se utiliza cuando los elementos de la población se dividen en subgrupos o


estratos. En estos subgrupos, la variable en estudio presenta comportamientos diferentes.
A continuación, de cada estrato se obtienen muestras aleatorias, ya sea por la técnica del
muestreo aleatorio simple o por el muestreo sistemático. Al final se suman todas las
muestras obtenidas de cada estrato.

Ejemplo:

En un curso de 45 alumnos, 27 son varones y 18 son mujeres. El profesor desea seleccionar


10 alumnos para representar al curso. ¿Cuántos varones y cuántas mujeres deben
seleccionar?
Estratos Cantidad Cálculo del porcentaje
Varones 27 27 .100
: 60%
45

4
Mujeres 18 18 .100
: 40%
45
Total 45

Cálculo de entrevistados por estratos:

60% de 10: 6 varones


40% de 10: 4 mujeres

d) Muestreo por conglomerado

Se tiene un conglomerado cuando los elementos de una población se dividen de manera


natural en subgrupos. En la técnica del muestreo por conglomerado, se eligen al azar los
subgrupos que forman la muestra.

Ejemplo:

En un barrio se desea estudiar el grado de aceptación que tiene un proyecto de arborización


de los parques. El barrio se divide en manzanas, las cuales constituyen los conglomerados.
Al azar se determinan las manzanas seleccionadas, encuestando luego a los habitantes de
las mismas.

Muestreo no probabilístico
Es un procedimiento mediante el cual la selección de la muestra queda librada al criterio
del seleccionador.

Ejercicios de Fijación
Resuelve los siguientes problemas
1) En una población formada por 100 elementos y queremos extraer una muestra de 25
elementos. Utiliza el muestreo sistemático.

2) En una fábrica que consta de 600 trabajadores queremos tomar una muestra de 20.
Sabemos que hay 200 trabajadores en la sección A, 150 en la B, 150 en la C y 100 en la D.

Marco con una x en la columna correspondiente de acuerdo a si es falsa o verdadera


la proposición dada en cada caso
V F
a. En el método de muestreo aleatorio simple los elementos se escogen en
forma individual y al azar de la totalidad de la población
b. En el muestreo por conglomerado, los elementos de la población no se
dividen en forma natural en subnatural en subgrupos, y estos, no son
escogidos al azar.

5
c. Si los elementos de una población se escogen a intervalos uniformes, a partir
de una lista ordenada de muestreo aleatorio es sistemático
d. Cuando los elementos de una población se clasifican en subgrupos o
estratos, el muestreo no es estratificados

EJERCITARIO DE EVALUACIÓN DE LA UNIDAD I – MUESTREO


Alumno/a: ____________________________________________

I- Pareo según corresponda:


*Una investigación está encaminada a determinar el número de alumnos fumadores en un
colegio de 500 alumnos. Se realiza una encuesta a 100 alumnos seleccionados al azar

1 Población estadística. Determinar número de alumnos fumadores.


2 Muestra. 500 alumnos de un colegio.
3 Variable estadística. 100 alumnos seleccionados al azar.
*Una emisora de radio ha realizado una encuesta a 50 personas que votaron para elegir su
música preferida

1 Variable estadística. Seleccionar música preferida.


2 Población estadística. 50 oyentes.
3 Muestra. Oyentes de una emisora de radio.

*El departamento de ventas de la Good Year desea conocer el nivel de aceptación de un


determinado modelo de neumático. Para ello realiza una encuesta a 200 personas elegidas
al azar del listado de clientes.
1 Muestra: Aceptación de un modelo de neumático.

2 Población estadística: Clientes de una empresa.


3 Variable estadística : 200 clientes.

II - Leo el siguiente enunciado y completo:

* Una emisora radial ha realizado una encuesta sobre un nuevo programa. En la tabla
de abajo se ilustra el puntaje entre 1 y 5 que un grupo de 100 oyentes asignó al mismo.

PUNTAJES ASIGNADOS A UN PROGRAMA RADIAL

Puntajes N° de personas
1 15
2 10
3 5
4 40
5 30
Total 100

- Población Estadística: _______________________


- Muestra: __________________________________
- Individuo: _________________________________

6
* Una concesionaria de automóviles tiene registrados a 2550 clientes y realizó una
encuesta sobre la preferencia de compra con relación al color (rojo, blanco y azul) y en
relación con el número de puertas (dos o cuatro). Fueron encuestados 200 clientes.
Contesto:

* ¿Cuál es la población estadística?____________________________


* ¿Cuál es la muestra de la encuesta? __________________________

 Leo el siguiente enunciado y luego completo las líneas de más abajo:

*En una Institución de 500 alumnos se ha realizado una investigación sobre el número
de horas semanales que cada estudiante práctica algún deporte, encuestado a 50
estudiantes elegidos al azar. El resultado se registra en la tabla siguiente:

Variable (Nº de horas de Frecuencia


prácticas deportivas) (Nº de Alumnos)
0 6
1 18
2 12
3 10
4 4
TOTAL 50
a. La población estadística: _____________________________
b. La muestra: ______________________________
c. La variable estadística: ______________________________
d. Tipo de variable: ______________________________

*Opinión de 500 lectores de cierto periódico hacia un artículo económico:


Población: __________________
Muestra: ____________________

III – Coloco F si la proposición es falsa y V si es verdadera

Se desea hacer un estudio referente a si los niños de una escuela poseen las vacunas
recomendadas. Se decidió estratificar la población por nivel escolar (1°, 2° y 3° ciclos),
seleccionando alumnos de manera aleatoria de cada estrato. Este método se llama muestreo
estratificado proporcional. ( )

Un procedimiento para asegurarse de que todos los individuos de una población tengan la
misma oportunidad de ser elegidos para la muestra se llama muestreo aleatorio simple. ( )

Todos los miembros de una asociación de 200 asociados tienen un número de ficha que va
del 001 al 200. Se desea conocer las preferencias políticas de los miembros. Se entrevistó a
uno de cada diez, comenzando por el 006, 016, 026, 036. Este método se llama muestreo
estratificado proporcional. ( )

IV – Completo con la palabra correcta en cada espacio asignado:


*Goles convertidos por la selección del colegio en el último torneo intercolegial
*Horas dedicadas a la práctica de danza
*Puntajes obtenidos en los exámenes
*Número de obras leídas en un año
*Color de pelo de los compañeros del curso

Muestreo - Censo
*En el colegio se desea realizar una actividad por el día de la primavera y se pregunta a un
grupo de estudiantes qué preferirían hacer. Es:

*Se investiga la formación académica de todos los padres de los alumnos del curso. Es:

7
*Se determina la clasificación por edades de los alumnos de un curso. Es:

*En una empresa desean controlar mil facturas archivadas por fecha de operación. Para ello
toman todas las facturas terminadas en cincuenta. Es:

Individuo - Muestra – Población

Conjunto sobre el cual se desea obtener información e inferir


conclusiones.________________

Una parte de la población de donde se han escogido los datos____________

Cada uno de los elementos que componen la población estadística__________

V - Utilizo la lista de mi curso y extraigo de la misma:

a. Una muestra de tamaño 8 por el método de muestreo aleatorio simple.

b. Una muestra de tamaño 5 por el método de muestreo sistemático.

2. Aplico el muestreo aleatorio simple y sistemático.

Para investigar el grupo sanguíneo más común entre mis parientes más cercanos he
confeccionado la siguiente lista de mis primos.

Andrés Enrique Cristina Jorge

Carla Juan Ana Ada

Teresa Arturo Raúl Joaquín

Nicolás José Silvia Bruno

Olga Mabel Cecilia Ana

a. Enumero mi lista y extraigo de la misma una muestra de tamaño 12 por el método de


muestreo aleatorio simple.

8
b. Luego extraigo una muestra de tamaño 10 por el método de muestreo sistemático.

*Se desea estudiar el número promedio de caries en niños de 10 años de una escuela. Como
se supone que esta variable depende del nivel socioeconómico de los niños. Utilizo el método
de muestreo estratificado proporcional para extraer una muestra de tamaño 60. Para ello tengo
en cuenta los datos preliminares recogidos en la tabla siguiente:

ESTRATOS PORCENTAJES NÚMEROS DE


ENTREVISTADOS POR
(Nivel socioeconómico) % NIVEL

Elevado 5

Medio 40

Bajo 55

*La siguiente tabla ilustra la cantidad de habitantes por barrios de la comunidad “Lapacho”

Barrios

Amanecer Mbokajaty Kuarahy Total

Habitantes 7500 3600 3900 15000

% 50 24 26 100

Elijo una muestra de 500 personas de esa comunidad utilizando el muestreo estratificado
proporcional y completo el cuadro:
Barrios

Amanecer Mbokajaty Kuarahy Total

N° de habitantes
seleccionados
500

9
*En una fábrica trabajan 1000 hombres y 500 mujeres. El gerente desea entrevistar a 120
obreros ¿Cuántos hombres y cuántas mujeres debe entrevistar?

Represento estos datos en una tabla y hallo sus porcentajes

ESTRATOS CANTIDAD CÁLCULO DEL PORCENTAJE


Hombres
Mujeres
TOTAL:

-Número de hombres entrevistados: -Número de mujeres entrevistadas:

MEDICIÓN

Básicamente, la medición es un valor numérico que se obtiene como resultado de


comparar una magnitud con otra de la misma especie tomada como unidad de
medida.
Ampliando el concepto de medición, se incluyen también en el mismo algunos
procedimientos menos precisos que se usan corrientemente en las ciencias básicas.

Escala de medida
A las diferentes formas de clasificar los datos según las características de los
mismos se denomina escala de medida o niveles de medición.

Variable aleatoria
Se denomina variable aleatoria o variable de probabilidad a aquella que puede
asumir determinados valores de un conjunto dado con unas probabilidades dadas.
Es una función que asigna un valor numérico a cada resultado del espacio muestral.
Generalmente las variables aleatorias las representamos con las letras x, y, z.

Ejemplo:
- Sea x la variable aleatoria que se obtiene al lanzar un dado al aire
Clases de escalas

10
Escalas nominales
La clasificación es considerada la operación más sencilla y básica en toda
ciencia. Al clasificar agrupamos los elementos en categorías o clases teniendo en
cuenta ciertas características. En la escala nominal, las categorías no expresan orden
o jerarquía. Tampoco se pueden hacer operaciones aritméticas entre los elementos
que la componen.

Ejemplo:
- Género de las y los alumnos:
1. Niña.
2. Varón.

Escalas ordinales o de orden jerárquico


En esta escala se tienen varias categorías, manteniendo un orden de mayor a menor.
Las categorías indican jerarquía. Se utilizan para indicar importancia, nivel, posición
o cualquier otro tipo de orden.

Ejemplo:
- Rango militar.

Escalas de intervalos
Existen orden y jerarquía entre las categorías, además se pueden establecer
intervalos iguales en la medición. El cero en esta medición es arbitrario, es decir, no
existe un punto de partida.

Ejemplo:
- La temperatura del día.

Escalas de razones o proporciones


Se diferencia de la escala de intervalo por la inclusión de un punto de partida, el
cero no es arbitrario. Aparte de esta diferencia, todas las demás características de
la escala de intervalo se hallan presentes en la escala de razón.

Ejemplo:
- Número de hijos.
- Antigüedad en el trabajo.

Ejercicios de Fijación
1) Define las siguientes palabras:
Medición:………………………………………………………………………………………………………
……………………………………………………………………………………………………………………
…………

Escala de Medida:…………………………………………………………………………………………….
……………………………………………………………………………………………………………………
……

2) Escribe la clasificación de las escalas de medida


* __________________________________ *__________________________________
* __________________________________ *__________________________________

3 Dadas las siguientes variables, las clasifico por clase de escalas

a. El sexo de los estudiantes de tu colegio (…………………………………)


b. Las hortalizas vendidas por un productor de un lejano poblado (……………………………)

11
c. El peso de de los desechos de los hogares (…………………………………)
d. La clasificación en una competencia de fútbol entre los alumnos de los cursos 2º y 3º
(…………………………………)

4 Completo los siguientes enunciados de modo a hacerlos verdaderos

 La escala de medida llamada ________________________________ es aquella en la cual


los datos se hallan organizados en ________________________ o
_______________________ separadas y distintas.
 En la escala de medida denominada ___________________________________ no se tiene
un punto de partida o cero natural en el cual la cantidad no se encuentre.
 La escala de medida _________________________________ es la que incluye un punto de
partida o cero natural, además esto están presentes todas las demás
características de la escala de intervalo

Distribución de frecuencias y gráficos


DISTRIBUCIÓN DE FRECUENCIAS

Una vez que se hayan obtenido los datos, surge la necesidad de organizarlos y
clasificarlos para una mejor interpretación.
Una distribución de frecuencias o simplemente tabla de frecuencias es una
ordenación de los datos en clases o categorías con las frecuencias correspondientes
a cada una.

Datos agrupados
Cuando se tiene una gran cantidad de datos es conveniente agruparlos en intervalos
para facilitar la interpretación.

Datos no agrupados
Cuando el número de datos no es muy elevado, éstos no necesitan agruparse en
intervalos.

FRECUENCIAS
Frecuencia absoluta (fa): es el número de veces que se repite un dato en una muestra. En
nuestra tabla, por ejemplo, se observa que 4 alumnos están aplazados, es decir obtuvieron
la calificación 1.

12
 Frecuencia relativa (fr): es el cociente o razón entre la frecuencia absoluta de cada
dato y el número total de datos. Representa la parte del total que corresponde a cada dato,
siendo la suma total igual a la unidad.

 En nuestro ejemplo, la frecuencia relativa correspondiente a la calificación 1 es


4_, significa que 4 de 25 alumnos obtuvieron la calificación 1.
25

 Frecuencia porcentual (fp): indica qué porcentaje del total corresponde a cada dato.
Se obtiene multiplicando por 100 la frecuencia relativa. La suma de las frecuencias
porcentuales es igual a 100. En nuestro ejemplo, podemos decir que 16 % obtuvieron 1.

 Frecuencia acumulada (fac) de un dato: es igual a la suma de la frecuencia absoluta


del dato y las anteriores a él. La frecuencia acumulada final es igual al número total de
datos.

Frecuencias: absoluta, relativa, porcentual y acumulada para datos sueltos

Ejemplo:
En un curso de 25 alumnos, 4 alumnos obtuvieron 1 en Matemática, 6 alumnos
obtuvieron 2, 7 alumnos obtuvieron 3, 5 alumnos obtuvieron 4 y 3 alumnos
obtuvieron 5. Para poder estudiar mejor los datos, se disponen los mismos en una
tabla de distribución de frecuencias.
Notas Frecuencia Frecuencia Frecuencia Frecuencia
Absoluta Relativa Porcentual Acumulada
fab fr fp fac
1 4 0,16 16 4
2 6 0,24 24 10
3 7 0,28 28 17
4 5 0,20 20 22
5 3 0,12 12 25
TOTALES 25 1 100

Ejercicios de Fijación
1 Conceptualizo

a) Frecuencia absoluta: ________________________________________________________________


b) Frecuencia relativa:__ ________________________________________________________________
c) Frecuencia porcentual: ______________________________________________________________

2 Construye la tabla de frecuencias


En Los 40 seminarios de una clase de cardiología, 2, 1, 5, 0, 0, 3, 2, 1, 1, 4, 3, 2, 1, 0, 1, 2, 1,
3, 6, 2, 2, 1, 0, 2, 1, 1, 3, 4, 1, 0, 2, 1, 0, 1, 2, 4, 1, 3, 1, 2, 4, 3, 1, 2, 3, inscriptos estuvieron
ausentes.
Frecuencia Frecuencia Frecuencia Frecuencia
Absoluta Relativa Porcentual Acumulada
fab fr fp fac

TOTALES

13
Frecuencias: absoluta, relativa, porcentual y acumulada para datos agrupados
Si el número de datos es muy elevado, es conveniente distribuirlos en clases o
categorías para así determinar cuáles corresponden a cada clase.
Para facilitar la construcción de la tabla es necesario ordenar los datos en forma
creciente o decreciente.

 Rango o recorrido
Es la diferencia entre el dato mayor y el dato menor.

 Intervalo de clase
Se denomina así a cada clase, categoría o intervalo en que se divide el conjunto
de datos.

 Límites de clase
Constituyen los números que son extremos de cada intervalo de clase. Cada
intervalo de clase tiene dos límites: el límite inferior de clase (LI) y el límite
superior de clase (LS).

 Límites reales de clase, fronteras de clase o límites verdaderos de clase


Se denominan así a los valores reales que se puede tomar para asegurarse que
estén incluidos los extremos. Se obtiene con más o menos media unidad que la
última cifra significativa de los límites de clase.

 Marca de clase o valor medio


Se determina calculando el promedio entre los límites inferior y superior. La
marca de clase representa a todos los datos pertenecientes al intervalo de clase
correspondiente.

 Tamaño de un intervalo de clase (i).


Es igual al número de distintos valores que comprende. Su valor se determina
hallando la diferencia entre el límite superior y el límite inferior de clase más
uno, o hallando la diferencia entre los límites reales de clase que lo forman.
Para determinar un intervalo aproximado se halla el cociente entre el rango y la
cantidad de intervalos que se desea. La cantidad de intervalos varía de un mínimo
de 5 a un máximo de 15 a 20.
i= Rango
N° de intervalos

Para asegurarse que todos los datos queden incluidos dentro del intervalo, si el
valor de la amplitud es un número fraccionario, se aproxima al entero superior.
Para construir una tabla de distribución de frecuencias se deben considerar los
siguientes pasos
1. Se ordena los datos, pudiendo utilizarse para ello una hoja de recuento.
2. Se calcula el rango.
3. Se determina la amplitud de clase.
4. Se determina los límites inferiores y superiores de las clases.
5. Se determina la frecuencia correspondiente a cada clase.
6. Se calcula las marcas de clase.

Ejemplo:

Los puntajes obtenidos en una prueba de Estadística fueron los siguientes:


27 29 32 34 26 32 16 13 34 25
33 29 30 39 35 15 32 49 19 27
15 33 31 29 38 12 30 34 35 25

14
33 24 11 29 18 37 26 31 25 18

a) Se ordena los datos.


11 12 13 15 15 16 18 18 19 24
25 25 25 26 26 27 27 29 29 29
29 30 30 31 31 32 32 32 33 33
33 34 34 34 35 35 37 38 39 49

b) Se determina el rango.
R= Ls – Li R = 49 – 11 = 38

c) Se selecciona la amplitud del intervalo. Antes se debe decidir el número de intervalos que
se desea. Por ejemplo: se trabajará con 6 clases.
38
𝑖 = 6 = 6,3 i = 7
d) Se construye la tabla de frecuencias: absoluta, relativa, porcentual, acumulada,
incluyendo además marca de clase y límites reales.

Puntajes F. Absoluta F. Relativa F. porcentual F. Acumulada Marca de


fa fr fp Fac clase
x
11 – 17 6 0,15 15 6 14
18 – 24 4 0,10 10 10 21
25 – 31 15 0,37 37 25 28
32 – 38 13 0,32 32 38 35
39 – 45 1 0,03 3 39 42
46 – 52 1 0,03 3 40 49
TOTAL 40 1 100

Ejercicios de Fijación

1) Realiza los siguientes ejercicios


a) Los siguientes datos corresponden a ciertos estudios estadísticos referentes a la cantidad
en litro/es consumidos por 10 familias: 20, 23, 17, 10, 8, 15, 15, 32, 38,40, 5. Ordena los
datos y halla el rango.

b) Construyo una distribución de frecuencia con los datos de los puntajes correspondientes
de una prueba de matemática en la facultad. Con tamaño de clase de 10
47 49 52 54 46 52 36 33 54 45 53 49 50 58
55 35 52 60 39 47 35 53 51 49 58 32 50 54
55 45 53 44 51 49 38 57 46 52 45 38

Puntaje Marca de Frecuencia Frecuencia


Clase Absoluta Acumulada

TOTALES

15
GRÁFICOS ESTADÍSTICOS

Las representaciones gráficas son importantes porque a través de ellas se puede visualizar
con mayor facilidad el comportamiento de una variable estadística.
Actualmente son muy utilizados por los medios de comunicación porque atraen la atención
del observador o lector.
Existen varios tipos de gráficos, aquí se trabajará con los histogramas, polígono de
frecuencias y ojivas.

 Histogramas

Son gráficos de barras utilizados para representar variables


cuantitativas continuas que están agrupados en intervalos.
Están formados por rectángulos contiguos.
Sobre el eje de las abscisas se señalan los límites reales y se
elaboran rectángulos cuyas alturas son proporcionales a la
frecuencia de cada clase.

Ejemplo:
Teniendo en cuenta el ejemplo anterior, referente a los puntajes obtenidos en una prueba
de Estadística, elaboro un histograma.

Puntaje fab Marca de fac


Clase
11 – 17 6 14 6
18 – 24 4 21 10
25 – 31 15 28 25
32 – 38 13 35 38
39 – 45 1 42 39
46 – 52 1 49 40
Totales 40

Polígono de frecuencias

El polígono de frecuencia es una gráfica lineal que se obtiene tomando el valor


medio de cada intervalo y su correspondiente frecuencia. El polígono de frecuencia se
construye uniendo los puntos medios y se debe prolongar hasta las marcas de
clase inferior y superior siguientes con frecuencia absoluta igual a 0 para alcanzar
el eje de abscisas.

16
Grafico Circular

Sirven para compara distintas distribuciones dadas en términos de porcentajes.


Ejemplo
Representamos en un grafico circular los siguientes datos.

Puntaje % Medida de
angulo
11 – 17 15 54º
18 – 24 10 36º
25 – 31 37 133º
32 – 38 32 115º
39 – 45 3 11º
46 – 52 3 11º
Totales 100 360º

Ejercicios de Fijación

1) El número de hermanos de los alumnos de una clase es el siguiente:


010032140011201120112130021235

a) Ordena.
b) Elabora una tabla de frecuencias en las que se incluyan: frecuencia absoluta, absoluta
acumulada, relativa y acumulada.
c) Dibuja un diagrama de barras con frecuencias absolutas acumuladas y un polígono de
frecuencias absolutas.
d) ¿Qué porcentaje de alumnos son hijos únicos?
e) ¿Cuántos alumnos tienen más de un hermano?

2) El número de goles metidos por partido por un cierto equipo es el siguiente:


010232130010301100112120121535

a) Elabora una tabla con las cuatro frecuencias y el porcentaje.


b) ¿Qué porcentaje de partidos han metido al menos un gol?
c) ¿Cuántos partidos han jugado?
d) Haz una representación gráfica circular.

17
HISTOGRAMA
Un histograma es una representación gráfica de una variable en forma de barras.
Se utilizan para variables continuas o para variables discretas, con un gran número de
datos, y que se han agrupado en clases.
En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del
intervalo, y por altura, la frecuencia absoluta de cada intervalo.
La superficie de cada barra es proporcional a la frecuencia de
los valores representados.

POLÍGONO DE FRECUENCIA
Para construir el polígono de frecuencia se toma la marca de clase que coincide con
el punto medio de cada rectángulo.

Ejercicios de Fijación
1) Las puntuaciones obtenidas por un grupo en una prueba han sido:
15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13.
Construir la tabla de distribución de frecuencias y dibuja el histograma
y polígono de frecuencias.

MEDIDAS DE CENTRALIZACIÓN
Son valores numéricos que nos informan del nivel general medio de los datos que se
están ordenando o procesando.
Son tres las medidas de tendencia central:
 Media
 Mediana
 Moda
1- Media aritmética: Es el promedio o resultado de la suma de todos los datos dividido
por la cantidad total de datos. Su valor es representativo de la muestra o población.
(𝑋̅ )
2- Mediana: (Me): Es el valor central de un conjunto ordenado de datos. Es un valor tal
que la mitad de los datos son menores o iguales a él, para ello ordenamos
previamente los mismos en forma creciente:
 Cuando la cantidad de datos es impar: elegimos el valor del medio.
 Cuando la cantidad de datos es par: la mediana es el promedio de los datos que
ocupan las posiciones centrales, dividido por 2.
3 – Moda: Es el valor que se presenta con mayor frecuencia. En una distribución de
frecuencias pueden existir dos o más modas y pueden no existir si todos los datos tienen
la misma frecuencia. (Mo).

18
MEDIDAS DE TENDENCIA CENTRAL CON DATOS NO AGRUPADOS:
Ejemplos:
* La cantidad de leche consumida por 10 familias en un mes (en litros) es:
15 20 35 30 18 32 16 18 25 20
Utilizo los datos de la muestra para calcular:
a. La Media b. La Mediana c. La Moda

MEDIDAS DE TENDENCIA CENTRAL CON DATOS AGRUPADOS:


Formulas
∑ 𝑥𝑖 . 𝑓𝑖
𝑋̅ = 𝑓𝑠𝑖𝑔
𝑁
𝑀𝑜 = 𝐿𝑖 + ( ) .𝑖
𝑓𝑎𝑛𝑡 + 𝑓𝑠𝑖𝑔
𝑁
− 𝑓𝑎𝑎
𝑀𝑒 = 𝐿𝑖 + ( 2 ) .𝑖
𝑓𝑀𝑒

Símbolos:

∑ = Sumatoria o sigma

𝑥𝑖 = indica los datos o valores (en datos agrupados marca de clase)

𝑓𝑖 = frecuencia

N = indica total de datos o valores

𝐿𝑖 = limite inferior del intervalo (Me y Mo)

N/2 = Mitad del total de valores o datos

𝑓𝑎𝑎 = frecuencia acumulada anterior al intervalo de la Me

𝑓𝑀𝑒 fMe = frecuencia del intervalo de la Me

i = amplitud del intervalo (Me y Mo)

𝑓𝑎𝑛𝑡 = frecuencia anterior

𝑓𝑠𝑖𝑔 = frecuencia siguiente

19
EJEMPLO:
N° de Calce fi xi xi. fi fac
30 – 32 6 31 186 6
33 – 35 10 34 340 16
36 – 38 17 37 629 33
39 - 41 5 40 200 38
42 - 44 2 43 86 40
N = 40 1.441
Determino: Media, Mediana y Mo.

Datos: ∑ 𝑥𝑖 . 𝑓𝑖
N/2= 20 𝑋̅ =
Li= 36 𝑁
𝑓𝑎𝑎 =16
𝑓𝑀𝑒 = 17 𝑁
−𝑓𝑎𝑎
𝑓𝑠𝑖𝑔 = 38 2
𝑀𝑒 = 𝐿𝑖 + ( ).i
i= 3 𝑓𝑀𝑒

𝑓𝑠𝑖𝑔
𝑀𝑜 = 𝐿𝑖 + ( ) .𝑖
𝑓𝑎𝑛𝑡 + 𝑓𝑠𝑖𝑔
1441
𝑋̅ = = = 36
40

20−16 4
𝑀𝑒 = 36 + ( ) . 3 = 36 + ( ) . 3= 36 + 0,7= 36,7 ≅ 37
17 17

Ejercicios de Fijación
1) Determino: Media, Mediana y Mo. Represento gráficamente las tres medidas halladas
Pesos en Kgs. fi xi xi. fi fac
59 - 63 3
64 - 68 5
69 - 73 9
74 - 78 12
79 - 83 5
84 - 88 4
89 - 93 2
N=

Hallo la media, mediana y moda. Las calificaciones obtenidas por María en la segunda etapa del
año escolar: 3,5,1,2,4,4,3,5,5,1,2,2,3,4. Grafica utilizando el grafico circular

20
MEDIDAS DE POSICIÓN

Si los valores ordenados de una variable deben ser divididos en grupos de igual tamaño, se
utilizan los cuartiles.
Los cuantiles más utilizados son los cuartiles, deciles y percentiles.

*Cuartiles: Son valores que dividen los datos ordenados en forma creciente en cuatro partes
de igual tamaño. Se tienen tres cuartiles, ya que el cuarto corresponde al 100%.
El primer cuartil (Q1), es el valor tal que el 25% de las observaciones son menores y 75 % de los
datos son mayores.
El segundo cuartil (Q2), corresponde a la mediana, 50% de las observaciones son menores y 50%
son mayores.
El tercer cuartil (Q3), es el valor por tal que el 75% de los observaciones son menores y 25% de
los datos son mayores.
Fórmula:

La clase donde se encuentra cuartil, es aquel en el que su fac ≥ kn 4

𝑘 .𝑛
( 4 )−𝑓𝑎𝑎
𝑄𝑘 = 𝐿𝑖 + .𝑖 Donde:
𝑓𝑄𝑘
K : número del cuartil (primero, segundo, tercero).
Li : límite real inferior de la clase donde se encuentra el cuartil.
faa : frecuencia acumulada anterior a la frecuencia acumulada del intervalo donde se
encuentra el cuartil K.
fQk: frecuencia absoluta del intervalo donde se encuentra.
i : amplitud del intervalo.
N : número de datos.

Deciles: Son valores que dividen los datos ordenados en forma creciente en diez partes
iguales. Se tienen 9 deciles, ya que el décimo corresponde al 100%.

Fórmula

𝑘 .𝑛
( 10 )−𝑓𝑎𝑎
𝐷𝑘 = 𝐿𝑖 +
𝑓𝑄𝑘

La clase donde se encuentra decil, es aquel en el que su fac ≥ kn10

* Percentiles: Son valores que dividen los datos ordenados en forma creciente en cien partes
iguales.

Fórmula:

𝑘 .𝑛
(100)−𝑓𝑎𝑎
𝑃𝑘 = 𝐿𝑖 + .𝑖
𝑓𝑄𝑘

La clase donde se encuentra percentil, es aquel en el que su fac≥ 100

Ejemplo:
La siguiente tabla registra los puntajes obtenidos en una prueba de Estadística.

21
Puntajes Marca de xi Frecuencia absoluta Frecuencia acumulada
X Clase Fa fac
11 – 17 14 6 6
18 – 24 21 4 10
25 – 31 28 15 25
32 – 38 35 13 38
39 – 45 42 1 39
46 – 52 49 1 40
Totales 40

Calculo e interpreto los resultados obtenidos:


a) El cuartil Q2
b) El decil D7
c) El percentil P75

Desarrollo:
a) Cálculo de Q2
𝑘 .𝑛
Datos: ( )−𝑓𝑎𝑎
4
N=40
𝑄𝑘 = 𝐿𝑖 + .𝑖
𝑓𝑄𝑘
k= 2
𝑘 . 𝑛 2.40 20−10
= = 20 𝑄2 = 25 + .5 = 25 + 3,3 = 28,3
15
4 4

x Fa Fac
25 – 31 15 25

El 50% obtuvieron 28,3 puntos en la prueba de Estadística.

b) Cálculo de D7
𝑘 .𝑛
Datos: ( )−𝑓𝑎𝑎
10
N=40
𝐷𝑘 = 𝐿𝑖 + .𝑖
𝑓𝑄𝑘
k= 7
𝑘 . 𝑛 7.40 28−25
= = 28 𝐷7 = 32 + .5 = 32 + 1,15 = 33,15
13
10 10

x Fa Fac
32 – 38 13 38

El 70% obtuvieron 33,15 puntos en la prueba de Estadística.

c) Cálculo de P75

Datos: 𝑘 .𝑛
N=40 ( )−𝑓𝑎𝑎 30−25
100
k= 75
𝑃𝑘 = 𝐿𝑖 + .𝑖 𝑃75 = 32 + .5 = 32 + 1,9 = 33,9
𝑓𝑄𝑘 13
𝑘 . 𝑛 75.40
= = 30 x Fa Fac
100 100
32 – 38 13 38
El 75% obtuvieron 33,9 puntos en la prueba de Estadística.

22
Ejercicio de Fijación

Se ha tomado una muestra de 231 personas que entre 20 y 50 años ha culminado sus estudios
primarios en Paraguay y se presenta la siguiente distribución por edades. Calculo Cuartil
segundo, decil tercero y percentil 37.

X Fa fac
20 – 25 41 41
25 – 30 123 164
30 – 35 44 208
35 – 40 13 221
40 – 45 7 228
45 – 50 3 231
231

23

También podría gustarte