Mathematics">
Nothing Special   »   [go: up one dir, main page]

Unidad 1. Estadística Descriptiva

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 50

UNIDAD 1.

ESTADÍSTICA DESCRIPTIVA
1.1 Conceptos básicos de estadística: Definición, Teoría de decisión población,
Muestra aleatoria, Parámetros aleatorios.
1.2 Descripción de datos: Datos agrupados y no agrupados, Frecuencia de clase,
Frecuencia relativa, Punto medio, Límites.
1.3 Medidas de tendencia central: Media aritmética, geométrica y ponderada,
Mediana, Moda,
1.4. Medidas de dispersión: Varianza, Desviación estándar, Desviación media,
Desviación mediana, Rango.
1.5 Parámetros para datos agrupados.
1.6 Distribución de frecuencias.
1.7 Técnicas de agrupación de datos.
1.8 Técnicas de muestreo.
1.9 Histogramas.
EVALUACIÓN DE UNIDAD 1

PARTICIPACIONES: 30%
EXAMEN ESCRITO: 20%
EXPOSICIÓN +TRABAJO DE CONSULTA.GOB.MX:
10%
INVESTIGACIÓN+ FICHAS: 10%
MAPA CONCEPTUAL: 10%
TAREAS: 20%
En equipos de 3 integrantes, para exponer, consulta la página www.consulta.com.mx,
elige un estudio realizado y determina cuales son los distintos conceptos estadísticos
que aparecen, tales como:
a) Población.
b) Muestra elegida.
c) Muestreo aplicado.
d) Variables involucrada
e) Una explicación breve del estudio
EQUIPOS PARA EXPONER SIGUIENTE CLASE
MESXXI punto 5 inciso i) & LEAA2015 5.4.1.1/5.4.4.4

T0. PRUEBA DIAGNOSTICA DE CONOCIMIENTOS PREVIOS


Objetivo: Al finalizar la tarea el estudiante resolverá los ejercicios de la prueba diagnóstica escrita
sobre los temas de álgebra.

Instrucción: La evaluación no tiene valor, es en forma individual, escrito en lápiz. Durante el examen
no se permite la salida al baño, ni preguntas al maestro. En caso de encontrar acordeón o
copiándose del compañero, se anulará el mismo.

Tiempo: 35 minutos Modo: Individual


I. INSTRUCCIONES: Responda de acuerdo a la que se te pide las siguientes preguntas

1. Escriba las característica que debe contener un reporte de investigación


2. Escriba las características que debe contener un ensayo.
3. Ejemplifique un mapa conceptual.
4. Ejemplifique un mapa mental
5. Explica que es un cuadro de doble entrada
6. Que utilidades te ha brindado el programa Microsoft Excel.
7. Explica que entiendes por DATOS
8. Explique que es un algoritmo.
9. Explique el significado de ∑
3.1 Conceptos básicos de estadística: Definición, Teoría de
decisión población, Muestra aleatoria, Parámetros aleatorios.

Se llama Estadística a la rama de las matemáticas que se sirve de un conjunto de


métodos, normas, reglas y principios para la observación, toma, organización,
descripción, presentación y análisis del comportamiento de un grupo de datos para la
conclusión sobre un experimento o fenómeno.

Es la técnica o proceso matemático de recolección recolección, descripción,


organización, análisis e interpretación de datos numéricos. Constituye un instrumento
fundamental de medida y de investigación dada su capacidad de expresión cuantitativa.
1.1. POBLACIÓN Y MUESTRA ALEATORIA
Se le llama Población a la cantidad total de cualquier conjunto completo de datos,
objetos, individuos o resultados que tengan alguna característica en común que se va a
observar o analizar en un problema o experimento. Denotaremos al tamaño de la
población por “N”.

El significado estadístico que se le da al término población es más amplio que el usual, ya


que puede referirse a actos, áreas geográficas, cosas, datos, objetos, individuos,
resultados, e incluso a temperaturas o tiempos.
"Una población es un conjunto de todos los elementos que estamos estudiando, acerca
de los cuales intentamos sacar conclusiones". Levin & Rubin (1996).

"Una población es un conjunto de elementos que presentan una característica común".


Cárdenas (1974)
"Se llama muestra a una parte de la población a estudiar que sirve para representarla".
Murria R. Spiegel (1991).

"Una muestra es una colección de algunos elementos de la población, pero no de


todos". Levin & Rubin (1996).

"Una muestra debe ser definida en base de la población determinada y las


conclusiones que se obtengan de dicha muestra solo podrán referirse a la población en
referencia", Cadenas (1974).

Se le llama Muestra a cualquier subconjunto de elementos de la población

Denotamos al tamaño de la muestra por “n”.


Ejemplo 1: Se puede citar el caso de un sociólogo, quien pudiera estar
interesado en investigar en una muestra de 750,000 conductores de
automóviles, quienes son más agresivos, los hombres o las mujeres.

Para la realización de este experimento, y debido al gran número de


personas que habría de sondear, queda fuera de consideración el hecho
de observar a todos los conductores de automóvil. Por lo que sería
necesario estudiar sólo un pequeño grupo de ellos (muestra), siendo ésta
la parte que le corresponde a la estadística descriptiva: El hecho de
observar a los conductores, tomar y anotar los datos de forma
organizada, hacer una descripción del carácter y sexo del individuo
observado, hacer una presentación de los datos obtenidos y por último,
analizar los resultados de la muestra.
En el ejemplo una muestra podría ser: 500 conductores elegidos al azar, en
este caso quedará
Muestra n = 500 y
Población N =750,000

Las características de la muestra dependen del criterio del muestreo


empleado para su determinación. Sin embargo, para que una muestra sea
representativa de la población, ésta deberá contener aproximadamente
entre el 5 % y el 10 % de los datos de la población cuando ésta es finita,
además los elementos de la muestra deben ser escogidos al azar (a la
suerte) y se deben observar todas las características que se observan en la
población.
Se le llama Datos a las agrupaciones de cualquier número de observaciones
relacionadas. Para que se considere un dato estadístico debe tener dos
características:
a) Que sean comparables entre sí.
b) Que tengan alguna relación

Se le llama Experimento a toda acción o prueba que se realiza con el fin de observar
su resultado

Se llama Muestreo al estudio que se hace de una población por medio de muestras
representativas, debidamente elegidas de manera que posea todas las
características de una población y de tamaño determinado según la precisión que de
ella se quiere obtener en las decisiones y conclusiones estadísticas posteriores.
Se le llama valores estadísticos, estadísticos muéstrales o simplemente estadísticos a
los valores o cantidades desconocidas que son obtenidas de, o que hacen referencia a
las características de una muestra.

Se le llama Parámetro, parámetros poblacionales o simplemente parámetros a los


valores o cantidades desconocidas que son obtenidas de, o que hacen referencia a las
características de una población.
La recolección de información o recopilación de datos estadísticos se divide en:
Datos Internos: son aquellos datos que no necesitan de observaciones adicionales al
experimento; es decir, no es necesario buscar características que proporcionen información
adicional acerca del experimento. Ejemplo: Las calificaciones de un grupo, un experimento
químico, etcétera.

Datos Externos: estos datos pueden ser de dos tipos:

a) Datos Bibliográficos: son aquellos ya conocidos y que podemos encontrar


fácilmente utilizando bibliografía, registros, actas, etcétera, como los datos
históricos, censos y otros.
b) Datos Originales: son aquellos que podemos obtener mediante métodos de
recolección, como las encuestas, plebiscitos, referéndum, y nos proporcionan
datos reales y certeros.
TA1. MAPA CONCEPTUAL Y CUADRO SOBRE TEORÍA ESTADÍSTICA
Competencia a desarrollar: Capacidad de análisis y Síntesis, Habilidad para búsqueda de información.
Capacidad para trabajar en equipo. Habilidad en el uso de tecnologías de información y comunicación.

Objetivo: El alumno creará un cuadro comparativo en su libreta de apuntes, explicando que es Estadística, y la
diferencia entre estadística descriptiva e inferencial, así mismo elaborará un mapa conceptual explicando lo que
es: población, muestra, muestreo, datos, parámetros y estadísticos, con base al archivo denominado “unidad 1.
Estadística Descriptiva”

Tiempo: 30min
Modo: GRUPAL
Formato: Libreta.
Narchivo: TA1.MAPAYCUADRO.1ERAPELLIDO1ERNOMBRE.

+MESXXI II Dimensión académica, inciso b). Plano Psicopedagógico puntos 2, 3, 4 & 5 + LEAA2015 5.4.4.2/5.4.4.5/5.4.4.6
1.2. Datos no agrupados.
Los datos no agrupados son aquellos que, obtenidos a partir de un estudio, no están
todavía organizados por clases. Cuando es un número manejable de datos, usualmente 20 o
menos, y hay pocos datos diferentes, se pueden tratar como no agrupados y extraer
información valiosa de ellos.

Los datos no agrupados provienen tal cual de la encuesta o del estudio realizado para
obtenerlos y por ello carecen de procesamiento. Veamos algunos ejemplos:

-Resultados de un examen de coeficiente intelectual CI realizado a 20 alumnos al azar de una


universidad. Los datos obtenidos fueron los siguientes:
119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112,
112,106

-Edades de 20 empleados de cierta cafetería muy popular:


24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 21, 19, 22, 27, 29, 23, 20

-El promedio de notas finales de 10 alumnos de una clase de Matemáticas:


3,2; 3,1; 2,4; 4,0; 3,5; 3,0; 3,5; 3,8; 4,2; 4,9
1.2.1. Medidas de tendencia central para datos NO agrupados

Medidas de tendencia central.

Las medidas de tendencia central nos muestran un valor central


de un conjunto de datos. Una de las características más
sobresalientes de la distribución de datos es su tendencia a
acumularse hacia el centro de la misma. Esta característica se
denomina Tendencia central. Las medidas de tendencia central
más usuales son: media aritmética, mediana y moda.
miércoles, 16 de febrero de 2022

Media aritmética, geométrica y ponderada.


Media aritmética. Es el promedio de un conjunto de datos; es una
descripción numérica de la tendencia de ellos. El símbolo de la media


aritmética es:
x
x
i

n
x = sumatoria de todos los datos / número de datos

La media aritmética se obtiene por medio del cociente entre la suma de los
datos y el número de ellos.

Estadística
Estadística descriptiva miércoles, 16 de febrero de 2022

EJEMPLO 1:
Mediante los siguientes datos hallar la media aritmética.
10, 8, 6, 5, 10, 9

SOLUCION:
Estadística descriptiva miércoles, 16 de febrero de 2022

Media geométrica

La media geométrica (MG), de un conjunto de ”n” números positivos se define como la


raíz enésima del producto de los n números. Por tanto la formula para la media
geométrica es:

Existen dos usos principales de la media geométrica:


1.Para promediar porcentajes, indices y cifras relativas y
2.Para determinar el incremento porcentual promedio en ventas, producción u otras
actividades o series económicas de un periodo a otro.
Ejemplo
Supóngase que las utilidades obtenidas por una compañía
constructora en cuatro proyectos fueron de 3, 2, 4 y 6%,
respectivamente. ¿Cuál es la media geométrica de las ganancias?.
Solución:

y así la media geométrica de las utilidades es el 3.46%.

Nota: Si uno de los números es cero o negativo, no se puede calcular la media geométrica.
Estadística descriptiva miércoles, 16 de febrero de 2022

EJERCICIO
Se ha calculado que, durante el primer año de uso, cierta
máquina sufre una depreciación del 16% respecto a su valor
de costo, y que, durante el segundo año, la depreciación es
del 9% del valor que tenía al comenzar dicho segundo año.
Encuéntrese un tanto por ciento promedio de depreciación
anual.
Estadística descriptiva miércoles, 16 de febrero de 2022

Media ponderada

En ciertas circunstancias no todas las observaciones tienen igual peso. En


general si se tienen observaciones con sus respectivos pesos es:

Ejemplo:
Suponga que necesitamos una media de tres calificaciones de una prueba (85, 90, 75),
donde la primera prueba cuenta el 20%, la segunda el 30% y la tercera el 50% de la
calificación final.

MEDIA PONDERADA = 81.5


Estadística descriptiva miércoles, 16 de febrero de 2022

Mediana

La mediana es el punto central de una serie de datos, para


encontrarla primero se acomodan los datos en orden ascendente o
descendente y luego se toma el valor central

Moda

Es el valor más común que se observa en el conjunto de datos. No siempre existe,


puesto que es posible que ningún valor se repita con mayor frecuencia que otro.
También pudiera haber dos datos con igual frecuencia, en cuyo caso se habla de una
distribución bi-modal.
Estadística descriptiva miércoles, 16 de febrero de 2022

Ejercicio: encuentre la mediana y moda de los siguientes


datos:
1.45 1.95 1.74 1.64 1.80 1.46 1.35 1.75 1.83 1.55

Primeramente se acomodan los datos de menor a mayor o viceversa:

1.35, 1.45, 1.46, 1.55, 1.64, 1.74, 1.75, 1.80, 1.83, 1.95

La mediana= dato central


La mediana para datos pares, se toman los valores centrales y se dividen entre dos
La mediana para datos impares se toma el valor del centro.
Mediana= (1.64+1.74)/2= = 1.69

En este caso no hay moda


Estadística descriptiva miércoles, 16 de febrero de 2022

Ejercicio: encuentre la mediana y moda de los siguientes datos:

1.45 1.95 1.74 1.64 1.80 1.46 1.35 1.75 1.83

Primeramente se acomodan los datos de menor a mayor o viceversa:

1.35, 1.45, 1.46, 1.64, 1.74, 1.75, 1.80, 1.83, 1.95

En este caso, los datos son impares, por lo tanto, se toma el


dato central como la mediana, que es igual a 1.74

La moda: No existe
Estadística descriptiva miércoles, 16 de febrero de 2022
TA2.MEDIDAS DE TENDENCIA CENTRAL

Competencia a desarrollar: Capacidad de análisis y Síntesis.


Objetivo: El alumno encontrará media, mediana y moda del siguiente ejercicio sobre
cereales, y hallará la media ponderada del ejercicio correspondiente
Tiempo: 20min
Modo: individual
Formato: Libreta, y en electrónico (Portada, introducción, contenido (ejercicio), conclusión y
referencias.
Narchivo: TA2.TENDENCIACENTRAL.1ERAPELLIDO1ERNOMBRE.

0.295 media
0.345 mediana
0.43, 0.47,
0.13 moda

media
ponderada 84.5
Medidas de dispersión: Rango, varianza y desviación estándar.

La varianza y la desviación estándar indican si los valores se encuentran más o menos próximos a las medidas
de posición.
Para Malhotra (2008), la varianza es una “técnica estadística que sirve para examinar las diferencias entre las
medias de dos o más poblaciones” (p. 505).

La desviación estándar es también útil para describir qué tan lejos las observaciones individuales de
una distribución de frecuencias se apartan de la media de la distribución. Una medida que se conoce
como resultado estándar nos da el número de desviaciones estándar que una observación en particular
ocupa por debajo o por encima de la media:

El rango es simplemente la diferencia entre el mayor y el menor de los datos y permite


apreciar rápidamente la variabilidad de ellos.
Desviación Estándar
La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos están los datos alrededor de la media. El símbolo σ
(sigma) se utiliza frecuentemente para representar la desviación estándar de una población, mientras que s se utiliza para representar la desviación
estándar de una muestra. La variación que es aleatoria o natural de un proceso se conoce comúnmente como ruido.
Debido a que la desviación estándar utiliza las mismas unidades que los datos, generalmente es más fácil de interpretar que la varianza.

Interpretación
Utilice la desviación estándar para determinar qué tan dispersos están los datos con respecto a la media. Un valor de desviación estándar más alto
indica una mayor dispersión de los datos. La desviación estándar también se puede utilizar para establecer un valor de referencia para estimar la
variación general de un proceso.

Tiempos de egreso de un hospital Hospital 1 Hospital 2


Los administradores dan seguimiento al tiempo de egreso de los pacientes que son tratados en las áreas de urgencia de dos
hospitales. Aunque los tiempos de egreso promedio son aproximadamente iguales (35 minutos), las desviaciones estándar son
significativamente diferentes. La desviación estándar del hospital 1 es de aproximadamente 6. En promedio, el tiempo para dar de
alta a un paciente se desvía de la media (línea discontinua) aproximadamente 6 minutos. La desviación estándar del hospital 2 es
de aproximadamente 20. En promedio, el tiempo para dar de alta a un paciente se desvía de la media (línea discontinua)
aproximadamente 20 minutos.
miércoles, 16 de febrero de 2022

Varianza
La varianza, V, es el promedio de los cuadrados de las desviaciones, (xi –
media)2, de cada elemento, xi, respecto a la media, entre n-1
2
 n

 x  x
n
2
  xi 
 i 1 
i n
S2  i 1

n 1
 xi
2

n
S 
2 i 1
n 1

Estadística descr
Ejemplo
Se han medido las alturas de sus perros (en milímetros):

Las alturas (hasta el lomo de cada perro) son: 600mm, 470mm, 170mm, 430mm y 300mm.
Calcula el rango, la media, la varianza y la desviación estándar de las alturas de los perros.
Rango= 600 -300 mm = 300 mm
Respuesta: Así que la altura media es 394 mm. Vamos a dibujar esto en el
gráfico:

Media = (600 + 470 + 170 + 43/0 + 300)/ 5


= 19705
Media = 394

Para calcular la Varianza, toma cada diferencia, elévala al cuadrado:


Así que la varianza es

Varianza
σ2 = (2062 + 762 + (−224)2 + 362 + (−94)2 )/4
= (42436 + 5776 + 50176 + 1296 + 8836)/4
= 108520/4
= 27320
Y la Desviación Estándar es la raíz de la Varianza, así que:
Desviación Estándar
σ = √27320 Y lo bueno de la Desviación Estándar es que es
útil: ahora podemos ver qué alturas están dentro
= 164.711... de una Desviación Estándar (+-165mm) de la
= 165 media:
Para comprender el concepto de la varianza y de la desviación estándar, a manera de ejemplo, si una persona
gerente de una empresa de alimentos desea saber qué tanto varían los pesos de los empaques (en gramos) de
sus productos, selecciona al azar cinco unidades de ellos para pesarlos, y se obtuvieron los siguientes pesos
en gramos: 490, 500, 510, 515 y 520, respectivamente.

Dados estos datos, lo primero que se calcula es la media de esos datos:

(490 + 500 + 510 + 515 + 520) / 5 = 507

La varianza se calcula de la siguiente manera:

(490-507)2 + (500-507)2 + (510-507)2 + (515-507)2 + (520-507)2/ 5-1 = 145

Por lo tanto, la desviación estándar sería: √145 = 12.04

Con estos datos se llega a la conclusión de que el peso promedio de los empaques es de 507 gramos, con una
tendencia a variar por debajo o por encima de dicho peso en 12 gramos.
Esta información le permite a quienes toman decisiones en la empresa, determinar cuánto es el promedio de
pérdidas causado por el exceso de peso en los empaques, y le da las bases para tomar los correctivos
necesarios en el proceso de empacado.
TA3. MEDIDAS DE DISPERSIÓN
Objetivo: Al finalizar la actividad, el
estudiante entregará en su libreta los
ejercicios solicitados

Tiempo: 30 min

Modo: individual, entrega en físico, tomar


foto y enviarlo con las participaciones al
final
Hallar cual banco varía más en sus tiempos de espera (usar coeficiente de variación)
Narchivo: MEDIDAS DE DISPERSIÓN

Hallar la desviación estándar de las edades de los motociclistas


Datos de agrupación
Los datos agrupados en frecuencia son los que se distribuyen u organizan en una tabla de frecuencia (La
frecuencia es igual al número de veces en que se repite cada valor en una serie de datos.), así, Por medio de
ella, es fácil identificar la cantidad de respuestas repetidas.

Los datos agrupados por intervalos son los que se organizan dentro de un rango y se delimita su amplitud por
límites establecidos. Así, por medio de esta, es fácil identificar la cantidad de elementos en un determinado
rango de valores.
Tabla de frecuencias.

La Tabla de frecuencia de datos agrupados son


aquella distribución en la que los datos estadísticos
se encuentran ordenados en clases y con la
frecuencia de cada clase; es decir, los datos
originales de varios valores adyacentes del conjunto
se combinan para formar un intervalo de clase.
Tabla de frecuencias
Las tablas de frecuencia agrupan los datos no agrupados en tablas para poder ser analizados con
más facilidad. Las tablas de frecuencia se dividen en dos tipos: Las tablas tipo A y las tablas Tipo
B

Ni Limite Limite Frecuenci Punto medio del intervalo


No. inferior superior a absoluta Marca de clase (Mc)
Intervalos

1 40.0 48.1 3 44.1


2 48.1 56.1 8 52.1
3 56.1 64.1 11 60.1
4 64.1 72.1 32 68.1
5 72.1 80.1 21 76.1
6 80.1 88.1 18 84.1
7 88.1 96.1 14 92.1
8 96.1 104.0 1 100.1
Suma total de datos: 108
Media para datos agrupados en tablas tipo A
SOLUCIÓN
PASO 1: Realizar la sumatoria del producto resultante de las clases por su frecuencia
absoluta. Para efectos del cálculo de la media, deberíamos sumar 15 veces el valor 1, 13
veces el valor 2, 8 veces el valor 3, hasta llegar a la última clase:

Preguntas buenas Personas Fi


1 15 15 * 1 = 15
2 13 13 * 2 = 26
3 8 3 * 8 = 24
4 19 4 * 19 = 76
5 21 5 *21 =105
6 5 6 * 5 = 30
Suma: 276

PASO 2: Dividir la sumatoria sobre el número total de datos.


276 / 81 = 3.4074 ≈ 3.41
INTERPRETACIÓN: En promedio los encuestados contestaron aproximadamente 3 (el valor
exacto es 3,41) preguntas buenas.
Obtener la media para tabla tipo B

Ni Limite Limite Frecuenci Punto medio del intervalo


No. Intervalos inferior superior a absoluta Marca de clase (Mc)
1 40.0 48.1 3 44.1
2 48.1 56.1 8 52.1
3 56.1 64.1 11 60.1
4 64.1 72.1 32 68.1
5 72.1 80.1 21 76.1
6 80.1 88.1 18 84.1
7 88.1 96.1 14 92.1
8 96.1 104.0 1 100.1
Suma total de datos: 108
SOLUCIÓN
Las marcas de clase representan a los intervalos de clase, por ejemplo, suponemos que la marca
de clase para el primer intervalo (44.1) se repite 3 veces, al desconocer los 3 valores exactos que
están dentro de dicho intervalo.

PASO 1: Realizar la sumatoria del producto resultante entre las marcas de clase por su frecuencia
absoluta.
Ni Limite Limite Frecuencia Punto medio del (Frecuencia)*(Mc)
No. inferior superior absoluta intervalo
Intervalos Marca de clase (Mc)

1 40.0 48.1 3 44.1 (3)(44.1)=132.3


2 48.1 56.1 8 52.1 (8)(52.1)=416.8
3 56.1 64.1 11 60.1 661.1
4 64.1 72.1 32 68.1 2179.2
5 72.1 80.1 21 76.1 1598.1
6 80.1 88.1 18 84.1 1513.8
7 88.1 96.1 14 92.1 1289.4
8 96.1 104.0 1 100.1 100.1
Suma total: 7890.8
PASO 2: Dividir la sumatoria sobre el número total de datos.

7890.8
  73.063  73
108

La media es 73
n

 2
xi ni
s 
2 i 1
n
 (x) 2

n
i 1
i
Encuentre la varianza y la desviación estándar de los datos siguientes;
TA4. DATOS AGRUPADOS

Competencia a desarrollar: Capacidad de análisis y Síntesis.

Objetivo: El alumno encontrará la media, la desviación estándar y la varianza de la siguiente tabla

Tiempo: 30min

Modo: MIXTO

Formato: Libreta, y en electrónico (Portada, introducción, contenido (ejercicio), conclusión y referencias.


Narchivo: TA4.DATOSAGRUPADOS.1ERAPELLIDO1ERNOMBRE. RÚBRICA
concepto C PC IC
Tiempo 5 2 1
Método 5 2 1
Formato 10 5 2
Contenido 35 20 10
TNombre 5 2 1
Total 60 31 15
+MESXXI II Dimensión académica, inciso b). Plano Psicopedagógico puntos 2, 3, 4 & 5 + LEAA2015 5.4.4.2/5.4.4.5/5.4.4.6

También podría gustarte