Mathematics">
Tarea 1.rivera Susana
Tarea 1.rivera Susana
Tarea 1.rivera Susana
¿QUÉ ES LA ESTADÍSTICA?
UN POCO DE HISTORIA …
1850
A raíz de la epidemia de la cólera, John Ejemplo de histograma
Snow crea el primer diagrama “x vs y” el
cual fue clave para descubrir que la raíz
1890
del problema se encontraba en un pozo
de agua contaminada. El cuñado de Darwin
crea los conceptos de
Es a raíz de esto que se desarrollan los
media aritmética y
primeros mapas estadísticos e
desviación estándar.
histogramas.
1917 FIN DE LA 2GM
Para 1910, los mejores Al término de la segunda
estadistas se encontraban en los guerra mundial, los
países eslavos, sin embargo, para estadounidenses que
finales de la 1GM, debido a originalmente eran campesinos
problemas climáticos, escasearon en Estados Unidos y habían ido
las cosechas en estos países a la guerra, se sentían bien
provocando que muchos acogidos en Europa y sin ganas
pobladores de estos países de regresar.
incluyendo a muchos de estos
Por esta razón, E.U. empieza a
estadistas se mudaran a Estados
tener problemas de falta de
Unidos.
trabajadores del campo y se
inicia el diseño de experimentos
estadísticos para aumentar la
producción de cereales en E.U. a
través del análisis estadístico.
Por último, para los datos de la población, utilizo símbolos griegos, mientras que,
para los datos de la muestra, utilizo símbolos romanos. Los censos se llevan a cabo
únicamente por los Estados (debido a la magnitud de los datos), mientras que las
empresas que desean conocer algún tipo de información acerca de la población, realizan
más bien encuestas.
I) MEDIA ARITMÉTICA
Pondera el “peso” de los datos más grandes con los datos chicos.
Se puede comparar con una
balanza en equilibrio, ya que
tendremos el valor de los datos
más pequeños, así como el valor
de los datos más grandes, será
el mismo.
Se calcula con la suma de todos los datos dividida entre el número de datos que
existen. Su notación es la siguiente : 𝑥̅ para la media aritmética poblacional y
𝑥̅𝑛=7 o 𝑥̅ (𝑛 = 7) para la muestral.
Para ejemplificar todas las medidas de tendencia central, se recopilaron los datos de la
altura de todas las mujeres del grupo. Se recopilaron 46 datos
de la población y de ahí, se tomó una muestra de 7 datos con
la cual se calcularon cada una de las medidas de tendencia
central que veremos a continuación. Cada uno de los
ejercicios fue calculado con los mismos datos.
Para calcular la media aritmética en Excel se llevaron a cabo los siguientes pasos:
Opción A:
1. Calcular la suma del valor de los datos con la función =SUMA( en Excel,
seleccionando los datos de la muestra.
2. Calcular el total de los datos con la función =CONTAR( seleccionando los datos
de la muestra.
3. Calcular la media aritmética dividiendo el valor obtenido en el punto uno (suma
del valor de los datos) entre el valor obtenido en el punto 2 (total de los datos).
Opción B:
Si se manejan datos muy grandes, se puede hacer un ajuste de los datos (sumar, restar,
dividir, multiplicar, etc. Todos los datos por algún valor arbitrario), calcular la media
aritmética y después hacer un reajuste a la media aritmética obtenida haciendo el
proceso inverso del ajuste hecho anteriormente. En el ejemplo siguiente, restaremos 1.6 a
todos los datos y luego
multiplicaremos el valor
obtenido por 100,
calcularemos la media
aritmética y a este
resultado lo dividiremos
entre 100 y le sumaremos 1.6 para hacer el reajuste.
II) MEDIANA
Dato que se encuentra justo en medio o en el centro de todos los datos registrados si
éstos se ordenan ya sea de forma ascendente o descendente. Permite observar el límite
entre los datos chicos y los datos grandes. A pesar de que no hay una notación
reglamentada, dentro del curso utilizaremos la m minúscula para anotar la mediana.
< Recordemos que es VITAL ordenar los datos ya sea en forma ascendente o
descendente >
III) MODA
La moda es el dato que más se repite. Si no se tiene ningún dato que se repite más,
se dice que se tienen datos amodales, si se tienen dos datos como moda, se dice que
se tienen datos bimodales y si son de 3 a 5 datos como moda; multimodales. De 5
modas en adelante, se dice que se tienen datos amodales ya que en realidad no hay
una moda, no hay un conjunto de datos que sobresalga significativamente de los
demás. A pesar de que no hay una notación reglamentada, dentro del curso
utilizaremos la M mayúscula para anotar la moda.
Se calcula como la raíz enésima del producto de datos o bien, con la exponencial de la
media aritmética del logaritmo de los datos. En Excel se puede calcular de tres formas
distintas.
Opción A:
Opción B:
Opción C:
1. Calcular el logaritmo natural de cada uno de los datos con la función =LN(.
2. Calcular la media aritmética de los datos “nuevos” con la función
=PROMEDIO(.
3. Se calcula la exponencial de la media aritmética obtenida con la función =EXP(.
DATOS Y MUESTREO
a) Numéricos: Arroja únicamente números como datos (ejem.: edad, estatura, peso,
etc.).
b) Categóricos: Arroja datos no numéricos como datos (ejem.: nombres).
Una encuesta puede tener una parte de datos categóricos y otra de datos numéricos.
Ahora bien, en lo que va al muestreo de los datos, es decir, al método para seleccionar la
muestra, existen tres tipos principales:
Diagrama que permite representar los datos de forma gráfica o visual para facilitar su
estudio.
Datos
1.53
1.58
1.59
1.63
1.64
1.65
1.77 o o o o o o o
1.53
1.54
1.55
1.56
1.57
1.58
1.59
1.61
1.62
1.63
1.64
1.65
1.66
1.67
1.68
1.69
1.71
1.72
1.73
1.74
1.75
1.76
1.77
1.6
1.7
̅(𝒏 = 𝟕) = 1.6271
𝒙
m = 1.63
M = AMODAL
̅𝑮 = 1.6257
𝒙