Taller 1 Estadistica PDF
Taller 1 Estadistica PDF
Taller 1 Estadistica PDF
ESTUDIANTES:
TATIANA RUEDA
DIEGO SALAMANCA
JINETH CARDENAS
SANTIAGO GUZMAN
DOCENTE:
CAJICÁ
10 DE AGOSTO 2020
2
EJERCICIO 1. Los siguientes son los salarios (en miles) de un grupo de trabajadores de
una empresa.
1530 - 3560 - 1480 - 2500 - 1480 - 1560 - 1535 - 3535 - 1700 - 1560
1400 - 1760 - 800 - 3710 - 840 - 1700 - 1560 - 2600 - 1480 - 1520
535 - 1480 - 820 - 900 - 1560 - 1520 - 2400 - 1560 - 2480 - 810
Intervalo de Marcas de
clase clase Frecuencia absoluta Frecuencia acumulada
535-1071 803 6 6
1072-1608 1340 14 20
1609-2145 1877 3 23
2146-2682 2414 4 27
2683-3219 2951 0 27
3220-3756 3488 3 30
Se analiza del histograma que la mayoría de personas tienen un salario entre 1072-1608(en
miles),con la marca de clase de 1340(en miles), también se deduce que los salarios entre
1609-2145(en miles) y 3220-3756(en miles) son menos frecuentes entre los trabajadores. Por
último, de acuerdo a la tabla podemos observar que la diferencia entre las personas con los
menores sueldos y con los mayores sueldos es de 3 personas.
3
valores Anchos
MIN 535 535
Q1 1480 945
Q2 1547.5 67.5
Q3 1745 197.5
MAX 3710 1965
Con estos valores se puede observar que los salarios que se encuentran dentro de la caja no
varían mucho entre sí, pero los que están afuera, es decir, los que se encuentran entre el valor
mínimo y el cuartil 1 y entre el cuartil 3 y el valor máximo, estos cambian drásticamente. Se
puede suponer que los que pertenecen al grupo entre el valor mínimo y el cuartil 1, son
trabajadores ubicados en la planta de la empresa, ganando el salario mínimo que ofrece la
misma. Los empleados que se encuentran en la caja, se puede decir que son los
administrativos, ganando un salario significativamente mayor a los trabajadores de planta. Y
finalmente, el que se encuentra entre el cuartil 3 y el valor máximo, podemos deducir que son
los dueños o administradores de la empresa.
También se puede analizar que las personas con salario mínimo, ganan más o menos un tercio
de lo que ganan los que se encuentran dentro de la caja. Y comparando a estas personas con
el valor máximo, ganan más o menos la mitad de lo que ganan los que se encuentran entre el
cuartil 4 y el valor máximo.
(b) Determinar los parámetros poblacionales para la media y para la desviación estándar,
interpretar.
xi
Media poblacional: μ= N
(xi −μ) 2
Varianza poblacional: σ 2 = N
Desviación estándar poblacional: σ = √σ 2
Al momento de promediar los salarios de la población que en este caso son 30 trabajadores,
nos da como resultado un dato central de 1729,166667(miles). Por otro lado, al calcular la
desviación estándar y ver que esta da un número grande se puede concluir que los números se
pueden extender más allá de la media.
(c) Determinar una muestra aleatoria simple de 8 de esos salario, mostrar el procedimiento
utilizado.
5
(d) Estimar los estadísticos muestrales para la media y para la desviación estándar, comparar
con los parámetros poblacionales.
Media 1783,75
Desviación
estándar 930,406017
Analizando y comparando los datos de las tablas tanto de los parámetros poblacionales y los
estadísticos muestrales con la muestra del punto anterior,se observa que la medidas de la
media, tanto poblacional como muestral ,es bastante parecida con una diferencia de solo
55(en miles), por otro lado las desviación es mucho mayor en la muestra , esto se debe a que
los datos de los salarios son más dispersos,teniendo el salario más bajo y 2 de los salarios más
altos.
6
Diagrama de barras
Soltero 9
Casado 10
Viudo 2
Divorciado 4
7
Diagrama circular
Soltero 36
Viudo 8
Casado 40
Divorciado 16
En el diagrama de barras observamos cada estado civil con su respectiva frecuencia absoluta,
podemos notar que en la empresa donde se tomaron dichos datos hay mayor número de
personas casadas y así mismo la cantidad de viudos es menor a los demás estados civiles. En
conclusión las personas adscritas a la empresa tienen estado civil de casados y solteros ya que
su frecuencia está entre 9 y 10; el resto de personas está entre viudo y divorciado.
En el diagrama circular se puede observar que cada uno de los estados civiles reciben un
segmento en proporción de su importancia relativa. Es por esto que se podría concluir que la
mayoría de personas adscritas a la empresa con un 40% son casados, sólo un 8% son viudos y
el 52% restante se reparten entre solteros y divorciados.
Proporción poblacional:
8
● Soltero
● Casado
● Viudo
● Divorciado
1. Soltero 0,26288206
9. Divorciado 0,31051167
Con el nuevo orden de la lista, escogemos los primeros 8 empleados de forma completamente
aleatoria.
viudo 0 0
Al comparar los datos obtenidos de la población, con los datos obtenidos de la muestra, nos
damos cuenta que el orden del tamaño de los porcentajes se mantiene, es decir, la mayoría
siguen siendo solteros, siguiéndole en cantidad los casados, luego los divorciados y en la
minoría, los viudos. Esto nos da a entender que los porcentajes obtenidos por la población y
por la muestra nos van a dar un resultado bastante similar.
(a) Determinar los parámetros para la proporción de cada actividad comercial, la media y la
desviación estándar para el precio de la acción.
x
Media poblacional: μ = Ni
(xi −μ) 2
Desviación estándar poblacional: σ2 = N
μ =12.812,719
Desviación estándar:
σ 2 = 15951, 39
13
(c) Con la muestra anterior, determinar los estadísticos para la proporción muestral, la media
y desviación estándar muestral.
Proporción muestral:
8
P = 35 = 0, 228
Media muestral:
xi
x= n x = 8733, 375
Desviación estándar:
2 Σ(xi −x)2
s = n−1
14
s2 = 10175,3179
(d) Según su criterio existe una diferencia significativa entre los parámetros poblacionales y
los estadísticos muestrales?
Un parámetro poblacional corresponde a toda medida que describe la variable de interés, en
una población finita de tamaño N y el estadístico muestral es toda medida que proviene de los
datos de una muestra de tamaño n.
EJERCICIO 4. Descargar la base de datos “prueba saber pro y saber 11”. Calcular los
parámetros poblacionales para la media y la desviación estándar de la variable Puntaje saber
pro.
(a) Extraer una muestra aleatoria simple de 30 registros, calcular los estadísticos muestrales.
7725
Estadísticos muestrales:
Media Muestral:
x = 99.18
Desviación estándar muestral:
s = 11.77
(b) Extraer una muestra por el método sistemático de 30 registros, calcular lo estadisticos
muestrales.
1477
➔ Estadísticos muestrales
19
Media Muestral:
x = 100.79
Desviación estándar muestral:
s = 10.08
(c) Extraer una muestra por estratos de 30 registros, calcular los estadísticos muestrales.
1561
➔ Estadísticos muestrales
Media Muestral:
x = 103.87
Desviación estándar muestral:
s = 12.04
CONGLOMERA #ALEATORIO
DO
24
"VALOR DE MATRÍCULA”
(0-1) 0.505757508
(1-2) 0.628013894
(2-3) 0.445520248
(3-4) 0.038213125
(4-5) 0.510126913
➔ Estadísticos muestrales
Media Muestral:
x = 97.19
Desviación estándar muestral:
s = 10.80
EJERCICIO 5. The amount of time that a drive-through bank teller spends on a customer is
a random variable with a mean p = 3.2 minutes and a standard deviation a = 1.6 minutes. If a
random sample of 64 customers is observed, find the probability that their mean time at the
tellerís counter is
(a) at most 2.7 minutes:
x−μ 2.7−3.2
P( x ≤ 2, 7) = P ( σ/√n ≤ ) =P( Z ≤ -2.5)=0.0062
1.6/√64
25
3.2−3.2 3.4−3.2
P (3.2 ≤ x ≤ 3.4) = P ( 1.6/ √64
≤x≤ 1.6/√64
)= P (0 ≤ Z ≤ 1)= 0.3413
26
EJERCICIO 6. Un banco reportó al Gobierno que sus cuentas de ahorro tienen un saldo
promedio de $1890 y una desviación estándar de $264. Los auditores del Gobierno Federal
seleccionan aleatoriamente una muestra de cuentas de ahorro para comprobar la contabilidad
del reporte dado por el banco. Estos van a certificar el reporte del banco solo si el saldo
medio de la muestra difiere a lo más en $50 del saldo medio reportado.
(a) Cuál es la probabilidad de que los auditores certifiquen el informe del banco, si la muestra
es de 144 cuentas?
x−μ
P (1840 ≤ x ≤ 1940) = P ( 1840−1890
√
≤ σ/√n
≤ 1940−1890
)
264/ 144 264/√144
= P (− 2.272 ≤ Z ≤ 2.272) = 0.9769
(b) Cuál es la probabilidad de que los auditores certifiquen el informe del banco, si la muestra
es de 22 cuentas?
(a) ¿Cuál es la probabilidad de encontrar un pago anual promedio de por lo menos $506.640?
[1.9%].
27
506640−500000
P (x ≥ 506.640) = (Z ≥ ) = P (2.099 ≤ Z ) = 0.0179
20000/√40
(b) ¿Cuál es la probabilidad de encontrar un pago anual promedio por debajo de $497.186?
[18,6%].
497.186−500000
P (x ≤ 5497186) = (Z ≤ ) = P (Z ≤− 0.889 ) = 0.187
20000/√40
EJERCICIO 8. De acuerdo con un estudio del Internal Revenue Service, los contribuyentes
tardan 330 minutos en promedio en preparar, copiar y archivar en un medio electrónico la
forma fiscal 1040, con una desviación estándar de 80 minutos. Un organismo de control
selecciona una muestra aleatoria de 25 contribuyentes. Asumiendo que el tiempo se
distribuye aproximadamente normal.
(a) ¿Cuál es la probabilidad de que la media de la muestra sea inferior a 310 minutos?
310−330
P (x ≤ 310) = P (Z ≤ ) = P (Z ≤− 1.25 ) = 0.1056
80/√25
28
(b) ¿Cuál es la probabilidad de que la media de la muestra se encuentre entre 320 y 340
minutos?
x−μ
P (320 ≤ x ≤ 340) = P ( 320−330
80/√25
≤ σ/√n
≤ 340−330
80/√25
) = P (− 0.625 ≤ Z ≤ 0.625) = 0.468
Ejercicio 9. Los pesos de los paquetes que se almacenan en una tienda tienen una
distribución aproximadamente normal con media de 300 kilogramos, con una desviación
estándar de 50 kilogramos.
(a) ¿Cuál es la probabilidad de que el peso promedio de 25 paquetes recibidos al azar supere
los 280 kilogramos?
P (280 ≤ x) = P ( 280−300
√
≤ Z ) = P (− 2 ≤ Z ) = 0.9772
50/ 25
29
(b) ¿Cuál es la probabilidad de que el peso promedio de 10 paquetes recibidos al azar supere
los 280 kilogramos?
P (280 ≤ x) = P ( 280−300
50/√10
≤ Z ) = P (− 1.26 ≤ Z ) = 0.8962