Guía 1
Guía 1
Guía 1
1. Lo siguiente es el detalle de la metodologı́a utilizada por Plaza Pública Cadem disponible en su página
web.
Técnica. Encuestas Telefónicas aplicadas a través de sistema Cati a celulares de prepago y postpago.
Universo. Hombres y mujeres de 18 años o más, habitantes en las 16 regiones del paı́s.
Muestreo. Muestreo probabilı́stico con selección aleatoria de individuos y estratificado previamente por
región.
Muestra y cobertura semanal. 705 casos. Margen de error de ±3, 7 puntos porcentuales al 95% de
confianza. Se alcanzó una cobertura total de 175 comunas. El 90% de la muestra fue aplicada en
población urbana y el 10% en población rural.
Tasa de logro semanal. Para lograr los 705 casos efectivos se realizaron un total de 7.223 llamados, lo
que representa una tasa de éxito del 9,8%.
Ponderación. Los datos fueron ponderados a nivel de sujetos por zona, género y edad, obteniendo una
muestra de representación nacional para el universo en estudio.
a) Indique qué variables de las unidades muestrales se deben tener para realizar el muestreo que se
indica.
b) Indique qué variables creen ustedes que se deberı́an considerar además para lograr representar a la
población de referencia.
c) Se ha discutido que la metodologı́a de esta encuesta no es adecuada. ¿Qué tipo de muestreo creen
que se está aplicando?
d) ¿Qué efecto podrı́a tener en los resultados la tasa de logro de esta encuesta?
2. El reporte financiero del año anterior muestra las estadı́sticas descriptivas de los 3 productos con mayor
venta (en unidades monetarias).
b) ¿Es la media la mejor medida de resumen de para las ventas del producto B?
e) Indique qué producto presenta una mayor concentración de las ventas en torno a la mediana.
1
3. En la publicación Diagnóstico del consumo de tabaco en estudiantes de pregrado de la Pontificia Uni-
versidad Católica de Valparaı́so (2015) el principal objetivo es diagnosticar la situación de consumo de
tabaco en los estudiantes de pregrado de una universidad chilena.
d) ¿Cuál es el rango de edad con mayor frecuencia en la muestra? Indique los estadı́sticos que justifican
su respuesta.
e) Calcule el promedio de la edad de los participantes. Explicı́te los valores utilizados para dicho
cálculo y comente el resultado obtenido.
g) Respecto de la edad de los participantes de este estudio, ¿qué podemos decir acerca de la simetrı́a
de esta variable? Indique los estadı́sticos que justifican su respuesta.
i) Indique una distribución condicional que se presente en esta tabla, señalando las variables involu-
cradas.
2
4. Se tienen los datos x1 , x2 , ..., xn de una variable X e y1 , y2 , ..., yn , valores que toma la variable Y . Si se
hace la transformación ui = mxi + n, comparar los valores de corr(X, Y ) y corr(U, Y ).
a) Esboce una gráfica de dispersión. ¿Es adecuado suponer que las variables se relacionan linealmente?
b) Calcule la covarianza y la correlación entre estas dos variables. ¿Es adecuado suponer que las variables
se relacionan linealmente?
Del 1 al 10 ¿qué probabilidad hay que recomiendes nuestro servicio?, para medir satisfacción con la
empresa.
Del 1 al 10 ¿qué probabilidad hay que deje nuestra empresa?, para medir intención de dejar la empresa.
Del total de clientes, un 60% corresponden a personas de sexo femenino, el 45% están casados y el 70%
tienen edades entre 24 y 45 años.
Además, se sabe por experiencias anteriores que los clientes con mayor edad (sobre 45 años) tienden a
recomendar el servicio en mayor proporción que aquellos de menor edad.
a) Proponga una estrategia de muestreo que sea óptima. Indique los insumos que requiere y la informa-
ción que utiliza.
3
7. El estudio “Manifestaciones clı́nicas y predictores de gravedad en pacientes adultos con infección
respiratoria aguda por coronavirus SARS-CoV-2”(Saldı́as F, et al. 2020) tiene como objetivo describir las
caracterı́sticas clı́nicas, los factores de riesgo y los predictores de hospitalización en pacientes adultos
tratados por infecciones respiratorias agudas asociadas a coronavirus SARS-CoV-2.
La siguiente tabla es un extracto de la Tabla 3
b) ¿Qué condiciones se deben cumplir para poder comparar los promedios de ambos grupos?
d) Indique una distribución condicional que se presente en esta tabla, señalando las variables involucra-
das.
b) Identifique dos variables cuantitativas y dos variables cualitativas medidas en los participantes del
estudio.
c) Describa la distribución de la variable edad. Justifique sus comentarios utilizando los estadı́sticos
descriptivos entregados en la publicación.
d) Describa la distribución de la variable consumo de tabaco. Justifique sus comentarios utilizando los
estadı́sticos descriptivos entregados en la publicación.
f) ¿Qué gráfica escogerı́a para mostrar la distribución de los dı́as de estadı́a en el hospital?
4
9. Su empresa está trabajando en el plan de negocios del año siguiente y le piden que analice las ventas
diarias de un producto en los últimos quince meses. Para esto, usted recopila toda la información
disponible del perı́odo enero 2022 - marzo 2023 que equivale al volumen de ventas de 455 dı́as.
En planes de negocios pasados, se ha eliminado del análisis el 3% de las ventas más altas y el 3% de las
ventas más bajas. Con este criterio, su muestra tendrı́a 427 observaciones.
a) ¿Es posible calificar la muestra de 427 observaciones como aleatoria? Justifique su respuesta.
c) El analista a cargo reporta la mediana como medida de centralidad y los percentiles 25 y 75 como
medidas de dispersión, ¿por qué habrı́a decidido mostrar estas estadı́sticas de resumen?
d) Si el percentil 10 del volumen de ventas es igual a 225 unidades monetarias (u.m.) y máximo es
398 u.m., ¿es correcto afirmar que el 10% son volúmenes de ventas mayores a 398?
Usted construye la siguiente gráfica para los volúmenes de ventas para dı́as de semana (L-V) y fines de
semana (S-D).
b) ¿Qué podemos decir de la distribución del volumen de ventas en dı́as de semana comparado con
dı́as de fin de semana?
d) Usted calcula además la correlación entre los volúmenes de venta y el número de visitas diarias a la
página web, obteniendo un valor de 0,82. ¿Esta información es suficiente para suponer que estas
variables se asocian linealmente?
5
10. Su empresa está trabajando en el plan de negocios del año siguiente y le piden que analice las ventas
diarias de un producto en los últimos quince meses. Para esto, usted recopila toda la información
disponible del perı́odo enero 2022 - marzo 2023 que equivale al volumen de ventas de 455 dı́as.
En planes de negocios pasados, se ha eliminado del análisis el 3% de las ventas más altas y el 3% de las
ventas más bajas. Con este criterio, su muestra tendrı́a 427 observaciones.
a) ¿Es posible calificar la muestra de 427 observaciones como aleatoria? Justifique su respuesta.
c) El analista a cargo reporta la mediana como medida de centralidad y los percentiles 25 y 75 como
medidas de dispersión, ¿por qué habrı́a decidido mostrar estas estadı́sticas de resumen?
d) Si el percentil 10 del volumen de ventas es igual a 225 unidades monetarias (u.m.) y máximo es
398 u.m., ¿es correcto afirmar que el 10% son volúmenes de ventas mayores a 398?
11. Un estudio de la relación entre la edad y varias funciones visuales, por ejemplo, agudeza y percepción de
la profundidad, reportó las siguientes observaciones sobre el área de la lámina esclerótica (mm2 ) de
cabezas de nervios ópticos humanos:
d) Si los dos valores muestrales más grandes, 4.33 y 4.52 hubieran sido 5.33 y 5.52, ¿cómo afecta esto a
la media, mediana y desviación estándar? Explique.
e) Si a la muestra original se agrega una décimo octava observación correspondiente a 4.60, ¿cómo
varı́an la media, mediana y desviación estándar? Explique.