Ej Regresión01
Ej Regresión01
Ej Regresión01
CURSO:
Anlisis de Datos
PROFESOR:
TOMS MINAURO LA TORRE
Pregunta 1
El Seor Juan Guerrero ha sido nombrado recientemente director de mercadotecnia de nuevos productos de
la empresa INCASUR. Actualmente est considerando la posibilidad de comercializar un nuevo producto
altamente nutritivo a base de Kiwicha. Este producto podra ser usado como un canap, un producto para
das de campo o como un elemento diettico. Debido a esta amplia gama de usos posibles, la compaa
tena una gran dificultad para definir el mercado. El producto era visualizado sin tener competidores directos.
Las pruebas de mercado y las primeras ventas del producto fueron muy alentadoras. Estos primeros
resultados condujeron al seor Guerrero a pensar que el producto poda vender fcilmente dos millones de
cajas (24 paquetes en cada caja) bajo el programa propuesto de mercadotecnia que implicaba un precio de
$ 0.24 por paquete y un programa de publicidad que implicaba $3 millones en gastos por ao.
Debido a que exista gran incertidumbre entre la administracin de INCASUR en cuanto a las ventas del
primer ao y los aos subsecuentes, o en cuanto a la mejor campaa introductoria, se decidi que se
llevara a cabo otra prueba de mercado de seis meses. Los objetivos de la prueba fueron:
Las tres variables incluidas en el diseo experimental fueron el precio, los gastos de publicidad y la
localizacin del producto en de la tienda. Se probaron tres precios (24, 29, 34 centavos), dos niveles de
publicidad (una simulacin de un plan de introduccin de $3 millones (0) y otra de $5 millones (1)), y dos
localizaciones (colocar el producto en la seccin de pan (0) versus la seccin de desayunos instantneos
(1)). Los precios y la ubicacin fueron variados a lo largo de las tiendas dentro de cuatro ciudades. Los
datos fueron analizados sobre una base bimestral. La medida de respuestas usada en el anlisis fue el
promedio de ventas unitarias por mes.
La informacin recolectada se muestra en el libro de Excel.
a.La correlacin entre el precio y las ventas es grande y negativa para los tres perodos
de tiempo. Qu le indica esto acerca de la forma como funciona el precio?
b.Explique la correlacin entre la publicidad y las ventas. Qu le est sucediendo a la
publicidad a lo largo del tiempo?
c.Note que las correlaciones entre la publicidad y el precio casi no existe. Por qu?
d.Corra regresiones para cada una de las tres variables de ventas (S1, S2 y S3) usando
P, A y L como variables independientes. Qu implican estas regresiones acerca del
efecto de precio? De la publicidad? De la localizacin?
e.Haga una regresin que incluya las variables I y V. Cambian sus juicios acerca de los
efectos de precio, de la publicidad y de la localizacin? Por qu?
f. Verifique los residuos para identificar observaciones que no se ajustan al modelo.
Por qu no se ajustan?
g.Qu corridas de regresin adicionales, debe hacerse para completar el anlisis de
estos datos?
h.Haga un resumen ejecutivo de todas sus conclusiones.
Pregunta 2
El seor Fred G. Hire es el gerente de recursos humanos del Centro Mdico St. Luke. Como parte de su
reporte anual al presidente de dicha institucin se le pidi presentar un anlisis de los empleados a
sueldo. Debido a que hay ms de 1 000 trabajadores, no tiene el perso nal para reunir informacin
respecto a cada uno de los empleados en cuestin, as que selecciona una muestra aleatoria de 30. Por
cada trabajador registra el pago laboral mensual, los meses de servicio en St. Luke, el sexo (1 =
masculino, 0 = femenino), y si el empleado tiene un puesto tcnico o de oficina. Los que hacen trabajos
tcnicos se codifican como 1, y los que realizan actividades de escritorio, como 0. Los datos los
encontrar en el file de Excel.
a) Determine la ecuacin de regresin usando el sueldo como la variable
dependiente, y las otras cuatro variables como variables independientes.
b) Cul es el valor de R2? Comente respecto a este valor.
c) Realice una prueba global de hiptesis para determinar si algunas de las variables
independientes son diferentes de cero.
d) Realice una prueba individual para determinar si se puede eliminar alguna de las
variables independientes.
e) Vuelva a establecer la ecuacin de regresin utilizando slo las variables
independientes significativas. Cunto ms gana al mes el hombre que la mujer?
Hay alguna diferencia si el empleado tiene un puesto tcnico o uno de oficina?
Pregunta 3
Una compaa que vende hardware al por mayor surte pedidos en un extenso alma cn. El volumen de
los pedidos flucta sustancialmente de un da a otro y la compaa tiene como poltica surtir cada pedido
el da de su recepcin. Las rdenes se reciben por telfono y por correo alrededor de las 10 a.m. El
supervisor del almacn estima el tiempo correspondiente a cada orden y asigna el nmero necesario de
trabajadores para atenderlas. Los trabajadores restantes, si los hay, son asignados a otras tareas y no
pueden ser llamados hasta el da siguiente. Frecuentemente, las estimaciones del tiempo por pedido que
hace el supervisor suelen ser errneas, de modo que en ocasiones algunos trabajadores estn ociosos y
en otras se les deben pagar horas extra. Se realiza un estudio de regresin para tratar de mejorar la
prediccin del tiempo correspondiente a cada pedido. La mini computadora que se utiliza para procesar
los pedidos y llevar el control de inventarios puede calcular con mucha facilidad los tiempos previstos,
una vez determinado el modelo.
Los artculos se clasifican de acuerdo con la frecuencia con que se piden como frecuentes, moderados y
poco comunes. Los artculos poco comunes estn almacenados en las partes ms distantes del almacn
y, por lo tanto, se requiere de un mayor tiempo para traerlos. Se piensa que el nmero de artculos
pedidos de cada categora y el tamao promedio por artculo influyen en el tiempo necesario para surtir
el pedido. La mayora de los artculos se piden por paquetes, surtindose los restantes como artculos de
"caja suelta" (que en su mayora son poco comunes). Ciertos pedidos requieren empaques especiales
para proteger artculos que son frgiles. El supervisor asigna cada orden de este tipo a uno de dos
puestos para empaquetado, A o B. Todos los artculos se empaquetan en una estacin central y se
colocan en contenedores de madera. Para mover los contenedores a los camiones de reparto se utiliza
un montacargas de horquilla.
Se selecciona una muestra de 50 pedidos; se tiene cuidado de incluir rdenes de compra de tipos
relativamente extremos (pequeos y grandes, integrados principalmente por paquetes y por cajas
sueltas, por artculos frecuentes y por artculos poco comunes). Se registran los valores
correspondientes a las siguientes variables:
TIME:
NUMFREQ:
NUMMOD:
NUMRARE:
NUMLOOSE:
AVSZCAR:
AVSZLB:
SPECIALS:
SKIDS:
El supervisor piensa que las variables de prediccin ms importantes son las que comienzan con el
prefijo NUM, pues gran parte del tiempo dedicado a surtir un pedido se utiliza para que los trabajadores
se desplacen al lugar apropiado. No obstante, este tiempo de traslado no parece ser proporcional al
nmero de artculos, pues un trabajador puede combinar artculos que se encuentran en la misma rea
del almacn. El nmero de piezas de cada artculo tambin es relevante, pues se requiere de algn
tiempo para tomarlas del estante. Se espera que este tiempo sea proporcional a AVSZ. Tambin se
espera que el tiempo destinado a trasladar los contenedores sea proporcional a SKIDS. Con los datos
que encontrar en el file de Excel.:
b)
c)
d)
e)
SOLIDS
PH
LOWER
UPPER
THICK
VARIDRIV
Estructura utilizada para controlar la velocidad del tambor. Puede ser diferente
de DRUMSPD debido a deficiencias mecnicas.
DRUMSPD
Velocidad a la cual estaba girando el tambor cundo se recogi el pastel de filtro.
Medida con un cronmetro.
Los datos obtenidos al monitorear el proceso en varias ocasiones diariamente durante 20 das se
presentan en el file de excel
Desarrolle un modelo de regresin para predecir el porcentaje de slidos. Escriba un resumen
ejecutivo al presidente de la Compaa Mountain States Potatos.
Pregunta 5
Los datos de la tabla siguiente, contienen el volumen de produccin de arroz entre los aos 1997 y 2003, en
miles de toneladas, de una regin del pas.
Ao
1999
2000
2001
2002
2003
2004
Total
I
284.24
327.11
337.05
397.07
495.48
442.35
2283.3
Trimestre
II
III
319.95
311.00
310.04
328.45
384.86
427.79
426.16
407.10
534.27
506.23
517.07
478.56
2492.35
2459.13
IV
345.33
313.38
428.38
469.30
582.46
573.85
2712.7
Total
1260.5
1279.0
1578.1
1699.6
2118.4
2011.8
9947.48
a. Utilizando el mtodo de los promedios mviles halle los ndices estacionales para el
volumen de produccin de arroz.
b. Explique estos ndices, qu factores son los que podran explicar esta componente
de la serie de tiempo.
c. Determine ahora la lnea de tendencia.
d. Explique a que factores se les puede atribuir esta componente y finalmente,
e. Pronostique la produccin para los cuatro trimestres de este ao utilizando el
modelo multiplicativo.
f.
Est de acuerdo con las predicciones del modelo? Es un modelo adecuado para
pronosticar esta serie? Haga un breve comentario al respecto.
Pregunta 6
American Autos S.A. ha estado operando en nuestra ciudad durante los ltimos cinco aos. En ese tiempo,
la venta de autos de su modelo econmico ha crecido desde 14 unidades el 2000 hasta los 81 en el 2004.
Juan Castro, propietario del negocio desea realizar un pronstico de la venta de autos de dicho modelo para
el ao 2005. Los datos aparecen en la tabla siguiente:
Ao
2000
2001
2002
2003
2004
Total
I
3
9
6
17
18
53
Trimestre
II
III
2
4
6
12
5
12
9
12
10
18
32
58
IV
5
14
18
22
35
94
Total
14
41
41
60
81
237
b. Realice un anlisis de influencias estacionales sobre los datos. Indique los ndices
estacionales y haga comentarios acerca de las ventas en trimestres altos y bajos.
Tiene sentido intuitivo esos ndices estacionales? Describa por qu.
c. Elimine el efecto del ndice estacional de la serie y determine la ecuacin de
tendencia.
Mes
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre
a.
b.
c.
d.
e.
1999
124.2
120.5
141.9
140.4
151.0
149.8
145.3
153.8
144.8
143.1
149.6
177.4
2000
133.3
128.0
149.2
145.8
155.0
154.4
149.7
158.2
146.3
151.5
156.1
179.7
Ao
2001
134.5
131.6
152.7
151.7
163.5
157.5
158.3
163.4
149.8
155.5
159.1
185.2
2002
141.9
142.8
154.5
158.8
165.7
164.2
165.4
165.9
160.2
168.7
167.0
204.0
2003
148.4
145.0
164.6
170.3
176.1
175.7
177.7
177.1
171.1
176.4
180.9
218.3