Finance & Money Management > Economics">
Nothing Special   »   [go: up one dir, main page]

Evidencia 2

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 35

Práctica de ejercicios

Nombre: Karla Guzmán Díaz Matrícula:


Nombre del curso: Nombre del profesor:
Estadística y pronósticos para la Ing. Claudia Judith Cavazos Trejo
toma de decisiones
Módulo: Actividad:
1. Estadística y series de tiempo Evidencia 2

Fecha: 9 de marzo de 2020.


Bibliografía:
 Pineda, O. (2003). Técnicas de pronósticos para la toma de
decisiones empresariales, México: ALFAOMEGA.
 Rodríguez, J., Pierdant, A. y Rodríguez, C. (2014). Estadística
aplicada II: Estadística en Administración para la toma de
decisiones.
 Hanke, J. E. y Wichern, D. W. (2010). Pronósticos en los negocios (9ª
ed.). México: Pearson.
ISBN: 9786074427004
 Bowreman, B. L., O' Conell, R. T. y Koehler, A. B.
(2007). Pronósticos, series de tiempo y regresión (4ª ed.). México:
Cengage Learning.
ISBN: 9789706866066 
 Montgomery D.C., Runger (2013). Probabilidad y estadística aplicadas
a la ingeniería (2ª ed.) México: Limusa
 Walpole R.E., Myers R.H, Myers S.L., Ye K. (2012). Probabilidad y
estadística para ingeniería y ciencias (9ª ed.), México: Pearson.

Desarrollo: Resolución de problemas

1. ¿Existe alguna relación entre el tiempo en minutos que se utiliza para llegar a un
centro comercial y la distancia desde la casa en donde tú vives? Entrevista a 20
personas y pregúntales el tiempo que tardan en llegar al centro comercial y la distancia
a su casa. Después denomina a la variable tiempo en minutos como Y y a la distancia
en km como X.
2. Contesta lo siguiente:
Práctica de ejercicios

a. Realiza el diagrama de dispersión y describe el comportamiento de ambas


variables. ¿Qué clase de relación crees que existe entre estas dos variables? ¿A
mayor distancia es mayor el tiempo?

Diagrama de dispersión
14

12

10
Distancia (km)

0
8 10 12 14 16 18 20 22 24
Tíempo (minutos)

b. Calcula la recta de regresión de mínimos cuadrados.

Distancia
Tiempo (Kilometros)
Persona (minutos)(X) (Y) xy X2 Y2
Práctica de ejercicios

1 11 12 132 121 144


2 16 9.5 152 256 90.25
3 10 4.5 45 100 20.25
4 13 5.6 72.8 169 31.36
5 15 8.5 127.5 225 72.25
6 12 7 84 144 49
7 15 3 45 225 9
8 19 12.5 237.5 361 156.25
9 11 6.5 71.5 121 42.25
10 12 7.6 91.2 144 57.76
11 14 11.3 158.2 196 127.69
12 15 7.8 117 225 60.84
13 12 3.7 44.4 144 13.69
14 22 12 264 484 144
15 12 5 60 144 25
16 15 7 105 225 49
17 10 4.9 49 100 24.01
18 9 3.8 34.2 81 14.44
19 11 4.3 47.3 121 18.49
20 10 4.2 42 100 17.64
SUMA 264 140.7 1979.6 3686 1167.17

X́ =¿ 13.2 Ý =¿ 58.3585

Recta
14

12 f(x) = 0.61 x − 0.99


R² = 0.42
10
Distancia (km)

0
8 10 12 14 16 18 20 22 24
Tíempo (minutos)

y ' =a 0+ a1 x
Práctica de ejercicios

En donde los coeficientes de regresión a 0 y a1 se obtendrán a partir del


sistema de ecuaciones normales siguiente:
n a 0+ a1 ∑ x =∑ y ……………1

a 0 ∑ x +a1 ∑ x 2=∑ xy……Donde n=20


Sustituyendo valores en el sistema se obtiene que:
20 a0 +264 a1=140.7

264 a 0+ 3686 a1=1979.6

Resolviendo el sistema de ecuaciones obtenemos los valores de a0 y a 1

a0=-0.9925

a1=0.6081

c. ¿Existe evidencia que indique que a mayor distancia es mayor el tiempo en


llegar? Prueba la significancia de la recta de regresión con un nivel de significancia
α = 0.01.
d. ¿Es significativa esta regresión? Realiza todas las etapas de una prueba
de hipótesis. Concluye en el contexto del problema.

Dado que existe relación lineal entre X y Y, lo cual implica que la pendiente no
es cero, hay evidencia de que la variable y está afectada por la variable
independiente.

Establecimiento de hipótesis:
H0 : β1 = 0 en oposición a Ha : β1≠ 0

Error estándar

∑ y 2−b0 ∑ y−b1 ∑ xy
Sε =
√ n−2

En donde:
Práctica de ejercicios

X = valores de la variable independiente


Y = valores de la variable dependiente
b0 = ordenada al origen
b1 = pendiente de la ecuación de regresión
n = número de puntos utilizados para ajustar la línea de regresión

1167.17−(−0.9925 )( 140.7 )−( 0.6081)(1979.6)


Sε =
√ 20−2

Sε =2.3923

1. Establecimiento de hipótesis:

H0 : β1 = 0 en oposición a Ha : β1≠ 0

Estadístico de prueba

b1−β 1
t calculada=
sb 1

En donde sb1 es error estándar de b1 y se define como:


sb = 2 2
1

√ ∑ x −n( x́ )

2.3923
Sb = 1
√ 3686−(20∗13.22)
Sb =0.1686
1

0.6081−0
t calculada=
0.1686
Práctica de ejercicios

t calculada=3.605

Establecer la región de rechazo con α = 0.01. En este caso:

tα/2 (n - 2) = t0.05/2 (20 - 2) = t0.025 (18) = 2.552.

Regla de decisión: Rechazar H0 si |tcalculada| es mayor que 2.552

Como la tcalculada es mayor que la t obtenida de tablas, se rechaza la hipótesis


nula.

e. Pronostica el tiempo en llegar al centro comercial si la distancia es de 3, 4 y


6 kilómetros de distancia.

Una vez obtenida la ecuación de regresión lineal se sustituyen los valores de x


para obtener a y’

 0.6082 ( 3 )−0.9926=0.832
 0.6082 ( 4 )−0.9926=1.4402
 0.6082 ( 6 )−0.9926=2.6566

f. Calcula el coeficiente de correlación.

Coeficiente de determinación
n

∑ ( y i ´ − ý )2
r 2= i=1n
∑ ( y i− ý )2
i=1

Coeficiente de correlación
n

r=
√ ∑ ( y i ´ − ý)2
i=1
n

∑ ( y i− ý )2
i=1
Práctica de ejercicios

PERDIDA
TIEMPO
DE PESO XY X2 Y2 y' ( y ' − ý )2 ( y ' − y )2
(x)
(y)
11 12 132 121 144 5.6976 1.78863876 24.651225
16 9.5 152 256 90.25 8.7386 2.90225296 6.076225
10 4.5 45 100 20.25 5.0894 3.78535936 6.426225
13 5.6 72.8 169 31.36 6.914 0.014641 2.059225
15 8.5 127.5 225 72.25 8.1304 1.19990116 2.146225
12 7 84 144 49 6.3058 0.53173264 0.001225
15 3 45 225 9 8.1304 1.19990116 16.281225
19 12.5 237.5 361 156.25 10.5632 12.44819524 29.866225
11 6.5 71.5 121 42.25 5.6976 1.78863876 0.286225
12 7.6 91.2 144 57.76 6.3058 0.53173264 0.319225
14 11.3 158.2 196 127.69 7.5222 0.23736384 18.190225
15 7.8 117 225 60.84 8.1304 1.19990116 0.585225
12 3.7 44.4 144 13.69 6.3058 0.53173264 11.122225
22 12 264 484 144 12.3878 28.65246784 24.651225
12 5 60 144 25 6.3058 0.53173264 4.141225
15 7 105 225 49 8.1304 1.19990116 0.001225
10 4.9 49 100 24.01 5.0894 3.78535936 4.558225
9 3.8 34.2 81 14.44 4.4812 6.52189444 10.465225
11 4.3 47.3 121 18.49 5.6976 1.78863876 7.480225
10 4.2 42 100 17.64 5.0894 3.78535936 8.037225
10 140.7 1979.6 3686 1167.17   74.42534488 177.3455

Promedio Promedio
7.035 13.2
y= x=

r ^2= 0.419663

74.4253
r 2= =0.4196
177.3445

r =√ 0.4196=0.6478

g. Determina e interpreta el coeficiente de determinación en el contexto del


problema.

Se calcula Sx:
Práctica de ejercicios

∑ (x−x́ ¿)2 ¿
sx=
√ n−1

74.4253
sx=
√ 19
=1.9791

Se calcula Sy:

∑ ( y− ý ¿)2 ¿
sx=
√ n−1

177.3455
sy=
√ 19
=3.0551

Y se calcula el coeficiente de correlación r:

1.9791
r= =0.6478
3.0551

h. Realiza un breve resumen de los hallazgos.

Dado que existe relación lineal entre X y Y, lo cual implica que la


pendiente no es cero, hay evidencia de que la variable y está afectada
por la variable independiente. Esto se comprueba con el rechazo de la
hipótesis nula. Es decir que existe una relación entre la distancia y el
tiempo ascendente del trayecto de los alumnos de su casa a la escuela.

3. ¿Existe relación entre el peso de una persona y la medida de su cintura en


centímetros? Selecciona 10 personas del género masculino y 10 personas del género
femenino y pídeles que te den su peso en kilogramos y la medida de su cintura en
centímetros. Posteriormente denomina a la variable peso como Y y a la medida de la
cintura como X.

Gener cm peso      
o Persona x Y xy x y
Práctica de ejercicios

1 55 48 2640 3025 2304


2 75 60 4500 5625 3600
3 79 67 5293 6241 4489
4 62 58 3596 3844 3364
MUJERES

5 67 66 4422 4489 4356


6 66 63 4158 4356 3969
7 74 66 4884 5476 4356
8 69 67 4623 4761 4489
9 78 69 5382 6084 4761
10 80 78 6240 6400 6084
11 72 64 4608 5184 4096
12 76 69 5244 5776 4761
13 80 75 6000 6400 5625
HOMBRES

14 84 83 6972 7056 6889


15 86 80 6880 7396 6400
16 87 84 7308 7569 7056
17 87 82 7134 7569 6724
18 88 86 7568 7744 7396
19 90 87 7830 8100 7569
20 98 93 9114 9604 8649
SUMA 1553 1445 114396 122699 106937

Gráfica de dispersión y línea de tendencia


100

90 f(x) = 1.04 x − 8.46


R² = 0.9
80

70

60
Peso (kg)

50

40

30

20

10

0
50 60 70 80 90 100 110

Cintura (cm)
Práctica de ejercicios

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.9478636
Coeficiente de determinación R^2 0.89844541
R^2 ajustado 0.89280348
Error típico 3.44909762
Observaciones 20

ANÁLISIS DE VARIANZA
Grados de Valor crítico de
  libertad Suma de cuadrados Promedio de los cuadrados F F
Regresión 1 1894.417061 1894.417061 159.244567 2.23564E-10
Residuos 18 214.132939 11.89627439
Total 19 2108.55      

Probabilida Superior
  Coeficientes Error típico Estadístico t d Inferior 95% 95% Inferior 95.0%
Intercepción 15.2014394 5.008426094 3.035172953 0.0071189 4.679126649 25.7237522 4.679126649
Variable X 1 0.86433994 0.068493959 12.61921419 2.2356E-10 0.720439471 1.00824041 0.720439471
Práctica de ejercicios

4. Investiga acerca de 20 casas en venta en donde las variables son Y (metros de


construcción) y X (metros de terreno), y realiza lo que se te indica:

x (metros Y (metros de
Casas
de terreno) construcción)
1 60 40
2 80 30
3 70 60
4 80 50
5 50 40
6 90 50
7 70 60
8 60 70
9 50 50
10 90 60
11 50 30
12 70 40
13 50 60
14 80 40
15 90 50
16 60 70
17 60 50
18 70 70
19 80 50
20 90 90

5.- Contesta lo siguiente:

a. Realiza el diagrama de dispersión y describe el comportamiento de ambas


variables.
Práctica de ejercicios

Diagrama de dispersión
100
90
80
70
Construcción

60
50
40
30
20
10
0
45 50 55 60 65 70 75 80 85 90 95
Terreno

b. ¿Qué clase de relación crees que existe entre estas dos variables?

La correlación sugiere que mayor se construya en metros el terreno


tendrá que ser mayor en metros. Por lo tanto, una variable dependerá de
la otra para incrementar o disminuir si valor.

c. Calcula la recta de regresión de mínimos cuadrados.

x (metros Y (metros de
Casas xy X2 Y2
de terreno) construcción)
1 60 40 2400 3600 1600
2 80 30 2400 6400 900
3 70 60 4200 4900 3600
4 80 50 4000 6400 2500
5 50 40 2000 2500 1600
6 90 50 4500 8100 2500
7 70 60 4200 4900 3600
8 60 70 4200 3600 4900
9 50 50 2500 2500 2500
10 90 60 5400 8100 3600
11 50 30 1500 2500 900
12 70 40 2800 4900 1600
13 50 60 3000 2500 3600
14 80 40 3200 6400 1600
15 90 50 4500 8100 2500
16 60 70 4200 3600 4900
17 60 50 3000 3600 2500
18 70 70 4900 4900 4900
Práctica de ejercicios

19 80 50 4000 6400 2500


20 90 90 8100 8100 8100
SUMA 1400 1060 75000 102000 60400

Línea de tendencia
100
90
80
70
Construcción

60
50 f(x) = 0.2 x + 39
R² = 0.04
40
30
20
10
0
45 50 55 60 65 70 75 80 85 90 95
Terreno

y ' =a 0+ a1 x

En donde los coeficientes de regresión a 0 y a1 se obtendrán a partir del


sistema de ecuaciones normales siguiente:
n a 0+ a1 ∑ x =∑ y ……………1

a 0 ∑ x +a1 ∑ x 2=∑ xy……Donde n=20


Sustituyendo valores en el sistema se obtiene que:
20 a0 +1400 a 1=1060

1400 a0 +102000 a1=75000

Resolviendo el sistema de ecuaciones obtenemos los valores de a0 y a 1

a0=39

a1=0.2

d. Prueba la significancia de la recta de regresión con un nivel de significancia


α = 0.01.
e. ¿Es significativa esta regresión? Explica. Concluye en el contexto del
problema. Realiza todas las etapas de una prueba de hipótesis.
Práctica de ejercicios

Establecimiento de hipótesis:
H0 : β1 = 0 en oposición a Ha : β1≠ 0

Error estándar

∑ y 2−b0 ∑ y−b1 ∑ xy
Sε =
√ n−2

En donde:

X = valores de la variable independiente


Y = valores de la variable dependiente
b0 = ordenada al origen
b1 = pendiente de la ecuación de regresión
n = número de puntos utilizados para ajustar la línea de regresión

60400−( 39 ) ( 1060 )−(0.2)(75000)


Sε =
√ 20−2

Sε =15.02

1. Establecimiento de hipótesis:

H0 : β1 = 0 en oposición a Ha : β1≠ 0

Estadístico de prueba

b1−β 1
t calculada=
sb 1

En donde sb1 es error estándar de b1 y se define como:


sb = 2 2
1

√ ∑ x −n( x́ )
Práctica de ejercicios

15.02
Sb = 1
√ 102000−(20∗702)
Sb =0.2374
1

0.2−0
t calculada=
0.2374

t calculada=0.8424

Establecer la región de rechazo con α = 0.01. En este caso:

tα/2 (n - 2) = t0.05/2 (20 - 2) = t0.025 (18) = 2.552.

Regla de decisión: Rechazar H0 si |tcalculada| es mayor que 2.552

Como la tcalculada es mayor que la t obtenida de tablas, se acepta la hipótesis


nula.

f. Pronostica los metros de construcción cuando los metros de terreno son de


90, 100 y 150 metros.

 39+0.2 ( 90 ) =57
 39+0.2 ( 100 )=59
 39+0.2 ( 150 )=69

g. Calcula el coeficiente de correlación.

Se calcula Sx:

∑ (x−x́ ¿)2 ¿
sx=
√ n−1
Práctica de ejercicios

160
sx=
√ 19
=2.90

Se calcula Sy:

∑ ( y− ý ¿)2 ¿
sx=
√ n−1

4220
sy=
√ 19
=14.903

Y se calcula el coeficiente de correlación r:


Práctica de ejercicios

x (metros Y (metros de
Casas xy X2 Y2 y' ( y ' − ý )2 ( y− ý)2
de terreno) construcción)
1 60 40 2400 3600 1600 51 4 169
2 80 30 2400 6400 900 55 4 529
3 70 60 4200 4900 3600 53 0 49
4 80 50 4000 6400 2500 55 4 9
5 50 40 2000 2500 1600 49 16 169
6 90 50 4500 8100 2500 57 16 9
7 70 60 4200 4900 3600 53 0 49
8 60 70 4200 3600 4900 51 4 289
9 50 50 2500 2500 2500 49 16 9
10 90 60 5400 8100 3600 57 16 49
11 50 30 1500 2500 900 49 16 529
12 70 40 2800 4900 1600 53 0 169
13 50 60 3000 2500 3600 49 16 49
14 80 40 3200 6400 1600 55 4 169
15 90 50 4500 8100 2500 57 16 9
16 60 70 4200 3600 4900 51 4 289
17 60 50 3000 3600 2500 51 4 9
18 70 70 4900 4900 4900 53 0 289
19 80 50 4000 6400 2500 55 4 9
20 90 90 8100 8100 8100 57 16 1369
SUMA 1400 1060 75000 102000 60400   160 4220
Práctica de ejercicios

h. Determina e interpreta el coeficiente de determinación en el contexto del


problema.

R2= (r)2= (0.977697871)2 = 0.9558931280 como es mas común


expresarlo, en porcentaje, 95.5893128%, lo cual se interpreta como la
variabilidad de Y (metros de construcción) que se explica por la X
(metros de terreno).

i. Realiza un breve resumen de los hallazgos.

Como nos podemos dar cuenta que a mayor metro de terreno mayor
será los metros de construcción como nos podemos percatar en el
diagrama de dispersión y así como en la hipótesis que se realizó.

5. Revisa la siguiente información tomada de la sección de avisos de ocasión.

Precio Metros deMetros deNúmero de


(miles deterreno X construcción X recámaras X
1 2 3

pesos)
Y
2700 288 378 4
1895 160 252 4
1397 230 252 4
1795 234 167 2
650 72 124 4
850 128 262 4
3875 188 246 4
4300 390 380 3
11850 885 775 4
11900 885 775 3
3250 150 233 3
6700 406 420 3
5499 320 390 4
Práctica de ejercicios

4250 170 244 4


4250 170 233 3
470 160 127 3
500 90 73 2
550 91 73 2
650 110 90 2
550 90 74 2
620 172 76 2
1700 189 374 4
2330 300 330 4
1600 136 140 3
1100 144 290 3
Información obtenida de: http://www.avisosdeocasion.com solo para fines educativos.

7. Utiliza Excel o cualquier otro paquete estadístico como Minitab para realizar lo
siguiente:
a. Estima el modelo de regresión múltiple e interpreta los coeficientes de la
ecuación de regresión lineal múltiple.

Utilizando el programa estadístico SPSS se obtiene el siguiente resumen:

Resumen del modelob


Modelo R cuadrado Error típ. de la
R R cuadrado corregida estimación
1 .940a .883 .866 1162.00151
dime
nsion
0

a. Variables predictoras: (Constante), x3, x1, x2


b. Variable dependiente: y

ANOVAb
Modelo Suma de Media
cuadrados gl cuadrática F Sig.
1 Regresión 2.138E8 3 7.126E7 52.776 .000a
Residual 2.836E7 21 1350247.501
Total 2.421E8 24
a. Variables predictoras: (Constante), x3, x1, x2
b. Variable dependiente: y
Práctica de ejercicios

Coeficientesa
Modelo Coeficientes
Coeficientes no estandarizados tipificados
B Error típ. Beta t Sig.
1 (Constante) -602.569 1152.574 -.523 .607
x1 9.142 4.185 .610 2.184 .040
x2 5.934 5.217 .351 1.138 .268
x3 -77.810 445.239 -.020 -.175 .863
a. Variable dependiente: y

Estadísticos sobre los residuosa


Desviación
Mínimo Máximo Media típica N
Valor pronosticado 480.2847 11853.8555 3009.2400 2984.56204 25
Residual -1457.15393 2161.66675 .00000 1086.95288 25
Valor pronosticado tip. -.847 2.963 .000 1.000 25
Residuo típ. -1.254 1.860 .000 .935 25
a. Variable dependiente: y
Práctica de ejercicios

De acuerdo con el programa Statgraphics se obtienen las siguientes gráficas:


Práctica de ejercicios

Gráfico de efecto de componentes

Observados Vs. Predichos

Residuos Vs. x
Práctica de ejercicios

Residuos Vs. Predichos

La ecuación de la regresión lineal múltiple es la siguiente:

y i=β 0 + β 1 x 1 + β 2 x 2+ β3 x 3
Práctica de ejercicios

Para obtener los coeficientes se realizará mediante el siguiente sistema de


ecuaciones:

n n n n
n β 0 + β 1 ∑ x i 1+ β2 ∑ x i2 + β 3 ∑ xi 3 =∑ y i
i=1 i=1 i=1 i=1

n n n n n
β 0 ∑ xi 1 + β 1 ∑ x 2i 1+ β2 ∑ x i 1 x i 2+ β 3 ∑ x i1 xi 3 =∑ x i1 y i
i=1 i=1 i=1 i=3 i=1

n n n n n
2
β 0 ∑ xi 2 + β 1 ∑ x i 2 x i 1+ β2 ∑ x + β 3 ∑ x i2 x i3 =∑ x i2 y i
i2
i =3 i=1 i=1 i=1 i=1

n n n n n
β 0 ∑ xi 3 + β 1 ∑ x i 3 x i 1 + β 2 ∑ x i 3 x i 2+ β3 ∑ x 2i 3=∑ x i 3 y i
i=1 i=1 i=1 i=1 i=1
Práctica de ejercicios

Precio Metros de Metros de Número


OBSERVACIONE
(miles de Terreno construcció de x12 x1*x2 x1*x3 x1*y x22 x2*x3 x2*y x32 x3*y
S
pesos) Y X1 n recámaras
1 2700 288 378 4 82944 108864 1152 777600 142884 1512 1020600 16 10800
2 1895 160 252 4 25600 40320 640 303200 63504 1008 477540 16 7580
3 1397 230 252 4 52900 57960 920 321310 63504 1008 352044 16 5588
4 1795 234 167 2 54756 39078 468 420030 27889 334 299765 4 3590
5 650 72 124 4 5184 8928 288 46800 15376 496 80600 16 2600
6 850 128 262 4 16384 33536 512 108800 68644 1048 222700 16 3400
7 3875 188 246 4 35344 46248 752 728500 60516 984 953250 16 15500
8 4300 390 380 3 152100 148200 1170 1677000 144400 1140 1634000 9 12900
9 11850 885 775 4 783225 685875 3540 10487250 600625 3100 9183750 16 47400
10 11900 885 775 3 783225 685875 2655 10531500 600625 2325 9222500 9 35700
11 3250 150 233 3 22500 34950 450 487500 54289 699 757250 9 9750
12 6700 406 420 3 164836 170520 1218 2720200 176400 1260 2814000 9 20100
13 5499 320 390 4 102400 124800 1280 1759680 152100 1560 2144610 16 21996
14 4250 170 244 4 28900 41480 680 722500 59536 976 1037000 16 17000
15 4250 170 233 3 28900 39610 510 722500 54289 699 990250 9 12750
16 470 160 127 3 25600 20320 480 75200 16129 381 59690 9 1410
17 500 90 73 2 8100 6570 180 45000 5329 146 36500 4 1000
18 550 91 73 2 8281 6643 182 50050 5329 146 40150 4 1100
19 650 110 90 2 12100 9900 220 71500 8100 180 58500 4 1300
20 550 90 74 2 8100 6660 180 49500 5476 148 40700 4 1100
21 620 172 76 2 29584 13072 344 106640 5776 152 47120 4 1240
22 1700 189 374 4 35721 70686 756 321300 139876 1496 635800 16 6800
23 2330 300 330 4 90000 99000 1200 699000 108900 1320 768900 16 9320
24 1600 136 140 3 18496 19040 408 217600 19600 420 224000 9 4800
25 1100 144 290 3 20736 41760 432 158400 84100 870 319000 9 3300
SUMA 75231 6158 6778 80 2595916 2559895 20617 33608560 2683196 23408 33420219 272 258024
Práctica de ejercicios
Práctica de ejercicios

Se sustituyen los datos obtenidos en la tabla, el sistema de ecuaciones queda de la


siguiente manera

25 β 0+ 6158 β1 +6778 β 2+ 80 β 3 =75231

6158 β 0+ 2595916 β1 +2559895 β 2+20617 β 3=33608560

6778 β 0+ 2559895 β 1 +2683196 β 2+23408 β 3=33420219

80 β 0 +20617 β1 +23408 β 2+ 272 β 3=258024

Resolver el sistema de ecuaciones

25 6158 6778 80 75231

( 6158 2595916 2559895 20617 33608560


6778 2559895 2683196 23408 33420219
80 20617 23408 272 258024
| )
Se obtienen los siguientes resultados

x0 −602.5689619

[][ x1 = 9.14198458
x2
x3
5.934450532
−77.81028379
]
Por lo tanto la ecuación queda de la siguiente manera:

y=−602.5689+ 9.14 19 x 1+5.9344 x 2−77.8102 x3

b. Prueba la significancia global del modelo de regresión múltiple; realiza


todas las etapas de una prueba de hipótesis.

La hipótesis nula es:

H 0 : β1 =β2 =β3 =0

La Hipótesis alternativa es:

H 1 : No todaslas β son 0
Práctica de ejercicios

Prueba global:

Fcal=52.7761

SSR
k
F calc= =52.7761
SSE
[ n−( k +1 ) ]

De las tablas de distribución Fisher obtener el valor para un nivel de confianza


de 95% con 3 y 21 grados de libertad

F ( 0.95,3,21 )=3.0724

Se rechaza H0 si F calculada > 3.0724

Entonces se rechaza la hipótesis nula

c. Pronostica el precio para los siguientes datos:

Metros deMetros deNúmero de


terreno construcció recámaras
( X  )
1 n ( X   )
3

(X  )
2

180 390 4
200 250 3
230 200 4
250 180 2
100 120 3

y=−602.5689+ 9.1419 ( 180 )+ 5.9344 ( 390 )−77.8102 ( 4 )=$ 3046.1483

y=−602.5689+ 9.1419 ( 200 ) +5.9344 ( 250 )−77.8102 ( 3 )=$ 2475.9805

y=−602.5689+ 9.1419 ( 230 ) +5.9344 ( 200 )−77.8102 ( 4 )=$ 2375.7073

y=−602.5689+ 9.1419 ( 250 ) +5.9344 ( 180 )−77.8102 ( 2 )=$ 2595.4777


Práctica de ejercicios

y=−602.5689+ 9.1419 ( 100 )+ 5.9344 ( 120 )−77.8102 ( 3 )=$ 790.3185

d. Prueba la significancia de los coeficientes de regresión individuales.


Realiza todas las etapas de una prueba de hipótesis para cada uno de los
coeficientes.

Establecimiento de hipótesis β1
H0 : β1= 0 (Metros de terreno, x1 no afecta el precio, Y)
Ha : β1 ≠ 0 (Metros de terreno, x1 afecta el precio, Y)

Estadística de prueba

9.14−0
t calculada= =2.18
4.18

Regla de decisión
Rechazar H0 si |t calculada| = 2.18 es mayor que t teórica

t teorica=t α ( 21 ) =t 0.05 ( 21 )=2.080


2 2

Conclusión
Puesto que t calculada =2.1844 es mayor que t teórica =2.080 H0 se rechaza lo
que indica que la variable X1 si afecta el precio.

Establecimiento de hipótesis β2
H0 : β2= 0 (Los metros de construcción, x2 no afecta el precio, Y)
Ha : β2 ≠ 0 (Los metros de construcción, x2 afecta el precio, Y)

Estadística de prueba

5.93−0
t calculada= =1.13
5.2169

Regla de decisión
Rechazar H0 si |t calculada| = 1.1375 es mayor que t teórica

t teorica=t α ( 21 ) =t 0.05 ( 21 )=2.080


2 2
Práctica de ejercicios

Conclusión
Puesto que t calculada =1.1375 es menor que teórica =2.080 H0 se acepta lo
que indica que la variable X2 no afecta el precio.

Establecimiento de hipótesis β3
H0 : β3= 0 (El número de recámaras, x3 no afecta el precio, Y)
Ha : β3 ≠ 0 (El número de recámaras, x3 afecta el precio, Y)

Estadística de prueba

−77.9103−0
t calculada= =−0.1748
445.2394

Regla de decisión
Rechazar H0 si |t calculada| = -0.17 es mayor que t teórica

t teorica=t α ( 21 ) =t 0.05 ( 21 )=2.080


2 2

Conclusión
Puesto que t calculada =-0.17 es menor que teórica =2.08 H0 se acepta
lo que indica que la variable X3 no afecta el precio.

e. Calcula el error estándar de estimación.

SCE
sε =
√ n−k −1

28355197.53
sε =
√ 21
=1162.0015

El error de 1162.0015, nos dice que tiene un error alto y no es tan preciso como
se espera.

f. Construye un intervalo de confianza para las pendientes de la población


(β1, β2 y β3).
Práctica de ejercicios

De acuerdo con el análisis en Excel se obtiene lo siguiente;

Inferior Superior
Intercepción 95% 95%
-
2999.47693 1794.3390
Variable X 1 6 1
0.43887128 17.845097
Variable X 2 4 9
-
4.91473473 16.783635
Variable X 3 4 8
-
1003.73620 848.11563
2 4

Establecimiento intervalo de confianza de β1

t∗t α ( n−2 )=t 0.05 ( n−2 )=t 0.025 (23 )=2.06


2 2

Establecimiento intervalo de confianza de β2

t∗t α ( n−2 )=t 0.05 ( n−2 )=t 0.025 (23 )=2.06


2 2

Establecimiento intervalo de confianza de β3

t∗t α ( n−2 )=t 0.05 ( n−2 )=t 0.025 (23 )=2.06


2 2

g. Calcula e interpreta R2 en el contexto del problema.

SCR 213782653
R 2= = =0.8829
SCT 242137850.6
Práctica de ejercicios

En este caso, el 88.29% de la variación en el precio se explica por X1 (Metros


de terreno), X2 (Metros de construcción) y X3 (Número de recamaras). En la
práctica, 0 ≤ R2 ≤ 1, y el valor de R2 debe interpretarse en relación con los
extremos, 0 y 1.

h. Calcula R2ajustada.

SSE
n−(k +1)
Rajustada =1−
SStotal
n−1

R_(ajustada= )^2 1-(1-R^2 )((n-1)/(n-k-1))=1-(1-0.88)(24/21)=0.86

Coeficiente de determinación ajustado: 86.62%

i. Determina el Factor de Inflación de Varianza (VIF) para cada variable


explicativa en el modelo. ¿Existe alguna razón para sospechar que existe
multicolinealidad?

1
VIF=
1−R2

1
VIF= =8.53
1−( 0.8828 )2

VIF x1: 7.62

VIF x2: 1.05

VIF x3: 1.27

El VIF para x1 está muy alejados de uno, por lo tanto se concluye


que no existe multicolinealidad.
Práctica de ejercicios

j. Finalmente prepara un documento presentando un resumen de tus


hallazgos.

Fp 52.7761646
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados Fp Valor crítico de F
Regresión 3 213782653 71260884.34 52.7761646 5.9362E-10
Residuos 21 28355197.5 1350247.501
Total 24 242137851

Coeficientes Error típico P - Value Probabilidad Inferior 95% Superior 95%Inferior 95.0%Superior 95.0%
Intercepción -602.568962 1152.57358 -0.522803032 0.60658383 -2999.47694 1794.33901 -2999.47694 1794.33901
X₁ 9.14198458 4.18496603 2.184482386 0.04040805 0.43887128 17.8450979 0.43887128 17.8450979
X₂ 5.93445053 5.21692298 1.137538459 0.26812631 -4.91473473 16.7836358 -4.91473473 16.7836358
X₃ -77.8102838 445.239351 -0.174760572 0.86294171 -1003.7362 848.115634 -1003.7362 848.115634

Y= -602.56 + 9.14X1 + 5.93X2 +-77.81X3 Metros de  Metros de  Número de


construcci
terreno  recámaras
ón 
( X1 ) (X2 ) ( X3  ) Y
180 390 4 3046.18283
200 250 3 2476.00974
230 200 4 2375.73646
250 180 2 2595.50771
100 120 3 790.332709

2.18448239
1.13753846
-0.17476057
Práctica de ejercicios

Fp
52.77

Fc
5.93621E-10

FpX3 FpX2
-0.174760572 1.137538459
FpX1= 2.184482386

X₁ X₂ X₁ X₃ X₂ X₃
288 378 288 4 378 4
160 252 160 4 252 4
230 252 230 4 252 4
234 167 234 2 167 2
72 124 72 4 124 4
128 262 128 4 262 4
188 246 188 4 246 4
390 380 390 3 380 3
885 775 885 4 775 4
885 775 885 3 775 3
150 233 150 3 233 3
406 420 406 3 420 3
320 390 320 4 390 4
170 244 170 4 244 4
170 233 170 3 233 3
160 127 160 3 127 3
90 73 90 2 73 2
91 73 91 2 73 2
110 90 110 2 90 2
90 74 90 2 74 2
172 76 172 2 76 2
189 374 189 4 374 4
300 330 300 4 330 4
136 140 136 3 140 3
144 290 144 3 290 3

r 0.932095373 r 0.21934247 r 0.46719265


R2 0.868801785 R2 0.04811112 R2 0.21826897
1-R2 0.131198215 1-R2 0.95188888 1-R2 0.78173103

VIF 7.622054918 VIF 1.05054279 VIF 1.27921237


Práctica de ejercicios

En estos temas se puede verificar que el método de mínimos cuadrados


produce la mejor línea recta. Sin embargo la línea de regresión puede usarse
para estimar el valor de Y para un valor determinado X. Para obtener una
predicción puntual o pronóstico, debemos evaluar la función de regresión
estimada en X, de los cuales existen dos fuentes de incertidumbre asociadas
con una predicción puntual generada por la ecuación de regresión adaptada,
una es incertidumbre debida a la dispersión de los datos respecto a la línea de
regresión, y la otra es incertidumbre debida a la dispersión de la regresión de la
muestra respecto de la población. Pudimos comprobar que la evaluación del
modelo se puede hacer en tres formas, por medio de un error estándar de
estimación, a través del coeficiente de determinación o mediante la prueba de
F del análisis de varianza.

Podemos concluir que la multicolinealidad aumenta el error en la estimación de


los coeficientes individuales, disminuyendo los test t. Luego, que sospechamos
existencia de multicolinealidad cuando los coeficientes individuales tienen bajas
significancias, pero el estadístico R2 es alto. También, dado el alto error, los
coeficientes estimados son altamente sensibles a cambios en las
observaciones, de modo que por ejemplo eliminando un dato, los coeficientes
cambiarán importantemente. El último aspecto es las predicciones del modelo
con multicolinealidad serán peores (alto error) que aquellas obtenidas
considerando solo un pequeño grupo de variables explicativas que no son
colineales.

También podría gustarte