Mathematics">
Nothing Special   »   [go: up one dir, main page]

REGRESIONMULTIPLE21

Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Está en la página 1de 13

5

CAPÍTULO VII

REGRESIÓN Y CORRELACIÓN LÍNEAL MULTIPLE.

5.1 Introducción

Como se vio anteriormente cuando se tiene dos


variables y se quiere determinar o cuantificar la
relación o realizar una estimación y se ha justificado
que los datos reales tienden a un modelo lineal hay
que hallar la ecuación.

Si en cualquier momento se tienen más de dos


variables y se quiere determinar o cuantificar la
relación o realizar una estimación y se ha justificado
que los datos reales tienden a un modelo lineal hay
que hallar la ecuación.

5.2. El modelo regresión y correlación líneal múltiple.

Esta ecuación del modelo de regresión lineal


múltiple para K variable independiente (Xi) y una
variable dependiente (Y) es:
5

Y = ß0 + ß1 X1 + ß2 X2 + ß3 X3 +...+ ßK XK

En esta ecuación se conocen los valores reales de Y, X 1,


X2, X3,…… XK pero se desconocen los parámetros de ß0, ß1,
ß2, ß3, ……... ßK entonces aplicando el método de los
minimos cuadrados se hallan las ecuaciones normales
para hallarlos. Estas ecuaciones son vectores y matrices y
con base a ellas se obtienen los valores de los betas. En
este curso se utilizarán el programa de Excel para hallar
los parámetros betas.

5.2.1 interpretación de los parámetros betas

Para interpretar la relación es decir cualquier


parámetro beta es de la misma forma que del modelo
lineal pero al finalizar el análisis debe agregarse “ si se
tiene constante las demás variables”. A continuación
se presentan la interpretacion de algunos de ellos:

Si ß1 es positivo (ß1>0) . Por cada unidad que aumente


la variable independiente X1, entonces la variable
dependiente Y aumenta en ß1, sí se mantiene constante
X2, X3, X4… Xk,
5

Si ß1 es negativo (ß1 < 0). Por cada unidad que


disminuya (aumente) X1, entonces la variable
dependiente Y aumenta (disminuye) en ß1, sí se mantiene
constante

Si beta ß2 es positivo ( ß2 > 0). Por cada unidad que


aumente la variable independiente X2, entonces la
variable dependiente Y aumenta en ß2, sí se mantiene
constante X1, X3, X4… Xk

Si beta ß2 es negativo (ß2 < 0). Por cada unidad que


disminuya (aumente) X2, entonces la variable
dependiente Y aumenta (disminuye) en ß2, sí se mantiene
constante X1, X3, X4… Xk.

5.3. Coeficiente de determinación múltiple.

Al aplicar la técnica de correlación para dos variables se


informó que el coeficiente de determinación sirve para
justificar si los valores reales de X y Y presentaban un
tendencia lineal.

Cuando se tienen tres o más variables este método tienen el


mismo servicio, es decir, los datos se ajustaban a un modelo
5

lineal múltiple. El coeficiente de determinación múltiple se


nota por R2 y la formula es:

La interpretación del coeficiente de determinación


múltiple es “ los datos tienden a un modelo lineal
múltiple porque el tanto por cientos (100R 2) de la
variación total de Y es explicada por las variaciones de
las variables X1, X2, X3, X4… Xk.
Ejemplo1: El gerente de la fábrica El Cono quiere detectar los factores que
influyen en el rendimiento de los empleados de la clínica. Seleccionan al azar
20 empleados y los califica con puntos el rendimiento (uno bajo rendimiento y
alto rendimiento 100). Luego a estos empleados les observa las siguientes
variables: (edad, antigüedad, salario, horas extras). Los resultados están a continuación:
Calificación
Salario Horas
del Antigüedad
Edad (años) (decenas de extras
Rendimiento (años)
miles de $) mensuales
(puntos)
70 25 4 151 40
72 28 5 182 38
74 32 6 191 37
77 35 7 195 35
78 39 7 200 33
79 45 8 220 34
79 49 8 220 33
80 54 9 230 28
5

81 58 9 240 27
81 65 11 160 26
82 65 12 170 24
85 70 12 180 23
86 68 12 281 22
88 69 13 250 20
90 74 15 290 20

1) Interprete el coeficiente de determinación múltiple.


2) Si se puede interprete beta dos y beta cuatro.

7.1. La matriz de correlación

En el análisis de correlación los programas estadísticos de las


computadoras determinan la matriz de correlación en las
cuales los elementos de la matriz son los coeficientes de
correlación parciales para cada par de variables. La matriz
es una matriz diagonal. Sí un modelo de regresión múltiple
tiene 5 variables (incluyendo la dependiente) entonces la
matriz de correlación (ver figura 7.1) tiene una matriz de
(5*5). En la figura 7.1 el coeficiente de correlación r 4.3
significa la correlación entre la variable 4 y la variable 3. Este
coeficiente de correlación r4.3 es el mismo r3.4. La primera
fila y la primera columna es la numeración de las variables
analizadas. Por lo general la variable 1 es la variable
dependiente y la demás las independientes. Esta matriz sirve
como indicador para identificar las posibles variables
preditoras (independientes) para el modelo.
5

VARIABLE
Y X1 X2 X3 X4………. Xn

Y ry.y ry.1 ry.2 ry.3 ry.4 …… ry.k


X1 r1.y r1.1 r1.2 r1.3 r1.4 …… r1.k
X2 r2.y r2.1 r2.2 r2.3 r2.4 …… r2.k
X3 r3.y r3.1 r3.2 r3.3 r3.4 …… r3.k
X4 r4.y r4.1 r4.2 r4.3 r4.4 …… r4.k
…… …. …. …. … …. …… …
…… …. …. …. … …. …… …
Xn rn.1 rn.2 rn.3 rn.4 ……. …… rn.k
Figura 7.1. Matriz de correlación.

Esta matriz diagonal los computadores lo generan de la


siguiente forma:
VARIABLE
Y X1 X2 X3 X4………. Xn

Y 1
X1 r1.y 1
X2 r2.y r2.1 1
X3 r3.y r3.1 r3.2 1
X4 r4.y r4.1 r4.2 r4.3 1

…… …. …. …. … …. ……
…… …. …. …. … …. …….
Xn rn.1 rn.2 rn.3 rn.4 ……. …… 1
5

Un ejemplo hipotético puede ser (Ver figura 7.2 y 7.3).

Y X1 X2 X3
Y 1 0.28 0.83 0.94
X1 0.28 1 -0.25 0.32
X2 0.83 -0.25 1 0.76
X3 0.94 0.32 0.76 1

Figura 7.2. Matriz de correlación para un modelo de 4


variables.

Y X1 X2 X3
Y 1
X1 0.28 1
X2 0.83 -0.25 1
X3 0.94 0.32 0.76 1

Figura 7.3. Matriz de correlación para un modelo de 4


variables.

7.2 Multicolínealidad
5

La multicolínealidad aparece cuando hay una alta correlación


entre dos variables independientes en un modelo de regresión
lineal múltiple. Esta multicolínealidad sugiere que las dos
variables independientes son dependientes y no es
posible distinguir que cantidad de efecto observado se debe a
una de las variables de predicción. En la figura 7.3 se observa
la multicolínealidad entre la variable predictoras 2 y 3 ( r 2.3 =
0.76 ).

Ejercicio: La siguiente matriz (figura 7.3) de correlación fue


generada por Excel. Escriba el modelo adecuado de regresión
lineal múltiple.
VARIABLES Y X1 X2 X3 X4 X5 X6 X7 X8
Y 1 0,85 0,95 -0,9 0,27 0,88 0,87 0,75 0,99
X1 0,85 1 0,22 -0,5 0,33 0,22 0,88 0,32 0,14
X2 0,95 0,22 1 0,01 0,21 0,35 0,41 0,28 0,25
X3 -0,9 -0,5 0,01 1 0,11 0,27 0,44 0,55 0,1
X4 0,27 0,33 0,21 0,11 1 0,28 0,36 0,24 0,09
X5 0,88 0,22 0,35 0,27 0,28 1 0,36 0,27 0,44
X6 0,87 0,88 0,41 0,44 0,36 0,36 1 0,88 0,04
X7 0,75 0,32 0,28 0,55 0,24 0,27 0,88 1 0,55
X8 0,99 0,14 0,25 0,1 0,09 0,44 0,04 0,55 1
Figura 7.4, matriz de correlación, eliminado X4

El modelo teórico para el ejemplo es:


5

Y = ß0 + ß1 X1 + ß2 X2 + ß3 X3 + ß4 X4 + ß5 X5 + ß6 X6+ ß7 X7 + ß8 X8

El primer paso para determinar el modelo de regresión


adecuado es observar que variables no aportan a
explicar la variable dependiente Y ( primera columna,
baja correlacion). Las variables independientes que no
aportan a Y es la : X 4. entonces el modelo adecuado por el
momento es :
Y = ß0 + ß1 X1 + ß2 X2 + ß3 X3 + ß5 X5 + ß6 X6+ ß7 X7 + ß8 X8

VARIABLES Y X1 X2 X3 X4 X5 X6 X7 X8
Y 1 0,85 0,95 -0,9 0,27 0,88 0,87 0,75 0,99
X1 0,85 1 0,22 -0,5 0,33 0,22 0,88 0,32 0,14
X2 0,95 0,22 1 0,01 0,21 0,35 0,41 0,28 0,25
X3 -0,9 -0,5 0,01 1 0,11 0,27 0,44 0,55 0,1
X4 0,27 0,33 0,21 0,11 1 0,28 0,36 0,24 0,09
X5 0,88 0,22 0,35 0,27 0,28 1 0,36 0,27 0,44
X6 0,87 0,88 0,41 0,44 0,36 0,36 1 0,88 0,04
X7 0,75 0,32 0,28 0,55 0,24 0,27 0,88 1 0,55
X8 0,99 0,14 0,25 0,1 0,09 0,44 0,04 0,55 1
Figura 7.5. Matriz de correlación eliminado X6.
5

Ahora para mejorar el modelo aplico multicolinealidad (alta


correlación entre las variables independientes). Entonces
elimino X6 (Figura 7.6) . El modelo adecuado es :

Y = ß0 + ß1 X1 + ß2 X2 + ß3 X3 + ß5 X5 + ß7 X7 + ß8 X8

VARIABLES Y X1 X2 X3 X4 X5 X6 X7 X8
Y 1 0,85 0,95 -0,9 0,27 0,88 0,87 0,75 0,99
X1 0,85 1 0,22 -0,5 0,33 0,22 0,88 0,32 0,14
X2 0,95 0,22 1 0,01 0,21 0,35 0,41 0,28 0,25
X3 -0,9 -0,5 0,01 1 0,11 0,27 0,44 0,55 0,1
X4 0,27 0,33 0,21 0,11 1 0,28 0,36 0,24 0,09
X5 0,88 0,22 0,35 0,27 0,28 1 0,36 0,27 0,44
X6 0,87 0,88 0,41 0,44 0,36 0,36 1 0,88 0,04
X7 0,75 0,32 0,28 0,55 0,24 0,27 0,88 1 0,55
X8 0,99 0,14 0,25 0,1 0,09 0,44 0,04 0,55 1
Figura 7.6. Matriz de correlación, eliminado X6

Ejercicio propuesto 1.
Para la tabla 7.5.;

a) Escriba el modelo de regresión múltiple general


b) Encuentre el modelo de regresión múltiple adecuado.
Tabla 7,5. Matriz de correlación.
Y X1 X2 X3 X4 X5 X6 X7 X8 X9
Y 1                  
X1 0,98 1                
5

X2 0,86 0,52 1              
X3 -0,77 -0,58 -0.90 1            
X4 0,84 -0,33 0,17 0,15 1          
X5 0,83 0,17 0,18 0,02 -0.91 1        
X6 0,88 0,05 0,43 0,03 0,02 0,17 1      
X7 0,54 0,12 0,35 0,4 0,01 0,05 0,37 1    
X8 0,39 0,14 0,38 0,33 0,04 0,4 0,34 0,32 1  
X9 0,91 0,03 0,04 0,32 0,03 0,45 0,33 0,35 0,78 1

Ejercicio propuesto 1: el precio, la antigüedad, los kilómetros recorridos y los caballos de fuerza de 24 vehículos de una misma marca

están a continuación (Tabla 7.6):

PRECIO (MILLONES KILOMERTROS


DE PESOS) ANTIGÜEDAD (años) RECORRIDO CABALLOS DE FUERZA
50 10 8000 1
48 15 8320 2
44 20 12000 2
40 24 13220 3
38 28 14111 4
35 34 17520 5
50 10 8000 1
48 15 8320 2
44 20 12000 2
40 24 13220 3
38 28 14111 4
35 34 17520 5
5

50 10 8000 1
48 15 8320 2
44 20 12000 2
40 24 13220 3
38 28 14111 4
35 34 17520 5
50 10 8000 1
48 15 8320 2
44 20 12000 2
40 24 13220 3
38 28 14111 4
35 34 17520 5
a) Interprete el coeficiente de determinación múltiple.
b) Si se puede interprete beta tres y beta cuatro.

Ejercicio propuesto 2. Utilidad anual de 12 fábricas de horno


según : producción de hornos (en miles),cantidad de
empleados (en decena), cantidad de vehículos que tiene la
fábrica, cartera morosa (en centenas de miles de $) y cantidad
de máquinas manuales que tiene la fábrica. a). hallar la
ecuación de regresión. b) interprete el coeficiente de
determinación múltiple , beta tres y beta cuatro.
5

También podría gustarte