Mathematics">
CLASE Nro. 31 Coeficiente Correlacion Multiple
CLASE Nro. 31 Coeficiente Correlacion Multiple
CLASE Nro. 31 Coeficiente Correlacion Multiple
REGRESIÓN Y PRUEBAS
NO PARAMÉTRICAS
ESTADÍSTICA
FABIÁN ORDÓÑEZ
DEPARTAMENTO DE CIENCIAS EXACTAS - ESPE
CLASE Nro. 31
CONTENIDO
Duración 2 horas
1
CLASE Nro. 31
𝑆𝐶𝐸
𝑅̅2 = 1 − 𝑛 − 𝑘 −1
𝑆𝐶𝑇
𝑛 −1
Donde n es el número de variables independientes. Existe una fórmula más desarrollada para
su determinación como se presenta a continuación.
2
𝑛[𝑏0 ∑ 𝑦 + 𝑏1 ∑ 𝑥1 𝑦 + 𝑏2 ∑ 𝑥2 𝑦 + … + 𝑏𝑘 ∑ 𝑥𝑘 𝑦] − (∑ 𝑦)2
𝑅 =
𝑛 ∑ 𝑦 2 − (∑ 𝑦)2
Este indicador al igual que en regresión simple mide la dispersión de la función de regresión
multilineal alrededor del plano de regresión Se, viene dado por:
∑𝑛𝑖=1(𝑦𝑖 − 𝑦̂𝑖 )2
𝑆𝑒 = √
𝑛−𝑘−1
Los grados de libertad están dados por el valor que toma el denominador de la fórmula, y k
representa el número de variables independientes. Se interpreta de manera similar a regresión
simple.
EJERCICIO 1
Un analista inmobiliario cree que existe relación entre la demanda de las viviendas, su precio
y el ingreso anual medio de los hogares, para ello construye un modelo de regresión lineal.
Los valores de estas variables se recogen en la siguiente tabla durante 6 períodos.
2
CLASE Nro. 31
∑ 𝑦𝑖 = 𝑛𝑏0 + 𝑏1 ∑ 𝑥1 + 𝑏2 ∑ 𝑥2
𝑖=0 𝑖=0 𝑖=0
𝑛 𝑛 𝑛 𝑛
∑ 𝑥1 𝑦𝑖 = 𝑏0 ∑ 𝑥1 + 𝑏1 ∑ 𝑥1 + 𝑏2 ∑ 𝑥1 𝑥2 2
𝑛 𝑛 𝑛 𝑛
∑ 𝑥2 𝑦𝑖 = 𝑏0 ∑ 𝑥2 + 𝑏1 ∑ 𝑥1 𝑥2 + 𝑏2 ∑ 𝑥2 2
𝑖=0 𝑖=0 𝑖=0 𝑖=0
Período yi x1 x2 x1.y x12 x1.x2 x2y x22 y(reg) (yi - y(reg))2 (yi -ym)2 y2
1 8 12 6,80 96,00 144,00 81,60 54,40 46,24 4,99 9,03 8,03 64,00
2 9 13 7,20 117,00 169,00 93,60 64,80 51,84 9,75 0,57 3,36 81,00
3 12 13 7,40 156,00 169,00 96,20 88,80 54,76 11,20 0,65 1,36 144,00
4 9 14 7,10 126,00 196,00 99,40 63,90 50,41 10,91 3,65 3,36 81,00
5 12 14 7,00 168,00 196,00 98,00 84,00 49,00 10,19 3,28 1,36 144,00
6 15 15 7,40 225,00 225,00 111,00 111,00 54,76 14,95 0,00 17,36 225,00
SUM. 65 81 42,90 888,00 1099,00 579,80 466,90 307,01 17,18 34,83 739,00
ymedia 10,83
3
CLASE Nro. 31
𝑛[𝑏0 ∑ 𝑦 + 𝑏1 ∑ 𝑥1 𝑦 + 𝑏2 ∑ 𝑥2 𝑦 + … + 𝑏𝑘 ∑ 𝑥𝑘 𝑦] − (∑ 𝑦)2
𝑅2 =
𝑛 ∑ 𝑦 2 − (∑ 𝑦)2
Interpretación
𝑆𝐶𝐸 10.62
̅2
𝑅 =1 − 𝑛 − 𝑘 − 1 =1 − 6 − 2 − 1 = 0.4919
𝑆𝐶𝑇 34,83
𝑛 −1 6 −1
El coeficiente de correlación simple, mide la relación existente entre las variables dependiente
e independiente, en cambio la correlación parcial, mide la relación existente entre 2 variables
independientes, se calcula mediante la siguiente expresión:
[∑ 𝑥𝑖 𝑥𝑗 − ∑ 𝑥𝑖 ∑ 𝑥𝑗 ]
2
𝑅𝑖,𝑗 =1 − 𝑛
2
(∑ 𝑥 )2 (∑ 𝑥𝑗 )
√[∑ 𝑥𝑖2 − 𝑛𝑖 ] [∑ 𝑥𝑗2 − 𝑛 ]
la correlación de la variable consigo mismo y en los otros casilleros estará el valor del
coeficiente de correlación, como se indica en el ejemplo siguiente.
4
CLASE Nro. 31
Y X1 X2 X3
Y 1
X1 0.3029 1
X2 0.862 0.251 1
X3 0.7077 0.2058 0.6823 1
Se interpreta esta información diciendo que existe correlación entre las variables 2 y 3
(multicolinealidad) pues pasa el 60%, se analiza entre las variables independientes.
La covarianza indica el valor para dos variables aleatorias que varían con respecto a sus
medias.
𝑐𝑜𝑣(𝑥, 𝑦)
𝑅𝑥,𝑦 =
𝑆𝐶𝑥 𝑆𝐶𝑦
La matriz de covarianzas resume todas las posibles covarianzas de las variables que
intervienen, es una matriz triangular inferior, en la diagonal principal va el valor de la
varianza, ya que es el cálculo de la covarianza consigo mismo y en los otros casilleros estará
el valor de la covarianza entre las variables.
5
CLASE Nro. 31
Y X1 X2 X3
Y 96.222
X1 20.467 47.44
X2 37.622 7.6933 19.796
X3 40.356 8.24 17.649 33.796
Estos valores obtenidos nos indican si son directa o inversamente proporcionales entre las
variables analizadas.
6
CLASE Nro. 31
REFERENCIAS BIBLIOGRAFICAS