Statistics">
DiapositivasRegresión (Samuel2012)
DiapositivasRegresión (Samuel2012)
DiapositivasRegresión (Samuel2012)
Regresión
Regresión Lineal Simple
Consiste en determinar una relación funcional
entre dos variables, con el fin de predecir el valor
de una variable(dependiente) en base a la
otra(independiente)
Diagrama de dispersión
Covarianza
Regresión lineal simple
Coeficiente o indice de correlación
Diagramas de dispersión
Covarianza
Mide el grado de dispersión conjunta de
dos variables
n n
SS xy ( x x)( y y) x y n x y
i i i i
S xy i 1
i 1
n 1 n 1 n 1
Varianzas
n n
(x x
2 2 2
i x) i nx
2 SS xx
s
x i 1
i 1
n 1 n 1 n 1
n n
(y y
2 2 2
y) ny
2 SS yy i i
s
y i 1
i 1
n 1 n 1 n 1
Modelos de Regresión
Modelo: y = + x i + ui
será estimado por: y = a + b xi + ei
Donde: ei = yi - a - b xi
Método Mínimos Cuadrados Ordinario
Estimadores
S xy
b 2 a y bx
s x
Estimación o Pronóstico
yˆ a b * x0
Estimador de 2
Que mide la variación de los valores de Y, respecto a
la línea E(y)=+xi. También conocido como la
desviación estándar de los errores.
SSE SSE
s2
Grados libertad para el error n 2
Donde:
n
SSE ( yi yˆ i ) SS yy b.SS xy
2
i 1
Prueba de utilidad del Modelo
La hipótesis a probar es:
Ho:=0
H1:0
El estadístico de Prueba:
b b
t
sb s / ss xx
Si │t │> t/2,n-2 se rechaza Ho. Lo que significa que la
relación entre la Variable Dependiente (Y) y la variable
independiente (X) no es significativa.
Intervalo de confianza para β
2 2
1 ( x0 x ) 1 ( x0 x )
yˆ tn 2, / 2 .s 1 Y yˆ t n2, / 2 .s 1
n ss xx n ss xx
Indice de correlación ()
Mide el grado de asociación entre dos
variables, será estimado por:
n
s xy x y i i nx y
r i 1
sx s y n n
x nx yi2 n y
2 2 2
i
i 1 i 1
Coeficiente Determinación
Mide el porcentaje de variación de la variable dependiente
(Y) que es explicada por la variable independiente (X)
R2 = r2*100%
(n 1) SSE (n 1)
2
R 1
aj 1
n (k 1) SSYY
n (k 1)
1 R2
Prueba Hipotesis de
La hipótesis a probar es:
Ho: =0
H1: 0
El estadístico de Prueba:
r n2
t
1 r 2
Si │t │> t/2,n-2 se rechaza Ho, que implica que la relación
entre la Variable Dependiente (Y) y la variable
independiente (X) no es significativa.
ANÁLISIS DE RESIDUALES
ei
SRi
s 1 hi
donde:
1 ( xi x ) 2
hi
n ss xx
Análisis de Influencias
ei
SRi
s 1 hi
* ei
t
i
s( i ) 1 hi
Si │ti*│>t0.10,n-3
SRi2 .hi
Di
2(1 hi )
Regla:
Desviación
Media típ. N
GASTO 667.0500 184.75915 20
SALARIO 767.7500 301.68088 20
Correlaciones
Variables Variables
Modelo introducidas eliminadas Método
1 SALARIOa . Introducir
a. Todas las variables solicitadas introducidas
b. Variable dependiente: GASTO Variable independiente
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 582902.564 1 582902.564 159.747 .000a
Residual 65680.386 18 3648.910
Total 648582.950 19 Si sig.=0< =0.05
a. Variables predictoras: (Constante), SALARIO
se rechaza Ho:=0
b. Variable dependiente: GASTO
Coeficientesa
Coeficientes
Coeficientes no estandarizad Intervalo de confianza para
estandarizados os B al 95%
Límite
Modelo B Error típ. Beta t Sig. Límite inferior superior
1 (Constante) 221.298 37.766 5.860 .000 141.955 300.641
SALARIO .581 .046 .948 12.639 .000 .484 .677
a. Variable dependiente: GASTO
Yˆ 221.298 0.581X
Regresión
Múltiple
Regresión Múltiple
Permite estudiar la relación entre una variable dependiente
(Y) y dos o más variables independientes (X1, X2, ..., Xk).
El modelo poblacional a considerar es:
e = y - X
Donde matricialmente se tiene:
y1 0 e1
y 1 x11 x21 xk1 e
2 1 x x x 1 2
y y3 , X 12 22 k2
, 2 e e3
yn 1 x1n x2 n xkn k en
Entonces, la solución por el método de mínimos cuadrados
para la estimación de del modelo lineal general, involucra
encontrar ß para lo cual se minimiza
SSE = (y – X ß)’(y – X ß)
Este proceso de minimización requiere resolver para ß
en la ecuación
( SSE ) 0
b
El resultado se reduce a la solución de ß en:
ˆ ( X ' X ) 1 X 'Y
Teniendo:
yi n
x x 1i 2i x
ki
x1i x x x x x
2
x1i yi
1i 2 i 1i ki 1i
A X ' X x2 i x x x 2
x x
g X ' Y x 2 i yi
1i 2i 2i ki 2 i
x
ki x x x
1i ki x
2i ki xki2
x y
ki i
c00 c01 c02 c0 k
c c11 c12 c1k
10
( X ' X ) 1 c20 c21 c22 c2 k
ck 0 ck1 ck 2 ckk
Para la estimación, dado: 0 1 x10 x20 xk 0
'
x
i
( y
i 1
y ) i
(2
y
ˆ y ) i i
(
i 1
y y
ˆ ) 22
i 1
2
2 ' X ' y Ny
R
y ' y Ny 2
Coeficiente de Determinación Ajustado
Permite determinar el grado de relación entre las variables
explicatorias y la explicada, considerando el tamaño de la muestra.
2 n 1 2
R ajust 1 (1 R )
n (k 1)
Análisis de Influencias
ei
SRi
s 1 hii
* ei
t
i
s( i ) 1 hii
Si │ti*│>t0.10,n-3
SRi2 .hii
Di
2(1 hii )
Regla:
Estadísticos descriptivos
Desviación
Media típ. N
GASTO 667.0500 184.75915 20
SALARIO 767.7500 301.68088 20
NHIJOS 2.25 1.916 20
EDAD 34.50 12.344 20
Correlaciones
b
Variables introducidas/eliminadas
Variables Variables
Modelo introducidas eliminadas Método
1 EDAD,
SALARIO,a
. Introducir
NHIJOS
a. Todas las variables solicitadas introducidas
b. Variable dependiente: GASTO
Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 587991.986 3 195997.329 51.756 .000a
Residual 60590.964 16 3786.935
Total 648582.950 19
a. Variables predictoras: (Constante), EDAD, SALARIO, NHIJOS
Si sig.=0< =0.05 se
b. Variable dependiente: GASTO rechaza Ho:1=2=3=0
Coeficientesa
Coeficientes
Coeficientes no estandarizad Intervalo de confianza para
estandarizados os B al 95%
Límite
Modelo B Error típ. Beta t Sig. Límite inferior superior
1 (Constante) 186.447 53.157 3.507 .003 73.759 299.135
SALARIO .580 .047 .946 12.214 .000 .479 .680
NHIJOS -8.803 9.357 -.091 -.941 .361 -28.639 11.033
EDAD 1.608 1.451 .107 1.108 .284 -1.468 4.684
a. Variable dependiente: GASTO
El modelo:
Estas dos variables no influyen en