3.3 Datos
3.3 Datos
3.3 Datos
Y estimada Y estimada
Y Y
X X
CONSTANTE HETEROCEDASTICIDAD
PRONOSTICOS USANDO
REGRESION
• Cuando la variable dependiente está en una serie de
tiempo, este tipo de análisis se conoce como
modelo econométrico.
yt a bx
• Modelo econométrico, se usa para identificar y
especificar las variables de predicción que influyen
en el comportamiento de la variable dependiente.
PRONOSTICOS USANDO
REGRESION
• Modelo Multiplicativo la fluctuación estacional es
proporciona a la tendencia.
• Modelo Aditivo: agrega una cantidad constante a
la estimación de tendencia, que corresponde al
incremento esperado en el valor de la variable
dependiente debido a factores estacionales.
AUTOCORRELACIÓN
Es la correlación existente entre una variable
desfasada uno o mas periodos y la misma variable.
EXPLORACION DE PATRONES DE DATOS
CON ANÁLISIS DE AUTOCORRELACION
COEFICIENTE DE AUTOCORRELACIÓN
•La autocorrelacion se mide con el Coeficiente de
Autocorrelación.
•Los coeficientes de autocorrelación para diferentes
desfases de tiempo de una variable se emplean para
identificar patrones en las series de tiempo.
•En general como el número de periodos de atraso,
‘k’, aumenta, entonces el coeficiente de
autocorrelación decrece.
EXPLORACION DE PATRONES DE DATOS
CON ANÁLISIS DE AUTOCORRELACION
El coeficiente de autocorrelación de 1º orden:
n 1
(Y Y)(Y
t t 1 Y)
r1 t 1
n
t
( Y
t 1
Y ) 2
(Y Y)(Y
t t k Y)
rk t 1
n
t
( Y
t 1
Y ) 2
2008
1050
1290
CON ANÁLISIS DE 2009 1528
2010 1586
AUTOCORRELACION 2011 1960
2013
2118
2116
2014 2477
2015 3199
2016 3702
2017 3316
2018 2702
EXPLORACION DE PATRONES DE DATOS
CON ANÁLISIS DE AUTOCORRELACION
COEFICIENTES DE
AUTOCORRELACIÓN
Salida SPSS: índices
de Autocorrelación.
(ejercicio Reynolds)
EXPLORACION DE PATRONES DE DATOS
CON ANÁLISIS DE AUTOCORRELACION
CORRELOGRAMA
Es una herramienta
gráfica para mostrar
autocorrelaciones
para distintos
atrasos de una serie
de tiempo.
EXPLORACION DE PATRONES DE DATOS
CON ANÁLISIS DE AUTOCORRELACION
CORRELOGRAMA
Los coeficientes de autocorrelación, para diferentes periodos de
atraso de una variable, se usan para contestar las siguientes
preguntas la serie de tiempo:
1. ¿los datos son aleatorios ?
2. ¿ los datos tienen una Tendencia (no son estacionarios)?
3. ¿los datos son estacionarios?
4. ¿Los datos son estacionales?
EXPLORACION DE PATRONES DE DATOS
CON ANÁLISIS DE AUTOCORRELACION
1. Si un a serie es aleatoria , la correlación de Yt y Yt-1 es
cercana a ‘0’, lo que indica que los valores sucesivos de
una serie de tiempo no están correlacionados entre sí.
EXPLORACION DE PATRONES DE DATOS
CON ANÁLISIS DE AUTOCORRELACION
2. Si un a serie tiene tendencia, tendrá una correlación muy
alta; los coeficientes de autocorrelación difieren de
manera significativa de ‘0’, para los primeros periodos de
atraso y después en forma gradual, se acercaran a ‘0’
conforme el número de periodos de atraso aumenta; r1
por lo general es muy grande (cercano a 1)
EXPLORACION DE PATRONES DE DATOS
CON ANÁLISIS DE AUTOCORRELACION
CORRELOGRAMA
(ejercicio clase)
EXPLORACION DE PATRONES DE DATOS
CON ANÁLISIS DE AUTOCORRELACION
CORRELOGRAMA
(ejercicio Reynolds)
EXPLORACION DE PATRONES DE DATOS
CON ANÁLISIS DE AUTOCORRELACION
3. Si un a serie tiene un patrón estacional, un
coeficiente de autocorrelación significativo ocurrirá
en el atraso adecuado, que es cuatro para datos
trimestrales y 12 para datos mensuales.
EXPLORACION DE PATRONES DE DATOS
CON ANÁLISIS DE AUTOCORRELACION
PRUEBA DE HIPOTESIS PARA LOS COEFICIENTES DE
AUTOCORRELACIÓN
•Evalúa si un coeficiente de autocorrelación es
significativamente diferente de cero.
•Los coeficientes de autocorrelación de datos aleatorios
tienen una distribución aproximada-mente normal con =0 y
=1/n.
•Todos los coeficientes de autocorrelación se pueden probar
al mismo tiempo.
EXPLORACION DE PATRONES DE DATOS
CON ANÁLISIS DE AUTOCORRELACION
PRUEBA DE HIPOTESIS PARA LOS COEFICIENTES DE
AUTOCORRELACIÓN
Las hipótesis son: Ho: k = 0
Hi: k ≠ 0
A un determinado nivel de confianza, una serie se puede
considerar aleatoria, si los coeficientes de autocorre-lación
calculados están todos dentro del intervalo producido por la
ecuación:
z: Valor normal estándar para
1 un nivel de confianza
0z n: # de observaciones en la
n serie de datos
EXPLORACION DE PATRONES DE DATOS
CON ANÁLISIS DE AUTOCORRELACION
SERIES ESTACIONARIAS
Series estacionaria tiene sus propiedades estadísticas básicas,
como media y varianza que no cambia con el tiempo. No
presenta crecimiento o declinación.
Los coeficientes de correlación de una serie estacionaria caen
a cero después del 2º o 3º periodo de desfasamiento.
Los modelos de pronósticos avanzados, como modelos de
Box-Jenkins (ARIMA), están diseñados para utilizarse con
«Series de Tiempo Estacionarias».
.
EXPLORACION DE PATRONES DE DATOS
CON ANÁLISIS DE AUTOCORRELACION
SERIES ESTACIONARIAS
Entonces para poder usar el modelo Box-Jenkins se
les debe retirar la tendencia.
Para retirar la tendencia de una serie no estacionaria,
con tendencia, se utiliza el «método de
diferenciación»; se resta Yt de Yt-1; se resta Yt-2 de Yt-1
y así sucesivamente.
EXPLORACION DE PATRONES DE DATOS
CON ANÁLISIS DE AUTOCORRELACION
Serie
Estacionaria
SERIES ESTACIONARIAS
105
-10 Autoc orre lac ione s
35 Serie: Ventas Automoviles
Autocorre Estadístico de Box-Ljung
122
Retardo lación Típ. Errora Valor gl Sig.b
8 1 ,360 ,208 2,999 1 ,083
65 2 -,361 ,202 6,189 2 ,045
100 3 -,311 ,197 8,698 3 ,034
4 ,022 ,191 8,712 4 ,069
160 5 ,090 ,185 8,952 5 ,111
170 6 -,072 ,178 9,113 6 ,167
240 7 -,037 ,172 9,158 7 ,241
238 8 ,011 ,165 9,163 8 ,329
9 -,078 ,158 9,404 9 ,401
58 10 -,082 ,151 9,701 10 ,467
374 11 -,105 ,143 10,244 11 ,509
158 12 -,069 ,135 10,510 12 ,571
13 -,003 ,126 10,510 13 ,652
-2 14 ,011 ,117 10,520 14 ,723
361 15 -,022 ,107 10,562 15 ,783
722 16 -,011 ,095 10,576 16 ,835
503 a. El proceso subyacente asumido es la independencia (ruido
blanco).
b. Basado en la aproximación chi cuadrado asintótica.
-386
-614
EXPLORACION DE PATRONES DE DATOS
CON ANÁLISIS DE AUTOCORRELACION
SERIES ESTACIONARIAS
EXPLORACION DE PATRONES DE DATOS
CON ANÁLISIS DE AUTOCORRELACION
OTRO EJEMPLO DE SERIES ESTACIONARIAS
III.7. CORRELACION SERIAL EN
LA REGRESION DE DATOS
DE SERIES DE TIEMPO
PROBLEMA DE CORRELACION
SERIAL
• Se parte de una suposición técnica, en Regresión,
existe independencia de los términos de error (e),
lo que implica que se ha seleccionado una
muestra aleatoria a partir de la población.
• En las series de tiempo, esta suposición de
independencia se viola, porque no es una
muestra al azar y existe una relación entre el valor
de la variable dependiente en un periodo y su
valor en el siguiente.
PROBLEMA DE CORRELACION
SERIAL
• Los términos de error correlacionados son muy
probables, al utilizar el análisis de regresión para
predecir variables en series de tiempo.
• Existe Correlación Serial cuando las observaciones
sucesivas a través del tiempo se encuentran
relacionadas entre si.
PROBLEMA DE CORRELACION
SERIAL
Correlación Serial:
Describe la situación en que cada término de error
(e) es una función del termino de error del periodo
anterior.
Los residuos están autocorrelacionados.
Las observaciones sucesivas a través del tiempo se
encuentran relacionadas entre si
PROBLEMA DE CORRELACION
SERIAL
DETECCION GRÁFICA DE LA CORRELACION SERIAL
Al examinar la tabla de residuales, se puede observar la
correlación, sobretodo si ésta es fuerte, al identificar diferencias
entre los valores de ‘Y’ y las estimaciones de la recta de
regresión que tienden a ser similares de un periodo al
siguiente, y aparecen cadenas de residuales con el mismo signo.
Ventas
(Ejercicio Reynolds) Año
Reynolds
Ingreso
CORRELACION 2003
2004
555
620
349.4
362.9
2005 720 383.9
SERIAL 2006 880 402.8
2007 1050 437
2008 1290 472.2
2009 1528 510.4
2010 1586 544.5
2011 1960 588.1
2012 2118 630.4
2013 2116 685.9
2014 2477 742.8
2015 3199 801.3
2016 3702 903.1
2017 3316 983.6
2018 2702 1076.7
Residuos
-76.36
-47.53 PROBLEMA DE CORRELACION
-123.91
-132.31 SERIAL
-91.16
-139.75
(Ejercicio Reynolds)
-132.20
-121.56
-41.98
-17.51 Coeficientes Error típico Estadístico t
72.71 Intercepción -792.00 187.1275483 -4.232420287
148.17 Ingreso 4.26 0.316270153 13.45421566
61.06
249.54
227.55
-10.62
108.26
581.34
651.16
-77.38
-1087.54
PROBLEMA DE (ejercicio Reynolds)
CORRELACION SERIAL
PROBLEMA DE CORRELACION
SERIAL
• El Coeficiente de Autocorrelación mide la correlación serial.
y = βo+ β1x+εt
• En la ecuación, εt es el termino de error, es la diferencia
entre el valor real de ‘y’ de una población y su valor
pronosticado por la recta de regresión de la población.
• Para que exista correlación serial, el nivel del termino de
error εt-1 afecte directamente el nivel del siguiente termino
de error.
PROBLEMA DE CORRELACION
SERIAL
La magnitud del coeficiente de correlación de 1º orden, indica la
fuerza de la correlación serial entre los términos de errores
sucesivos.
t 1 t 1 1
εt = Término de error en el periodo t.
εt-1 = Término de error en el periodo t-1
ρ1 = Coeficiente de autocorrelación de 1º orden que mide la
correlación en términos de errores sucesivos.
υt= Término de desorden independiente con distribución normal.
PROBLEMA DECORRELACION
SERIAL
La causa primordial de residuos positivos correlacionados, en
forma serial, es un error de especificación, como una variable
omitida o una forma funcional incorrecta.
Usar mínimos cuadrados, cuando se tiene residuos autocorre-
lacionados en forma positiva, presenta consecuencias:
a. El Se puede ser mucho mas grande de lo que se establece,
proporcionar un r2 alto, cuando en realidad no lo tiene.
b. Los intervalos de confianza y las pruebas con distribuciones ‘t’ y
‘F’ pueden llevar a conclusiones equivocadas.
c. Los coeficientes de regresión en la ecuación de regresión no son
confiables, varían mucho de una muestra a otra. Las interpreta-
ciones basadas en los coeficientes de regresión pueden llevar a
conclusiones equivocadas.
PROBLEMA DE CORRELACION
SERIAL
PRUEBA DURBIN WATSON: Detección de la Correlación Serial.
Detecta la presencia de residuales autocorrelacionados
(correlación serial) en la regresión de una serie de tiempo.
Las hipótesis son: Ho: = 0
Hi: > 0 n
(e t e t 1 )
2
DW t 2
n
t
e 2
t 1
(Ejercicio Clase)
Ventas Pronósti
Reynolds co Venta e t Residuos
Observación Cuad et e t-1 et - e t-1 Cuad dif
1 295 371.36 -76.36 5830.88
2 400 447.53 -47.53 2258.88 -76.36 28.83 831.31
3 390 513.91 -123.91 15353.26 -47.53 -76.38 5834.00
4 425 557.31 -132.31 17506.19 -123.91 -8.40 70.61
5 547 638.16 -91.16 8309.99 -132.31 41.15 1693.47
6 555 694.75 -139.75 19530.86 -91.16 -48.59 2361.35
7 620 752.20 -132.20 17476.21 -139.75 7.56 57.08 (Ejercicio
8 720 841.56 -121.56 14775.89 -132.20 10.64 113.24 Reynolds)
9 880 921.98 -41.98 1762.22 -121.56 79.58 6332.55
10 1050 1067.51 -17.51 306.44 -41.98 24.47 598.94
11 1290 1217.29 72.71 5287.13 -17.51 90.22 8139.31
12 1528 1379.83 148.17 21952.95 72.71 75.45 5693.10
13 1586 1524.94 61.06 3728.82 148.17 -87.10 7586.62
14 1960 1710.46 249.54 62269.62 61.06 188.47 35522.72
15 2118 1890.45 227.55 51776.84 249.54 -21.99 483.72
16 2116 2126.62 -10.62 112.71 227.55 -238.16 56721.02
17 2477 2368.74 108.26 11721.20 -10.62 118.88 14132.69
18 3199 2617.66 581.34 337952.98 108.26 473.07 223797.82
19 3702 3050.84 651.16 424010.97 581.34 69.82 4875.39
20 3316 3393.38 -77.38 5987.62 651.16 -728.54 530771.89
21 2702 3789.54 -1087.54 1182733.93 -77.38 -1010.16 1020415.21
2210645.59 1926032.05
DW = 0.8712532
PROBLEMA DE CORRELACION
SERIAL
ANÁLISIS DE LA PRUEBA DURBIN WATSON
• Si los residuales se autocorrelacionan, estarán cerca unos
de otros de un periodo al siguiente, en este caso resultará
un estadístico de Durbin-Watson pequeño, ya que el
numerador mide las diferencias de error entre periodos
adyacentes.
• Si los residuales no se autocorrelacionan, resultará un
estadístico de Durbin-Watson grande. Esto se debe a que
los términos de error tienden a variar mucho de un periodo
al siguiente, lo que resulta en numerador grande.
PROBLEMA DE CORRELACION
SERIAL
TABLA DE LA PRUEBA DURBIN WATSON
• Columna k: indica el # de variables de predicción que se
usa en la regresión.
• Columna dL: limite inferior.
• Columna dU: Límite superior.
• Tamaño de la muestra indica la fila que se va utilizar.
PROBLEMA DE CORRELACION
SERIAL
INTERPRETACIONES DE LA TABLA DE LA PRUEBA DURBIN
WATSON:
• Si el estadístico D_W calculado es menor que el Limite
Inferior, los residuales tienen una autocorrelación positiva.
• Si el estadístico D_W calculado es mayor que el Limite
Superior, los residuales se distribuyen al azar, no hay
autocorrelación.
• Si el estadístico D_W calculado se encuentra entre el L.
Inferior y el L. Superior, la prueba no es concluyente. Se
necesita una muestra mas grande para determinar si los
residuales se autocorrelacionan.
PROBLEMA DE CORRELACION
SERIAL
PRUEBA DE HIPOTESIS DE LA PRUEBA DURBIN WATSON:
e t
DAM i 1
n
B. MEDICION DEL ERROR EN EL
PRONOSTICO
2. ERROR CUADRATICO MEDI0 (ECM)
Penaliza los errores mayores de pronóstico.
Podría ser mejor una técnica de pronostico que produzca
errores moderados a otra que tenga errores pequeños
pero arroje algunos que son extremos.
t
e 2
ECM i 1
n
B. MEDICION DEL ERROR EN EL
PRONOSTICO
3. PORCENTAJE DEL ERROR ABSOLUTO MEDIO
(PEAM)
Es útil cuando el tamaño o magnitud de la variable del
pronóstico es importante en la evaluación de precisión
del pronóstico
Indica que tan grande son los errores de pronóstico
comparados con los valores reales de la serie de
tiempo.
n
et
i 1 Yt
x100
PEAM
n
B. MEDICION DEL ERROR EN EL
PRONOSTICO
4. ERROR PORCENTUAL MEDIO (EPM)
n
et
i 1 Yt
x100
EPM
n