Nothing Special   »   [go: up one dir, main page]

Análisis de Series Temporales

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 5

ARTÍCULOS DE ESTADÍSTICA

1. ARTÍCULOS DE ESTADÍSTICA

EL ANÁLISIS DE SERIES TEMPORALES: SITUACIÓN Y


PERSPECTIVAS
Daniel Peña e Ismael Sánchez
Universidad Carlos III de Madrid

1. Introducción presentan un comportamiento cíclico estacional, co-


mo consecuencia de la rotación de la tierra alrede-
Este trabajo presenta los modelos más utilizados
dor del sol. Fourier demostró a principios del siglo
en el análisis de series temporales, sus aplicaciones
XIX que toda función periódica puede representar-
más importantes y algunas de las lineas abiertas
se como suma de funciones sinusoidales de distinta
de investigación. Se presentan en primer lugar los
amplitud y frecuencia y los primeros análisis de se-
análisis descriptivos que se utilizaron extensamente
ries climatológicas utilizaron el ajuste de funciones
hasta la segunda mitad del siglo XX para represen-
sinusoidales de distinta amplitud y frecuencia. Sea
tar series temporales. Estos modelos fueron susti-
zt una serie temporal observada en los instantes,
tuidos por los modelos ARIMA y los modelos en el
t = 1, ..., T. Podemos representar exactamente esta
espacio de los estados, que han alcanzado a nales
serie mediante la descomposición
del siglo XX una posición central en las aplicaciones
y pueden considerarse ya como los modelos clásicos T /2
X T /2−1
X
de series. En la última parte del siglo XX comenzó zt = µ + Aj sen(wj t) + Bj cos(wj t).
el desarrollo de los modelos no lineales y no paráme- j=1 j=1

tricos, que han permitido la extensión del análisis donde µ es la media de la serie, Aj y Bj son am-
de series a situaciones donde los modelos clásicos noplitudes y wj = 2πj/T siendo j = 1, 2, ..., T /2. Es
resultan apropiados. fácil comprobar que esta ecuación contiene T pa-
Una serie temporal es el resultado de observar rámetros (la media µ más T /2 amplitudes Aj y
una variable a lo largo del tiempo, generalmente en los T /2 − 1 amplitudes Bj ). En consecuencia, tene-
intervalos regulares (cada día, cada mes, cada año, mos que encontrar un procedimiento para seleccio-
etc). Cuando los valores de la serie oscilan alrededor
nar las frecuencias que debemos incluir para expli-
de un nivel jo con variabilidad constante a lo largocar la evolución de la serie. Este es el objetivo del
del tiempo y la dependencia entre las observaciones periodograma, que es una representación de la con-
sólo depende de la distancia que las separa y perma- tribución de cada frecuencia a la varianza de la serie
nece constante en el tiempo decimos que la serie es y puede construirse estimando el modelo anterior.
estable o estacionaria. En otro caso, decimos que la De forma similar al análisis de la varianza podemos
serie es no estacionaria. Un caso particular impor- descomponer la varianza de la serie en partes debi-
tante de una serie no estacionaria aparece cuando el das a cada uno de los componentes (funciones sinu-
nivel de la serie varía siguiendo un ciclo, como ocu-soidales de distinta frecuencia) y obtener un modelo
rre con las temperaturas mensuales dentro del año, capaz de generar buenas predicciones seleccionando
y este ciclo se repite aproximadamente en periodos los componentes más importantes. El periodograma
de tiempo jos (cada año, cada mes, cada día). A es también útil para detectar ciclos deterministas en
esta clase de series no estacionarias las llamamos la serie. Por ejemplo, en una serie mensual estacio-
series estacionales. nal esperamos encontrar un valor alto del periodo-
grama para f = 1/12, pero también son previsibles
2. Los modelos descriptivos de series tem-
valores altos para f = j/12, es decir, 1/6, 1/4, 1/3,
porales
que son armónicos del periodo estacional.
Las primeras series que se analizaron cuantitati- El análisis de Fourier de una serie se extendió
vamente fueron las de variables climatológicas, co- en la primera mitad del siglo XX para series que
mo la temperatura y la pluviosidad. Estas series además de estacionalidad cíclica presentan tenden-

4
ARTÍCULOS DE ESTADÍSTICA

cias, de manera que su nivel no es constante en el los valores presentes y pasados de una serie tempo-
tiempo, como ocurre en muchas series económicas. ral. Por ejemplo, el modelo más simple supone una
Los llamados métodos de descomposición de series dependencia de sólo un periodo y conduce al mode-
suponen que los datos se generan como suma de tres lo AR(1) zt = c + φzt−1 + at donde c y −1 < φ < 1
efectos: son constantes a determinar. La generalización de
zt = µt + St + at este modelo para cualquier orden de dependencia
lleva al proceso AR(p). Si superponemos la estruc-
donde µt es el nivel de la serie, St es el componente
tura AR y MA se obtienen los procesos ARMA. Su
estacional y at es el componente puramente alea-
forma es:
torio o innovación. Inicialmente, se supuso que el
nivel de la serie podría explicarse por una función zt = φ1 zt−1 +· · ·+φp zt−p +at −θ1 at−1 −· · ·−θq at−q .
determinista del tiempo de tipo polinómico (gene- (2)
ralmente lineal) mientras que la estacionalidad se Existen muchos procedimientos para identicar la
representaba mediante ciclos. Sin embargo, es muy estructura de un modelo ARMA para una serie con-
poco frecuente que una serie tenga una tendencia creta (Peña, 2005) destacando las representaciones
determinista y, como puede verse en Peña (1995) grácas basadas en las funciones de autocorrelación.
estos modelos generan predicciones con estructuras La funcion de autocorrelación mide la dependencia
difíciles de justicar. Un avance importante en el lineal entre la serie en el instante t y la serie en
análisis de series temporales es la representación de un momento anterior, t-k. Para series estacionarias
tendencias mediante métodos de suavizado, como las autocorrelaciones sólo dependen del retardo k y
los métodos de alisado exponencial, que permiten deben tender a cero al aumentar k, para que se man-
que la tendencia cambie suavemente en el tiempo. tenga la constancia del nivel de la serie a lo largo
Estos modelos son casos particulares de los modelos del tiempo. Box y Jenkins (1976) propusieron un
ARIMA,que comentamos en la sección siguiente. procedimiento eciente para identicar el tipo de
modelo en una serie real, estimar sus parámetros
3. Modelos ARIMA y modelos en el espa- por máxima verosimilitud y comprobar analizando
cio de los estados los residuos si el modelo es adecuado. Puesto que el
Según el teorema de descomposición de Wold, principal objetivo en la modelización ARMA es la
una serie estacionaria gausiana de media µ puede predicción de valores futuros la modelización de se-
siempre representarse mediante ries temporales debe incluir una evaluación de la ca-

X pacidad predictiva del modelo seleccionado (West,
zt = µ + ψj at−j , (1) 1996; Peña y Sánchez, 2005). En muchas ocasiones,
j=0 además de la predicción puntual es necesario pro-
P∞
donde j=0 ψj < ∞ y at es un proceso de varia- porcionar intervalos de predicción o estimaciones de
bles normales independientes y con la misma dis- la densidad de la predicción (Pascual et al, 2001).
tribución N(0, σ 2 ), que llamaremos en adelante in- La generalización de estos modelos a procesos
novaciones o proceso de ruido blanco para simpli- no estacionarios lleva a los modelos ARIMA, que
car. Esta representación se conoce como la forma suponen que alguna diferencia de la serie sigue un
MA(∞) de un proceso estacionario y no es muy ope- modelo ARMA. Diremos que un proceso es integra-
rativa al incluir innitos parámetros. Puede verse en do de orden h ≥ 0, y lo representaremos por I(h),
(1) cómo zt es causado por las innovaciones pasadas cuando al diferenciarlo h veces se obtiene un pro-
y presentes. Los modelos ARMA son aproximacio- ceso estacionario. En la práctica, la mayoría de las
nes a esta representación general (1) con pocos pa- series no estacionarias que son integradas tienen un
rámetros. Los modelos MA(q), con q < ∞ suponen orden h ≤ 3. Los modelos ARIMA han mostrado ser
que sólo los primeros q coecientes son no nulos. una herramienta muy ecaz para modelar y prever
Por ejemplo, un MA(1) de media µ sigue el modelo series económicas, demográcas y sociales.
zt = µ+at −θat−1 , donde θ es una constante a deter- Una generalización de los modelos ARIMA es
minar. Otro tipo de modelos lineales que son casos permitir un orden de integración 0 < h < 1. Es
particulares de (1) son los modelos autorregresivos decir, el orden de integración h es fraccionado (mo-
(AR), que establecen una dependencia lineal entre delos ARFIMA). Estos modelos fueron introducidos

5
ARTÍCULOS DE ESTADÍSTICA

    
por Granger y Joyeux (1980) y tienen la propiedad α1,t φ1 1 ... 0 α1,t−1
de memoria larga, ya que la dependencia entre las  α2,t   φ2 0 ... 0   
     α2,t−1 
observaciones se mantiene durante largos periodos.  .. = .. .  .. +
 .   . 0 .. 1  . 
Estos modelos son útiles en series que observamos
αm,t φm 0 ... 0 αm,t−1
con alta frecuencia (cada minuto, cada hora) y han  
sido útiles para explicar series físicas, climatológicas 1
 −θ1 
y nancieras.  
+  .  at (5)
La inclusión de variables exógenas en el mode-  .. 
lo lleva a los denominados modelos de función de −θm
transferencia o modelos ARMAX, que son la ex-
tensión de los modelos de regresión múltiple a se- y es fácil comprobar que sustituyendo sucesivamen-
ries temporales. Un ejemplo sencillo de función de te en las variables de estado se obtiene la represen-
transferencia sería zt = φzt−1 + α0 xt + α1 xt−1 + at . tación del proceso ARMA. Los modelos en espacio
La identicación de una función de transferencia es de estados han sido muy utilizados en el análisis
compleja cuando hay más de una variable exógena bayesiano de series temporales (West y Harrison,
(véase Peña, 2005). Asimismo, existe la generaliza- 1989) y tienen la ventaja de que su generalización
ción de los modelos ARIMA univariantes al caso de multivariante es muy simple y con menos riesgos de
vectores; es decir, al caso en que zt es un vector de sobreparametrización que los modelos VARIMA.
series temporales (modelos VARIMA) (Lutkepohl, 4. Modelos no lineales
1993). Todos los procedimientos de análisis multiva-
riante pueden extenderse al caso de las series tem- Un modelo no lineal puede considerarse como
porales. En concreto, el análisis factorial de series una generalización de la descomposición de Wold
temporales (Peña y Poncela, 2006) es una linea muy (1) al caso en que los coecientes ψj cambian con
activa de investigación. el tiempo. Al igual que sucede con (1), esta formu-
Una alternativa a los modelos ARIMA son los lación tiene limitado interés práctico, por lo que la
modelos en el espacio de los estados (Durbin y modelización de series no lineales suele circunscri-
Koopman, 2001). Estos modelos provienen del mun- birse a casos que tengan aplicaciones reales.
do físico y concretamente de la ingeniería aeroespa-
cial. En la versión más simple que vamos a presen- 4.1. Modelos ARCH/GARCH
tar aquí se supone que la serie se ha generado como En un modelo lineal, la varianza de zt condi-
función de un vector de variables de estado o pará- cionada a las observaciones anteriores es constante.
metros, αt , de dimensión p × 1 que no se observa Este supuesto, sin embargo, no se cumple en muchas
zt = Ht αt + ²t , (3) series reales, siendo ejemplos especialmente relevan-
donde Ht es un vector 1 × p que suponemos conoci- tes muchas series económico-nancieras. En un mo-
do para todo t y ²t es un proceso de ruido blanco. delo ARCH, sin embargo, la varianza condicionada
Por otro lado los parámetros αt evolucionan en el tiene dependencia. Un modelo ARCH se dene co-
tiempo mediante la llamada ecuación de estado mo zt = σt at donde
αt = Ωt αt−1 + ut (4) E(zt2 |zt−1 , zt−2 , ...) = σt2 = c0 +c1 zt−1
2 2
+· · ·+cp zt−p ,
donde Ωt es una matriz conocida de dimensión p×p (6)
y ut otro proceso de ruido blanco, independiente del con ci constantes a determinar. Estos modelos fue-
anterior. ron introducidos por Engel (1982) para la modeli-
Es fácil comprobrar que los modelos ARMA y zación de de la volatilidad en series nancieras. La
los modelos en el espacio de los estados son equi- práctica ha demostrado que muchas series nancie-
valentes y que un modelo ARMA puede conside- ras requieren de valores de p muy altos. Para evitar
rarse como una forma reducida de la forma de es- este efecto se han propuesto los llamados modelos
tado. Para ver esta relación dado un modelo AR- GARCH, que tienen la forma
MA(p,q), denamos zt = (1, 0, ..,0)αt donde αt = p q
X X
(α1,t , α2,t , ..., αm,t )0 y m = máx(p, q + 1). La ecua- σt2 = c0 + 2
ci zt−i + 2
bj σt−j , (7)
ción de estado es: i=1 j=1

6
ARTÍCULOS DE ESTADÍSTICA

de esta forma es posible conseguir modelos con ejemplo una variable exógena, o retardos de zt , pue-
menos parámetros que los ARCH. Los modelos de estimarse de forma no paramétrica de manera
GARCH tienen una estructura que recuerda a los análoga a los modelos no paramétricos de regresión,
modelos ARMA, compartiendo con ellos muchas de como los basados en un estimador Kernel (ver, por
sus propiedades. ejemplo, Vilar-Fernandez y Cao, 2007, y las referen-
cias que contiene), o a los modelos aditivos genera-
4.2. Modelos de regímenes cambiantes lizados (Chen y Tsay, 1993). De esta forma, muchos
Otro tipo de modelos que ha interesado a los métodos estadísticos no paramétricos desarrollados
analistas son los llamados modelos de regímenes para los modelos de regresión son aplicables al caso
cambiantes o modelos por umbrales (Tong, 1990). dinámico. Surgen, sin embargo, numerosos proble-
Estos modelos son lineales por tramos. El paso de mas relacionados con la dependencia de las obser-
un modelo a otro puede venir regido por los valores vaciones. Uno de ellos es la selección del parámetro
de cierta variable. El ejemplo más sencillo serían los de suavizado para los estimadores Kernel. En el ca-
denominados modelos SETAR (self-exciting thres- so de observaciones independientes, el método de
hold autoregressions). Un ejemplo muy sencillo de cross-validation es una herramienta habitual para
modelo SETAR sería utilizando un modelo AR(1) seleccionar dicho parámetro. En el caso de observa-
con sólo dos regímenes: ciones dependientes, el método de cross-validation
ya no es directamente aplicable, y los métodos exis-
½
φ1 zt−1 + at ; zt−d < r, tentes para su adaptación a series temporales re-
zt =
φ2 zt−1 + at zt−d ≥ r. quieren eliminar muchas observaciones.

La dicultad de la modelización estriba en la 5. Áreas de investigación futuras


identicación de los valores de d y r, siendo un área
La evolución de la Estadística ha estado siem-
de investigación abierta. Existen muchas variantes
pre marcada por las aplicaciones que desde otros
de modelos por umbrales, como aquellos que permi-
campos se ha hecho de ella. Es por tanto razonable
ten transiciones suaves (modelos STAR).
pedecir que el futuro de las series temporales avan-
zará en paralelo a los avances en otros campos. Es
4.3. Modelos de parámetros cambiantes fácil ver cómo muchas líneas de investigación, como
Siguiendo la generalización de la descomposición ocurre con los modelos no lineales basados en datos
de Wold, una forma de modelizar la evolución no funcionales, van de la mano de las mayores facili-
lineal de una serie temporal es mediante la mode- dades computacionales. De esta forma, métodos es-
lización ARMA con parámetros que cambien con tadísticos no lineales que hace unos años tenían un
el tiempo. Este tipo de modelos recibe también el interés minoritario se convertirán en herramientas
nombre de modelos con coecientes funcionales. Por habituales de muchos analistas. Las oportunidades
ejemplo, un modelo AR(1) con parámetros cam- que se presentan entonces para el desarrollo de los
biantes sería modelos no lineales son claras. Por otra parte, la
zt = φ0,t + φ1,t zt−1 + at , mayor facilidad para obtener series de alta frecuen-
cia, como ocure en el campo de las telecomunica-
donde la complejidad de la modelización depende de ciones, internet, o nanzas, seguirán demandando
la estructura temporal que queramos asumir para el desarrollo de investigaciones en procesos de larga
(φ0,t , φ1,t ). Una forma sencilla de estimar la secuen- memoria y modelos sobre la volatilidad condiciona-
cia de valores de (φ0,t , φ1,t ) es mediante la estima- da. Asímismo, el mayor empleo de grandes bases
ción recursiva utilizando mínimos cuadrados adap- de datos tanto por parte de instituciones públicas
tativos (Sánchez, 2006). Este tipo de estimación re- como privadas, seguirá impulsando el campo de las
sulta adecuada cuando (φ0,t , φ1,t ) tiene una evolu- series multivariantes así como de técnicas de reduc-
ción suave con el tiempo. En caso contrario, otras ción de la dimensión. Un campo en sus inicios es
formas de estimación serían más apropiadas. el de modelos vectoriales no lineales, donde es es-
En los casos en los que la evolución de (φ0,t , φ1,t ) parable avances importantes en el futuro. Los pro-
pueda relacionarse con otra variable, como por blemas de clasicación y discriminación de series

7
ARTÍCULOS DE ESTADÍSTICA

temporales son también objeto de numeros trabajos [8] Peña, D. (1995). Forecasting Growth with Ti-
recientes. Un factor de desarrollo importante para me Series, Journal of Forecasting, 14, 97-105.
este área serán las aplicaciones en Internet. Para la
[9] Peña, D. (2005): Analisis de series temporales.
ampliación de estas ideas y un punto de vista com-
Alianza Universidad.
plementario sobre el desarrrollo de otras lineas de
investigación remitimos al lector al trabajo de re- [10] Peña, D. y Poncela (2006). Nonstationary Dy-
visión del campo de las series temporales de Tsay namic Factor Analysis, Journal of Statistical
(2000). Planning and Inference, 136, 1237-1257.

Referencias [11] Peña, D. y Sánchez, I. (2005). Multifold Pre-


dictive Validation in ARMAX Time Series Mo-
[1] Box, G.E.P. y Jenkins, G.M. (1976). Time dels, Journal of the American Statistical Asso-
Series Analysis: Forecasting and Control, San ciation, 100, 135-146.
Francisco: Holden-Day.
[12] Sánchez, I. (2006). Recursive estimation of dy-
[2] Chen, R. y Tsay, R. (1993). Functional Coef- namic models using Cook's distance, with ap-
cient Autoregressive Models, Journal of the plication to wind energy forecast, Technome-
American Statistical Association, 88, 298-308. trics, 48, 61-73.

[3] Durbin, J. y Koopman, S.J. (2001). Time Se- [13] Tong, H. (1990). Non-linear time series: a
ries Analysis by State Space Methods. Oxford dynamical system approach. Clarendon Press.
University Press. New York. Oxford.

[4] Engel, R.F. (1982). Autoregressive conditional [14] Tsay, R.S. (2000). Time Series and Forecasting:
heteroscedasticity with estimates of the varian- Brief History and Future Research, Journal of
za of U.K. ination, Econometrica, 50, 987- the American Statistical Association, 95,638-
1008. 43.

[5] Granger, C.W.J. y Joyeux, F. (1980). An intro- [15] Vilar-Fernández, J.M. y Cao, R. (2007). Non-
duction to long-memory time series models and parametric forecasting in time series. A com-
fractional dierencing, Journal of Time Series parative study, Communications in Statistics:
Analysis, 1, 15-29. Simulation and Computation, 36, 311-334.

[6] Lutkepohl, H. (1993). Introduction to Multiple [16] West, K.D. (1996). Asymptotic Inference
Time. Series Analysis. Springer Verlag, Berlin. about Predictive Ability, Econometrica, 68,
1084-1097.
[7] Pascual, L., Romo, J, y Ruíz, E. (2001). Ef-
fects of Parameter Estimation on Prediction [17] West, M. y Harrison, P.J. (1989). Bayesian
Densities: A Bootstrap Approach, Internatio- Forecasting and Dynamic Models. Springer-
nal Journal of Forecasting, 17, 83-103. Verlag. New York.

También podría gustarte