V 31 N 2 A 04 Correal Pena
V 31 N 2 A 04 Correal Pena
V 31 N 2 A 04 Correal Pena
i=1
(j)
i
f
ti
+
(j)
a
t
, si w
td
(
j1
,
j
], j = 1, . . . , c.
(1)
donde w
t
es una variable aleatoria unidimensional observable y estacionaria, f
t
es un vector aleatorio r-dimensional no observable con media cero, u
t
es ruido
blanco k-dimensional con matriz de varianza-covarianza
u
diagonal y denida
positiva, a
t
es un ruido blanco r-dimensional con matriz de varianza-covarianza la
identidad I
r
y tales que u
t
sea independiente de f
th
para h 0, a
t
independiente
de f
th
para h 1, {w
t
}, {u
t
} y {a
t
} independientes entre s. Los parmetros del
modelo son los denominados parmetros umbral: =
0
<
1
< <
c1
<
c
= , el entero positivo d, rezago de la variable umbral, la matriz de carga
, de dimensin (k r) que debe ser tal que rango() = r y
= I
r
, I
r
matriz
identidad de orden r, y los parmetros que determinan la dinmica del factor,
(j)
i
,
(j)
j = 1, . . . , c, matrices de dimensin (r r), con
(j)
diagonal y denida
positiva.
El modelo propuesto detecta componentes comunes no lineales que puedan ser
representadas por modelos umbral y que involucren la dinmica propia del sistema.
La idea general es representar el vector temporal mediante la suma de dos com-
ponentes latentes ortogonales: una comn a las componentes del vector, descrita
por un proceso vectorial autorregresivo threshold TAR, de dimensin menor, y
otra especca a cada componente particular. La variable umbral w puede ser una
de las componentes estacionarias del vector observado, z
jt
, j k, o una variable
exgena estacionaria que afecte el estado del sistema, o una combinacin de las
componentes de Z
t
. Esta combinacin debe ser estacionaria.
Mediante este modelo pueden salir a relucir caractersticas signicativas en un
rgimen y no en el otro. El proceso formulado para los factores permite tener en
consideracin autorregresiones con rdenes diferentes en los regmenes. La serie de
los factores es generada por procesos diferentes en diferentes instantes de tiempo;
su cambio es consecuencia de un estado del sistema que se mantiene hasta que
determinada variable sobrepasa un valor umbral.
3. Propiedades del modelo
3.1. Identicacin
El modelo propuesto hereda los problemas de identicacin presentes en el
modelo factorial esttico debido a la no observabilidad de f. La imposicin de una
estructura TAR con c regmenes para los factores no evita la no identicacin de
los parmetros. Efectivamente, si f
t
es un TAR r-dimensional con c regmenes de
rdenes p
1
, . . . , p
c
y variable umbral w
t
, entonces para cualquier matriz (r r)
no singular C, el vector f
t
= Cf
t
ser tambin un TAR r-dimensional para la
misma variable umbral, el mismo nmero de regmenes c y los mismos rdenes
Revista Colombiana de Estadstica 31 (2008) 183192
186 Mara Elsa Correal & Daniel Pea
autorregresivos dentro de cada rgimen. Especcamente, f
t
se expresa como
f
t
=
pj
i=1
(j)
i
f
ti
+
(j)
a
t
, si w
td
(
j1
,
j
], j = 1, . . . , c
donde
(j)
i
= C
(j)
i
C
1
y
(j)
= C
(j)
. Dicho de otra forma, para cualquier
matriz C no singular, los conjuntos
_
,
(1)
1
, . . . ,
(c)
pc
,
(1)
, . . . ,
(c)
,
u
, d,
1
, . . . ,
c
_
y
_
C
1
, C
(1)
1
C
1
, . . . , C
(c)
pc
C
1
, C
(1)
, . . . , C
(c)
,
u
, d,
1
, . . . ,
c
_
no pueden distinguirse a partir de las observaciones.
Proposicin 1. Las restricciones
= I
r
y
(j)
matriz diagonal y positiva
denida para j = 1, . . . , c, eliminan esta fuente de indeterminacin.
Demostracin. En efecto, si y
= C
1
satisfacen la primera restric-
cin,
= I
r
y (
= (C
1
)
C
1
= I
r
, entonces C ser matriz ortogo-
nal. Adems, si
(j)
y
(j)
= C
(j)
satisfacen la segunda restriccin, entonces
C =
(j)
(
(j)
)
1
y, por tanto, C es diagonal. Puesto que la nica matriz ortogo-
nal y diagonal es la matriz identidad, se concluye que C = I
r
.
Vale la pena mencionar que la representacin TAR de los factores en el modelo
factorial dinmico threshold (1) puede escribirse como f
t
=
pj
i=1
(j)
i
f
ti
+ a
(j)
t
con
a
(j)
t
=
(j)
a
t
. Puede verse entonces que la matriz de varianza covarianza de a
t
puede restringirse a la identidad sin prdida de generalidad.
3.2. Estructura para las matrices de covarianza rezagadas
Las matrices de covarianza para diferentes rezagos contienen informacin acerca
de la dinmica de las interrelaciones entre las diferentes componentes del proceso.
Sean
Z
(h) = E(Z
th
Z
t
),
f
(h) = E(f
th
f
t
) y
u
(h) = E(u
th
u
t
) para h =
0, 1, 2, . . . las matrices de covarianza rezagadas de Z, f y u respectivamente.
Proposicin 2. Si Z
t
se representa mediante un modelo autorregresivo threshold,
rango(
Z
(h)) = r, para h = 1, 2, . . .
Demostracin. En efecto, si f
t
es estacionario de segundo orden, Z
t
tambin lo
es, y puesto que Z
t
= f
t
+u
t
, y u
t
es ruido blanco,
Z
(h) =
f
(h)
, para h = 1, 2, . . .
Esta propiedad es muy til en la etapa de identicacin del nmero de factores
comunes.
Revista Colombiana de Estadstica 31 (2008) 183192
Modelo factorial dinmico threshold 187
3.3. Modelo de rezagos distribuidos por regmenes
Proposicin 3. Z
t
puede expresarse como un modelo de rezagos distribuidos por
regmenes
Z
t
=
pj
i=1
(j)
i
f
ti
+
(j)
t
, si w
td
(
j1
,
j
], j = 1, . . . , c
donde los espacios nulos de
(j)
i
comparten un subespacio comn de dimensin
(k r).
Demostracin. En efecto, remplazando la segunda ecuacin de (1) en la pri-
mera se obtiene
(j)
i
=
(j)
i
; por tanto, si M es una matriz k (k r) cu-
yas columnas generan el espacio nulo de
, M
(j)
i
= 0 para i = 1, . . . , p
j
,
j = 1, . . . , c. Sin embargo, las matrices
(j)
i
no necesariamente tienen rango com-
pleto y rango
_
(j)
i
_
= rango
_
(j)
i
_
.
El ruido asociado al modelo expresado en rezagos distribuidos es
(j)
t
=
(j)
a
t
+ u
t
, y su matriz de covarianza, no necesariamente diagonal, viene dada
por
(j)
= D
(j)
+
u
, j = 1, . . . , c
con D
(j)
=
(j)
(j)
matriz diagonal.
4. Estimacin
Se propone estimar los parmetros del modelo por mxima verosimilitud me-
diante un algoritmo que combina el principio del algoritmo EM con un mtodo de
bsqueda directa. El procedimiento maximiza el logaritmo de la funcin de verosi-
militud L
w
Z
de forma secuencial, primero sobre
1
=
_
,
(1)
,
(2)
,
(1)
,
(2)
,
u
_
y luego sobre
2
= {d, }. Para d y jos, el mximo sobre
1
se obtiene mediante
un algoritmo EM. La utilizacin del algoritmo EM en el contexto de factores din-
micos fue propuesta inicialmente por Shumway & Stoer (1982) y Watson & Engle
(1983) y ha sido utilizada posteriormente por Wu et al. (1996) y Pea & Poncela
(2006), entre otros. En la segunda etapa, por bsqueda directa se encuentran los
valores
d y que maximicen L
w
Z
. La bsqueda se realiza para d {1, . . . ,
d},
d una
cota para el retardo y {
1
, . . . ,
L
}, conjunto formado por los cuantiles mues-
trales de la variable umbral escogidos de forma tal que en cada rgimen se tengan
sucientes observaciones para estimar adecuadamente los parmetros asociados.
Siendo as las cosas, se tendrn que realizar
d L veces el procedimiento EM.
Revista Colombiana de Estadstica 31 (2008) 183192
188 Mara Elsa Correal & Daniel Pea
Para d y jos, el logaritmo de la funcin de verosimilitud de los datos com-
pletos, L
w
Z,f
(
1
;
2
), puede separarse por una funcin indicadora:
L
w
Z,f
(
1
;
2
) = cte
T
2
log |
u
|
1
2
T
t=1
(Z
t
f
t
)
1
u
(Z
t
f
t
)
1
2
tI1
log
(1)
(1)
1
2
tI2
log
(2)
(2)
1
2
tI1(d,)
_
f
t+1
(1)
X
t
_
(1)
(1)
_
1
_
f
t+1
(1)
X
t
_
1
2
tI2(d,)
_
f
t+1
(2)
X
t
_
(2)
(2)
_
1
_
f
t+1
(2)
X
t
_
donde I
1
(d, ) =
_
t {1, . . . , T}/w
td
<
_
, I
2
(d, ) =
_
t {1, . . . , T}/w
td
_
, X
t
= (f
t
, f
t1
, . . . , f
tp+1
)
vector rp 1, y
(i)
=
_
(i)
1
(i)
2
(i)
p
_
matriz
r rp, para i = 1, 2.
Utilizando la solucin de la k-sima iteracin,
(k)
1
, la evaluacin del paso E
del algoritmo
Q
_
1
;
(k)
1
_
= E
(k)
1
_
L
W
Z,f
(
1
;
2
)
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
_
(2)
se obtiene involucrando los algoritmos del ltro de Kalman y de suavizacin de
intervalo jo aplicados a una representacin espacio-estado del modelo. Como re-
sultado de este paso, se obtienen las sucesiones
X
(k)
t|T
, P
(k)
t|T
, M
(k)
t|T
, t = 1, . . . , T,
donde
X
(k)
t|T
= E
(k)
1
_
X
t
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
_
P
(k)
t|T
= E
(k)
1
_
_
X
t
X
t|T
__
X
t
X
t|T
_
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
_
M
(k)
t|T
= E
(k)
1
_
_
X
t+1
X
t+1|T
__
X
t
X
t|T
_
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
_
Teniendo en cuenta que f
t
= S
t
X
t
para S
=
_
I
r
| 0
r
| | 0
r
, tambin se
obtienen las sucesiones
f
(k)
t|T
= E
(k)
1
_
f
t
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
_
= S
X
(k)
t|T
E
(k)
1
_
f
t
f
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
_
= S
_
P
(k)
t|T
+
X
(k)
t|T
X
(k)
t|T
_
S
E
(k)
1
_
f
t+1
X
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
_
= S
_
M
(k)
t|T
+
X
(k)
t|T
X
(k)
t|T
_
Revista Colombiana de Estadstica 31 (2008) 183192
Modelo factorial dinmico threshold 189
En la k-sima iteracin del paso M del algoritmo se maximiza Q
_
1
;
(k)
1
_
con
respecto a
1
. Se mostrar a continuacin que la solucin viene dada por
(k+1)
=
_
T
t=1
Z
t
f
(k)
t|T
__
T
t=1
f
(k)
t|T
f
(k)
t|T
+ P
(k)
_
1
(k+1)
v
=
1
T
_
T
t=1
_
Z
t
(k+1)
f
(k)
t|T
__
Z
t
(k+1)
f
(k)
t|T
_
(k+1)
P
(k)
(k+1)
_
(j)
(k+1)
=
_
tIj
f
(k)
t+1|T
X
(k)
t
+ V
(k)
j
__
tIj
f
(k)
t+1|T
f
(k)
t+1|T
+ W
(k)
j
_
1
, j = 1, 2
(j)
(k+1)
=
1
T
j
_
tIj
_
f
(k)
t+1|T
(j)
(k+1)
X
(k)
t
_
f
(k)
t+1|T
(j)
(k+1)
X
(k)
t
_
+
(j)
(k+1)
W
(k)
j
(j)
(k+1)
_
donde T
j
nmero de casos en el rgimen j y las matrices P
(k)
, V
(k)
j
y W
(k)
j
estn
dadas por
P
(k)
=
T
t=1
S
P
(k)
t|T
S, V
(k)
j
=
tIj
S
M
(k)
t|T
, W
(k)
j
=
tIj
S
P
(k)
t|T
S
para S
=
_
I
r
| 0
r
| | 0
r
.
En efecto, el trmino que involucra a en (2) es
E
_
T
t=1
_
Z
t
f
t
_
1
u
_
Z
t
f
t
_
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
_
que es igual a
traza
_
1
u
T
t=1
_
Z
t
Z
f
(k)
t|T
Z
t
Z
t
f
(k)
t|T
+
_
f
(k)
t|T
f
(k)
t|T
+ S
P
(k)
t|T
S
_
_
_
y, por tanto,
Q
=
1
u
T
t=1
Z
t
f
(k)
t|T
+
1
u
T
t=1
_
f
(k)
t|T
f
(k)
t|T
+ S
P
(k)
t|T
S
_
Igualando a cero este sistema de derivadas parciales, se obtiene el resultado
para
(k+1)
.
Ahora, jando
(k+1)
, la parte de E
_
L
W
Z,f
(
1
;
2
)
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
_
que
involucra a
u
puede escribirse como
T
2
log |
u
|
1
2
traza
_
1
u
T
t=1
_
_
Z
t
(k+1)
f
(k)
t|T
__
Z
t
(k+1)
f
(k)
t|T
_
(k+1)
S
P
(k)
t|T
S
(k+1)
_
_
Revista Colombiana de Estadstica 31 (2008) 183192
190 Mara Elsa Correal & Daniel Pea
y entonces vale el resultado para
(k+1)
u
.
El resultado para
(j)
(k+1)
y
(j)
(k+1)
se prueba de forma similar. En este caso, apa-
rece E(f
t+1
X
t
), que involucra a V
(k)
= S
M
(k)
t|T
. Ms detalles pueden consultarse
en Correal (2007).
El algoritmo proporciona tambin el estimador ptimo de los factores:
f
t|T
= E
_
f
t
| Z
1
, . . . , Z
T
, w
1
, . . . , w
T
_
5. Aplicacin
El modelo y el mtodo de estimacin se aplican a un vector de dimensin 5 con-
formado por los caudales de los ros colombianos Calima, Cauca, Grande, Ovejas y
Prado, que pertenecen a la cuenca del Magdalena. Los datos histricos disponibles
abarcan un periodo de 36 aos y corresponden al periodo comprendido entre enero
de 1955 y diciembre de 1990, para un total de 432 observaciones mensuales.
El procedimiento se realiz en tres etapas resumidas a continuacin. Los re-
sultados detallados pueden consultarse en Correal (2007). En la primera se prob
la hiptesis de que los caudales presentan un comportamiento no lineal del tipo
threshold con variable umbral ndice de Oscilacin del Sur, IOS, variable atmos-
frica relacionada con el evento climtico del fenmeno de El Nio. La hiptesis se
contrast mediante el test propuesto por Tsay (1989). Este se basa en autorregre-
siones reordenadas de acuerdo con la variable umbral w
td
. El test se aplic para
los retardos d = 1, 2, . . . , 12 y para los datos z
it
= (1 B
12
)
1
(1 B
12
) log c
it
,
i = 1, . . . , 5; c
it
caudal del isimo ro en el instante t. De los nueve ros conside-
rados originalmente, los cinco utilizados en esta aplicacin dieron signicativos.
En la segunda etapa, se procedi a identicar el nmero de factores comunes.
Para esto se realizaron dos pruebas, ambas basadas en los vectores propios de
las matrices de autocovarianza rezagadas observadas
Z
(k) = E(Z
tk
Z
t
), y cu-
yos detalles pueden consultarse en Pea & Poncela (2006) y Hu & Chou (2004).
Los resultados de estas pruebas llevaron a plantear un modelo con dos factores
comunes.
En la tercera etapa se implement el algoritmo para estimar los parmetros del
modelo. El algoritmo de bsqueda se realiz sobre el par de conjuntos {1, 2, . . . , 12}
para d y {2.6, 2.5, . . . , 2.3} para , con lo que el algoritmo EM se corri 60
veces.
El estimador del valor umbral fue = 2.3. Puesto que los episodios del
fenmeno de El Nio se presentan acompaados de valores negativos del ndice de
Oscilacin al Sur, el rgimen 1 puede asociarse a una de las fases del fenmeno.
El resultado para el rezago fue
d = 1 y la estimacin para la matriz de carga del
modelo factorial dinmico threshold es
=
_
0.29 0.54 0.34 0.47 0.52
0.94 0.05 0.06 0.23 0.22
_
Revista Colombiana de Estadstica 31 (2008) 183192
Modelo factorial dinmico threshold 191
La estimacin de la matriz de varianzas de los trminos especcos es
u
=
diag(0.016, 0.006, 0.032, 0.040, 0.201), y el modelo estimado para el factor es
_
f
1t
f
2t
_
=
_
0.70 0.00
0.00 0.55
_ _
f
1,t1
f
2,t1
_
+
_
a
1t
a
2t
_
si IOS
t1
< 2.3
_
f
1t
f
2t
_
=
_
0.78 0.00
0.00 0.67
_ _
f
1,t1
f
2,t1
_
+
_
a
1t
a
2t
_
si IOS
t1
2.3
donde cov
_
a
(1)
t
_
= diag(0.30, 0.08), cov
_
a
(2)
t
_
= diag(0.27, 0.04) para
a
(1)
t
=
_
a
(1)
1t
, a
(1)
2t
_
y a
(2)
t
=
_
a
(2)
1t
, a
(2)
2t
_
.
6. Conclusiones
El modelo presentado en este trabajo permite analizar sistemas de series tem-
porales que presenten efectos no lineales del tipo threshold. El modelo puede inter-
pretarse o bien como una reparametrizacin del modelo TAR vectorial, que reduce
signicativamente el nmero de parmetros, o bien como una extensin del modelo
de Pea y Box que permite tener en cuenta efectos no lineales. El vector de los
factores comunes se representa mediante diferentes procesos autorregresivos que
se activan cuando determinada variable sobrepasa un valor umbral. Los diferen-
tes regmenes pueden relacionarse con los estados de una economa o con estados
propios de la naturaleza, como el caso que se estudia en la aplicacin, donde los
estados estn asociados a la presencia o ausencia del fenmeno de El Nio.
Agradecimientos
Este artculo es producto del trabajo de tesis del primer autor (Correal 2007)
para obtener el ttulo de doctor en Estadstica de la Universidad Nacional de
Colombia.
_
Recibido: marzo de 2008 Aceptado: septiembre de 2008
Referencias
Correal, M. E. (2007), Modelo factorial dinmico con efectos umbral, Tesis docto-
ral, Departamento de Estadstica, Facultad de Ciencias, Universidad Nacional
de Colombia.
Forni, M., Hallin, M., Lippi, M. & Reichlin, L. (2005), The Generalized Dyna-
mic Factor Model: One-Sided Estimation and Forecasting, Journal of the
American Statistical Association 100, 830840.
Revista Colombiana de Estadstica 31 (2008) 183192
192 Mara Elsa Correal & Daniel Pea
Gonzalo, J. & Pitarakis, J. Y. (2002), Estimation and Model Selection Based
Inference in Single and Multiple Threshold Models, Journal of Econometrics
110, 319352.
Hansen, B. E. (1997), Inference in TAR Models, Studies in Nonlinear Dynamics
and Econometrics 2, 114.
Hansen, B. E. (2000), Sample Splitting and Threshold Estimation, Econometrica
68, 575603.
Hu, Y. P. & Chou, R. J. (2004), On the Pea-Box Model, Journal of Time Series
Analysis 25, 811830.
Pea, D. & Box, G. E. P. (1987), Identifying a Simplifying Structure in Time
Series, Journal of the American Statistical Association 82, 836843.
Pea, D. & Poncela, P. (2004), Forecasting with Nonstationary Dynamic Factor
Models, Journal of Econometrics 119, 291321.
Pea, D. & Poncela, P. (2006), Nonstationary Dynamic Factor Models, Journal
of Statistical Planning and Inference 136, 12371257.
Shumway, R. H. & Stoer, D. S. (1982), An Approach to Time Series Smoothing
and Forecasting Using the EM Algorithm, Journal of Time Series Analysis
3, 253264.
Stock, J. H. & Watson, M. W. (2002), Forecasting Using Principal Components
From a Large Number of Predictors, Journal of the American Statistical
Association 97, 11671179.
Tong, H. & Lim, K. S. (1980), Threshold Autoregression, Limit Cycles and Cy-
clical Data, Journal of The Royal Statistics Society Ser. B(4), 245292.
Tsay, R. S. (1989), Outliers, Level Shifts and Variance Changes in Time Series,
Journal of Forecasting 7, 120.
Tsay, R. S. (1998), Testing and Modeling Multivariate Threshold Models, Journal
of the American Statistical Association 93, 11881202.
Watson, M. W. & Engle, R. F. (1983), Alternative Algorithms for the Estima-
tion of Dynamic Factor, Mimic and Varying Coecient Regression Models,
Journal of Econometrics 23, 385400.
Wu, L. S., Pai, J. S. & Hosking, J. R. M. (1996), An Algorithm for Estimating
Parameters of State-Space Models, Statistics & Probability Letters 28, 99
106.
Revista Colombiana de Estadstica 31 (2008) 183192