Science">
Material Stata Avanzado
Material Stata Avanzado
Material Stata Avanzado
Avanzado
Aplicado a la Investigación Económica
25 de febrero de 2011
2
5. Modelos Panel 61
5.1. Introducción a la Estimación de los Modelos de Datos Panel . 61
5.1.1. Preparando la base de datos . . . . . . . . . . . . . . . 61
5.1.2. Estimando mi Primer Panel . . . . . . . . . . . . . . . . 62
5.2. Diagnostico y Especificación de los Modelos Panel . . . . . . 63
5.2.1. Controlando la Heterogeneidad dentro de un Panel . . 63
3
4 ÍNDICE GENERAL
6. Panel Dinámico 73
6.1. Heterogeneidad de los paneles de datos . . . . . . . . . . . . . 73
6.2. Estimación intragrupo de modelos dinámicos de datos de
panel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
6.3. Alternativas de estimación de modelos dinámicos con datos
de panel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
6.3.1. Enfoque simple de máxima verosimilitud . . . . . . . . 77
6.3.2. Enfoque de variables instrumentales: estimador sim-
ple de Anderson - Hsiao . . . . . . . . . . . . . . . . . . 78
6.3.3. Método generalizado de momentos . . . . . . . . . . . 79
6.4. Aplicación a una base de datos de empleo . . . . . . . . . . . 83
5
6 1. Modelos de Elección Discreta
Y ∗ = Xβ + e
La formulación del modelo bajo esta teoría parte del supuesto de que
la utilidad derivada de una elección, Ui0 o Ui1 , es función de las variables
explicativas de dicha decisión, que son las características propias de cada
una de las alternativas de elección y las características personales propias
exp( Xβ)
Pr (Y = 1/X ) = Mi = 1+exp( Xβ)
Pr (Y =1/X ) Pr (Y =1/X )
Ω( x ) = Pr (Y =0/X )
= 1− Pr (Y =1/X )
Ln(Ω( x )) = Xβ + e
Es decir medir que tan a menudo ocurre algo (Y=1), respecto a que tan
a menudo no ocurre (Y=0).
Yt = αt + Xkt β k + et
Donde (:
1, si ocurre una alternativa,
Yt =
0, en caso contrario.
Xkt =Variables explicativas
et =Variable aleatoria que se distribuye N (0, σ2 )
En general, la distribución de los modelos de elección binaria se car-
acteriza por configurar una nube de puntos de tal manera que las obser-
vaciones se dividen en dos subgrupos. Uno de ellos esta formado por las
observaciones en las que ocurrió el acontecimiento objeto de estudio (Yi
=1), y el otro, por los puntos muéstrales en los que no ocurrió (Yi =0).Para
el desarrollo de los modelos de elección discreta se utilizará la base de
datos “labora.dta”.
tw sc y admit gpa
kdensity r, normal
en el rango 0-1. Estos son los modelos logit y probit. Analizaremos a con-
tinuación los datos a través de una regresión logística, la cual se formula a
continuación.
e Xβ
Pr (Y = 1) = = ∆( Xβ)
1 + e Xβ
Pos-estimación
b. Test de Wald
Podemos analizar el modelo una vez estimado, mediante un testeo
de hipótesis que validen una correcta especificación. Para esto el test
de Wald calculado para hipótesis lineales sobre los parámetros de
los modelos estimados nos será de mucha utilidad. También puede
usarse el test bajo una estructura no lineal, la cual no abordaremos en
esta sección.
test gpa=0
test gre=gpa, accumulate
c. Test LR
El estadístico de verosimilitud también nos será de gran utilidad para
evaluar mediante hipótesis la significacia de modelos. Este estadístico
compara modelos anidados.
d. Fitstat
A continuación proveeremos de una breve descripción de cada una de
las medidas que computa el “fitstat”. Mayores detalles de las medidas
las podemos encontrar en Long(1997).
N2
L( Mintercepto ) − G2
R2ML = 1− = 1 − exp
L( M f ull ) N
1
R2Count =
N ∑ n jj
j
∑ j n jj − maxr (n++ )
R2Count =
N − maxr (n++ )
−2Ln L̂( Mk ) + 2p
AIC =
N
Donde “p” es el número de parámetros en el modelo (K+1 en
los modelos de regresión binaria donde K es el número de re-
gresores)
BIC
El criterio de información Bayesiana fue propuesto por Raftery
(1996) como una medida que compara modelos anidados como
modelos no anidados. Definimos BIC de la siguiente manera:
y = f ( β 0 + β 1 x1 + ... + β k xk ) + e
e β0 + β k xkt
E(yi ) = Prob(yi = 1) = Mi =
1 + e β0 + β k xkt
Donde
Mi + Mi e β0 + β k xkt = e β0 + β k xkt
Mi
1 − Mi = e β0 + β k xkt
Al cociente de las probabilidades de que se elija la opción 1, frente a la
posibilidad de que se elija la opción 0, se le denomina Odds:
Pr (y = 1)
Odds =
1 − Pr (y = 1)
Veamos un ejemplo
Digamos que la probabilidad de éxito de un evento es 0.8, entonces p=0.8
Entonces la probabilidad de falla del evento será: q=0.2
El odds de éxito es definido como:
Odds(éxito)=p/q=0.8/0.2=4, es decir, el odds de éxito es de 4 a 1.
El odds de falla debe ser entonces:
Odds(falla)=q/p=0.2/0.8=0.25
Tanto el odds de éxito como el de falla son recíprocos.
Pr (y = 1) Mi
Odd = Ω = = = e β0 + β k xkt
Pr (y = 0) ( 1 − Mi )
Entonces
LnΩ = β 0 + β k xkt
Lo cual nos indica que por cada unidad de cambio en Xk , esperamos que
el logit cambie en β k manteniendo las demás variables constantes.
Ω( x, xk ) = e β0 e β1 x1 e β2 x2 ...e β k xk
Medidas superiores a uno de e β k , quiere decir que los odds son e β k ve-
ces mayores, mientras que medidas inferiores a uno de e β k , quieren decir
que los odds son e β k veces menores.
Veamos un ejemplo
Aquí codificamos a admit como 1 para si, y 0 para no, gender es codifi-
cado como 1 para hombre y 0 para mujeres. El comando Logistic produce
resultados en términos de odds ratios, mientras Logit produce resultados
en términos de coeficientes.
clear
input admit gender freq
1 1 7
1 0 3
0 1 3
0 0 7
end
logistic admit gender [weight=freq]
logit admit gender [weight=freq]
Existe una relación entre los coeficientes que produce Logit y los odds ra-
tios que produce Logistic. Primero un Logit es definido como un logaritmo
base e (log) de un odds:
Una regresión Logística es una relación ordinal, usa el logit como la vari-
able dependiente:
Logit( p) = β 0 + β k Xk
log( p/q) = β 0 + β k Xk
p/q = e β0 + β k Xk
OR = e β = e1,694596 = 5,44
listcoef, help
Para analizar esto, veremos los comandos “prvalue”, “prtab”, “prgen”, “pr-
change”, “mfx”.
PRVALUE
Calcula valores predichos de la endógena, para especificaciones de las vari-
ables independientes, pudiendo calcular diferencias en predicciones para
dos set de valores.
PRTAB
Crea una tabla de endógena predicha, para un cruce de clasificaciones
por encima de cuatro categorías de variables independientes, mientras las
restantes son mantenidas en valores específicos.
PRCHANGE
Calcula el cambio discreto o continuo de la variable endógena predichas.
PRGEN
Calcula valores predichos de la endógena, cuando una variable independi-
ente cambia sobre un rango especificado, manteniendo las demás variables
constantes.
RETO 1
[?]Con la base de datos “highschool” genere una variable latente
llamada “hiwrite” que marque el valor de la unidad si la nota
de escritura supera al menos 52, luego estime un logit con las
variables explicativas read, female y prog. Realice un análisis
econométrico y responda:
. ¿cuál es el efecto de un cambio en los parámetros de las variables
explicativas sobre hiwrite?.
¿Como interpretarias los ODDs de la regresión logistica?
¿Realice un testeo de hipótesis LM sobre un modelo que incluya
vs uno que no incluya los efectos de la variable “prog”, programa
academico?.
¿Cómo cambian las probabilidades si prog_2=0 y prog_2=1?.
21
22 2. Modelos de Elección Ordinal
yi∗ = xi β + e
Donde la variable endógena toma los siguientes valores:
1, si −∞ = r0 ≤ yi∗ < r1 ,
∗
2, si r1 ≤ yi < r2 ,
yi = 3, si r2 ≤ yi∗ < r3 ,
..
.
J, si r J −1 ≤ yi∗ < r J = ∞.
Pr (y ≤ m/x )
Ω≤m|>m =
Pr (y| > m/x )
Para una simple variable independiente y tres categorías en la explica-
da, donde el intercepto fue fijado en “0”, tendriamos:
Pr (y≤1/x )
Ln( Pr(y>1/x) ) = r1 − β 1 x1
Pr (y≤2/x )
Ln( Pr(y>2/x) ) = r2 − β 1 x1
Parece confuso que el modelo substraiga xb en lugar de añadirlo, esto
es consecuencia del calculo del logit de y ≤ m vs y > m.
xβ = β yr89 yr89 + β male male + β white white + β age age + β prst prst
Aquí las salidas sean con ologit, oprobit, pueden ser comparadas con el
outreg:
version 8
ologit warm yr89 male white age ed prst,nolog
fitstat
Sy∗ βk
βk =
σy∗
Por cada unidad en que se incremente xk , se espera que y∗ se incremente
Sy∗
en β k desviaciones estándar, manteniendo las demás variables constantes.
σk β k S ∗
βSk = = σk β k y
σy∗
Por cada desviación estándar en que se incremente xk , se espera que y∗
se incremente en βSk desviaciones estándar, manteniendo las demás vari-
ables constantes.
Podemos observar que en 1989 el apoyo hacia las madres que trabajan
fue de 0.27 desviaciones estándar mayores que en 1977, manteniendo las
Predicción de Probabilidades
Probabilidad Predicha
Tipo de individuo SD D A SA
Hombres de la clase trabajadora en1997 0.23 0.42 0.27 0.07
quienes están cerca del retiro
Mujeres jóvenes con alta educación en 0.02 0.08 0.32 0.59
1989 con trabajos prestigiosos
Individuo promedio en 1977 0.13 0.36 0.37 0.14
Individuo promedio en 1989 0.08 0.28 0.43 0.21
1977 SD D A SA
Hombres 0.19 0.4 0.32 0.1
Mujeres 0.1 0.31 0.41 0.18
Diferencia 0.09 0.09 -0.09 -0.08
1989 SD D A SA
Hombres 0.12 0.34 0.39 0.15
Mujeres 0.06 0.23 0.44 0.27
Diferencia 0.06 0.11 -0.05 -0.12
En este ejemplo “w98x” tendrá los valores de “age”, para el rango de 20-
80, la p# variable contiene la predicción de la probabilidad para la opción #
de la endógena. Cuando el modelo es ordinal, “prgen” también calcula las
probabilidades acumuladas, las que son indicadas por w89s#, la cual es la
suma de probabilidades para las características 1 y 2.
El cambio marginal también puede ser analizado con mfx, este coman-
do no calcula los efectos del conjunto de variables independientes y solo
estima el efecto marginal para una categoría por vez, la cual es especifica-
da en la opción predict(outcome(#)). Veamos ésto con una estimación del
ologit y considerando las mismas variables.
RETO 2
[?]Se realizo una encuesta a 400 padres de familia, preguntan-
doles el grado de aceptación sobre la graduación de sus hijos,
sus respuestas fueron categorizadas en tres niveles (desacuerdo,
moderado acuerdo, muy de acuerdo), además se tomo informa-
ción sobre el record academico de sus hijos, el tipo de universi-
dad al que asistio su hijo, y el nivel de educación de los padres
(si alguno logro algún grado universitario).
Con la información contenida en el archivo ologit, se le pide:
35
36 3. Modelos de Elección Nominal
Hay que señalar que los tres logits binarios incluyen información re-
dundante, dado que ln( a/b) = ln( a) − ln(b), obteniéndose la siguiente
igualdad.
Pr ( P/x ) Pr ( E/x ) Pr ( P/x )
ln − ln = ln
Pr (S/x ) Pr (S/x ) Pr ( E/x )
Esto implica que:
Pr (y = m/x )
lnΩm/b ( x ) = ln = xβ m/b , ∀m = [1, J ]
Pr (y = b/x )
Donde “b” es la categoría base, la cual hace referencia al grupo de com-
paración. Las J ecuaciones pueden ser resueltas calculando las probabili-
dades predichas:
exp( xβ m/b )
Pr (y = m/x ) = J
∑ j=1 exp( xβ j/b )
Mientras las probabilidades predichas serán obtenidas con la categoría
b, cambiar la base de la categoría podría confundir a algunos, dado que
los resultados de los parámetros tienden a ser algo diferentes. Solo habría
un cambio en la parametrización mas no en la estimación de las probabili-
dades predichas, dado que estas serán las mismas, sea cual sea la categoría
base. Las probabilidades para tres categorias podrian ser:
exp( xβ m/1 )
Pr (y = m/x ) = J
∑ j=1 exp( xβ j/1 )
exp( xβ m/2 )
Pr (y = m/x ) = J
∑ j=1 exp( xβ j/2 )
Aplicación
Por defecto mlogit deja como categoría base a la salida con mayor can-
tidad de observaciones. Alternativamente, uno puede seleccionar la cate-
goría base con “basecategory()”. Uno podría estar interesado en saber como
la raza afecta la ubicación de los trabajadores entre artesanos y sirvientes,
lo cual no fue estimado en la salida anterior, pero podría ser calculado esti-
mando el mlogit con una categoría diferente, sin embargo es mas fácil usar
“listcoef”, el cual presenta las estimaciones para todas las combinaciones
de categorías.
El LR-test involucra:
Test de Wald
mlogtest, wald
O también:
test [Menial]
1 Anderson 1984
test [Menial=Craft]
Una vez más, los resultados son idénticos a los reportados en mlogtest.
Este comando puede usar restricciones, para ver esto, nosotros usamos
el test que compara la categoria sirviente con obrero. Primero calculamos
el modelo completo y guardamos los resultados:
Así la opción [Menial] indica que todos los coeficientes excepto la con-
tante de las ecuaciones de la categoria sirvientes (Menial), serán cero.
Finalmente re-estimamos el modelo con la restricción. La categoría base de-
berá ser obreros (Bluecol), así que los coeficientes indicados por “[Menial]”
son comparados entre Bruecol y Menial.
lrtest, using(lrf)
Pr (y = m/x )
= exp[ x ( β m/b − β n/b )]
Pr (y = n/x )
Hay dos test que tratan el supuesto IIA. Hausman y McFadden (1984)
propusieron un test tipo Hausman. Y McFadden, Tye y Train (1976) pro-
pusieron una aproximación al test de ratio de verosimilitud, que fue im-
plantado por Small y Hsiao (1985). Ambos, asumían que el MNLM es esti-
mado con la categoría base “b”, y existían por tanto J-1 test a ser calculados
excluyendo cada uno las principales categorías para formar un modelo re-
stricto. Para cambiar la categoría base, el test puede ser calculado excluyen-
do b. El resultado del test difieren dependiendo de cual es la categoría base
que fue usada para estimar el modelo.
Test de Hausman
Dejar que β̂∗sr sea una sub muestra de β̂ sr luego de eliminar los coefi-
cientes no estimados en el modelo restricto. El test será:
mlogtest, smhsiao
fitstat
use ordwarm2,clear
ologit warm yr89 male white age ed prst, nolog
predict SDologit Dologit Aologit SAologit
label var Dologit "ologit-D"
mlogit warm yr89 male white age ed prst,nolog
predict SDmlogit Dmlogit Amlogit SAmlogit
label var Dmlogit "mlogit-D"
dotplot Dologit Dmlogit
use nomocc2,clear
mlogit occ white ed exper, b(5) nolog
quietly prvalue, x( white 0) rest(mean) save
prvalue, x(white 1) rest(mean) dif
J
∂Pr (y = m/x )
= Pr (y = m/x )[ β k,m/J − ∑ β k,m/J Pr (y = j/x )]
∂xk j =1
Dado que esta ecuación combina todos los β k,j/J , el valor de los cam-
bios marginales dependen de los valores de todas las variables del
modelo. Mas aun cuando el valor de xk cambia, el signo del im-
pacto marginal puede cambiar. Por ejemplo, en algún punto, el efecto
marginal de la educación sobre tener una ocupación de sirvientes po-
dría ser positivo, mientras que en otro punto dicho efecto podría ser
negativo.
J ∆Pr (y = j/x )
¯ =1
∆ ∑
J j =1
∆x k
prchange
Los cambios marginales son listados en las filas del Efecto Marginal.
Para variables que no son binarias, los cambios discretos son reportados
sobre el rango completo de las variables (reportado como Min → Max),
para cambios en una unidad centrada alrededor de los valores base (re-
portado como -+1/2) y para cambios en una desviación estándar centrada
El cambio marginal también puede ser calculado con “mfx”, que al igual
que “prchange”, calcula el cambio manteniendo todo el conjunto de vari-
ables independientes en su media. Hay que notar que no solo nos permite
calcular el efecto de un conjunto de variables en el modelo, sino que tam-
bién estima los efectos marginales para una categoría a la vez:
Sesgo por errores en las variables (EV); es decir, medimos X con error.
Yi = β 0 + β 1 ∗ Xi + µi
Relevante: corr ( Zi , Xi ) 6= 0
Exógeno: corr ( Zi , ui ) = 0
57
58 4. Modelos de Variables Instrumentales
Xi = π0 + π1 Zi + vi
drop if inlf==0
Test de Hausman
Figura 5.1:
reshape wide birth_yr age race msp nev_mar grade collgrad not_smsa \\\
city south ind_code occ_code union wks_ue ttl_exp tenure hours \\\
wks_work ln_wage, i(idcode) j(year)
reshape long birth_yr age race msp nev_mar grade collgrad not_smsa \\\
c_city south ind_code occ_code union wks_ue ttl_exp tenure hours \\\
wks_work ln_wage, i(idcode) j(year 68 69 70 71 72 73 74 75 76 77 \\\
78 79 80 81 82 83 84 85 86 87 88)
61
62 5. Modelos Panel
Figura 5.2:
iis idcode
tis year
generate age2=age^2
generate ttl_exp2=ttl_exp^2
generate tenure2=tenure^2
generate byte black=race==2
xthausman
El enfoque más simple de analizar datos tipo panel es omitir las dimen-
siones del espacio y el tiempo de los datos agrupados y sólo calcular la
regresión MCO usual. Este modelo se expresa como:
Efectos Aleatorios
Figura 5.3:
El p-value nos indica que podemos rechazar la Ho; por lo tanto, los
efectos aleatorios µi son relevantes y es preferible usar la estimación de
efectos aleatorios en vez de la agrupada.
Efectos Fijos
xi: reg spend dem* divgov dis1 persinc* aper* popul* i.stcode
El cual estima una dummy para cada estado. Una opción más sencilla
es el comando xtreg:
El p-value nos indica que podemos rechazar la Ho, por lo que es preferi-
ble usar el método de efectos fijos al modelo agrupado.
Figura 5.4:
xi: xtreg spend dem1 demmaj1 demgov divgov dis1 persinc* \\\
aper* popul* i.year, fe
xi: reg spend dem1 demmaj1 demgov divgov dis1 persinc* aper* \\
popul* i.stcode i.year
Al igual que con los efectos estatales, podemos realizar una prueba F
para conocer la significancia conjunta de las variables dicotómicas tempo-
rales en nuestro modelo. La hipótesis nula es que η1 = η2 = ... = ηt = 0 .
En nuestro ejemplo, luego de estimar un modelo con efectos fijos estatales
y temporales, indicamos en la ventana de comando:
Autocorrelación
Figura 5.5:
Heterocedasticidad
Correlación Contemporánea
por los eventos que afectan por igual a todas las unidades (estados) en un
año dado. La correlación contemporánea es similar, pero con la posibili-
dad de algunas unidades estén más o menos correlacionadas que otras. El
problema de correlación contemporánea se refiere a la correlación de los
errores de al menos dos o más unidades en el mismo tiempo t. En otras
palabras, tenemos errores contemporáneamente correlacionados si existen
características inobservables de ciertas unidades que se relacionan con las
características inobservables de otras unidades. Por ejemplo, los errores de
dos estados pueden relacionarse pero mantenerse independientes de los er-
rores de los demás estados. En nuestro ejemplo, una fuerte helada podría
afectar a los estados agrícolas, disminuyendo la producción y por tanto el
ingreso (que se asocia con nuestra variable dependiente spend). Pero este
efecto probablemente no se manifieste en los estados no agrícolas.
Stata ejecuta FGLS y PCSE con los comandos xtgls y xtpcse. Las op-
ciones que ofrecen estos comandos dependen de los problemas detecta-
xi: xtgls spend dem1 demmaj1 demgov divgov dis1 persinc* aper* \\\
popul* i.stcode i.year, panels (correlated) correlation(ar1)
ó el comando:
xi: xtpcse spend dem1 demmaj1 demgov divgov dis1 persinc* aper* \\\
popul* i.stcode i.year, correlation(ar1)
RETO 3
[?]En el modelo de crecimiento aleatorio:
73
74 6. Panel Dinámico
−(1 − α) (1 − α T )
t −1 T −t
plim(α̂ − α) = 1−α −α + ∗ Φ −1
T−1 T (1 − α )
(1 − α T )
2α t −1 T −t
Φ = 1− 1−α −α +
( T − 1)(1 − α) T (1 − α )
Esta expresión permite observar, en primer lugar, que para todo al pha >
0 el sesgo es negativo, en segundo lugar, que ese sesgo depende (y por
tanto varía) con el corte transversal t elegido, siendo menor para los cortes
situados en los extremos del intervalo muestral que para aquellos situados
en el medio de la muestra.
En el caso en que utilizásemos la muestra completa para la estimación
por MCO del modelo en diferencias con respecto a la media, la expresión
de este sesgo toma la forma:
−1
−(1 − α) (1 − α T ) (1 − α T )
2α
plim(α̂ − α) = 1− 1− 1−
T−1 T (1 − α ) ( T − 1)(1 − α) T (1 − α )
−(1 − α)
plim(α̂ − α) =
T−1
λ
plim(α̂ − α) =
λ (1 − α ) + (1 + α )
donde λ = σu2 /σ2 , , haciendo evidente que la estimación depende de σu2
(la dispersión de los efectos µi en la población).
Por otro lado, otros estudios también recientes, como los de Judson
y Owen (1999), invitan a seguir utilizando el estimador de efectos fijos en
paneles en los que la dimensión temporal no sea muy pequeña con relación
a la transversal, argumentando que el sesgo, en este caso, no habría de
ser considerable. Los experimentos de Monte Carlo en este sentido sug-
ieren que, incluso con un número aproximado de 30 observaciones tem-
porales, el sesgo del estimador de efectos fijos no superaría, en el peor de
los casos (es decir, en presencia de un parámetro autorregresivo elevado)
el 20 % del verdadero valor del parámetro. Los experimentos de estos dos
autores sirvieron para recomendar, como mejor alternativa, la modificación
de Kiviet seguido del estimador de Método Generalizado de Momentos y,
por último, el estimador simple de Anderson - Hsiao.
0
yi1 0 ... 0 4ei3
0 yi1 , yi2 ... 0 4e
i4
E[ Zt0 ēt ] = 0 → .. .. .. .. = 0
. ...
. . .
0 0 . . . yi1 , yi2 , . . . , yi(T −2) 4eiT
De entre los autores que más han contribuido a mejorar este método,
debemos mencionar expresamente a Ahn y Schmidt (1995). Ambos dedi-
caron algunos de sus trabajos a perfeccionar el método base de estimación
propuesto por Arellano y Bond, derivando, por ejemplo, restricciones no
lineales de momentos antes no explotadas por Arellano y Bond (1991).
Además, en Ahn y Schmidt (1997), los autores ofrecieron una completa
relación de los conjuntos de condiciones ortogonales correspondientes a
una amplia variedad de asunciones relativas a las perturbaciones y a las
condiciones iniciales del modelo dinámico. Aunque muchos de los momen-
Por otro lado, Ziliak (1997), estudió en que medida era conveniente, de
cara a la eficiencia asintótica del estimador, la selección indiscriminada de
cuantos instrumentos fueran posibles en cada contexto. Tauchen (1986) ya
había recomendado utilizar un número sub - óptimo de momentos para
el caso de series temporales, reduciendo así el sesgo en la estimación por
empleo de muestras pequeñas, a cambio de una leve pérdida de eficiencia.
Andersen y Sorensen (1996), habían encontrado, en esta misma línea, que
el GMM tiende a funcionar igualmente mal tanto con defecto como con ex-
ceso de instrumentos. Este problema (el del exceso de instrumentos), puede
ser más pronunciado en el caso de un panel de datos, de modo que Zili-
ak (1997) realizó una serie de experimentos de Monte Carlo para modelos
dinámicos comprobando que el hallazgo de Tauchen también era válido en
este contexto: el sesgo a la baja en la estimación podía llegar muy severo
a medida que el número de momentos se expande excesivamente, hacien-
do inútiles las ganancias de eficiencia. Continuando los estudios de Ziliak,
los autores Ahn, Schmidt y Wooldridge (1999), Ahn y Schmidt (1999a) e
Im et al. (1995) analizaron algunos procedimientos para localizar condi-
ciones redundantes de cara a encontrar versiones modificadas del GMM
con propiedades razonables en muestras pequeñas.
Una primera intuición para mostrar el efecto fijo abstrayéndolo del er-
ror es usando variables dummys para cada individuo, y así correr un esti-
mador Mínimo Cuadrado de Variables Dummy:
xi: regress n nL1 nL2 w wL1 k kL1 kL2 ys ysL1 ysL2 yr* i.id
1
T −1 ( vi2 + ... + viT ). El problema es que el termino yit−1 en yit∗ −1 esta correla-
cionado negativamente con el − T − 1 ∗
1 ( vit−1 ) en vit mientras que por simetria,
1
− T− 1 ( yit−1 ) y vit también se mueven juntos.
Peor aún uno no puede atacar la endogeneidad continua, instrumentan-
do yit∗ −1 con rezagos de yit−1 porque estos estan incrustados em eñ error
transformado vit∗ . Por el contrario, si T fuera grande entonces los terminos
1 1
− T− 1 ( vit−1 ) y − T −1 ( yit−1 ) serian insignificativos y el problema desapare-
ceria. Judson y Owen (1999) encontraron en una simulación que el sesgo
era de 20 % del coeficiente de interés, aún con T=30.
q
T −1
T −√ 1 −√ 1 ...
qT (T −1) T ( T −1)
T −2
T −√ 1 . . .
M⊥ = ( T −1)( T −2)
q
T −3
T . . .
...
ivreg D.n (D.nL1= nL2) D.(nL2 w wL1 k kL1 kL2 ys ysL1 \\\
forvalues yr=1978/1984 {
forvalues lag = 2 / '= 'yr' - 1976' {
quietly generate z'yr'L'lag' = L'lag'.n if year == 'yr'
}
}
quietly recode z* (. = 0)
ivreg D.n D.(nL2 w wL1 k kL1 kL2 ys ysL1 ysL2 yr1979 yr1980 \\\
yr1981 yr1982 yr1983) (D.(nL1 nL2) = z*), nocons
APLICANDO GMM
xtabond2 n L.n L2.n w L.w L(0/2).(k ys) yr*, gmmstyle(L.(n w k)) \\\
ivstyle(L(0/2).ys yr*) noleveleq nocons robust small
Testeando la autocorrelación
RETO 4
[?]Para ilustrar el mercado de crédito en moneda extranjera, se
considera que los bancos, a parte de los depósitos, pueden obten-
er todos los fondos que necesiten del exterior, además de que
puede existir más de un instrumento de política monetaria, co-
mo la tasa de interés en MN y los encajes en MN y ME así como
los encajes a las líneas del exterior. Así, pues se incorpora a este
modelo, la variable que indica al producto y al nivel de precios, y
se abandona el supuesto de que las tasas de encaje se mantienen
constantes. El supuesto básico es que los bancos evaden el ries-
go cambiario “casando” activos y pasivos por tipo de moneda;
de esta manera, es como si hubiera dos sistema bancarios, uno
que opera en moneda nacional (MN), y otro que opera en mon-
eda extranjera (ME). Además de que se supone fija la tasa de
interés en MN y el tipo de cambio, pasando a ser determinados
los bonos en el mercado de crédito en ME y la oferta monetaria
en el mercado de dinero. De esta manera, se puede modelar el
equilibrio en el mercado de crédito en ME, lo cual es relevante
en un análisis del crédito en la economía peruana, que está car-
acterizada por una alta dolarización y porque además se toma
en cuenta fuentes alternativas de financiamiento distintas a los
depósitos como las fuentes de financiamiento externo. Con la in-
formación contenida en el archivo “finanzas.dta”, se le pide:
[6] Manuel Arellano and Stephen Bond - Some Tests of Specification for
Panel Data: Monte Carlo Evidence and an Application to Employment
Equations.
[7] J. Scott Long, Jeremy Freese - Regression Models for Categorical De-
pendent Variables Using Stata, 2nd Edition.
97