Linear Regression">
PDF Trabajo Econometria Con e - Compress
PDF Trabajo Econometria Con e - Compress
PDF Trabajo Econometria Con e - Compress
UNIDAD 1
EJEMPLO 7.1
Modelo: Comportamiento de la mortalidad infantil (MI) en relación con el PIB per cápita
(PIBPC) y el alfabetismo femenino medido por la tasa de alfabetización de las mujeres
(TAM).
Datos:
Los datos necesarios se proporcionan en la tabla 6.4. Fecundidad y otros datos de 64 paises.
______________________
Tenga en cuenta que la MI es el número de muertes de niños menores de 5 años por cada
1 000 nacidos vivos, el PIBPC es el PIB per cápita en 1980 y la TAM se mide en porcentaje.
La muestra se realizó en 64 países.
Estimación:
Interpretación
−0.0056 es el coeficiente de regresión parcial del PIBPC e indica que, si se mantiene
constante la influencia de la TAM, conforme el PIBPC se incrementa, por ejemplo en un
dólar en promedio, la mortalidad infantil disminuye en 0.0056 unidades. Para interpretar
esto desde el punto de vista económico, si el PIB per cápita se incrementara 1 000 dólares,
en promedio, el número de muertes de niños menores de 5 años se reduciría a 5.6 por cada
1 000 nacimientos vivos.
El coeficiente −2.2316 señala que si la infl uencia del PIBPC se mantiene constante, el
número de muertes de niños menores de 5 años disminuiría, en promedio, 2.23 por cada 1
000 nacimientos vivos, si la tasa de alfabetización en las mujeres subiera un punto
porcentual.
El valor del intercepto de alrededor de 263, si se interpretara de una forma mecanicista,
significaría que si los valores del PIBPC y de la TAM fuesen cero, la mortalidad infantil
promedio sería de más o menos 263 muertes por cada 1 000 nacimientos vivos.
El valor de R2 de casi 0.71 significa que casi 71% de la variación en la mortalidad infantil se
explica mediante el PIBPC y la TAM.
Regresión sobre variables estandarizadas
Comando:
__________________________
Interpretación:
En esta regresión, si se conserva constante la TAM, un incremento igual a una desviación
estándar en el PIBPC propicia, en promedio, una disminución de 0.2026 desviación estándar
en la MI.
Si se conserva al PIBPC constante, un incremento igual a una desviación estándar en la TAM,
en promedio, causará una disminución de 0.7639 de desviación estándar en la MI.
En términos relativos, el alfabetismo en las mujeres tiene un mayor impacto en la
mortalidad infantil que el PIB per cápita. Aquí se advierte la ventaja de utilizar variables
estandarizadas, pues la estandarización hace que todas las variables tengan una medida
común, en vista de que todas las variables estandarizadas tienen medias iguales a cero y
varianzas unitarias.
EJEMPLO 7.2
Considere los datos de la tabla 7.1, los cuales se refi eren al consumo de tazas de café por
día (Y) y el precio al menudeo del café (X) en Estados Unidos de 1970 a 1980. Al aplicar MCO
a los datos se obtienen los siguientes resultados de la regresión:
(7.8.9)
Como es un modelo de doble logaritmo, el coeficiente de la pendiente proporciona un
estimado directo del coeficiente de elasticidad del precio. En el ejemplo presente, indica
que si el precio del café por libra se incrementa 1%, en promedio, su consumo diario
disminuye casi 0.25%. Recuerde que, en el modelo lineal (7.8.8), el coeficiente de la
pendiente sólo señala la tasa de cambio del consumo del café respecto del precio. (¿Cómo
estimará la elasticidad-precio en el modelo lineal?) El valor r2 de casi 0.74 significa que 74%
de la variación en el logaritmo de la demanda de café se explica por la variación en el
logaritmo del precio del café. Como el valor r2 (0.6628) del modelo lineal es menor que el
valor r2 de 0.7448 del modelo lineal logarítmico, se presenta la tentación de elegir este
último modelo debido al alto valor de r2. Sin embargo, por las razones expresadas, no es
posible hacerlo así. No obstante, si desea comparar ambos valores r2, puede proceder de
la siguiente manera:
1. Obtengâ para cada observación; es decir, encuentre el valor estimado de cada
1.
observación a partir de este modelo.
2. Tome el antilogaritmo de esos valores
2.
3. Calcule r2 entre dichos valores del antilogaritmo y la verdadera Yt de la manera
3.
señalada por la ecuación (3.5.14). Este valor r2 es comparable con el valor r2 del
modelo lineal (7.8.8). 2. Otra forma es suponer que todos los valo
valores
res Y son positivos,
en cuyo caso calcule los logaritmos de los valores Y, ln Y. Obtenga los valores
estimados Y, ˆ Yt, del modelo lineal (7.8.8), calcule los logaritmos de dichos valores
estimados Y (es decir, ln ˆ Yt) y calcule la r2 entre (ln Yt) y (ln ˆ Yt) como en la
ecuación (3.5.14). Este valor r2 es comparable con el valor r2 obtenido mediante
(7.8.9).
Para el ejemplo del café, en la tabla 7.2 se presentan los datos originales necesarios para
calcular las r2 comparables. A fi n de comparar el valor r2 del modelo lineal (7.8.8) con
el de (7.8.9), primero obtenemos el logaritmo de (ˆ Yt) [dado en la columna (6) de la
tabla 7.2], luego calculamos el logaritmo de los valores reales Y [dados en la columna
(5) de la tabla] y por último calculamos
calc ulamos r2 entre estos dos conjuntos de valores mediante
la ecuación (3.5.14). El resultado es un valor r2 de 0.6779, el cual ahora se puede
comparar con el valor r2 de 0.7448 del modelo log-lineal. La diferencia entre ambos
valores r2 es aproximadamente 0.07. Por otra parte, si deseamos comparar el valor r2
del modelo log-lineal con el obtenido del modelo lineal, estimamos lnYt para cada
observación de (7.8.9) [dadas en la columna (3) de la tabla], obtenemos sus valores
antilog [dados en la columna (4) de la tabla] y por último calculamos r2 entre estos
valores antilog y los valores reales de Y observados mediante la fórmula (3.5.14). Esto
da a r2 un valor de 0.7187, el cual es un poco superior al valor obtenido del modelo
lineal (7.8.8) de 0.6628. Con cualquier método, parece que el modelo log-lineal ofrece
un ajuste ligeramente mejor.
____________________________
__________________________ __
EJEMPLO 7.3
Para ilustrar la función de producción Cobb-Douglas se obtuvieron los datos de la tabla 7.3,
referentes al sector agrícola de Taiwán durante 1958-1972. Si el modelo (7.9.2) satisface los
supuestos del modelo clásico de regresión lineal obtenemos la siguiente regresión por el
método de MCO
Estimación:
Regresión Log-Lineal
Interpretación:
Se puede ver que en el sector agrícola taiwanes durante el periodo 1958 y 1972, las
elasticidades del producto con respecto al trabajo y al capital fueron 1,4988 y 0.4899
respectivamente.
Ósea manteniendo constante el capital un incremento de 1% en trabajo, en promedio, a un
incremento de cerca del 1,5% en el producto.
El periodo se caracterizó por tener rendimientos crecientes a escala.
El R cuadrado de 0.8890 significa que cerca de 89% de la variación en el producto es
explicada por el trabajo y por el capital.
EJEMPLO 7.4
Como ejemplo de regresión polinomial, considere los datos de la tabla 7.4 sobre producción
de un bien y su costo de producción total en el corto plazo. ¿Qué tipo de modelo de
regresión ajusta estos datos? Para este fin, trace primero el diagrama de dispersión, que se
muestra en la fi gura 7.2.
__________________
De esta figura es claro que la relación entre el costo total y la producción semeja una curva
en forma de S alargada; observe cómo la curva de costo total primero aumenta poco a poco
y luego lo hace rápido, como lo establece la conocida ley de rendimientos decrecientes. Esta
forma de S de la curva de costo total se representa por el siguiente polinomio cúbico o de
tercer grado:
Yi β0 +β1Xi +β2X 2 i +β3X 3 i +ui (7.10.4) donde Y = costo total y X = producción.
Resultados empíricos. Cuando la regresión polinomial de tercer grado se ajustó a los datos
de la tabla 7.4, obtuvimos los siguientes resultados:
_________________
(Nota: Las cifras entre paréntesis son los errores estándar estimados.) Aunque
examinaremos la significancia estadística de estos resultados en el siguiente capítulo, el
lector puede verificar que corresponden a las expectativas teóricas de (7.10.5). Como
ejercicio para el lector queda la tarea de interpretar la regresión (7.10.6).
UNIDAD 8:
EJEMPLO 8.1
En el capítulo 7 efectuamos la regresión de la mortalidad infantil (MI) sobre el PIB per cápita
(PIBPC) y la tasa de alfabetización de las mujeres (TAM) para una muestra de 64 países. Los
resultados de la regresión de (7.6.2) se reproducen a continuación, con información
adicional:
_________________
Podemos utilizar la prueba t para demostrar una hipótesis sobre cualquier coeficiente de
regresión parcial individual. Para ilustrar el procedimiento considere la regresión sobre la
mortalidad infantil (8.1.4). Postulemos que
H0:β2 = 0 y H1:β2 0
La hipótesis nula establece que, al mantener constante X3 (la tasa de alfabetización de las
mujeres), X2 (PIBPC) no tiene influ encia (lineal) sobre Y (la mortalidad infantil).2 Para probar
la hipótesis nula se utiliza la prueba t dada en (8.1.2). Según el capítulo 5, si el valor de t
calculado excede el valor de t crítico en el nivel de signifi cancia escogido, se rechaza la
hipótesis nula; de lo contrario, no se puede rechazar. Para el ejemplo ilustrativo, con (8.1.2)
y la advertencia de que β2β2 = 0 con la hipótesis nula, tenemos t −0.0056 0.0020 − 2.8187
Intervalo de confianza
En el capítulo 5 se observó una conexión muy estrecha entre las pruebas de hipótesis y la
estimación por intervalos de confianza. Para este ejemplo, el intervalo a 95% de confianza
para β2 es
_________________________________
A partir del histograma, parece que los residuos están normalmente distribuidos. También
podemos calcular la prueba Jarque-Bera (JB) de normalidad, como se muestra en la
ecuación (5.12.1). En este caso, el valor JB es 0.5594, con un valor p de 0.76.3 Por tanto, al
parecer, el término de error en este ejemplo sigue la distribución normal. Por supuesto, se
debe tener en cuenta que la prueba JB es para muestras grandes, y que la muestra de 64
observaciones pueda no ser necesariamente grande.
El valor p, al obtener un valor F igual o mayor que 73.8325, es casi cero, lo cual implica el
rechazo de la hipótesis que establece que el PIBPC y la TAM, conjuntamente, no tienen
efecto sobre la mortalidad infantil. Si empleamos el nivel usual de signifi cancia de 5%, el
valor F crítico para 2 gl en el numerador y 60 gl en el denominador (sin embargo, los gl reales
son 61) es de casi 3.15, o de 4.98 más o men os, si utiliza el nivel de signifi cancia de 1%.
Obvio, el valor observado F de casi 74 excede por mucho cualquiera de estos valores críticos
F
_______________________
EJEMPLO 8.2
Recuerde la función cúbica del costo total estimada en el ejemplo 7.4, sección 7.10, que se
reproduce en seguida:
_____________________________________
donde Y es el costo total y X es la producción, y donde las cifras en paréntesis son los errores
estándar estimados. Suponga que deseamos probar la hipótesis de que los coefi cientes de
los términos X2 y X3 en la función cúbica de costo son los mismos, es decir, β3 = β4 o (β3 −
β4) = 0. En la regresión (7.10.6) aparecen todos los resultados necesarios para realizar la
prueba t a partir de (8.5.5). La mecánica es la siguiente:
________________________________________________
El lector puede verificar que, para 6 gl (¿por qué?), el valor t observado excede el valor t
crítico aun en el nivel de significancia de 0.002 (o 0.2%) (prueba de dos colas); el valor p es
extremadamente pequeño, 0.000006. Por tanto, podemos rechazar la hipótesis de que los
coeficientes de X2 y X3 en la función cúbica de costo son idénticos.
EJEMPLO 8.3
A fin de ilustrar el análisis anterior, considere los datos de la tabla 8.8. El ajuste de la función
de producción Cobb-Douglas a esos datos produjo los siguientes resultados:
______________________________________
Como la variable dependiente en las dos regresiones anteriores es diferente, tenemos que
utilizar la prueba F dada en (8.6.9). Se cuenta con los datos necesarios para obtener el valor
F.
___________________________EXCEL_______________________
Observe que en el presente caso m = 1, pues sólo se impuso una restricción y (n − k) es 17,
en vista de que se tienen 20 observaciones y tres parámetros en la regresión no restringida.
Este valor F sigue una distribución F con 1 gl en el numerador y 17 en el denominador. El
lector puede verificar con facilidad que esta F no es significativa, en un nivel de significancia
de 5%. (Véase el apéndice D, tabla D.3.) Así, la conclusión es que la economía mexicana
quizá se caracterizó por rendimientos constantes a escala en el periodo de muestra y, por
tanto, no hay daño alguno al utilizar la regresión restringida dada en (8.6.14). Como muestra
esta regresión, si la razón capital/trabajo se incrementó 1%, en promedio, la productividad
del trabajo aumentó casi 1%.
EJEMPLO 8.4
En el ejercicio 7.23, entre otras cosas, se le pidió considerar la siguiente función de demanda de
pollos:
Donde Y = consumo de pollo per cápita, lbs; X2 = ingreso real disponible per cápita, $; X3 = precio
real al menudeo del pollo por lb; X4 = precio real al menudeo del cerdo por lb, y X5 = precio real de
la carne de res por lb.
En este modelo β2, β3, β4 y β5 son las elasticidades ingreso, precio-propio, precio-cruzado (cerdo)
y precio-cruzado (carne de res). (¿Por qué?) De acuerdo con la teoría económica,
Supongase que alguien afirma que el pollo, el cerdo y la carne de res, son productos no relacionados
en el sentido de que al consumo de pollo no le afectan los precios del cerdo y de la carne de res.
En resumen,
Donde las cifras en paréntesis son los errores estándar estimados. Nota: Los valores de R2 de
(8.6.23)
Ahora layrazón
(8.6.24) sonprobar
F para comparables, pues(8.6.21)
la hipótesis la variable
es dependiente en los dos modelos es la misma.
En este caso, el valor de m es 2, pues hay dos restricciones: β4 = 0 y β5 = 0. Los gl del denominador
(n − k) son 18, porque n = 23 y k = 5 (5 coeficientes β). Por consiguiente, la razó
razónn F es
En eviews.10:
Comprobación en Excel:
Interpretación:
La anterior es una distribución F con 2 y 18 gl. En el nivel de 5% se aprecia con claridad que este
no hay razón para rechazar la hipótesis nula: la demanda de pollo no depende de los precios del
cerdo ni de la carne de res.
EJEMPLO 8.5
Consulte el ejercicio 7.16, en el cual se presenta información sobre la demanda de rosas en
el área metropolitana de Detroit de 1971-III a 1975- II. Para fines ilustrativos consideraremos
la demanda de rosas como función sólo de los precios de las rosas y de los claveles, y
dejaremos fuera, por el momento, la variable ingreso. Ahora consideremos los siguientes
modelos:
En eviews.10:
Regresión Log-Lineal
Interpretación:
Como lo indican estos resultados, ambos modelos, el lineal y el log-lineal, parecen ajustarse
a la información razonablemente bien: los parámetros tienen los signos esperados y los
valores t y R2 son estadísticamente significativos.