Taller 1 Econometría
Taller 1 Econometría
Taller 1 Econometría
Taller 1
y_corr_tribut 8,8 15,7 206,0 0 6.571e+ 8,8 4.247e+ 29.60 932.3 1.391e+ 161 293 382 649 1,3 3,8 11,7 31,4 140,6
08 87 71 06 08 10 08 .7 .3 .7 .6 30 13 52 56 55
iga_total 8,8 69.5 9.952 28. 91.03 8,8 99.05 -0.769 3.517 612,502 41. 50. 55. 64. 71. 76. 81.3 83.1 86.55
08 4 16 08 72 13 57 30 11 72 3 0
votos_nulos 8,9 34.5 643.2 0 54,663 8,9 413,728 71.17 5,858 310,114 0 0 0 0 0 0 27 89 541
76 5 76
votos_en_blanc 8,9 85.3 2,341 0 207,525 8,9 5.482e+ 79.49 6,908 766,099 0 0 0 0 0 0 50 159 966
o 76 5 76 06
En primer lugar, las medias de estas variables indican: i) que en promedio 85.35 de los votos de los
ciudadanos son en blanco, lo cual indica que en promedio son pocos los individuos que no apoyan a
ninguno de los candidatos; ii) en promedio los votos nulos son 35, que es un número bajo en una
muestra de 8976 personas; iii) Los ingresos tributarios son en promedio 15787, y iv) el índice de
gobierno abierto es en promedio 69.54.
En segundo lugar, se observa en las variables votos nulos y votos en blanco, que desde el percentil
90 se encuentran resultados superiores a 0, que indica que es alrededor del 10% de la muestra en la
que se presenta cada uno de los casos.
Finalmente, se observa que algunos de los municipios no tienen ingresos tributarios y en los
percentiles se evidencian importantes diferencias a partir del percentil 50. Respecto al índice de
gobierno abierto, se puede decir que hay diferencias considerables en la forma en que los diferentes
municipios reportan su información y el fortalecimiento de la gestión pública.
2. Presente mediante diagramas de caja (box plots) la distribución del número de votos
en blanco, votos nulos, ingresos tributarios e índice de gobierno abierto. Interprete los
resultados.
De acuerdo con los resultados del diagrama, la variable votos nulos no sigue una distribución
normal, en tanto la mayoría de los datos se concentran en la parte inferior de la gráfica. Su valor
máximo se encuentra en 54.663 con una observación y su mínimo es 0, y se encuentra que
aproximadamente el 75% de los votos nulos son iguales a 0. Sin embargo, la media de 34.55, puede
ser resultado de las observaciones que se encuentran en el extremo o son atípicos.
Respecto a la variable índice de gobierno abierto, se encuentra que los datos tienden a seguir una
distribución normal, y se concentran principalmente entre 64% y 77%. En cuanto a la media, esta es
del 69.54% y el valor máximo que alcanza es del 91%. Sin embargo, algunas de las observaciones
se encuentran por debajo del 40% y el valor más bajo es del 28%,. Esto implica que el
cumplimiento de reportes y cumplimiento de estrategias para la prevención de corrupción o
ineficiencia en la gestión públicas no es del 100% y en algunos municipios es muy bajo este índice
de gestión.
En cuanto a la variable votos en blanco, esta presenta valores bajos e inferiores a 50.000.Su
distribución no es normal, pues los datos se encuentran concentrados hacia la parte inferior de la
gráfica. Presenta su valor más alto en 207.525 y su mínimo en 0, teniendo una media de 85.35. Esto
último se considera que se debe a los valores atípicos que se encuentran desde el percentil 90, los
cuales pueden alterar el valor de la media.
Finalmente, los ingresos tributarios no siguen una distribución normal, pues sus valores se
encuentran principalmente por debajo de 2.000.000, siendo el mínimo de 0. No obstante, se
presenta un valor máximo de ingresos en 6.571.000. En cuanto a la media, su valor es de 15.787.
3. ¿Cuáles municipios tienen más de 10.000 votos en blanco? Para este grupo de
municipios, ¿cuál es el valor máximo, mínimo y promedio del índice de gobierno
abierto?
Summary statistics: max min mean by(mun_mas_10m_vb )
mun_mas_10m_vb max min mean
4. Calcule e interprete una matriz de correlación entre el número total de votos, ingresos
tributarios e índice de gobierno abierto. ¿Son estas correlaciones estadísticamente
significativas al 5%? ¿Qué comando de Stata sirve para este proposito, correlate o
pwcorrelate?
Usando el comando pwcorr, se obtuvo el siguiente resultado
Pairwise correlations
Variables (1) (2) (3)
(1) votos 1.000
De acuerdo con este resultado, se puede concluir que las correlaciones entre los ingresos
tributarios y los votos, y el índice de gobierno abierto y los votos, son significativas al 5%.
Entre los ingresos tributarios y los votos se presenta una correlación positiva de 0.984, lo
cual indica una fuerte relación entre las variables. En cuanto los votos y el índice de
gobierno abierto, la correlación es positiva pero su valor de 0.063 es muy bajo. Finalmente,
entre los ingresos tributarios y el índice de gobierno abierto, la correlación es positiva, pero
no es significativa.
5. Calcule estadísticas descriptivas del número total de votos por departamento
(1)
VARIABLES votos
y_corr_tribut 0.000393***
(2.12e-06)
Constant 5,701***
(437.3)
α =0.01
t t=2.57
13.57¿2.57: por lo que se rechaza la hipótesis nula.
Con una significancia del 99% se concluye que el valor del β 0 es diferente de 0
H 0 : β1 =0
Ha : β1≠ 0
0.000393−0
t c= =¿
0.00000212
Región de rechazo: |t c|>t t
α =0.01
t t=2.57
185.37¿2.57: por lo que se rechaza la hipótesis nula
Con unas significancia del 99% se concluye el valor del β 1 es diferente de 0.
7. Realice la regresión anterior pero ahora defina los ingresos tributarios en miles de
millones de pesos. ¿Qué cambios evidencia en las conclusiones del literal j?
(1) (2)
VARIABLES votos votos
y_corr_tribut 0.000393***
(2.12e-06)
y_corr_tribut_mm 0.393***
(0.00212)
Constant 5,701*** 5,701***
(437.3) (437.3)
y_corr_tribut 0.000393***
(2.12e-06)
y_corr_tribut_mm 0.393*** 0.000393***
(0.00212) (2.12e-06)
Constant 5,701*** 5,701*** 5.701***
(437.3) (437.3) (0.437)
En este caso, al tener los votos y los ingresos tributarios en miles de millones, los resultados
vuelven a ser los mismos que en la primera regresión con las variables en millones. Entonces, por
cada ml millón que aumente el ingreso tributario, los votos aumentaran 0.000393 miles de millones.
9. Estime de nuevo el modelo del literal k pero transforme la variable dependiente en el
logaritmo del total de votos 𝑙𝑜𝑔_𝑡𝑜𝑡𝑎𝑙_𝑣𝑜𝑡𝑜𝑠. Interprete el coeficiente estimado de 𝛽1,
¿es estadísticamente significativo?
(1)
VARIABLES log_votos
y_corr_tribut_mm 1.56e-06***
(1.51e-07)
Constant 8.279***
(0.0311)
Observations 1,101
R-squared 0.089
Standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1
H 0 : β1 =0
Ha : β1≠ 0
0.000156−0
t c= =993.63
0.000000157
Región de rechazo: |t c|>t t
α =0.01
t t=2.57
993.63¿2.57: por lo que se rechaza la hipótesis nula
10. Realice con detalle los pasos de la prueba de hipótesis para probar que el coeficiente
estimado de 𝛽1 es mayor a 0.001.
H 0 : β1 ≤ 0.001
H a : β 1> 0.001
0.00000156−0.001
t c= =−0.000998
0.000000157
α =0.01
t t=2.4049
-0.000998¿2.57: por lo que no se rechaza la hipótesis nula
Con unas significancia del 99% se concluye el valor del β 1 es mayor de 0.001.
11. Estime de nuevo el modelo del literal k pero transforme la variable independiente en
el logaritmo del total de ingresos tributarios. Interprete el coeficiente estimado de 𝛽1,
¿es estadísticamente significativo?
(1)
VARIABLES votos
log_y_corr_tribut_mm 20,999***
(1,589)
Constant -145,270***
(12,115)
Observations 1,100
R-squared 0.137
Standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1
En este modelo logarítmico, se tiene que por cada 1% en que aumenten los ingresos tributarios, los
votos aumentarán en 20.999, con una significancia del 99%.
De igual forma, el coeficiente β 1 es significativo al 90%, 95% y 99% al tenerse un p-valor menor al
0.01.
12. Estime de nuevo el modelo del literal k pero haciendo una transformación logarítmica
tanto al número de votos como a los ingresos tributarios. Exporte los resultados con
outreg2 de los literales m, o y p en la misma tabla. Pista: revise la opción append.
Interprete el coeficiente estimado de 𝛽1, ¿es estadísticamente significativo?
α =0.01
t t=2.4049
Dado que -31.4529<2.4049 no se rechaza la hipótesis nula y con una significancia del 99%
se concluye que el coeficiente β 1 no es mayor a 1.
Do file
clear all
set more off
cd "C:\Users\ma.beltran641\Downloads\Taller 1 stata\Taller 1 stata"
// a. Abra la base de datos PANEL_BUEN_GOBIERNO.dta...
use "PANEL_BUEN_GOBIERNO.dta"
keep ano codmpio y_corr_tribut iga_total
keep if ano==2014
save "base2014.dta", replace
//b. Abra la base de datos 2014_Presidente_Primera_Vuelta...
use "2014_Presidente_Primera_Vuelta.dta", clear
encode primer_apellido, generate (codigo) label(n_codigo)
label var codigo "Codigo por candidato"
recode codigo (1=1) (3=2)(4=3)(2=4)(8=5)(5=6)(7=7)(6=8)
label values codigo
//c. Una la base de datos 2014_Presidente_Primera_Vuelta con la base construida en el
literal a...
merge m:1 codmpio using base2014.dta
save "baselitc.dta", replace
//d. alcule estadísticas descriptivas para el número de votos en blanco, votos nulos...
generate votos_nulos = votos if codigo==7
generate votos_en_blanco = votos if codigo==8
recode votos_en_blanco (.=0)
recode votos_nulos (.=0)
outreg2 using estdesclitc.doc, replace sum(detail) keep(votos_en_blanco votos_nulos
y_corr_tribut iga_total)
//e. Presente mediante diagramas de caja (box plots) la distribución del número de votos
en blanco,
graph box votos_nulos
graph save Graph "C:\Users\toshiba\Desktop\taller 1 20192\Nueva carpeta\Taller 1
stata30 de agosto\Taller 1 stata\BOX VOTOS NULOS.gph"
graph export "C:\Users\toshiba\Desktop\taller 1 20192\Nueva carpeta\Taller 1 stata30
de agosto\Taller 1 stata\BOX VOTOS NULOS.png", as(png) replace
graph box votos_en_blanco
graph export "C:\Users\toshiba\Desktop\taller 1 20192\Nueva carpeta\Taller 1 stata30
de agosto\Taller 1 stata\bOX VOTOS EN BLANCO .png", as(png) replace
graph box y_corr_tribut
graph export "C:\Users\toshiba\Desktop\taller 1 20192\Nueva carpeta\Taller 1 stata30
de agosto\Taller 1 stata\box ingresos tributarios.png", as(png) replace
graph box iga_total
graph export "C:\Users\toshiba\Desktop\taller 1 20192\Nueva carpeta\Taller 1 stata30
de agosto\Taller 1 stata\Gobierno abierto.png", as(png) replace
//f. ¿Cuáles municipios tienen más de 10.000 votos en blanco? Para este grupo de
municipios
generate mun_mas_10m_vb = municipio if votos_en_blanco>10000
// k.Realice la regresión anterior pero ahora defina los ingresos tributarios en miles de
millones de pesos. ¿Qué cambios evidencia en las conclusiones del literal j? //
gen y_corr_tribut_mm = y_corr_tribut/1000
reg votos y_corr_tribut_mm
outreg2 using literalljk_.doc , append
// Punto l.Realice la regresión del literal j pero ahora defina la variable votos en miles
de votos//
gen votos_m = votos/1000
reg votos_m y_corr_tribut_mm
outreg2 using literalljk_.doc , append
// Punto m. Estime de nuevo el modelo del literal k pero transforme la variable
dependiente en el logaritmo del total de votos 𝑙𝑜𝑔_𝑡𝑜𝑡𝑎𝑙_𝑣𝑜𝑡𝑜� //
gen log_votos = log(votos)
reg log_votos y_corr_tribut_mm
outreg2 using literalmop_.doc , replace