Nothing Special   »   [go: up one dir, main page]

Academia.eduAcademia.edu

ESTIMACION Y VALIDACION DEL MODELO PROBIT

UNIVERSIDAD NACIONAL DE SAN AGUSTÍN DE AREQUIPA FACULTAD DE ECONOMÍA ESCUELA DE POSGRADO EJERCICIO DEL MODELO PROBIT ESTIMACIÓN DEL MODELO PROBIT BINARIO, PRUEBA DE COLINEALIDAD, PRUEBA DE SIGNIFICANCIA INDIVIDUAL, PRUEBA DE SIGNIFICANCIA GLOBAL, PREBA DE NÚMERO DE CASOS CORRECTAMENTE PREDICHOS Y TABLA DE VARIABLE OBSERVADA, ESTIMADA Y RESIDUOS Presentado por: Dulhey Lossin Quispe Toledo Docente: Carlos Pedro Vera Ninacondor Curso: Estadística para el análisis político AREQUIPA – PERÚ 2020 2 Índice 1 Caso a resolver ....................................................................................................................... 4 2 Estimación del modelo probit ................................................................................................ 9 2.1 3 Contraste de colinealidad .................................................................................................... 10 3.1 3.1.1 4 Contraste de colinealidad con el Factor de Inflación de la Varianza (VIF) ....................... 10 Contraste de colinealidad para los regresores con el VIF ..................................................... 10 Contraste de significancia individual .................................................................................. 11 4.1 4.1.1 4.1.2 4.1.3 5 Estimación del modelo probit binario ..................................................................................... 9 Contraste de significancia individual para los coeficientes de la regresión parcial ........... 11 Contraste de significancia para 𝛽0 con valor p ...................................................................... 11 Contraste de significancia para 𝛽1 con valor p ...................................................................... 13 Contraste de significancia para 𝛽2 con valor p ...................................................................... 14 Contraste de significancia de razón de verosimilitud (significancia global) ..................... 15 5.1 Contraste de significancia global con valor p........................................................................ 15 5.1.1 Datos ..................................................................................................................................... 15 5.1.2 En el nivel de significancia de 5 % ....................................................................................... 16 6 Contraste de número de casos correctamente predichos .................................................... 18 7 Tabla de variable observada, estimada y residuos .............................................................. 19 Anexos .......................................................................................................................................... 23 3 Índice de tablas Tabla 1 Matriz de datos................................................................................................................................................. 5 Tabla 2 Estimación del modelo probit binario .............................................................................................................. 9 Tabla 3 Estimación del modelo probit sin restringir ................................................................................................... 15 Tabla 4 Contraste de número de casos correctamente predichos ............................................................................... 18 Tabla 5 Variable observada, estimada y residuos del modelo probit ......................................................................... 19 Tabla 6 Contraste de colinealidad para los regresores con el VIF ............................................................................ 23 4 1 Caso a resolver Datos Con los datos que se presenta en la Tabla 1, y con el software econométrico gretl 2020, estimar con MV el modelo probit binario que se plantea a continuación, además, realizar el contraste de colinealidad con VIF, el contraste de significancia individual, el contraste de razón de verosimilitud (significancia global), el contraste de número de casos correctamente predichos, en el nivel de significancia de 5% donde corresponda, y en una Tabla mostrar variable observada, estimada (probabilidad) y los residuos, Modelo lineal de probabilidad 𝑃𝑟(𝐴𝑝𝑟𝑜𝑏𝑎𝑑𝑜 = 1|𝐶𝑜𝑙𝑒𝑔𝑖𝑜, 𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠) = Φ(𝛽0 + 𝛽1 𝐶𝑜𝑙𝑒𝑔𝑖𝑜𝑖 + 𝛽2 𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠𝑖 ) Donde 𝐴𝑝𝑟𝑜𝑏𝑎𝑑𝑜𝑖 Representa la nota lograda por el i-ésimo estudiante, tomando el valor de uno si el estudiante está aprobado (nota igual o mayor que 11), y el valor de cero si el estudiante está desaprobado (nota igual o menor que 10), 𝐶𝑜𝑙𝑒𝑔𝑖𝑜𝑖 Representa el tipo de colegio de procedencia, considerando el valor uno si el colegio de procedencia del estudiante es colegio estatal y el valor cero si el colegio de procedencia del estudiante es colegio no estatal, 𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠𝑖 Representa el número de hermanos que tiene el i-ésimo estudiante, 5 Tabla 1 Matriz de datos N° 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 Aprobado 0 1 1 1 1 1 1 0 1 0 1 1 1 1 1 0 1 1 0 1 1 1 1 1 1 0 1 0 1 0 1 0 0 1 1 1 0 Colegio 1 0 1 1 1 0 1 1 1 1 1 1 1 0 0 0 0 1 1 0 1 1 1 0 0 0 1 0 1 0 0 0 0 0 0 1 0 Hermanos 3 2 1 2 3 1 2 2 4 5 2 6 5 0 1 0 2 5 7 7 2 7 2 4 3 4 5 1 0 2 2 1 1 1 1 3 1 6 N° 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 Aprobado 0 1 1 0 0 1 1 1 1 1 1 1 0 1 0 0 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 0 1 0 1 0 1 0 0 Colegio 0 1 0 1 1 0 1 1 0 0 0 0 1 0 0 1 0 1 1 1 1 1 0 0 1 0 0 0 1 1 1 1 1 1 0 1 0 1 1 1 Hermanos 3 3 3 3 1 10 4 2 1 3 2 2 1 0 3 2 1 3 2 1 1 3 1 1 3 0 3 3 7 1 1 3 1 4 1 3 1 2 5 1 7 N° 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 Aprobado 1 0 0 1 1 1 0 1 0 0 0 1 1 1 1 0 1 0 0 0 0 1 0 1 1 0 0 0 1 1 1 0 1 0 0 1 1 1 1 1 Colegio 1 1 0 0 1 1 1 1 1 1 1 1 1 1 0 0 0 0 1 0 0 0 1 1 1 1 1 0 1 0 1 1 1 1 0 0 0 1 0 1 Hermanos 2 4 4 1 1 1 1 1 0 1 2 2 14 2 1 1 2 3 3 2 5 1 2 4 2 1 1 1 1 2 2 1 1 3 5 2 2 2 2 2 8 N° Aprobado 118 1 119 0 120 0 Fuente: Cuestionario aplicado a estudiantes, Elaboración: Autoría propia, Colegio 1 0 0 Hermanos 5 1 1 9 2 Estimación del modelo probit 2.1 Estimación del modelo probit binario 𝑃𝑟(𝐴𝑝𝑟𝑜𝑏𝑎𝑑𝑜 = 1|𝐶𝑜𝑙𝑒𝑔𝑖𝑜, 𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠) = Φ(𝛽0 + 𝛽1 𝐶𝑜𝑙𝑒𝑔𝑖𝑜𝑖 + 𝛽2 𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠𝑖 ) Tabla 2 Estimación del modelo probit binario Fuente: Software econométrico gretl 2020, Elaboración: Software econométrico gretl 2020, Ecuación del modelo probit binario 𝑃𝑟(𝐴𝑝𝑟𝑜𝑏𝑎𝑑𝑜 = 1|𝐶𝑜𝑙𝑒𝑔𝑖𝑜, 𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠) = Φ(0,167499 + 0,0889914𝐶𝑜𝑙𝑒𝑔𝑖𝑜𝑖 + 0,0613403𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠𝑖 ) 10 3 Contraste de colinealidad 3.1 Contraste de colinealidad con el Factor de Inflación de la Varianza (VIF) 3.1.1 Contraste de colinealidad para los regresores con el VIF Estadístico de prueba VIF (Factor de inflación de la varianza) Estadístico calculado1 𝑉𝐼𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 𝑝𝑎𝑟𝑎 𝐶𝑜𝑙𝑒𝑔𝑖𝑜 = 1,024 𝑉𝐼𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 𝑝𝑎𝑟𝑎 𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠 = 1,024 Estadístico crítico 𝑉𝐼𝐹𝑐𝑟í𝑡𝑖𝑐𝑜 = 10,0 Regla de decisión La regla de decisión es rechazar la no colinealidad entre los regresores si el valor del estadístico de prueba VIF calculado excede al valor del estadístico de prueba VIF crítico (el cual es 10), o no rechazar en caso contrario, Decisión La decisión es no rechazar la no colinealidad entre los regresores, porque el valor del estadístico de prueba VIF calculado (1,024; 1,024) no excede al valor del estadístico de prueba VIF crítico (10), Conclusión La conclusión es que los regresores no presentan un problema de colinealidad, por lo tanto, se cumple con el supuesto de no colinealidad entre los regresores, con el estadístico de prueba VIF, 1 El estadístico calculado de los valores VIF se presenta en la tabla 6. 11 4 Contraste de significancia individual 4.1 Contraste de significancia individual para los coeficientes de la regresión parcial Cabe precisar que el modelo considerado para la evaluación individual es el siguiente: 𝑃𝑟(𝐴𝑝𝑟𝑜𝑏𝑎𝑑𝑜 = 1|𝐶𝑜𝑙𝑒𝑔𝑖𝑜, 𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠) = Φ(𝛽0 + 𝛽1 𝐶𝑜𝑙𝑒𝑔𝑖𝑜𝑖 + 𝛽2 𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠𝑖 ) 4.1.1 Contraste de significancia para 𝛽0 con valor p Planteamiento de hipótesis 𝐻0: 𝛽0 = 0 (el verdadero coeficiente de la constante 𝛽0 es cero) 𝐻1: 𝛽0 ≠ 0 (el verdadero coeficiente de la constante 𝛽0 es diferente de cero) Nivel de significancia seleccionado 𝛼 = 5 % = 0,05 Estadístico de contraste z que sigue una distribución z con 𝑛−2 grados de libertad Estadístico calculado2 zc = β̂̂0−β0 DT(β̂ 0) Regla de decisión = 0,167499−0 0,219849 = 0,7619 con valor p = 0,4461 La regla de decisión es rechazar la hipótesis nula (𝐻0) si el valor p del estadístico de contraste z calculado es menor que el valor del nivel de significancia seleccionado, o no rechazar la hipótesis nula (𝐻0) en caso contrario, 2 El estadístico calculado con el valor p se presenta en la tabla 2. 12 Decisión La decisión es no rechazar la hipótesis nula (𝐻0) porque el valor p (0,4461) del estadístico de contraste z calculado no es menor que el valor del nivel de significancia de 5 % (α = 0,05), Conclusión La conclusión es que el coeficiente de regresión 𝛽0 no es estadísticamente significativo, es decir, significativamente el coeficiente de regresión 𝛽0 es igual a cero en el nivel de significancia de 5 % (α = 0,05), con el estadístico de contraste z, 13 4.1.2 Contraste de significancia para 𝛽1 con valor p Planteamiento de hipótesis 𝐻0: 𝛽1 = 0 (el verdadero coeficiente de la constante 𝛽1 es cero) 𝐻1: 𝛽1 ≠ 0 (el verdadero coeficiente de la constante 𝛽1 es diferente de cero) Nivel de significancia seleccionado 𝛼 = 5 % = 0,05 z que sigue una distribución z con 𝑛−2 grados de libertad Estadístico calculado3 zc = β̂̂1−β1 DT(β̂ 1) Regla de decisión = 0,0889914−0 0,239353 = 0,3718 con valor p = 0,7100 La regla de decisión es rechazar la hipótesis nula (𝐻0) si el valor p del estadístico de contraste z calculado es menor que el valor del nivel de significancia seleccionado, o no rechazar la hipótesis nula (𝐻0) en caso contrario, Decisión La decisión es no rechazar la hipótesis nula (𝐻0) porque el valor p (0,7100) del estadístico de contraste z calculado no es menor que el valor del nivel de significancia de 5 % (α = 0,05), Conclusión La conclusión es que el coeficiente de regresión 𝛽0 no es estadísticamente significativo, es decir, significativamente el coeficiente de regresión 𝛽0 es igual a cero en el nivel de significancia de 5 % (α = 0,05), con el estadístico de contraste z, 3 El estadístico calculado con el valor p se presenta en la tabla 2. 14 4.1.3 Contraste de significancia para 𝛽2 con valor p Planteamiento de hipótesis 𝐻0: 𝛽2 = 0 (el verdadero coeficiente de la constante 𝛽2 es cero) 𝐻1: 𝛽2 ≠ 0 (el verdadero coeficiente de la constante 𝛽2 es diferente de cero) Nivel de significancia seleccionado 𝛼 = 5 % = 0,05 z que sigue una distribución z con 𝑛−2 grados de libertad Estadístico calculado4 zc = β̂̂2−β2 DT(β̂ 2) Regla de decisión = 0,0613403−0 0,0644911 = 0,9511 con valor p = 0,3415 La regla de decisión es rechazar la hipótesis nula (𝐻0) si el valor p del estadístico de contraste z calculado es menor que el valor del nivel de significancia seleccionado, o no rechazar la hipótesis nula (𝐻0) en caso contrario, Decisión La decisión es no rechazar la hipótesis nula (𝐻0) porque el valor p (0,3415) del estadístico de contraste z calculado no es menor que el valor del nivel de significancia de 5 % (α = 0,05), Conclusión La conclusión es que el coeficiente de regresión 𝛽0 no es estadísticamente significativo, es decir, significativamente el coeficiente de regresión 𝛽0 es igual a cero en el nivel de significancia de 5 % (α = 0,05), con el estadístico de contraste z, 4 El estadístico calculado con el valor p se presenta en la tabla 2. 15 5 Contraste de significancia de razón de verosimilitud (significancia global) 5.1 Contraste de significancia global con valor p 5.1.1 Datos Tabla 3 Estimación del modelo probit sin restringir Fuente: Software econométrico gretl 2020, Elaboración: Software econométrico gretl 2020, Ecuación del modelo probit binario 𝑃𝑟(𝐴𝑝𝑟𝑜𝑏𝑎𝑑𝑜 = 1|𝐶𝑜𝑙𝑒𝑔𝑖𝑜, 𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠) = Φ(0,167499 + 0,0889914𝐶𝑜𝑙𝑒𝑔𝑖𝑜𝑖 + 0,0613403𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠𝑖 ) 16 5.1.2 En el nivel de significancia de 5 % Planteamiento de hipótesis En forma literal 𝐻0: Todos los coeficientes de regresión son simultáneamente iguales a cero, 𝐻1: Al menos uno de los coeficientes de regresión es diferente de cero, En forma simbólica 𝐻0: 𝛽1 = 𝛽2 = 0, 𝐻1: 𝛽1, 𝛽2 ≠ 0, Nivel de significancia seleccionado 𝛼 = 5 % = 0,05 Estadístico de contraste Como estadístico de prueba, se utiliza el estadístico de la razón de verosimilitud (𝑅𝑉), Con la hipótesis nula, el estadístico 𝑅𝑉 sigue la distribución 𝜒2 con grados de libertad (𝑔𝑙) igual al número de variables explicativas (no se incluye el término constante), Estadístico calculado5 𝜒𝐶2 = 1,22979 con valor p = 0,5407 Regla de decisión La regla de decisión es rechazar la hipótesis nula conjunta (𝐻0) si el valor p del estadístico de contraste 𝜒2 calculado es menor que el valor del nivel de significancia seleccionado, o no rechazar la hipótesis nula (𝐻0) en caso contrario, 5 El estadístico calculado con el valor p se presenta en la tabla 3. 17 Decisión La decisión es no rechazar la hipótesis nula (𝐻0) porque el valor p (0,5407) del estadístico de contraste 𝜒2 calculado no es menor que el valor del nivel de significancia de 5 % (α = 0,05), Conclusión La conclusión es que, todos los coeficientes de regresión no son estadísticamente significativos, es decir, significativamente todos los coeficientes de regresión son simultáneamente iguales a cero en el nivel de significancia de 5 % (α = 0,05), con el estadístico de prueba 𝜒2, 18 6 Contraste de número de casos correctamente predichos Tabla 4 Contraste de número de casos correctamente predichos Fuente: Software econométrico gretl 2020, Elaboración: Software econométrico gretl 2020, Número de casos correctamente predichos De acuerdo a la tabla 4, se han estimado 77 casos correctamente predichos, lo que representa el 64,2% del total de casos bajo análisis, Por lo tanto, el supuesto de número de casos correctamente estimados se cumple, puesto que el porcentaje de casos correctamente estimados (64,2%) es mayor que el 50%, 19 7 Tabla de variable observada, estimada y residuos Tabla 5 Variable observada, estimada y residuos del modelo probit 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 Aprobado 0,000000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 0,000000 1,00000 0,000000 1,00000 1,00000 1,00000 1,00000 1,00000 0,000000 1,00000 1,00000 0,000000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 0,000000 1,00000 0,000000 1,00000 0,000000 1,00000 0,000000 0,000000 1,00000 1,00000 1,00000 0,000000 0,000000 Estimada 0,670217 0,614161 0,624693 0,647720 0,670217 0,590503 0,647720 0,647720 0,692114 0,713348 0,647720 0,733861 0,713348 0,566511 0,590503 0,566511 0,614161 0,713348 0,753603 0,724707 0,647720 0,753603 0,647720 0,660146 0,637401 0,660146 0,713348 0,590503 0,601214 0,614161 0,614161 0,590503 0,590503 0,590503 0,590503 0,670217 0,590503 0,637401 Residuo -0,670217 0,385839 0,375307 0,352280 0,329783 0,409497 0,352280 -0,647720 0,307886 -0,713348 0,352280 0,266139 0,286652 0,433489 0,409497 -0,566511 0,385839 0,286652 -0,753603 0,275293 0,352280 0,246397 0,352280 0,339854 0,362599 -0,660146 0,286652 -0,590503 0,398786 -0,614161 0,385839 -0,590503 -0,590503 0,409497 0,409497 0,329783 -0,590503 -0,637401 20 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 1,00000 1,00000 0,000000 0,000000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 0,000000 1,00000 0,000000 0,000000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 0,000000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 0,000000 1,00000 0,000000 1,00000 0,000000 1,00000 0,000000 0,000000 1,00000 0,000000 0,000000 1,00000 1,00000 1,00000 0,670217 0,637401 0,670217 0,624693 0,782570 0,692114 0,647720 0,590503 0,637401 0,614161 0,614161 0,624693 0,566511 0,637401 0,647720 0,590503 0,670217 0,647720 0,624693 0,624693 0,670217 0,590503 0,590503 0,670217 0,566511 0,637401 0,637401 0,753603 0,624693 0,624693 0,670217 0,624693 0,692114 0,590503 0,670217 0,590503 0,647720 0,713348 0,624693 0,647720 0,692114 0,660146 0,590503 0,624693 0,624693 0,329783 0,362599 -0,670217 -0,624693 0,217430 0,307886 0,352280 0,409497 0,362599 0,385839 0,385839 -0,624693 0,433489 -0,637401 -0,647720 0,409497 0,329783 0,352280 0,375307 0,375307 0,329783 0,409497 0,409497 -0,670217 0,433489 0,362599 0,362599 0,246397 0,375307 0,375307 0,329783 -0,624693 0,307886 -0,590503 0,329783 -0,590503 0,352280 -0,713348 -0,624693 0,352280 -0,692114 -0,660146 0,409497 0,375307 0,375307 21 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 0,000000 1,00000 0,000000 0,000000 0,000000 1,00000 1,00000 1,00000 1,00000 0,000000 1,00000 0,000000 0,000000 0,000000 0,000000 1,00000 0,000000 1,00000 1,00000 0,000000 0,000000 0,000000 1,00000 1,00000 1,00000 0,000000 1,00000 0,000000 0,000000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 0,000000 0,000000 Fuente: Software econométrico gretl 2020, Elaboración: Software econométrico gretl 2020, 0,624693 0,624693 0,601214 0,624693 0,647720 0,647720 0,867629 0,647720 0,590503 0,590503 0,614161 0,637401 0,670217 0,614161 0,682322 0,590503 0,647720 0,692114 0,647720 0,624693 0,624693 0,590503 0,624693 0,614161 0,647720 0,624693 0,624693 0,670217 0,682322 0,614161 0,614161 0,647720 0,614161 0,647720 0,713348 0,590503 0,590503 -0,624693 0,375307 -0,601214 -0,624693 -0,647720 0,352280 0,132371 0,352280 0,409497 -0,590503 0,385839 -0,637401 -0,670217 -0,614161 -0,682322 0,409497 -0,647720 0,307886 0,352280 -0,624693 -0,624693 -0,590503 0,375307 0,385839 0,352280 -0,624693 0,375307 -0,670217 -0,682322 0,385839 0,385839 0,352280 0,385839 0,352280 0,286652 -0,590503 -0,590503 22 Rango de estimación del modelo: 1 - 120 Estadísticos de evaluación de la predicción utilizando 120 observaciones Error medio -9,9547e-005 Raíz del Error cuadrático medio 0,47738 Error absoluto medio 0,45548 23 Anexos Tabla 6 Contraste de colinealidad para los regresores con el VIF Fuente: Software econométrico gretl 2020, Elaboración: Software econométrico gretl 2020,