UNIVERSIDAD NACIONAL DE SAN AGUSTÍN DE AREQUIPA
FACULTAD DE ECONOMÍA
ESCUELA DE POSGRADO
EJERCICIO DEL MODELO PROBIT
ESTIMACIÓN DEL MODELO PROBIT BINARIO, PRUEBA DE
COLINEALIDAD, PRUEBA DE SIGNIFICANCIA INDIVIDUAL, PRUEBA DE
SIGNIFICANCIA GLOBAL, PREBA DE NÚMERO DE CASOS CORRECTAMENTE
PREDICHOS Y TABLA DE VARIABLE OBSERVADA, ESTIMADA Y RESIDUOS
Presentado por:
Dulhey Lossin Quispe Toledo
Docente:
Carlos Pedro Vera Ninacondor
Curso:
Estadística para el análisis político
AREQUIPA – PERÚ
2020
2
Índice
1
Caso a resolver ....................................................................................................................... 4
2
Estimación del modelo probit ................................................................................................ 9
2.1
3
Contraste de colinealidad .................................................................................................... 10
3.1
3.1.1
4
Contraste de colinealidad con el Factor de Inflación de la Varianza (VIF) ....................... 10
Contraste de colinealidad para los regresores con el VIF ..................................................... 10
Contraste de significancia individual .................................................................................. 11
4.1
4.1.1
4.1.2
4.1.3
5
Estimación del modelo probit binario ..................................................................................... 9
Contraste de significancia individual para los coeficientes de la regresión parcial ........... 11
Contraste de significancia para 𝛽0 con valor p ...................................................................... 11
Contraste de significancia para 𝛽1 con valor p ...................................................................... 13
Contraste de significancia para 𝛽2 con valor p ...................................................................... 14
Contraste de significancia de razón de verosimilitud (significancia global) ..................... 15
5.1
Contraste de significancia global con valor p........................................................................ 15
5.1.1
Datos ..................................................................................................................................... 15
5.1.2
En el nivel de significancia de 5 % ....................................................................................... 16
6
Contraste de número de casos correctamente predichos .................................................... 18
7
Tabla de variable observada, estimada y residuos .............................................................. 19
Anexos .......................................................................................................................................... 23
3
Índice de tablas
Tabla 1 Matriz de datos................................................................................................................................................. 5
Tabla 2 Estimación del modelo probit binario .............................................................................................................. 9
Tabla 3 Estimación del modelo probit sin restringir ................................................................................................... 15
Tabla 4 Contraste de número de casos correctamente predichos ............................................................................... 18
Tabla 5 Variable observada, estimada y residuos del modelo probit ......................................................................... 19
Tabla 6 Contraste de colinealidad para los regresores con el VIF ............................................................................ 23
4
1 Caso a resolver
Datos
Con los datos que se presenta en la Tabla 1, y con el software econométrico gretl 2020,
estimar con MV el modelo probit binario que se plantea a continuación, además, realizar el
contraste de colinealidad con VIF, el contraste de significancia individual, el contraste de razón de
verosimilitud (significancia global), el contraste de número de casos correctamente predichos, en
el nivel de significancia de 5% donde corresponda, y en una Tabla mostrar variable observada,
estimada (probabilidad) y los residuos,
Modelo lineal de probabilidad
𝑃𝑟(𝐴𝑝𝑟𝑜𝑏𝑎𝑑𝑜 = 1|𝐶𝑜𝑙𝑒𝑔𝑖𝑜, 𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠) = Φ(𝛽0 + 𝛽1 𝐶𝑜𝑙𝑒𝑔𝑖𝑜𝑖 + 𝛽2 𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠𝑖 )
Donde
𝐴𝑝𝑟𝑜𝑏𝑎𝑑𝑜𝑖 Representa la nota lograda por el i-ésimo estudiante, tomando el valor de uno
si el estudiante está aprobado (nota igual o mayor que 11), y el valor de cero si el
estudiante está desaprobado (nota igual o menor que 10),
𝐶𝑜𝑙𝑒𝑔𝑖𝑜𝑖 Representa el tipo de colegio de procedencia, considerando el valor uno si el
colegio de procedencia del estudiante es colegio estatal y el valor cero si el colegio
de procedencia del estudiante es colegio no estatal,
𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠𝑖 Representa el número de hermanos que tiene el i-ésimo estudiante,
5
Tabla 1
Matriz de datos
N°
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
Aprobado
0
1
1
1
1
1
1
0
1
0
1
1
1
1
1
0
1
1
0
1
1
1
1
1
1
0
1
0
1
0
1
0
0
1
1
1
0
Colegio
1
0
1
1
1
0
1
1
1
1
1
1
1
0
0
0
0
1
1
0
1
1
1
0
0
0
1
0
1
0
0
0
0
0
0
1
0
Hermanos
3
2
1
2
3
1
2
2
4
5
2
6
5
0
1
0
2
5
7
7
2
7
2
4
3
4
5
1
0
2
2
1
1
1
1
3
1
6
N°
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
Aprobado
0
1
1
0
0
1
1
1
1
1
1
1
0
1
0
0
1
1
1
1
1
1
1
1
0
1
1
1
1
1
1
1
0
1
0
1
0
1
0
0
Colegio
0
1
0
1
1
0
1
1
0
0
0
0
1
0
0
1
0
1
1
1
1
1
0
0
1
0
0
0
1
1
1
1
1
1
0
1
0
1
1
1
Hermanos
3
3
3
3
1
10
4
2
1
3
2
2
1
0
3
2
1
3
2
1
1
3
1
1
3
0
3
3
7
1
1
3
1
4
1
3
1
2
5
1
7
N°
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
Aprobado
1
0
0
1
1
1
0
1
0
0
0
1
1
1
1
0
1
0
0
0
0
1
0
1
1
0
0
0
1
1
1
0
1
0
0
1
1
1
1
1
Colegio
1
1
0
0
1
1
1
1
1
1
1
1
1
1
0
0
0
0
1
0
0
0
1
1
1
1
1
0
1
0
1
1
1
1
0
0
0
1
0
1
Hermanos
2
4
4
1
1
1
1
1
0
1
2
2
14
2
1
1
2
3
3
2
5
1
2
4
2
1
1
1
1
2
2
1
1
3
5
2
2
2
2
2
8
N°
Aprobado
118
1
119
0
120
0
Fuente: Cuestionario aplicado a estudiantes,
Elaboración: Autoría propia,
Colegio
1
0
0
Hermanos
5
1
1
9
2 Estimación del modelo probit
2.1 Estimación del modelo probit binario
𝑃𝑟(𝐴𝑝𝑟𝑜𝑏𝑎𝑑𝑜 = 1|𝐶𝑜𝑙𝑒𝑔𝑖𝑜, 𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠) = Φ(𝛽0 + 𝛽1 𝐶𝑜𝑙𝑒𝑔𝑖𝑜𝑖 + 𝛽2 𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠𝑖 )
Tabla 2
Estimación del modelo probit binario
Fuente: Software econométrico gretl 2020,
Elaboración: Software econométrico gretl 2020,
Ecuación del modelo probit binario
𝑃𝑟(𝐴𝑝𝑟𝑜𝑏𝑎𝑑𝑜 = 1|𝐶𝑜𝑙𝑒𝑔𝑖𝑜, 𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠) = Φ(0,167499 + 0,0889914𝐶𝑜𝑙𝑒𝑔𝑖𝑜𝑖 + 0,0613403𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠𝑖 )
10
3 Contraste de colinealidad
3.1 Contraste de colinealidad con el Factor de Inflación de la Varianza (VIF)
3.1.1 Contraste de colinealidad para los regresores con el VIF
Estadístico de prueba
VIF (Factor de inflación de la varianza)
Estadístico calculado1
𝑉𝐼𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 𝑝𝑎𝑟𝑎 𝐶𝑜𝑙𝑒𝑔𝑖𝑜 = 1,024
𝑉𝐼𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 𝑝𝑎𝑟𝑎 𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠 = 1,024
Estadístico crítico
𝑉𝐼𝐹𝑐𝑟í𝑡𝑖𝑐𝑜 = 10,0
Regla de decisión
La regla de decisión es rechazar la no colinealidad entre los regresores si el valor del
estadístico de prueba VIF calculado excede al valor del estadístico de prueba VIF crítico
(el cual es 10), o no rechazar en caso contrario,
Decisión
La decisión es no rechazar la no colinealidad entre los regresores, porque el valor del
estadístico de prueba VIF calculado (1,024; 1,024) no excede al valor del estadístico de
prueba VIF crítico (10),
Conclusión
La conclusión es que los regresores no presentan un problema de colinealidad, por lo tanto,
se cumple con el supuesto de no colinealidad entre los regresores, con el estadístico de
prueba VIF,
1
El estadístico calculado de los valores VIF se presenta en la tabla 6.
11
4 Contraste de significancia individual
4.1 Contraste de significancia individual para los coeficientes de la regresión parcial
Cabe precisar que el modelo considerado para la evaluación individual es el siguiente:
𝑃𝑟(𝐴𝑝𝑟𝑜𝑏𝑎𝑑𝑜 = 1|𝐶𝑜𝑙𝑒𝑔𝑖𝑜, 𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠) = Φ(𝛽0 + 𝛽1 𝐶𝑜𝑙𝑒𝑔𝑖𝑜𝑖 + 𝛽2 𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠𝑖 )
4.1.1 Contraste de significancia para 𝛽0 con valor p
Planteamiento de hipótesis
𝐻0: 𝛽0 = 0 (el verdadero coeficiente de la constante 𝛽0 es cero)
𝐻1: 𝛽0 ≠ 0 (el verdadero coeficiente de la constante 𝛽0 es diferente de cero)
Nivel de significancia seleccionado
𝛼 = 5 % = 0,05
Estadístico de contraste
z que sigue una distribución z con 𝑛−2 grados de libertad
Estadístico calculado2
zc =
β̂̂0−β0
DT(β̂ 0)
Regla de decisión
=
0,167499−0
0,219849
= 0,7619
con valor p = 0,4461
La regla de decisión es rechazar la hipótesis nula (𝐻0) si el valor p del estadístico de
contraste z calculado es menor que el valor del nivel de significancia seleccionado, o no
rechazar la hipótesis nula (𝐻0) en caso contrario,
2
El estadístico calculado con el valor p se presenta en la tabla 2.
12
Decisión
La decisión es no rechazar la hipótesis nula (𝐻0) porque el valor p (0,4461) del estadístico
de contraste z calculado no es menor que el valor del nivel de significancia de 5 % (α =
0,05),
Conclusión
La conclusión es que el coeficiente de regresión 𝛽0 no es estadísticamente significativo, es
decir, significativamente el coeficiente de regresión 𝛽0 es igual a cero en el nivel de
significancia de 5 % (α = 0,05), con el estadístico de contraste z,
13
4.1.2 Contraste de significancia para 𝛽1 con valor p
Planteamiento de hipótesis
𝐻0: 𝛽1 = 0 (el verdadero coeficiente de la constante 𝛽1 es cero)
𝐻1: 𝛽1 ≠ 0 (el verdadero coeficiente de la constante 𝛽1 es diferente de cero)
Nivel de significancia seleccionado
𝛼 = 5 % = 0,05
z que sigue una distribución z con 𝑛−2 grados de libertad
Estadístico calculado3
zc =
β̂̂1−β1
DT(β̂ 1)
Regla de decisión
=
0,0889914−0
0,239353
= 0,3718
con valor p = 0,7100
La regla de decisión es rechazar la hipótesis nula (𝐻0) si el valor p del estadístico de
contraste z calculado es menor que el valor del nivel de significancia seleccionado, o no
rechazar la hipótesis nula (𝐻0) en caso contrario,
Decisión
La decisión es no rechazar la hipótesis nula (𝐻0) porque el valor p (0,7100) del estadístico
de contraste z calculado no es menor que el valor del nivel de significancia de 5 % (α =
0,05),
Conclusión
La conclusión es que el coeficiente de regresión 𝛽0 no es estadísticamente significativo, es
decir, significativamente el coeficiente de regresión 𝛽0 es igual a cero en el nivel de
significancia de 5 % (α = 0,05), con el estadístico de contraste z,
3
El estadístico calculado con el valor p se presenta en la tabla 2.
14
4.1.3 Contraste de significancia para 𝛽2 con valor p
Planteamiento de hipótesis
𝐻0: 𝛽2 = 0 (el verdadero coeficiente de la constante 𝛽2 es cero)
𝐻1: 𝛽2 ≠ 0 (el verdadero coeficiente de la constante 𝛽2 es diferente de cero)
Nivel de significancia seleccionado
𝛼 = 5 % = 0,05
z que sigue una distribución z con 𝑛−2 grados de libertad
Estadístico calculado4
zc =
β̂̂2−β2
DT(β̂ 2)
Regla de decisión
=
0,0613403−0
0,0644911
= 0,9511
con valor p = 0,3415
La regla de decisión es rechazar la hipótesis nula (𝐻0) si el valor p del estadístico de
contraste z calculado es menor que el valor del nivel de significancia seleccionado, o no
rechazar la hipótesis nula (𝐻0) en caso contrario,
Decisión
La decisión es no rechazar la hipótesis nula (𝐻0) porque el valor p (0,3415) del estadístico
de contraste z calculado no es menor que el valor del nivel de significancia de 5 % (α =
0,05),
Conclusión
La conclusión es que el coeficiente de regresión 𝛽0 no es estadísticamente significativo, es
decir, significativamente el coeficiente de regresión 𝛽0 es igual a cero en el nivel de
significancia de 5 % (α = 0,05), con el estadístico de contraste z,
4
El estadístico calculado con el valor p se presenta en la tabla 2.
15
5 Contraste de significancia de razón de verosimilitud (significancia global)
5.1 Contraste de significancia global con valor p
5.1.1 Datos
Tabla 3
Estimación del modelo probit sin restringir
Fuente: Software econométrico gretl 2020,
Elaboración: Software econométrico gretl 2020,
Ecuación del modelo probit binario
𝑃𝑟(𝐴𝑝𝑟𝑜𝑏𝑎𝑑𝑜 = 1|𝐶𝑜𝑙𝑒𝑔𝑖𝑜, 𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠) = Φ(0,167499 + 0,0889914𝐶𝑜𝑙𝑒𝑔𝑖𝑜𝑖 + 0,0613403𝐻𝑒𝑟𝑚𝑎𝑛𝑜𝑠𝑖 )
16
5.1.2 En el nivel de significancia de 5 %
Planteamiento de hipótesis
En forma literal
𝐻0: Todos los coeficientes de regresión son simultáneamente iguales a cero,
𝐻1: Al menos uno de los coeficientes de regresión es diferente de cero,
En forma simbólica
𝐻0: 𝛽1 = 𝛽2 = 0,
𝐻1: 𝛽1, 𝛽2 ≠ 0,
Nivel de significancia seleccionado
𝛼 = 5 % = 0,05
Estadístico de contraste
Como estadístico de prueba, se utiliza el estadístico de la razón de verosimilitud (𝑅𝑉), Con
la hipótesis nula, el estadístico 𝑅𝑉 sigue la distribución 𝜒2 con grados de libertad (𝑔𝑙) igual
al número de variables explicativas (no se incluye el término constante),
Estadístico calculado5
𝜒𝐶2 = 1,22979
con valor p = 0,5407
Regla de decisión
La regla de decisión es rechazar la hipótesis nula conjunta (𝐻0) si el valor p del estadístico
de contraste 𝜒2 calculado es menor que el valor del nivel de significancia seleccionado, o
no rechazar la hipótesis nula (𝐻0) en caso contrario,
5
El estadístico calculado con el valor p se presenta en la tabla 3.
17
Decisión
La decisión es no rechazar la hipótesis nula (𝐻0) porque el valor p (0,5407) del estadístico
de contraste 𝜒2 calculado no es menor que el valor del nivel de significancia de 5 % (α =
0,05),
Conclusión
La conclusión es que, todos los coeficientes de regresión no son estadísticamente
significativos, es decir, significativamente todos los coeficientes de regresión son
simultáneamente iguales a cero en el nivel de significancia de 5 % (α = 0,05), con el
estadístico de prueba 𝜒2,
18
6 Contraste de número de casos correctamente predichos
Tabla 4
Contraste de número de casos correctamente predichos
Fuente: Software econométrico gretl 2020,
Elaboración: Software econométrico gretl 2020,
Número de casos correctamente predichos
De acuerdo a la tabla 4, se han estimado 77 casos correctamente predichos, lo que representa el
64,2% del total de casos bajo análisis, Por lo tanto, el supuesto de número de casos correctamente
estimados se cumple, puesto que el porcentaje de casos correctamente estimados (64,2%) es mayor
que el 50%,
19
7 Tabla de variable observada, estimada y residuos
Tabla 5
Variable observada, estimada y residuos del modelo probit
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
Aprobado
0,000000
1,00000
1,00000
1,00000
1,00000
1,00000
1,00000
0,000000
1,00000
0,000000
1,00000
1,00000
1,00000
1,00000
1,00000
0,000000
1,00000
1,00000
0,000000
1,00000
1,00000
1,00000
1,00000
1,00000
1,00000
0,000000
1,00000
0,000000
1,00000
0,000000
1,00000
0,000000
0,000000
1,00000
1,00000
1,00000
0,000000
0,000000
Estimada
0,670217
0,614161
0,624693
0,647720
0,670217
0,590503
0,647720
0,647720
0,692114
0,713348
0,647720
0,733861
0,713348
0,566511
0,590503
0,566511
0,614161
0,713348
0,753603
0,724707
0,647720
0,753603
0,647720
0,660146
0,637401
0,660146
0,713348
0,590503
0,601214
0,614161
0,614161
0,590503
0,590503
0,590503
0,590503
0,670217
0,590503
0,637401
Residuo
-0,670217
0,385839
0,375307
0,352280
0,329783
0,409497
0,352280
-0,647720
0,307886
-0,713348
0,352280
0,266139
0,286652
0,433489
0,409497
-0,566511
0,385839
0,286652
-0,753603
0,275293
0,352280
0,246397
0,352280
0,339854
0,362599
-0,660146
0,286652
-0,590503
0,398786
-0,614161
0,385839
-0,590503
-0,590503
0,409497
0,409497
0,329783
-0,590503
-0,637401
20
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
1,00000
1,00000
0,000000
0,000000
1,00000
1,00000
1,00000
1,00000
1,00000
1,00000
1,00000
0,000000
1,00000
0,000000
0,000000
1,00000
1,00000
1,00000
1,00000
1,00000
1,00000
1,00000
1,00000
0,000000
1,00000
1,00000
1,00000
1,00000
1,00000
1,00000
1,00000
0,000000
1,00000
0,000000
1,00000
0,000000
1,00000
0,000000
0,000000
1,00000
0,000000
0,000000
1,00000
1,00000
1,00000
0,670217
0,637401
0,670217
0,624693
0,782570
0,692114
0,647720
0,590503
0,637401
0,614161
0,614161
0,624693
0,566511
0,637401
0,647720
0,590503
0,670217
0,647720
0,624693
0,624693
0,670217
0,590503
0,590503
0,670217
0,566511
0,637401
0,637401
0,753603
0,624693
0,624693
0,670217
0,624693
0,692114
0,590503
0,670217
0,590503
0,647720
0,713348
0,624693
0,647720
0,692114
0,660146
0,590503
0,624693
0,624693
0,329783
0,362599
-0,670217
-0,624693
0,217430
0,307886
0,352280
0,409497
0,362599
0,385839
0,385839
-0,624693
0,433489
-0,637401
-0,647720
0,409497
0,329783
0,352280
0,375307
0,375307
0,329783
0,409497
0,409497
-0,670217
0,433489
0,362599
0,362599
0,246397
0,375307
0,375307
0,329783
-0,624693
0,307886
-0,590503
0,329783
-0,590503
0,352280
-0,713348
-0,624693
0,352280
-0,692114
-0,660146
0,409497
0,375307
0,375307
21
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
0,000000
1,00000
0,000000
0,000000
0,000000
1,00000
1,00000
1,00000
1,00000
0,000000
1,00000
0,000000
0,000000
0,000000
0,000000
1,00000
0,000000
1,00000
1,00000
0,000000
0,000000
0,000000
1,00000
1,00000
1,00000
0,000000
1,00000
0,000000
0,000000
1,00000
1,00000
1,00000
1,00000
1,00000
1,00000
0,000000
0,000000
Fuente: Software econométrico gretl 2020,
Elaboración: Software econométrico gretl 2020,
0,624693
0,624693
0,601214
0,624693
0,647720
0,647720
0,867629
0,647720
0,590503
0,590503
0,614161
0,637401
0,670217
0,614161
0,682322
0,590503
0,647720
0,692114
0,647720
0,624693
0,624693
0,590503
0,624693
0,614161
0,647720
0,624693
0,624693
0,670217
0,682322
0,614161
0,614161
0,647720
0,614161
0,647720
0,713348
0,590503
0,590503
-0,624693
0,375307
-0,601214
-0,624693
-0,647720
0,352280
0,132371
0,352280
0,409497
-0,590503
0,385839
-0,637401
-0,670217
-0,614161
-0,682322
0,409497
-0,647720
0,307886
0,352280
-0,624693
-0,624693
-0,590503
0,375307
0,385839
0,352280
-0,624693
0,375307
-0,670217
-0,682322
0,385839
0,385839
0,352280
0,385839
0,352280
0,286652
-0,590503
-0,590503
22
Rango de estimación del modelo: 1 - 120
Estadísticos de evaluación de la predicción utilizando 120 observaciones
Error medio
-9,9547e-005
Raíz del Error cuadrático medio
0,47738
Error absoluto medio
0,45548
23
Anexos
Tabla 6
Contraste de colinealidad para los regresores con el VIF
Fuente: Software econométrico gretl 2020,
Elaboración: Software econométrico gretl 2020,