Nothing Special   »   [go: up one dir, main page]

Heterocedasticidad Ejercicios

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 4

HETEROCEDASTICIDAD EJERCICIOS

MATRIZ 6

Matriz 6: Se desea ajustar un buen modelo lineal con las variables siguiente.

ERA (Y): Promedio de carreras ganadas o número de carreras permitidas por partido (en nueve
entradas)
WHIP(x2): Número de bases por bolas más hits cedidos por entrada lanzada
CMD(x3): Dominio de lanzamientos, la razón de ponches/bases por bolas
K/9(x4): Bateadores que un lanzador poncho por partido (en nueve entradas lanzadas)
HR/9(x5): Homeruns de la oposición por partido (en nueve entradas lanzadas)
OBA(x6): Promedio de bateo de la oposición
THROWS(x7): Lanzador diestro (1) o lanzador zurdo (0)

Ajustar un buen modelo que cumpla con: los supuestos de la forma funcional del
modelo, normalidad de los residuales, ausencia de multicolinealidad y
homocedasticidad (Interpretar cada resultado obtenido).

Al hacer un análisis se puede observar que las variables x2, x4, x6, x7 del modelo no
son significativa. Las variables que se ha considerado su significancia son las variables
y, x3, x5, además al analizar el valor p se observa que es menor al nivel de significancia
con un valor de 2.2e-16. Por lo que se concluye que se debe omitir las variables x2, x4,
x6, x7.

AJUSTANDO EL MEJOR MODELO


Se observa que las tres variables son significativas

FORMA FUNCIONAL DEL MODELO


Histogram of rstint Normal Q-Q Plot
Histogram of rstint Normal Q-Q Plot

3
30

3
30
25

2
25

2
20
20

1
Sample Quantiles
1

1
Sample Quantiles
Frequency
Frequency
15
15

0
0

0
10
10

-1
-1

-1
-1
5
5

-2
-2

-2
-2
0
0

-2 -1 0 1 2 3 -2 -1 0 1 2
-2 -1 0 1 2 3 -2 -1 0 1 2
rstint Theoretical Quantiles
rstint Theoretical Quantiles

Mediante el histograma se observa que tiene asimetría a la derecha debido a que sus datos
están concentrados a la izquierda, en la gráfica de boxplot se observa la presencia de datos
atípicos y en el qqplot la línea de tendencia se ajusta en los datos, es decir que tiene
normalidad.

 Tiene una asimetría de 0.417927 y una Curtosis de 3.482806 es decir que existe una
mayor concentración de los datos en torno a la media
 El modelo cumple con los supuestos de omisión de variable, significativas, forma
funcional del modelo, correlación entre las variables exógenas de las variables
residuales y normalidad de los residuales. Con respecto a este último podemos decir
también que no se tiene problema de micronumerocidad y por lo tanto la inferencia
que se realice con respecto a los parámetros del modelo lineal(beta)son válidos.
 En la tabla anova, observamos que las variables se explican entre si.
MULTICOLINEALIDAD

Grafico:
Grafico:Matriz
Matrizde
deDispersion
Dispersiondel
deldatos
datos
2 4 6 8 10 260 280 300 320 340 360 380
2 4 6 8 10 260 280 300 320 340 360 380

6
6
5
5
yy

4
4
3
3
2
2
8 10
8 10

x3
6

x3
6
4
4
2
2

2.0
2.0
1.5
x5

1.5
x5

1.0
1.0
0.5
0.5
380
380
340
340

x6
x6
300
300
260
260

2 3 4 5 6 0.5 1.0 1.5 2.0


2 3 4 5 6 0.5 1.0 1.5 2.0

Matriz de correlación de las variables x3, x5, x6

 Se observa que la variable x3, tiene unas correlaciones negativas con la variable x3, x5,
x6 es decir que mi r cuadrado no va a variar mucho en mi modelo.

 mediante el criterio de vif podemos decir que no existe problema de multicolinealidad,


en nuestro modelo.
 Ajustando el modelo, el r cuadrado no varía mucho con respecto a las variables x3, x5,
x6.

HETEROCEDASTICIDAD-HOMOCEDASTICIDAD

Visualizando
Visualizandosi lasi lavarianza
varianzaesesconstante
constante
3
3
2
2
1
1
dos
s
a
o
riz
a d
a
riz
nd
a
ta
nd
s
ta
se
ses
o

0
u
id
o

0
u
s
e
id
R
e
Rs
-1
-1
-2
-2

3 4 5 6
3 4 5 6
Valores ajustados
Valores ajustados

 Los datos se comporten horizontalmente en el modelo.

 Se observa que existe Homocedasticidad dentro del modelo ajustado fit1,


mediante la prueba Breusch-Pagan, porque no se rechaza la hipótesis nula.
 #Ho: Precencia de homoscedasticida
 # Ha: Precencia de heterocedasticidad
Se encontró un modelo bueno que explica el 77% de la variabilidad de Promedio de
carreras ganadas o número de carreras permitidas por partido (en nueve entradas), y este
cumple satisfactoriamente con los supuestos de la forma funcional del modelo, normalidad
de los residuales, ausencia de multicolinealidad y homocedasticidad.

También podría gustarte