Laboratorio#1 AR21 Gil Flores Karina
Laboratorio#1 AR21 Gil Flores Karina
Laboratorio#1 AR21 Gil Flores Karina
ANALISIS DE REGRESION
PROFESOR:
OSWALDO GARCIA SALGADO
ALUMNA:
KARINA GIL FLORES
LABORATORIO UNIDAD 1
PERIODO
2021-B
30 DE SEPTIEMBRE DEL 20
DE MEXICO
𝑆𝐶𝐸𝑟𝑟𝑜𝑟∑▒ 〖 (𝑌_𝑖−𝑌 ̂_𝑆𝐶𝑇𝑜𝑡𝑎𝑙
𝑆𝐶𝑅𝑒𝑔∑▒ 〖 (𝑌 ̂_𝑖−𝑌 ̅) 〗 ∑▒ 〖 (𝑌_𝑖−𝑌 ̅)
X Y X2 XY Y^ ^2
〗 ^2
𝑖)
〗 ^2
1. Assuming a model, Y=b0+b1X+e, what are the least squares estimates of b0 and b1? what is the prediction equation?
2. Construct the analysis of variance table and test the hypothesis H0: b1=0 with an a risk of 0.05
Respuesta a la hipotesis: Se rechaza Ho, existe evidencia estadistica de que el modelo es adecuado
^b1:
Ho:b1=0
Ha: b1≠0
𝑆_(𝑏_1)^2= 0.02
tc= 9.81
tt= 2.26
Intervalos de confianza
Limite inferiob1 Limite superior
1.11 1.44 1.77
4. What are the confidence limits (a=0.05) for the true mean value of Y when X=3?
Y^= 13.5818182
5. What are the confidence limits (a=0.05) for the difference between the true mean value of Y when X1=3 and the true mean
Y^(X1)= 13.58
Y^(X2)= 6.4
7. Comment on the umber of levels of temperature investigated with respect to the estimate of b1 in the assumed model.
ng data (in coded form) were collected:
𝐸𝑟𝑟𝑜𝑟∑▒ 〖 (𝑌_𝑖−𝑌 ̂_𝑆𝐶𝑇𝑜𝑡𝑎𝑙
𝑖) ∑▒ 〖〖
∑▒ 〖 (𝑌_𝑖−𝑌 ̅ ) (𝑥_𝑖−𝑥 ̅) 〗 ^2 " " 〗 𝑌 ̂_𝑝
^2 〗 ^2
68.44 25 2.09
18.26 16 3.53
27.80 9 4.96
5.17 4 6.40
0.53 1 7.84
1.62 0 9.27
0.07 1 10.71
13.89 4 12.15
22.35 9 13.58
13.89 16 15.02
76.17 25 16.45
he prediction equation?
3636363636364X+e
Y when X1=3 and the true mean value of Y when X2=-2?
𝑆𝐶𝐸𝑟𝑟𝑜𝑟∑▒ 〖 (𝑌_𝑖−𝑌 ̂_𝑖)
𝑆𝐶𝑇𝑜𝑡𝑎𝑙∑▒ 〖 (𝑌_𝑖−𝑌 ̅)
X(Fe) Y (loss in MDD) X2 XY Y^ 𝑆𝐶𝑅𝑒𝑔∑▒ 〖 (𝑌 ̂_𝑖−𝑌 ̅) 〗
^2 〗 ^2 〗 ^2
1 0.01 127.6 0.0001 1.276 129.55 429.78 3.79
2 0.48 124 0.2304 59.52 118.26 89.15 32.98
3 0.71 110.8 0.5041 78.668 112.73 15.34 3.73
4 0.95 103.9 0.9025 98.705 106.97 3.41 9.41
5 1.19 101.5 1.4161 120.785 101.20 57.95 0.09
6 0.01 130.1 0.0001 1.301 129.55 429.78 0.31
7 0.48 122 0.2304 58.56 118.26 89.15 14.01
8 1.44 92.3 2.0736 132.912 95.20 185.43 8.40
9 0.71 113.1 0.5041 80.301 112.73 15.34 0.14
10 1.96 83.7 3.8416 164.052 82.71 681.62 0.98
11 0.01 128 0.0001 1.28 129.55 429.78 2.39
12 1.44 91.4 2.0736 131.616 95.20 185.43 14.42
13 1.96 86.2 3.8416 168.952 82.71 681.62 12.20
Suma 11.35 1414.6 15.6183 1097.928 1414.6 3293.76669 102.850233
Media 0.873 108.815
Requirement.
Determine if the effect of iron content on the corrosion resistance of 90/10
Cu-Ni alloys in seawater can justifiably be represented by a straight line model. Assume a=0.05
b0^ 129.79
b1^ -24.020
El modelo: Y^=129.786599277239+-24.0198934452957X
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 3293.7666901 3293.76669 352.273714 1.05536E-09
Residuos 11 102.85023302 9.35002118
Total 12 3396.6169231
Respuesta a la hipotesis: Se rechaza Ho, existe evidencia estadistica de que el modelo es adecuado
n-wheel setup.
oss in milligams/square decimeter/day. MDD.
𝐸𝑟𝑟𝑜𝑟∑▒ 〖 (𝑌_𝑖−𝑌 ̂𝑆𝐶𝑇𝑜𝑡𝑎𝑙
_𝑖) ∑▒ )〖〖 (𝑥_𝑖−𝑥 ̅) 〗 ^2 " " 〗
∑▒ 〖 (𝑌_𝑖−𝑌 ̅
^2 〗 ^2
352.86 0.7449
230.57 0.1545
3.94 0.0266
24.16 0.0059
53.51 0.1004
453.03 0.7449
173.83 0.1545
272.76 0.3214
18.36 0.0266
630.78 1.1814
368.05 0.7449
303.30 0.3214
511.46 1.1814
3396.61692 5.70887692
The data below consist of seven pairs of values of
X= price of alcohol relative to take-home pay
Y1= consumption of absolute alcohol in liters per head of population per year
Y2= cirrhosis deaths per 100,000 of populations,
for seven European countries. Plot Y 1 versus X and Y2 versus X (Y as ordinate, X as
abscissa) and judge whether in your opinion a straight line would fit each ser of data reasonably well.
u Country X Y1 Y2 X2
1 France 0.016 24.66 51.70 0.000256
2 Italy 0.027 18.00 30.50 0.000729
3 West Germany 0.026 13.63 29.00 0.000676
4 Belgium 0.022 8.42 14.20 0.000484
5 United Kigdom 0.057 7.66 4.10 0.003249
6 Ireland 0.092 7.64 5.00 0.008464
7 Denmark 0.096 7.50 11.60 0.009216
Suma 0.336 87.51 146.1 0.023074
Media 0.048 12.50142857 20.87142857
1. For the (X,Y2) only, evaluate the fitted least squares line and draw it on your data plot.
60.00
b0^ 38.07 50.00
b1^ -358.25 40.00
30.00
El modelo: Y^=38.0673974743943+-358.249352145119X 20.00
10.00
0.00
0.01 0.02 0.03 0.04 0.05 0.06
2. Evaluate the residuals to two decimal places. Check that Sex=0, within roundig error.
ei
19.36
2.11
0.25
-15.99
-13.55
-0.11
7.92
Suma 0.00
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F
Regresión 1 891.4676879 891.4676879 5.057303567 0.0743845969527
Residuos 5 881.3665978 176.2733196
Total 6 1772.834286
Prueba b1:
tc= 2.25
S =
2
b1 25377.67 Error estándar de b1 159.30371439123
Prueba b0:
tc= 2.87
S2b0= 83.65 Error estándar de b0 9.1461501383006
tt= 2.57
5. Find the formula for the standard error of Y^, and contruct 95% condidence bands for the true mean value of Y.
6. Test the overall regression via an F-test, and find how much of the variation about the mean Y- is explained by the fitted line
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F
Regresión 1 891.4676879 891.4676879 5.057303567 0.0743845969527
Residuos 5 881.3665978 176.2733196
Total 6 1772.834286
r2=ry/x2 0.502848853422
7. For our data, it might be sensile to regard the following sets of runs as approcimate repeats.
b0^ -60.08
b1^ 3385.71
b0^ -146.80
b1^ 1650.00
∑▒ 〖 (𝑌 ̂_(2,𝑖)^ − ∑▒ 〖 (𝑌_(2,𝑖)^ −(𝑌_(2,𝑖)
∑▒) ̂〖
) 〗(𝑌_(2,𝑖)^
^2 −𝑌 ̅2) ∑▒
〗 ^2
XY2 Y2^ (𝑌2) ̅) 〗 ^2
〖 (𝑋_𝑖^ −𝑋 ̅) 〗 ^2
0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1 0.11
a= 5%
e true mean value of Y.
)∗√176.27
−(𝑌_(2,𝑖) ) ̂) 〗
∑▒^2
〖 (𝑌_(2,𝑖)^ −𝑌 ̅2) 〗∑▒
^2 〖 (𝑋_𝑖^ −𝑋 ̅) 〗 ^2 Y^
35.204 0.0000040 31.338
19.654 0.0000010 27.952
107.468 0.0000090 14.410
162.327 0.000014
Suma de errores
Nuevo conjunto de datos 184.11
∑▒ 〖 (𝑌_(2,𝑖)^ −(𝑌_(2,𝑖)
∑▒) ̂〖
) 〗(𝑌_(2,𝑖)^
^2 −𝑌 ̅2) 〗∑▒
^2 〖 (𝑋_𝑖^ −𝑋 ̅) 〗 ^2
Diferencia 697.26
0.0000 10.89 4E-06
0.0000 10.89 4E-06
0.000 21.780 0.0000080
Grados de libertad CM F
3 61.37 5.68089095
2 348.63
The moisture of the wet mix of a product is considered to have an effect on the finished product density.
The moisture of the mix was controlled and finished product densities were measured as shown in the following data:
b0^ -21.33
b1^ 5.000
El modelo: Y^=-21.3333333333325+4.99999999999984X
3. Is there any evidence in the data that a more complex model should be tried (Use a=0.05)
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 52.5 52.5 30.5825243 0.0002509656
Residuos 10 17.1666667 1.71666667
Total 11 69.6666667
Ft a
4.96460274 5%
The effect of the temperature of the deodorizing process on the color of the finished product was determined
experimentally. The data collected were as follows:
Temperature Color
𝑆𝐶𝐸𝑟𝑟𝑜𝑟∑▒ 〖 (𝑌_𝑖−𝑌 ̂_
X Y X2 Y2 XY Y^ 𝑆𝐶𝑅𝑒𝑔∑▒ 〖 (𝑌 ̂_𝑖−𝑌 ̅) 〗
^2 〗 ^2
b0^ 2.54
b1^ -0.00472
El modelo: Y^=2.53642473118276+-0.0047177419354838X
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F Ft
Regresión 1 0.11039516 0.11039516129 14.5053933 0.0021716 4.66719273
Residuos 13 0.09893817 0.00761062862
Total 14 0.20933333
3. Obtain a 95% conffidence interval for the true mean value of Y at any given value of X, say, X0
𝑌 ̂ 𝑠_(𝑦_𝑝)^
Lim. Inferior Lim. Superior
0.36626344086 0.04776131 0.2630814 0.46944547763
0.41344086022 0.03729866 0.332862 0.49401972026
0.46061827957 0.02842741 0.39920459 0.52203197213
0.50779569892 0.02306351 0.45797001 0.55762139065
0.55497311828 0.02371948 0.5037303 0.60621593684
0.60215053763 0.03000303 0.53733293 0.66696814578
0.41344086022 0.03729866 0.332862 0.49401972026
0.46061827957 0.02842741 0.39920459 0.52203197213
0.50779569892 0.02306351 0.45797001 0.55762139065
0.55497311828 0.02371948 0.5037303 0.60621593684
0.60215053763 0.03000303 0.53733293 0.66696814578
0.64932795699 0.03930178 0.56442161 0.73423430053
0.55497311828 0.02371948 0.5037303 0.60621593684
0.60215053763 0.03000303 0.53733293 0.66696814578
0.64932795699 0.03930178 0.56442161 0.73423430053
a
5%
En la fabricacion de un material plastico, se cree que el tempo de enfriamiento influye en la
resistencia al impacto. Por tanto, se lleva a cabo un estudio en el que se determina la resistencia al
impacto del material plastico para 4 tiempos de enfriamiento diferetes. Los resulados de este
experimento se muestran en la siguiente tabla:
Tiempos de Resistencia al
enfrimieto en impacto en
segundos kJ/m2
∑▒ 〖 (𝑌 ̂_𝑖^ −𝑌 ̅) 〗 ∑▒ 〖 (𝑌_𝑖^ −(𝑌_𝑖 ) ̂) 〗 ^2 ∑▒ 〖 (𝑌_𝑖^ −𝑌 ̅) 〗 ^
(X) (Y) X2 XY Y^ ^2
1 15 42.1 225 631.5 41.8186 51.38946 0.0791612
2 25 36 625 900 36.6051 3.82236 0.3661275
3 35 31.8 1225 1113 31.3915 10.61766 0.1668515
4 40 28.7 1600 1148 28.7847 34.40121 0.0071818
Suma 115 138.6 3675 3792.5 138.6 100.230678 0.6193220339
Media 28.75 34.65
b0^ 49.64
b1^ -0.52136
El modelo: Y^=49.6389830508475+-0.52135593220339X
a) ¿Cuál es el intervalo de confianza del 95% para la pendiente del modelo de regresion expresando
la resistencia al impacto como una funcion lineal del tiempo de enfriamiento?
Prueba b1:
b) ¿Puede concluir que existe una relacion entre la resistencia al impacto y el tiempo de enfriamiento al nivel de significancia d
Determinación de R2
r2=ry/x2 0.99385898 Es relación (en distancia) entre la var X y Y
La relación entre la resistencia al impacto y e tiempo de enfriamiento al nivel de significancia de a=5% en el mod
Muy alta
c) Para un material plástico similar, el valor tabulado de la relación lineal entre la tmeperatura y la resistencia al impacto
(es decir, la pendiente) es -0.30. Si se prueba la siguiente hipotesis (en el nivel a=0.05)
H0: β1 = −0.30 con el estadistico de prueba t-student para tal prueba, ¿Cuál es el rango
H1: β1 ≠ −0.30 (para t) dentro del cual se acepta la hipotesis?
Prueba b1:
tc= 9.83
se= 0.56
a= 5% Nivel de significancia
tt= 4.30
Hipótesis
Ho: b1=-0.30 Se rechaza Ho, existe evidencia estadística de que b1 no es -0.30
Ha: b1≠-0.30
pvalor 0.0101887 Se rechaza Ho, existe evidencia estadística de que b1 no es igual a -0.30
∑▒ 〖 (𝑌_𝑖^ −𝑌 ̅) 〗 ^2∑▒ 〖 (𝑋_𝑖^ −𝑋 ̅) 〗 ^2
ANÁLISIS DE VARIANZA
55.5025 189.0625 Grados de libertad
Suma de cuadrados
Promedio de los cuadrados
1.8225 14.0625 Regresión 1 100.230678 100.230678
8.1225 39.0625 Residuos 2 0.61932203 0.30966102
35.4025 126.5625 Total 3 100.85
100.85 368.75
Coeficiente de correlación
Ho: r=0
Ha: r≠0
tc= 17.991073
tt= 4.30265273
Conclusión: Se rechaza Ho, existe evidencia estadística de la relación de X y
Por lo tanto: Existe una relación entre los tiempos de enfriamiento y la resistencia a
ancia de a=5% en el modelo propuesto se considera:
istencia al impacto
0.30
F Valor crítico de F a
323.678708 0.00307524 5%
tadística de la relación de X y Y
enfriamiento y la resistencia al impacto.
Se selecciono una muestra aleatoria de ocho conductores seleccionados de una pequeña ciuda
asegurada con una empresa y que tenian polizas de seguros de automovil minimas
similares. La siguiente tabla enumera sus experiencias de conduccion (en años) y las primas mensuales del seguro de automov
Experiencia de
conduccion
a) ¿Dependen la prima del seguro de la experiencia de conduccion o la experiencia de conduccion depende de la prima de seg
SSxx= 383.5
SSyy= 1557.5
SSxy= -593.5
c) Encuentre la recta de regresion de minimos cuadrados eligiendo variables dependientes e independientes apropiadas según
∑▒ 〖〖 (𝑥_𝑖−𝑥 ̅) 〗 ^2 " " 〗
Seguro de Prima mensual
automovil (años) ($) X^2 Y^2 XY Y^
1 5 64 25 4096 320 68.922 39.0625
2 2 87 4 7569 174 73.565 85.5625
3 12 50 144 2500 600 58.089 0.5625
4 9 71 81 5041 639 62.732 5.0625
5 15 44 225 1936 660 53.447 14.0625
6 6 56 36 3136 336 67.375 27.5625
7 25 42 625 1764 1050 37.971 189.0625
8 16 60 256 3600 960 51.899 22.5625
Suma 90 474 1396 29642 4739 383.5
Media 11.25 59.25
b^0 76.6603651
b^1 -1.54758801 El modelo: Y^=76.6603650586702+-1.54758800521512X
Diagrama de dispersión
100
90
87
80
70 71
64
60 60
56
50 50
44 42
40
30
20
10
0
0 5 10 15 20 25 30
Resumen
Estadísticas de la regresión
Coeficiente de 0.7679342
Coeficiente de 0.58972294
R^2 ajustado 0.52134343
Error típico 10.3199364
Observaciones 8
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 918.493481 918.493481 8.62426395 0.0260588
Residuos 6 639.006519 106.501086
Total 7 1557.5
g) Predecir la prima mensual del seguro de automovil para un conductor con 10 años de experiencia de conducción.
Y^10= 61.184485
^b1:
Ho:b1=0
Ha: b1≠0
𝑆_(𝑏_1)^2= 0.28 𝑆_(𝑏_0)^2=
tc= -2.94
tt= 1.94
Intervalos de confianza
Limite inferiob1 Limite superior
-2.57 -1.55 -0.52
j) Pruebe a un nivel de significancia del 5% si B es negativo
^b1:
Ho:b1=0
Ha: b1≠0
𝑆_(𝑏_1)^2= 0.28 𝑆_(𝑏_0)^2=
tc= -2.94
tt= 2.45
Intervalos de confianza
Limite inferiob1 Limite superior
-2.84 -1.55 -0.26
nsuales del seguro de automovil (en dolares)
4758800521512X
Inferior 95.0%
Superior 95.0%
59.6266109 93.6941192
-2.83706221 -0.2581138
ncia de conducción.
^b0:
Ho:b0=0
Ha: b0≠0
𝑆_(𝑏_0)^2= 48.46
tc= 11.01
tt= 1.94
Intervalos de confianza
Limite inferiob1 Limite superior
63.13 76.66 90.19
^b0:
Ho:b0=0
Ha: b0≠0
𝑆_(𝑏_0)^2= 48.46
tc= 11.01
tt= 2.45
Intervalos de confianza
Limite inferiob1 Limite superior
59.63 76.66 93.69
Compruebe matematicamente y estadisticamente que el error estandar del modelo S e(Y^0) es equivalente a:
𝑌 ̂=𝑌 ̅+𝑏_1 (𝑋−𝑋 ̅)
𝐴𝑝𝑙𝑖𝑐𝑎𝑛𝑑𝑜 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎
n= 20
Syi= 12.75
Syi2= 8.86
Sxi= 1478
Sxi2= 143,215.80
Sxiyi= 1083.67
El modelo: Y^=0.329989159086362+0.00416117511385167X
n Y^
1 0.3342
2 0.3383
3 0.3425
4 0.3466
5 0.3508 Linea de regresión
6 0.3550 0.4500
7 0.3591 0.4000
8 0.3633
0.3500
9 0.3674
0.3000
10 0.3716
11 0.3758 0.2500
12 0.3799 0.2000
13 0.3841 0.1500
14 0.3882
0.1000
15 0.3924
0.0500
16 0.3966
17 0.4007 0.0000
0 5 10 15 20
18 0.4049
19 0.4091
20 0.4132
c) Estima Se2
d) Use la ecuacion de la linea ajustada para predecir que deflexion del pavimento se observaria cuando la temperatura de la su
Temperatura Deflexion
85 0.684
Temperatura Deflexion
90 0.704
f) ¿Qué cambio de la deflexion media del pavimento se esperaria para un cambio de 1° en la temperatura de la superficie?
egresión
15 20 25
uando la temperatura de la suprficie es de 85°F.
peratura de la superficie?
Considere la salida de la computadora a continuacion
Analysis of Variance
Source DF SS MS F P
Regression 1 912.43 912.43 415.922507123 0.00000003
Residual Error 8 17.55 2.19375
Total 9 929-98
Respuesta
Se rechaza Ho, por lo tanto existe evidencia estadistica de que es un buen
modelo
σe2 = 2.19375
De dos recnicas existentes para evaluacion de personal, la primera requiere una entrevista de prueba de dos horas
mientras que la segunda se puede completar en menos de una hora. Las puntuaciones para cada una de las 15 personas que t
a) Construya una grafica de dispersion para los datos. ¿Le parece razonable la suposicion de linealidad?
80
70
60
50
40
30
20
10
0
50 60 70 80 90 100 110
b) Encuentre la recta de minimos cuadrados para los datos aplicando el metodo matricial.
b0 b1
1 75
1 89
1 60
1 71 1 1 1 1
1 92 75 89 60 71
1 105
1 55
1 87
1 73 X'X=
1 77
1 84
1 91
1 75 (X'X)^-1=
1 82
1 76
X'Y=
b0= -11.665
b1= 0.755
El modelo: Y^=-11.665+0.755X
c) Use la recta de regresión para predecir la puntuacion en la segunda prueba para un solicitante que obtuvo 85 puntos en la p
Y^(85)= 52.51
ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F Ft
Regresión 1 1291.58202 1291.582024 131.4316573 3.606683E-08 4.667192732
Residuos 13 127.751309 9.827023797
Total 14 1419.33333
Respuesta
Se rechaza Ho, por lo tanto existe evidencia estadistica de que es un
buen modelo
de dos horas
de las 15 personas que tomaron ambas pruebas se dan en la tabla siguiente:
1 1 1 1 1 1 1
92 105 55 87 73 77 84
15 1192
1192 96990
2.853822162 -0.035
-0.035073265 4.00E-04
725
59324
a
5%
1 1 1 1
91 75 82 76
Un investigador desea saber si esta relacionada la relacion entre la edad (Y) y dos variables independientes la grasa corporal (
A1. Calcula y representa gráficamente la recta de regresión, junto con la correspondiente nube de puntos
25
R2 0.07038062
C1. ¿Cuánto valen los estimadores de todos los parametros del modelo?
bo 199.2975017
b1 1.622342724
Suma de
cuadrados
𝑌 ̂ ∑▒ 〖 (𝑥_𝑖−𝑥 ̅) 〗 ^2
∑▒ 〖 (𝑦 ̂_𝑖−𝑦 ̅) 〗 ∑▒^2〖 (𝑦_𝑖−
Peso (X2) Grasas (X1)
𝑦 ̂_𝑖) 〗 ^2
84 354 335.574 234.7024 617.736
73 190 317.729 18.6623999999999 49.119
65 405 304.750 13.5424000000001 35.644
70 263 312.861 1.74239999999998 4.586
76 451 322.596 53.5823999999999 141.029
69 302 311.239 0.1024 0.270
63 288 301.505 32.2624000000001 84.915
72 385 316.106 11.0224 29.011
79 402 327.463 106.5024 280.314
75 365 320.973 39.9423999999999 105.128
27 209 243.101 1737.2224 4572.362
89 290 343.686 412.9024 1086.757
65 346 304.750 13.5424000000001 35.644
57 254 291.771 136.4224 359.063
59 395 295.016 93.7024000000001 246.624
69 434 311.239 0.1024 0.270
60 220 296.638 75.3424000000001 198.301
79 374 327.463 106.5024 280.314
75 308 320.973 39.9423999999999 105.128
82 220 332.330 177.4224 466.975
59 311 295.016 93.7024000000001 246.624
67 181 307.994 2.82240000000002 7.429
85 274 337.197 266.3424 701.012
55 303 288.526 187.1424 492.558
63 244 301.505 32.2624000000001 84.915
Sumas 1717 7768 7768 3887.44 10231.7262
Medias 68.68 310.72
F1. Calcula y representa los intervalos de confianza al 95% de la cantidad de grasas media para los individuos entre 30 y 90 kg.
24
G1. Lleva a cabo el diagnostico de los supuestos de una regresión lineal: (los 5 supuestos)
CM
SC (Suma de g.l. Cuadrados p-valor
Fuente de Cuadrados) medios Fc (calculada)
variación
Regresión 10231.7262 1 10231.7262 1.74130864011907 0.199958473
Error 135145.3138 23 5875.883209
Total 145377.04 24 16107.60941
Hipotesis: Respuesta
Ho: βi=0 Se acepta Ho,por lo tanto no existe evidencia estadistica de que hay
Ha: βi≠0
Prueba Breusan-Pagan
b0= 199.2975017
b1= 1.622342724
X Y yi est ei ei^2 gi v indep
27 209 243.1008 -34.1008 1162.8615 0.000035
55 303 288.5264 14.4736 209.4865 0.000006
57 254 291.7710 -37.7710 1426.6512 0.000043
59 395 295.0157 99.9843 9996.8558 0.000300
59 311 295.0157 15.9843 255.4971 0.000008
60 220 296.6381 -76.6381 5873.3930 0.000176
63 288 301.5051 -13.5051 182.3875 0.000005
63 244 301.5051 -57.5051 3306.8358 0.000099
65 405 304.7498 100.2502 10050.1069 0.000302
65 346 304.7498 41.2502 1701.5808 0.000051
67 181 307.9945 -126.9945 16127.5939 0.000484
69 302 311.2391 -9.2391 85.3619 0.000003
69 434 311.2391 122.7609 15070.2264 0.000453
70 263 312.8615 -49.8615 2486.1684 0.000075
72 385 316.1062 68.8938 4746.3587 0.000143
73 190 317.7285 -127.7285 16314.5750 0.000490
75 365 320.9732 44.0268 1938.3586 0.000058
75 308 320.9732 -12.9732 168.3041 0.000005
76 451 322.5955 128.4045 16487.7031 0.000495
79 402 327.4626 74.5374 5555.8274 0.000167
79 374 327.4626 46.5374 2165.7317 0.000065
82 220 332.3296 -112.3296 12617.9402 0.000379
84 354 335.5743 18.4257 339.5068 0.000010
85 274 337.1966 -63.1966 3993.8145 0.000120
89 290 343.6860 -53.6860 2882.1870 0.000087
135145.3138
5405.8126
33295591.7757
ei vs. Y est
150
100
50
-50
-100
-150
220 240 260 280 300 320 340 360
𝑠(𝑖)=𝑒_𝑖/√(𝑀𝑆_𝐸(𝑖) (1−ℎ_𝑖))
ANOVA
Fuente Var SC gl
Regresión 10231.7261996582 1
Error 135145.313800342 23
Total 145377.04 24
ependientes la grasa corporal (X1; grs /cm2) y el peso (x2;kgs)
Grasas (X1)
500
450
400
350
300
250
200
150
100
400
350
300
250
200
150
100
50
0
20 30 40 50 60 70 80 90 100
bo 199.2975017
b1 1.622342724
Y = 199.298+1.6223* X
Error Total
(𝑦 ̂_𝑖−𝑦 ̅) 〗 ∑▒^2〖 (𝑦_𝑖−∑▒ 〖 (𝑦_𝑖−𝑦 ̅) 〗 ^2
SC (Suma de g.l.
𝑦 ̂_𝑖) 〗 ^2
(yi-b0-bixi)^2 Fuente de Cuadrados)
339.507 1873.158 339.50676926 variación
16314.575 14573.318 16314.574967 Regresión 10231.7262 1
10050.107 8888.718 10050.106856 Error 135145.3138 23
2486.168 2277.198 2486.168424 Total 145377.04 24
16487.703 19678.478 16487.703103
85.362 76.038 85.361886657 Para la pendiente, se utilizara b1
182.388 516.198 182.38754575
4746.359 5517.518 4746.3587312 tc= 1.319586541
5555.827 8332.038 5555.8274402 𝑠_𝑏1^2 1.512
1938.359 2946.318 1938.3585884 𝑠_𝑒^2 5875.883209
1162.862 10346.958 1162.8615088 𝑠_𝑒^ 76.65430979
2882.187 429.318 2882.1870423
1701.581 1244.678 1701.5807511 Intervalo de confianza
1426.651 3217.158 1426.6512346 Nivel de confianza 95%
9996.856 7103.118 9996.8557614 α= 5%
15070.226 15197.958 15070.226373 gl= 23
5873.393 8230.118 5873.3930305 𝑡_𝑡^ = 2.06865761
2165.732 4004.358 2165.7317475
168.304 7.398 168.30407437
12617.940 8230.118 12617.940179
255.497 0.078 255.49712946
16127.594 16827.278 16127.593943
3993.814 1348.358 3993.8144554
209.486 59.598 209.48649997
3306.836 4451.558 3306.8357585
135145.3138 145377.04 135145.3138
. Sup. Predic
Intervalos de confianza de la cantidad de grasas para los indi-
viduos entre 30 y 90 kg
450
400
350
300
250
200
150
100
50
0
50 55 60 65 70 75 80 85 90 95
Prueba estadística
Estadística de prueba: B.P
Prueba 1 n R2 auxiliar= 0.708437668
Prueba 2 1/2 SCR aux= 1.021307E-08
Valor critico
chi cuadrada= 5.991464547
a= 0.05
(d1,d2) k=gl 2
Criterio: Si el estadistico de prueba B-P > valor crítico, se rechaza a Ho, hay hetocedasticidad
Resp 1 Existe homocedasticidad
Resp 2 Existe homocedasticidad
Por lo tanto, podemos decir que los errores tienen varianza constante
ei vs Xi(Peso(X2))
150
100
50
-50
-100
-150
360 20 30 40 50 60 70 80 90 100
nderson Darling
𝐸(𝑖) (1−ℎ_𝑖))
Analizar
a= t-test Cook D>0.25 DFFITS>1 DFFITS> formula
0.01 0.01 0.25 1 0.738548946
t-test D(i)'cook
DFFITS (Diferencia de ajuste)
Criterio 1 Criterio 2 Criterio 3 Criterio 4
0.8063621066 0.002388659 0.0828267949Hay problemas con el dato - - -
0.0869554295 0.045444159 -0.3872304064 - - - -
0.1860655983 0.027096752 0.2906202776 - - - -
0.5187289287 0.006195818 -0.13455653 - - - -
0.0835768429 0.056186694 0.4312371458 - - - -
0.9053449149 0.000210328 -0.0245502989 - - - -
0.8613872046 0.000551746 -0.0397787112 - - - -
0.3695540745 0.012589126 0.1936201075 - - - -
0.3242996138 0.024422937 0.2707714985 - - - -
0.5672812512 0.006129054 0.1335400249 - - - -
0.5464437759 0.121988747 -0.5962926507 - - - -
0.4606206031 0.032795975 -0.310538322 - - - -
0.593494989 0.004587743 0.1154163964 - - - -
0.6193379277 0.007104402 -0.1434925492 - - - -
0.1822775833 0.041504775 0.3599447127 - - - -
0.1019031801 0.037132366 0.3478962382 - - - -
0.3126168232 0.022362199 -0.2593982099 - - - -
0.5414814253 0.009520369 0.1666181123 - - - -
0.8666611534 0.000532174 -0.0390646391 - - - -
0.1268018719 0.073322238 -0.4848313859 - - - -
0.8348888134 0.001060769 0.0551732203 - - - -
0.0896674255 0.04049132 -0.3650852642 - - - -
0.3942137719 0.030934853 -0.3029297277 - - - -
0.8483760534 0.001259737 0.0601153177 - - - -
0.4540301037 0.010003608 -0.1715749536 - - - -
C
7768 Recomendación
539813
Ningun dato muestra mayor influencia sobre el modelo
b0= 199.2975
b1= 1.6223427
CM F p-valor
10231.7262 1.74130864 0.1999584734
5875.8832087
CM
Cuadrados p-valor
medios Fc (calculada)
Ft (tablas) α Nivel de significancia
10231.7262 1.74130864 0.199958473 4.279344309 0.05
5875.883209
16107.60941
Hipotesis
Ho:b1=0
Ha:b1 ≠1
85 90 95
Regresion auxiliar: gi vs X para verificar la homocedasticidad del modelo
Resumen
Estadísticas de la regresión
Coeficiente de 0.168337479
Coeficiente de 0.028337507
R^2 ajustado -0.01390869
Error típico 0.000174504
Observaciones 25
ANÁLISIS DE VARIANZA
hay hetocedasticidad Grados de libertad
Suma de cuadrados
Promedio de los cuadrados
Regresión 1 2.042613E-08 2.042613E-08
Residuos 23 7.0039E-07 3.045174E-08
Total 24 7.208161E-07
0.202428732
0.751
número de parametros=k
FITS> formula
SSx=(xi-xmed)^2 X^2
0 234.7024 7056
0 18.6624 5329
0 13.5424 4225
0 1.7424 4900
0 53.5824 5776
0 0.1024 4761
0 32.2624 3969
0 11.0224 5184
0 106.5024 6241
0 39.9424 5625
0 1737.2224 729
0 412.9024 7921
0 13.5424 4225
0 136.4224 3249
0 93.7024 3481
0 0.1024 4761
0 75.3424 3600
0 106.5024 6241
0 39.9424 5625
0 177.4224 6724
0 93.7024 3481
0 2.8224 4489
0 266.3424 7225
0 187.1424 3025
0 32.2624 3969
3887.44 0 121811
a sobre el modelo
mocedasticidad del modelo
F Valor crítico de F
0.670770622 0.421188698
Probabilidad Inferior 95% Superior 95% Inferior 95.0%Superior 95.0%
0.980098484 -0.00039922 0.0004090707 -0.000399217 0.000409071
0.421188698 -3.49754E-06 8.082036E-06 -3.49754E-06 8.082036E-06
∑▒ 〖 (𝑦 ̂_𝑖−𝑦 ̅∑▒
) 〗 〖 ^2(𝑦_𝑖−𝑦 ̂_𝑖) 〗 ^2
∑▒ 〖 (𝑦_𝑖−𝑦 ̅) 〗 ^2
A2. Calcula y representa gráficamente la recta de regresión, junto con la correspondiente nube de puntos
25
R2 0.70116069
C2. ¿Cuánto valen los estimadores de todos los parametros del modelo?
bo 102.5751422
b1 5.320676324
Suma de
cuadrados
Edad (Y) Grasas (X1) 𝑌 ̂ ∑▒ 〖 (𝑥_𝑖−𝑥 ̅) ∑▒ 〖 (𝑦 ̂_𝑖−𝑦 ̅) 〗 ∑▒
〗 ^2 ^2〖 (𝑦_𝑖−
𝑦 ̂_𝑖) 〗 ^2
F2. Calcula y representa los intervalos de confianza al 95% de la cantidad de grasas media para los individuos entre 30 y 90 año
G2. Lleva a cabo el diagnostico de los supuestos de una regresión lineal: (los 5 supuestos)
CM
SC (Suma de g.l. Cuadrados p-valor
Fuente de Cuadrados) medios Fc (calculada)
variación
Regresión 101932.6657 1 101932.6657 53.9644395787 1.794101E-07
Error 43444.37429 23 1888.885839
Total 145377.04 24 103821.5515
Hipotesis: Respuesta
Ho: βi=0 Se rechaza Ho, por lo tanto existe evidencia estadistica de que haya
Ha: βi≠0
Prueba Breusan-Pagan
b0= 102.5751422
b1= 5.320676324
Edad (Y) Grasas (X1) 𝑌 ̂
ei ei^2 gi v indep
46 354 347.326 6.6737 44.5389 0.000010
20 190 208.989 -18.9887 360.5695 0.000080
52 405 379.250 25.7497 663.0465 0.000148
30 263 262.195 0.8046 0.6473 0.000000
57 451 405.854 45.1463 2038.1891 0.000455
25 302 235.592 66.4079 4410.0158 0.000983
28 288 251.554 36.4459 1328.3051 0.000296
36 385 294.119 90.8805 8259.2671 0.001842
57 402 405.854 -3.8537 14.8509 0.000003
44 365 336.685 28.3151 801.7449 0.000179
24 209 230.271 -21.2714 452.4714 0.000101
31 290 267.516 22.4839 505.5254 0.000113
52 346 379.250 -33.2503 1105.5832 0.000247
23 254 224.951 29.0493 843.8620 0.000188
60 395 421.816 -26.8157 719.0829 0.000160
48 434 357.968 76.0324 5780.9250 0.001289
34 220 283.478 -63.4781 4029.4739 0.000899
51 374 373.930 0.0704 0.0050 0.000000
50 308 368.609 -60.6090 3673.4458 0.000819
34 220 283.478 -63.4781 4029.4739 0.000899
46 311 347.326 -36.3263 1319.5967 0.000294
23 181 224.951 -43.9507 1931.6638 0.000431
37 274 299.440 -25.4402 647.2021 0.000144
40 303 315.402 -12.4022 153.8144 0.000034
30 244 262.195 -18.1954 331.0737 0.000074
43444.3743
1737.7750
4484318.2175
ei vs. Y est
100
80
60
40
20
-20
-40
-60
-80
150 200 250 300 350 400 450
𝑠(𝑖)=𝑒_𝑖/√(𝑀𝑆_𝐸(𝑖) (1−ℎ_𝑖))
ANOVA
Fuente Var SC gl
Regresión 101932.665711 1
Error 43444.374289 23
Total 145377.04 24
3. De ambos modelos cual es el modelo que mejor describe la cantidad de grasa que tiene una persona
Despues de realizar ambos modelos, y las mismas pruebas para cada uno, podemos decir que el segundo mode
la edad, describe mejor la cantidad de grasas que tiene una per
independientes la grasa corporal (X1; grs /cm2) y el peso (x2;kgs)
ube de puntos
Grasas (X1)
500
450
400
350
300
250
200
150
100
400
350
300
250
200
150
100
50
0
15 20 25 30 35 40 45 50 55 60 65
bo 102.5751422
b1 5.320676324
Y = 102.575+5.3207* X
Error Total
(𝑦 ̂_𝑖−𝑦 ̅) 〗 ∑▒
^2〖 (𝑦_𝑖− ∑▒ 〖 (𝑦_𝑖−𝑦 ̅) 〗 ^2 g.l.
𝑦 ̂_𝑖) 〗 ^2 SC (Suma de
(yi-b0-bixi)^2 Fuente de Cuadrados)
44.539 1873.158 44.538897544335 variación
360.570 14573.318 360.56953828148 Regresión 101932.6657 1
663.046 8888.718 663.04648072242 Error 43444.37429 23
0.647 2277.198 0.6473297901836 Total 145377.04 24
2038.189 19678.478 2038.1890649156
4410.016 76.038 4410.0157830697 Para la pendiente, se utilizara b1
1328.305 516.198 1328.3051375079
8259.267 5517.518 8259.2671217675 tc= 7.34604925
14.851 8332.038 14.850947247664 𝑠_𝑏1^2 0.525
801.745 2946.318 801.74486183892 𝑠_𝑒^2 1888.885839
452.471 10346.958 452.47135091022 𝑠_𝑒^ 43.46131428
505.525 429.318 505.52538834161
1105.583 1244.678 1105.5831853083 Intervalo de confianza
843.862 3217.158 843.86196680382 Nivel de confianza 95%
719.083 7103.118 719.08292758263 α= 5%
5780.925 15197.958 5780.9249740225 gl= 23
4029.474 8230.118 4029.4739049275 𝑡_𝑡^ = 2.06865761
0.005 4004.358 0.0049512709965
3673.446 7.398 3673.4458392293
4029.474 8230.118 4029.4739049275
1319.597 0.078 1319.5966650523
1931.664 16827.278 1931.6638242514
647.202 1348.358 647.20205591102
153.814 59.598 153.81444491829
331.074 4451.558 331.07374287231
43444.37429 145377.04 43444.374289015
. Sup. Predic
Intervalos de confianza
500
450
400
350
300
250
200
150
100
50
0
25 30 35 40 45 50 55 60 65
Prueba estadística
Estadística de prueba: B.P
Prueba 1 n R2 auxiliar= 0.065289909
Prueba 2 1/2 SCR aux= 6.988611E-09
Valor critico
chi cuadrada= 5.991464547
a= 0.05
(d1,d2) k=gl 2
Criterio: Si el estadistico de prueba B-P > valor crítico, se rechaza a Ho, hay hetocedasticidad
Resp 1 Existe homocedasticidad
Resp 2 Existe homocedasticidad
Por lo tanto, podemos decir que los errores tienen varinza constante
0.0000
ei vs Xi(Peso(X2))
100
80
60
40
20
-20
-40
-60
450 -80
15 20 25 30 35 40 45 50 55 60 65
a Anderson Darling
((𝑛−𝑘−1)/(𝑛−𝑘−2))
𝐷_𝑖=(𝑒_𝑖^2)/(𝑘+1)(𝑀𝑆_𝐸 ) (ℎ_𝑖/(1−ℎ_𝑖 )^2 )
p=número de parametros=k
𝑀𝑆_𝐸(𝑖) (1−ℎ_𝑖))
Analizar
a= t-test Cook D>0.25 DFFITS>1 DFFITS> formula
0.01 0.01 0.25 1 0.738548946
t-test D(i)'cook
DFFITS (Diferencia de ajuste)
Criterio 1 Criterio 2 Criterio 3 Criterio 4
0.879 0.00047 0.037 - - - -
0.648 0.01222 -0.188 - - - -
0.547 0.01206 0.187 - - - -
0.985 0.00001 0.005 - - - -
0.275 0.06103 0.430 - - - -
0.108 0.09070 0.542 - - - -
0.395 0.02034 0.246 - - - -
0.028 0.06792 0.495 - - - -
0.927 0.00044 -0.036 - - - -
0.517 0.00726 0.146 - - - -
0.616 0.01028 -0.173 - - - -
0.605 0.00587 0.130 - - - -
0.436 0.02011 -0.244 - - - -
0.490 0.02119 0.249 - - - -
0.513 0.02904 -0.291 - - - -
0.068 0.07176 0.491 - - - -
0.137 0.03704 -0.344 - - - -
0.999 0.00000 0.000 - - - -
0.150 0.05496 -0.417 - - - -
0.137 0.03704 -0.344 - - - -
0.402 0.01380 -0.202 - - - -
0.293 0.04851 -0.383 - - - -
0.562 0.00513 -0.122 - - - -
0.778 0.00118 -0.058 - - - -
0.675 0.00420 -0.110 - - - -
C
7768 Recomendación
323042 Ningun dato muestra mayor influencia sobre el modelo
b0= 102.5751
b1= 5.320676
CM F p-valor
101932.6657 53.96443958 1.7941011E-07
1888.885839
una persona
odemos decir que el segundo modelo, en donde la cantidad de grasas esta en función de
antidad de grasas que tiene una persona
CM
Cuadrados p-valor
medios Fc (calculada)
Ft (tablas) α Nivel de significancia
101932.6657 53.96443958 1.794101E-07 4.279344309 0.05
1888.885839
103821.5515
Hipotesis
Ho:b1=0
Ha:b1 ≠1
Resumen
Estadísticas de la regresión
Coeficiente de 0.05110378
Coeficiente de 0.002611596
R^2 ajustado -0.04075312
Error típico 0.000481754
Observaciones 25
ANÁLISIS DE VARIANZA
y hetocedasticidad Grados de libertad
Suma de cuadrados
Promedio de los cuadrados
Regresión 1 1.397722E-08 1.397722E-08
Residuos 23 5.338007E-06 2.320873E-07
Total 24 5.351984E-06
0.273615093
0.751
número de parametros=k
FITS> formula
SSx=(xi-xmed)^2 X^2
0 47.33 2116
0 365.57 400
0 165.89 2704
0 83.17 900
0 319.69 3249
0 199.37 625
0 123.65 784
0 9.73 1296
0 319.69 3249
0 23.81 1936
0 228.61 576
0 65.93 961
0 165.89 2704
0 259.85 529
0 435.97 3600
0 78.85 2304
0 26.21 1156
0 141.13 2601
0 118.37 2500
0 26.21 1156
0 47.33 2116
0 259.85 529
0 4.49 1369
0 0.77 1600
0 83.17 900
3600.64 0 41860