Nothing Special   »   [go: up one dir, main page]

Laboratorio#1 AR21 Gil Flores Karina

Download as xlsx, pdf, or txt
Download as xlsx, pdf, or txt
You are on page 1of 100

UNIVERSIDAD AUTONOMA DEL ESTADO DE MEXICO

ANALISIS DE REGRESION

PROFESOR:
OSWALDO GARCIA SALGADO

ALUMNA:
KARINA GIL FLORES

LABORATORIO UNIDAD 1

PERIODO
2021-B

30 DE SEPTIEMBRE DEL 20
DE MEXICO

0 DE SEPTIEMBRE DEL 2021


A study was made on the effect of temperature on the yield of a chemical process. The following data (in coded form) were co

𝑆𝐶𝐸𝑟𝑟𝑜𝑟∑▒ 〖 (𝑌_𝑖−𝑌 ̂_𝑆𝐶𝑇𝑜𝑡𝑎𝑙
𝑆𝐶𝑅𝑒𝑔∑▒ 〖 (𝑌 ̂_𝑖−𝑌 ̅) 〗 ∑▒ 〖 (𝑌_𝑖−𝑌 ̅)
X Y X2 XY Y^ ^2
〗 ^2
𝑖)
〗 ^2

1 -5 1 25 -5 2.09 51.58 1.19


2 -4 5 16 -20 3.53 33.01 2.17
3 -3 4 9 -12 4.96 18.57 0.93
4 -2 7 4 -14 6.40 8.25 0.36
5 -1 10 1 -10 7.84 2.06 4.68
6 0 8 0 0 9.27 0.00 1.62
7 1 9 1 9 10.71 2.06 2.92
8 2 13 4 26 12.15 8.25 0.73
9 3 14 9 42 13.58 18.57 0.17
10 4 13 16 52 15.02 33.01 4.07
11 5 18 25 90 16.45 51.58 2.39

Suma 0 102 110 158.000 102.000 226.945 21.236


Media 0 9.27272727

1. Assuming a model, Y=b0+b1X+e, what are the least squares estimates of b0 and b1? what is the prediction equation?

b0 9.2727273 El modelo: Y^=9.27272727272727+1.43636363636364X+e


b1 1.4363636

2. Construct the analysis of variance table and test the hypothesis H0: b1=0 with an a risk of 0.05

Fuente de variacion SC gl CM Fc Ft P-valor


Regresion 226.95 1 226.95 96.18 5.12 0.0000042
Error 21.24 9 𝑆_𝑒^2= 2.36
Total 248.18 10

Nivel de confianza que se somete la prueba


Nivel de confianza 1-a= 95%
Nivel de significancia a= 5%

Respuesta a la hipotesis: Se rechaza Ho, existe evidencia estadistica de que el modelo es adecuado

3. What are the confidence limits (a=0.05) for b1?

^b1:
Ho:b1=0
Ha: b1≠0
𝑆_(𝑏_1)^2= 0.02

tc= 9.81
tt= 2.26

Intervalos de confianza
Limite inferiob1 Limite superior
1.11 1.44 1.77

4. What are the confidence limits (a=0.05) for the true mean value of Y when X=3?

Y^= 13.5818182

5. What are the confidence limits (a=0.05) for the difference between the true mean value of Y when X1=3 and the true mean

Y^(X1)= 13.58
Y^(X2)= 6.4

7. Comment on the umber of levels of temperature investigated with respect to the estimate of b1 in the assumed model.
ng data (in coded form) were collected:

𝐸𝑟𝑟𝑜𝑟∑▒ 〖 (𝑌_𝑖−𝑌 ̂_𝑆𝐶𝑇𝑜𝑡𝑎𝑙
𝑖) ∑▒ 〖〖
∑▒ 〖 (𝑌_𝑖−𝑌 ̅ ) (𝑥_𝑖−𝑥 ̅) 〗 ^2 " " 〗 𝑌 ̂_𝑝
^2 〗 ^2

68.44 25 2.09
18.26 16 3.53
27.80 9 4.96
5.17 4 6.40
0.53 1 7.84
1.62 0 9.27
0.07 1 10.71
13.89 4 12.15
22.35 9 13.58
13.89 16 15.02
76.17 25 16.45

248.182 110.000 102.000

he prediction equation?

3636363636364X+e
Y when X1=3 and the true mean value of Y when X2=-2?

of b1 in the assumed model.


Thirteen specimens of 90/10 Cu-Ni alloys, each with a specific iron content, were tested in a corrosion-wheel setup.
The wheel was rotated in salt seawater at 30 ft/s for 60 days. The corrosion was measured in weight loss in milligams/square d
The following data were collected:

𝑆𝐶𝐸𝑟𝑟𝑜𝑟∑▒ 〖 (𝑌_𝑖−𝑌 ̂_𝑖)
𝑆𝐶𝑇𝑜𝑡𝑎𝑙∑▒ 〖 (𝑌_𝑖−𝑌 ̅)
X(Fe) Y (loss in MDD) X2 XY Y^ 𝑆𝐶𝑅𝑒𝑔∑▒ 〖 (𝑌 ̂_𝑖−𝑌 ̅) 〗
^2 〗 ^2 〗 ^2
1 0.01 127.6 0.0001 1.276 129.55 429.78 3.79
2 0.48 124 0.2304 59.52 118.26 89.15 32.98
3 0.71 110.8 0.5041 78.668 112.73 15.34 3.73
4 0.95 103.9 0.9025 98.705 106.97 3.41 9.41
5 1.19 101.5 1.4161 120.785 101.20 57.95 0.09
6 0.01 130.1 0.0001 1.301 129.55 429.78 0.31
7 0.48 122 0.2304 58.56 118.26 89.15 14.01
8 1.44 92.3 2.0736 132.912 95.20 185.43 8.40
9 0.71 113.1 0.5041 80.301 112.73 15.34 0.14
10 1.96 83.7 3.8416 164.052 82.71 681.62 0.98
11 0.01 128 0.0001 1.28 129.55 429.78 2.39
12 1.44 91.4 2.0736 131.616 95.20 185.43 14.42
13 1.96 86.2 3.8416 168.952 82.71 681.62 12.20
Suma 11.35 1414.6 15.6183 1097.928 1414.6 3293.76669 102.850233
Media 0.873 108.815

Requirement.
Determine if the effect of iron content on the corrosion resistance of 90/10
Cu-Ni alloys in seawater can justifiably be represented by a straight line model. Assume a=0.05

b0^ 129.79
b1^ -24.020

El modelo: Y^=129.786599277239+-24.0198934452957X

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 3293.7666901 3293.76669 352.273714 1.05536E-09
Residuos 11 102.85023302 9.35002118
Total 12 3396.6169231

Nivel de confianza que se somete la prueba


Nivel de confianza 1-a= 95%
Nivel de significancia a= 5%

Respuesta a la hipotesis: Se rechaza Ho, existe evidencia estadistica de que el modelo es adecuado
n-wheel setup.
oss in milligams/square decimeter/day. MDD.

𝐸𝑟𝑟𝑜𝑟∑▒ 〖 (𝑌_𝑖−𝑌 ̂𝑆𝐶𝑇𝑜𝑡𝑎𝑙
_𝑖) ∑▒ )〖〖 (𝑥_𝑖−𝑥 ̅) 〗 ^2 " " 〗
∑▒ 〖 (𝑌_𝑖−𝑌 ̅
^2 〗 ^2
352.86 0.7449
230.57 0.1545
3.94 0.0266
24.16 0.0059
53.51 0.1004
453.03 0.7449
173.83 0.1545
272.76 0.3214
18.36 0.0266
630.78 1.1814
368.05 0.7449
303.30 0.3214
511.46 1.1814
3396.61692 5.70887692
The data below consist of seven pairs of values of
X= price of alcohol relative to take-home pay
Y1= consumption of absolute alcohol in liters per head of population per year
Y2= cirrhosis deaths per 100,000 of populations,
for seven European countries. Plot Y 1 versus X and Y2 versus X (Y as ordinate, X as
abscissa) and judge whether in your opinion a straight line would fit each ser of data reasonably well.

u Country X Y1 Y2 X2
1 France 0.016 24.66 51.70 0.000256
2 Italy 0.027 18.00 30.50 0.000729
3 West Germany 0.026 13.63 29.00 0.000676
4 Belgium 0.022 8.42 14.20 0.000484
5 United Kigdom 0.057 7.66 4.10 0.003249
6 Ireland 0.092 7.64 5.00 0.008464
7 Denmark 0.096 7.50 11.60 0.009216
Suma 0.336 87.51 146.1 0.023074
Media 0.048 12.50142857 20.87142857

1. For the (X,Y2) only, evaluate the fitted least squares line and draw it on your data plot.
60.00
b0^ 38.07 50.00
b1^ -358.25 40.00
30.00
El modelo: Y^=38.0673974743943+-358.249352145119X 20.00
10.00
0.00
0.01 0.02 0.03 0.04 0.05 0.06

2. Evaluate the residuals to two decimal places. Check that Sex=0, within roundig error.

ei
19.36
2.11
0.25
-15.99
-13.55
-0.11
7.92
Suma 0.00

3. Obtain the analysis of variance table

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F
Regresión 1 891.4676879 891.4676879 5.057303567 0.0743845969527
Residuos 5 881.3665978 176.2733196
Total 6 1772.834286

4. Find the standard errors of b0 and b1

Prueba b1:
tc= 2.25
S =
2
b1 25377.67 Error estándar de b1 159.30371439123
Prueba b0:
tc= 2.87
S2b0= 83.65 Error estándar de b0 9.1461501383006
tt= 2.57

5. Find the formula for the standard error of Y^, and contruct 95% condidence bands for the true mean value of Y.

〖𝑠𝑒〗 _𝑦 inferior superior


 ̂ 7.15 13.95 50.72 〖 𝑠𝑒〗 _𝑦 ̂ =√(1/7+
6.03 12.89 43.90 (𝑥−0.048)2/0.006946)∗√176.27
6.12 13.02 44.49
6.51 13.46 46.91
5.22 4.23 31.06
8.62 -17.05 27.27
9.15 -19.84 27.19

6. Test the overall regression via an F-test, and find how much of the variation about the mean Y- is explained by the fitted line

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F
Regresión 1 891.4676879 891.4676879 5.057303567 0.0743845969527
Residuos 5 881.3665978 176.2733196
Total 6 1772.834286

r2=ry/x2 0.502848853422

7. For our data, it might be sensile to regard the following sets of runs as approcimate repeats.

∑▒ 〖 (𝑌_(2,𝑖)^ −(𝑌_(2,𝑖) ) ̂) 〗


∑▒^2
X Y3 X^2 XY2 ∑▒ 〖 (𝑌 ̂_(2,𝑖)^ − 〖 (𝑌_(2,𝑖)^ −𝑌 ̅2) 〗 ^2
(𝑌2) ̅) 〗 ^2
0.027 30.500 0.001 0.824 45.852 0.702
0.026 29.000 0.001 0.754 11.463 1.098
0.022 14.200 0.000 0.312 103.168 0.044
Suma 0.075 73.700 0.002 1.890 160.483 1.844
Media 0.025 24.567

b0^ -60.08
b1^ 3385.71

∑▒ 〖 (𝑌 ̂_(2,𝑖)^ − ∑▒ 〖 (𝑌_(2,𝑖)^ −(𝑌_(2,𝑖) ) ̂) 〗 ^2


X Y x^2 XY2 y estimada (𝑌2) ̅) 〗 ^2
0.092 5.0000 0.0085 0.46 5 10.89
0.096 11.6000 0.0092 1.1136 11.6 10.89
Suma 0.188 16.6 0.0177 1.5736 21.78
Media 0.094 8.3000

b0^ -146.80
b1^ 1650.00
∑▒ 〖 (𝑌 ̂_(2,𝑖)^ − ∑▒ 〖 (𝑌_(2,𝑖)^ −(𝑌_(2,𝑖)
∑▒) ̂〖
) 〗(𝑌_(2,𝑖)^
^2 −𝑌 ̅2) ∑▒
〗 ^2
XY2 Y2^ (𝑌2) ̅) 〗 ^2
〖 (𝑋_𝑖^ −𝑋 ̅) 〗 ^2

0.8272 32.335 776807.080 688346.664 2672.890 0.0010


0.8235 28.395 3142941.405 ### 930.250 0.0004
0.754 28.753 #REF! #REF! 841.000 0.0005
0.3124 30.186 #REF! #REF! 201.640 0.0007
0.2337 17.647 #REF! #REF! 16.810 0.0001
0.46 5.108 #REF! #REF! 25.000 0.0019
1.1136 3.675 0.000 134.560 134.560 0.0023
4.5244 146.1 #REF! #REF! 4822.15 0.0069460

0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1 0.11

a= 5%
e true mean value of Y.

)∗√176.27

ean Y- is explained by the fitted line.

−(𝑌_(2,𝑖) ) ̂) 〗
∑▒^2
〖 (𝑌_(2,𝑖)^ −𝑌 ̅2) 〗∑▒
^2 〖 (𝑋_𝑖^ −𝑋 ̅) 〗 ^2 Y^
35.204 0.0000040 31.338
19.654 0.0000010 27.952
107.468 0.0000090 14.410
162.327 0.000014
Suma de errores
Nuevo conjunto de datos 184.11
∑▒ 〖 (𝑌_(2,𝑖)^ −(𝑌_(2,𝑖)
∑▒) ̂〖
) 〗(𝑌_(2,𝑖)^
^2 −𝑌 ̅2) 〗∑▒
^2 〖 (𝑋_𝑖^ −𝑋 ̅) 〗 ^2
Diferencia 697.26
0.0000 10.89 4E-06
0.0000 10.89 4E-06
0.000 21.780 0.0000080
Grados de libertad CM F
3 61.37 5.68089095
2 348.63
The moisture of the wet mix of a product is considered to have an effect on the finished product density.
The moisture of the mix was controlled and finished product densities were measured as shown in the following data:

Mix Moisture Density


X Y X2 Y2 XY Y^ 𝑆𝐶𝑅𝑒𝑔∑▒ 〖 (𝑌 ̂_𝑖−𝑌 ̅) 〗
^2
1 4.7 3 22.09 9 14.1 2.17
2 5 3 25 9 15 3.67
3 5.2 4 27.04 16 20.8 4.67
4 5.2 5 27.04 25 26 4.67
5 5.9 10 34.81 100 59 8.17
6 4.7 2 22.09 4 9.4 2.17
7 5.9 9 34.81 81 53.1 8.17
8 5.2 3 27.04 9 15.6 4.67
9 5.3 7 28.09 49 37.1 5.17
10 5.9 6 34.81 36 35.4 8.17
11 5.6 6 31.36 36 33.6 6.67
12 5 4 25 16 20 3.67
Suma 63.6 62 339.18 390 339.1 62
Media 5.3 5.17

1. Fit the model Y=b0+b1X+e to the data

b0^ -21.33
b1^ 5.000

El modelo: Y^=-21.3333333333325+4.99999999999984X

2. Place 95% confidence limits on b1

𝑠_𝑒^2 1.71666667 Lim. Inferior b1 Lim. Superior


Nivel de confianza 95.00% 2.98546141 5.000 7.0145385911
a= 5%
gl= 10
tt= 2.22813885
𝑠_𝑏1^2 0.81746032

3. Is there any evidence in the data that a more complex model should be tried (Use a=0.05)

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 52.5 52.5 30.5825243 0.0002509656
Residuos 10 17.1666667 1.71666667
Total 11 69.6666667

Respuesta: Se rechaza Ho, por lo tanto existe evidencia estadistica de que es un


buen modelo
oduct density.
hown in the following data:

𝑆𝐶𝑅𝑒𝑔∑▒ 〖 (𝑌 ̂_𝑖−𝑌 ̅) 〗 𝑆𝐶𝐸𝑟𝑟𝑜𝑟∑▒ 〖 (𝑌_𝑖−𝑌 ̂𝑆𝐶𝑇𝑜𝑡𝑎𝑙


_𝑖) ∑▒ )〖〖 (𝑥_𝑖−𝑥 ̅) 〗 ^2 " " 〗
∑▒ 〖 (𝑌_𝑖−𝑌 ̅
^2 〗 ^2 〗 ^2
(yi-b0-b1xi)^2
9.00 0.69 4.69 0.3600 0.69
2.25 0.44 4.69 0.0900 0.44
0.25 0.44 1.36 0.0100 0.44
0.25 0.11 0.03 0.0100 0.11
9.00 3.36 23.36 0.3600 3.36
9.00 0.03 10.03 0.3600 0.03
9.00 0.69 14.69 0.3600 0.69
0.25 2.78 4.69 0.0100 2.78
0.00 3.36 3.36 0.0000 3.36
9.00 4.69 0.69 0.3600 4.69
2.25 0.44 0.69 0.0900 0.44
2.25 0.11 1.36 0.0900 0.11
52.5 17.1666667 69.6666667 2.1 17.17

Ft a
4.96460274 5%
The effect of the temperature of the deodorizing process on the color of the finished product was determined
experimentally. The data collected were as follows:

Temperature Color
𝑆𝐶𝐸𝑟𝑟𝑜𝑟∑▒ 〖 (𝑌_𝑖−𝑌 ̂_
X Y X2 Y2 XY Y^ 𝑆𝐶𝑅𝑒𝑔∑▒ 〖 (𝑌 ̂_𝑖−𝑌 ̅) 〗
^2 〗 ^2

1 460 0.3 211600 0.09 138 0.37 0.03


2 450 0.3 202500 0.09 135 0.41 0.01
3 440 0.4 193600 0.16 176 0.46 0.00
4 430 0.4 184900 0.16 172 0.51 0.00
5 420 0.6 176400 0.36 252 0.55 0.00
6 410 0.5 168100 0.25 205 0.60 0.01
7 450 0.5 202500 0.25 225 0.41 0.01
8 440 0.6 193600 0.36 264 0.46 0.00
9 430 0.6 184900 0.36 258 0.51 0.00
10 420 0.6 176400 0.36 252 0.55 0.00
11 410 0.7 168100 0.49 287 0.60 0.01
12 400 0.6 160000 0.36 240 0.65 0.02
13 420 0.6 176400 0.36 252 0.55 0.00
14 410 0.6 168100 0.36 246 0.60 0.01
15 400 0.6 160000 0.36 240 0.65 0.02
Suma 6390 7.9 2727100 4.37 3342 7.9 0.11039516
Media 426 0.52666667

1. Fit the model Y=b0+b1X+e to the data

b0^ 2.54
b1^ -0.00472

El modelo: Y^=2.53642473118276+-0.0047177419354838X

2. Is this model sensible? (Use a=0.05)

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F Ft
Regresión 1 0.11039516 0.11039516129 14.5053933 0.0021716 4.66719273
Residuos 13 0.09893817 0.00761062862
Total 14 0.20933333

Respuesta: Se rechaza Ho, por lo tanto existe evidencia estadistica de que es un


buen modelo, es decir es un modelo sensible

3. Obtain a 95% conffidence interval for the true mean value of Y at any given value of X, say, X0

𝑌 ̂ 𝑠_(𝑦_𝑝)^
Lim. Inferior Lim. Superior
0.36626344086 0.04776131 0.2630814 0.46944547763
0.41344086022 0.03729866 0.332862 0.49401972026
0.46061827957 0.02842741 0.39920459 0.52203197213
0.50779569892 0.02306351 0.45797001 0.55762139065
0.55497311828 0.02371948 0.5037303 0.60621593684
0.60215053763 0.03000303 0.53733293 0.66696814578
0.41344086022 0.03729866 0.332862 0.49401972026
0.46061827957 0.02842741 0.39920459 0.52203197213
0.50779569892 0.02306351 0.45797001 0.55762139065
0.55497311828 0.02371948 0.5037303 0.60621593684
0.60215053763 0.03000303 0.53733293 0.66696814578
0.64932795699 0.03930178 0.56442161 0.73423430053
0.55497311828 0.02371948 0.5037303 0.60621593684
0.60215053763 0.03000303 0.53733293 0.66696814578
0.64932795699 0.03930178 0.56442161 0.73423430053

Nivel de confianza 95%


α= 5%
gl= 13
𝑡_𝑡^ = 2.16036866
𝑒𝑔∑▒ 〖 (𝑌 ̂_𝑖−𝑌 ̅) 𝑆𝐶𝐸𝑟𝑟𝑜𝑟∑▒ 〖 (𝑌_𝑖−𝑌 ̂𝑆𝐶𝑇𝑜𝑡𝑎𝑙
_𝑖) ∑▒ )〖〖 (𝑥_𝑖−𝑥 ̅) 〗 ^2 " " 〗

〗 ^2 〗 ^2
∑▒ 〖 (𝑌_𝑖−𝑌 ̅
(yi-b0-b1xi)^2
0.0044 0.05 1156 0.0044
0.0129 0.05 576 0.0129
0.0037 0.02 196 0.0037
0.0116 0.02 16 0.0116
0.0020 0.01 36 0.0020
0.0104 0.00 256 0.0104
0.0075 0.00 576 0.0075
0.0194 0.01 196 0.0194
0.0085 0.01 16 0.0085
0.0020 0.01 36 0.0020
0.0096 0.03 256 0.0096
0.0024 0.01 676 0.0024
0.0020 0.01 36 0.0020
0.0000 0.01 256 0.0000
0.0024 0.01 676 0.0024
0.09893817 0.20933333 4960 0.09893817204

a
5%
En la fabricacion de un material plastico, se cree que el tempo de enfriamiento influye en la
resistencia al impacto. Por tanto, se lleva a cabo un estudio en el que se determina la resistencia al
impacto del material plastico para 4 tiempos de enfriamiento diferetes. Los resulados de este
experimento se muestran en la siguiente tabla:

Tiempos de Resistencia al
enfrimieto en impacto en
segundos kJ/m2
∑▒ 〖 (𝑌 ̂_𝑖^ −𝑌 ̅) 〗 ∑▒ 〖 (𝑌_𝑖^ −(𝑌_𝑖 ) ̂) 〗 ^2 ∑▒ 〖 (𝑌_𝑖^ −𝑌 ̅) 〗 ^
(X) (Y) X2 XY Y^ ^2
1 15 42.1 225 631.5 41.8186 51.38946 0.0791612
2 25 36 625 900 36.6051 3.82236 0.3661275
3 35 31.8 1225 1113 31.3915 10.61766 0.1668515
4 40 28.7 1600 1148 28.7847 34.40121 0.0071818
Suma 115 138.6 3675 3792.5 138.6 100.230678 0.6193220339
Media 28.75 34.65

b0^ 49.64
b1^ -0.52136

El modelo: Y^=49.6389830508475+-0.52135593220339X

a) ¿Cuál es el intervalo de confianza del 95% para la pendiente del modelo de regresion expresando
la resistencia al impacto como una funcion lineal del tiempo de enfriamiento?

Prueba b1:

S2b1= 0.00084 Int. Inferior b1 Int. Superior


S =
2
e 0.30966102 -0.64604074 -0.52136 -0.39667112
tt= 4.30265273

b) ¿Puede concluir que existe una relacion entre la resistencia al impacto y el tiempo de enfriamiento al nivel de significancia d

Determinación de R2
r2=ry/x2 0.99385898 Es relación (en distancia) entre la var X y Y

Determinación del coef de correlacion de Pearson:


r= 0.99692476 Es una relacion lineal y permite la comparacion de X y Y

La relación entre la resistencia al impacto y e tiempo de enfriamiento al nivel de significancia de a=5% en el mod
Muy alta

c) Para un material plástico similar, el valor tabulado de la relación lineal entre la tmeperatura y la resistencia al impacto
(es decir, la pendiente) es -0.30. Si se prueba la siguiente hipotesis (en el nivel a=0.05)

H0: β1 = −0.30 con el estadistico de prueba t-student para tal prueba, ¿Cuál es el rango
H1: β1 ≠ −0.30 (para t) dentro del cual se acepta la hipotesis?

Prueba b1:
tc= 9.83
se= 0.56
a= 5% Nivel de significancia
tt= 4.30
Hipótesis
Ho: b1=-0.30 Se rechaza Ho, existe evidencia estadística de que b1 no es -0.30
Ha: b1≠-0.30

pvalor 0.0101887 Se rechaza Ho, existe evidencia estadística de que b1 no es igual a -0.30
∑▒ 〖 (𝑌_𝑖^ −𝑌 ̅) 〗 ^2∑▒ 〖 (𝑋_𝑖^ −𝑋 ̅) 〗 ^2
ANÁLISIS DE VARIANZA
55.5025 189.0625 Grados de libertad
Suma de cuadrados
Promedio de los cuadrados
1.8225 14.0625 Regresión 1 100.230678 100.230678
8.1225 39.0625 Residuos 2 0.61932203 0.30966102
35.4025 126.5625 Total 3 100.85
100.85 368.75

al nivel de significancia del 5%?

Coeficiente de correlación
Ho: r=0
Ha: r≠0

tc= 17.991073
tt= 4.30265273
Conclusión: Se rechaza Ho, existe evidencia estadística de la relación de X y
Por lo tanto: Existe una relación entre los tiempos de enfriamiento y la resistencia a
ancia de a=5% en el modelo propuesto se considera:

istencia al impacto
0.30
F Valor crítico de F a
323.678708 0.00307524 5%

tadística de la relación de X y Y
enfriamiento y la resistencia al impacto.
Se selecciono una muestra aleatoria de ocho conductores seleccionados de una pequeña ciuda
asegurada con una empresa y que tenian polizas de seguros de automovil minimas
similares. La siguiente tabla enumera sus experiencias de conduccion (en años) y las primas mensuales del seguro de automov

Experiencia de
conduccion

Seguro de Prima mensual


automovil (años) ($)
5 64
2 87
12 50
9 71
15 44
6 56
25 42
16 60

a) ¿Dependen la prima del seguro de la experiencia de conduccion o la experiencia de conduccion depende de la prima de seg

Respuesta: Depende la prima del seguro de la experiencia de conduccion

¿Espera una relacion positiva o negativa entre estas dos variables?


Respuesta: Negativa

b) Calcule SSxx, SSyy y SSxy

Seguro de Prima mensual


automovil (años) ($) X^2 Y^2 XY
1 5 64 25 4096 320
2 2 87 4 7569 174
3 12 50 144 2500 600
4 9 71 81 5041 639
5 15 44 225 1936 660
6 6 56 36 3136 336
7 25 42 625 1764 1050
8 16 60 256 3600 960
Suma 90 474 1396 29642 4739

SSxx= 383.5
SSyy= 1557.5
SSxy= -593.5

c) Encuentre la recta de regresion de minimos cuadrados eligiendo variables dependientes e independientes apropiadas según
∑▒ 〖〖 (𝑥_𝑖−𝑥 ̅) 〗 ^2 " " 〗
Seguro de Prima mensual
automovil (años) ($) X^2 Y^2 XY Y^
1 5 64 25 4096 320 68.922 39.0625
2 2 87 4 7569 174 73.565 85.5625
3 12 50 144 2500 600 58.089 0.5625
4 9 71 81 5041 639 62.732 5.0625
5 15 44 225 1936 660 53.447 14.0625
6 6 56 36 3136 336 67.375 27.5625
7 25 42 625 1764 1050 37.971 189.0625
8 16 60 256 3600 960 51.899 22.5625
Suma 90 474 1396 29642 4739 383.5
Media 11.25 59.25

b^0 76.6603651
b^1 -1.54758801 El modelo: Y^=76.6603650586702+-1.54758800521512X

d) Interprete el significado de los valores a y b calculados en el inciso c

a y b en cualquier modelo de regresion son los coeficientes de regresion, en este caso:


La pendiente es negativa, por los años de experiencia del conductor
existe -1.5 de prima mensual

e) Trace el diagrama de dispersion y la linea de regresion

Diagrama de dispersión
100
90
87
80
70 71
64
60 60
56
50 50
44 42
40
30
20
10
0
0 5 10 15 20 25 30

f) Calcule r y r2 y explicar lo que significan

Resumen
Estadísticas de la regresión
Coeficiente de 0.7679342
Coeficiente de 0.58972294
R^2 ajustado 0.52134343
Error típico 10.3199364
Observaciones 8

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadradosF Valor crítico de F
Regresión 1 918.493481 918.493481 8.62426395 0.0260588
Residuos 6 639.006519 106.501086
Total 7 1557.5

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%


Intercepción 76.6603651 6.96132726 11.0123202 3.33384E-05 59.6266109 93.6941192
Variable X 1 -1.54758801 0.52698024 -2.93670972 0.0260588 -2.83706221 -0.2581138

g) Predecir la prima mensual del seguro de automovil para un conductor con 10 años de experiencia de conducción.

Y^10= 61.184485

h) Calcule la desviacion estandar de los errores

Error cuadrati Se2= 106.501086


Error estandar Se= 10.3199364

i) Construya un intervalo de confianza del 90% para B


Nivel de confianza 90%
Nivel de significancia 10%

^b1:
Ho:b1=0
Ha: b1≠0
𝑆_(𝑏_1)^2= 0.28 𝑆_(𝑏_0)^2=

tc= -2.94
tt= 1.94

Intervalos de confianza
Limite inferiob1 Limite superior
-2.57 -1.55 -0.52
j) Pruebe a un nivel de significancia del 5% si B es negativo

Nivel de confianza 95%


Nivel de significancia 5%

^b1:
Ho:b1=0
Ha: b1≠0
𝑆_(𝑏_1)^2= 0.28 𝑆_(𝑏_0)^2=

tc= -2.94
tt= 2.45

Intervalos de confianza
Limite inferiob1 Limite superior
-2.84 -1.55 -0.26
nsuales del seguro de automovil (en dolares)

on depende de la prima de seguro?

ependientes apropiadas según su respuesta en el inciso a.


〖 (𝑥_𝑖−𝑥 ̅) 〗 ^2 " " 〗

4758800521512X
Inferior 95.0%
Superior 95.0%
59.6266109 93.6941192
-2.83706221 -0.2581138

ncia de conducción.

^b0:
Ho:b0=0
Ha: b0≠0
𝑆_(𝑏_0)^2= 48.46

tc= 11.01
tt= 1.94

Intervalos de confianza
Limite inferiob1 Limite superior
63.13 76.66 90.19
^b0:
Ho:b0=0
Ha: b0≠0
𝑆_(𝑏_0)^2= 48.46

tc= 11.01
tt= 2.45

Intervalos de confianza
Limite inferiob1 Limite superior
59.63 76.66 93.69
Compruebe matematicamente y estadisticamente que el error estandar del modelo S e(Y^0) es equivalente a:

𝑆_𝑒 (𝑌 ̂_𝑜 )=𝑠𝑒√((1/𝑛+(𝑥_𝑜−𝑥 ̅ )^2/(∑▒(𝑥_𝑖−𝑥 ̅ ) )) )

𝑇𝑒𝑛𝑒𝑚𝑜𝑠 𝑞𝑢𝑒 𝑒𝑙 𝑚𝑜𝑑𝑒𝑙𝑜 𝑒𝑠 𝑌 ̂=𝑏_0+𝑏_1 𝑋

𝑃𝑜𝑑𝑒𝑚𝑜𝑠 𝑣𝑒𝑟 𝑎 𝑏_0 𝑐𝑜𝑚𝑜 𝑏_0=𝑌 ̅−𝑏_1 𝑋 ̅, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠

𝑌 ̂=𝑌 ̅+𝑏_1 (𝑋−𝑋 ̅)

𝐴𝑝𝑙𝑖𝑐𝑎𝑛𝑑𝑜 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎

𝑉((𝑌_0)) ̂=𝑉(𝑌 ̅ )+(𝑋_0−𝑋 ̅ )2 𝑉(𝑏_1)

𝑌 𝑒𝑠𝑡𝑜 𝑙𝑜 𝑝𝑜𝑑𝑒𝑚𝑜𝑠 𝑎𝑛𝑜𝑡𝑎𝑟 𝑐𝑜𝑚𝑜:

=𝜎^2/𝑛+( 〖 (𝑋_0−𝑋 ̅) 〗 ^2 𝜎^2)/(∑▒(𝑋_𝑖−𝑋 ̅ )2)

=𝜎^2 1/𝑛+ 〖 (𝑋_0−𝑋 ̅) 〗 ^2/(∑▒(𝑋_𝑖−𝑋 ̅ )2)

=𝜎^ √(1/𝑛+ 〖 (𝑋_0−𝑋 ̅) 〗 ^2/(∑▒(𝑋_𝑖−𝑋 ̅ )2) ∎)


equivalente a:
Se utilizaron metodos de regresion para analizar los atos de un estudio que invstigaba la relacion entre la temperatura de la su
y la deflexion del pavimento (y)
Las cantidades resuminas fueron:

n= 20
Syi= 12.75
Syi2= 8.86
Sxi= 1478
Sxi2= 143,215.80
Sxiyi= 1083.67

a) Calcule las estimaciones de minimos cuadrados de la pendiente y la interseccion

Media x 73.9 b^0 0.32999


Media y 0.6375 b^1 0.00416

El modelo: Y^=0.329989159086362+0.00416117511385167X

b) Grafica la linea e regresion

n Y^
1 0.3342
2 0.3383
3 0.3425
4 0.3466
5 0.3508 Linea de regresión
6 0.3550 0.4500
7 0.3591 0.4000
8 0.3633
0.3500
9 0.3674
0.3000
10 0.3716
11 0.3758 0.2500
12 0.3799 0.2000
13 0.3841 0.1500
14 0.3882
0.1000
15 0.3924
0.0500
16 0.3966
17 0.4007 0.0000
0 5 10 15 20
18 0.4049
19 0.4091
20 0.4132
c) Estima Se2

SSxx SSyy SSxy Se2


33991.6 0.731875 141.445 0.0080

d) Use la ecuacion de la linea ajustada para predecir que deflexion del pavimento se observaria cuando la temperatura de la su

Temperatura Deflexion
85 0.684

e) ¿Cuál es la deflexion media del pavimento cuando la temperatura de la superficie es de 90°F?

Temperatura Deflexion
90 0.704

f) ¿Qué cambio de la deflexion media del pavimento se esperaria para un cambio de 1° en la temperatura de la superficie?

Temperatura Deflexion Aumento


1 0.33415
2 0.33831 0.00416
90 0.70449
91 0.70866 0.00416
entre la temperatura de la superficie del camino(x)

egresión

15 20 25
uando la temperatura de la suprficie es de 85°F.

peratura de la superficie?
Considere la salida de la computadora a continuacion

La ecuacion de regresion es:


Y= 12.9 + 2.34 x
Predictor Coef SE Coef T P
Constant 12.857 1.032 12.4583 0.000001610
X 2.3445 0.115 20.387 0.000000035

S= 1.48111 R-Sq= 98.10% R-Sq(adj)= 97.90%

Analysis of Variance
Source DF SS MS F P
Regression 1 912.43 912.43 415.922507123 0.00000003
Residual Error 8 17.55 2.19375
Total 9 929-98

Completa la información que falta

a) Puede usar limites de confianza del estimador para los p-valores

p-valor(1) P - valor < 0.001 0.000001610


p-valor(2) P - valor < 0.001 0.000000035
p-valor (3) 0.00

b) ¿Puede concluir que el modelo define una relación lineal util?

Respuesta
Se rechaza Ho, por lo tanto existe evidencia estadistica de que es un buen
modelo

c) ¿Cuál es su estimación de se2?

σe2 = 2.19375
De dos recnicas existentes para evaluacion de personal, la primera requiere una entrevista de prueba de dos horas
mientras que la segunda se puede completar en menos de una hora. Las puntuaciones para cada una de las 15 personas que t

Solicitante Prueba 1 Prueba 2


n x y
1 75 38
2 89 56
3 60 35
4 71 45
5 92 59
6 105 70
7 55 31
8 87 52
9 73 48
10 77 41
11 84 51
12 91 58
13 75 45
14 82 49
15 76 47

a) Construya una grafica de dispersion para los datos. ¿Le parece razonable la suposicion de linealidad?

80

70

60

50

40

30

20

10

0
50 60 70 80 90 100 110

Respuesta: Si, en la linea de tendencia se puede observar la linealidad.

b) Encuentre la recta de minimos cuadrados para los datos aplicando el metodo matricial.
b0 b1
1 75
1 89
1 60
1 71 1 1 1 1
1 92 75 89 60 71
1 105
1 55
1 87
1 73 X'X=
1 77
1 84
1 91
1 75 (X'X)^-1=
1 82
1 76
X'Y=

b0= -11.665
b1= 0.755

El modelo: Y^=-11.665+0.755X

c) Use la recta de regresión para predecir la puntuacion en la segunda prueba para un solicitante que obtuvo 85 puntos en la p

Y^(85)= 52.51

d) Determine el análisis de varianza de los datos del análisis matricial de la figura A

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados
Promedio de los cuadrados F Valor crítico de F Ft
Regresión 1 1291.58202 1291.582024 131.4316573 3.606683E-08 4.667192732
Residuos 13 127.751309 9.827023797
Total 14 1419.33333

Respuesta
Se rechaza Ho, por lo tanto existe evidencia estadistica de que es un
buen modelo
de dos horas
de las 15 personas que tomaron ambas pruebas se dan en la tabla siguiente:
1 1 1 1 1 1 1
92 105 55 87 73 77 84

15 1192
1192 96990

2.853822162 -0.035
-0.035073265 4.00E-04

725
59324

obtuvo 85 puntos en la prueba 1.

a
5%
1 1 1 1
91 75 82 76
Un investigador desea saber si esta relacionada la relacion entre la edad (Y) y dos variables independientes la grasa corporal (

Los datos proporcionados del estudio son los siguientes:

Edad (Y) Grasas (X1) Peso (X2)


46 354 84
20 190 73
52 405 65
30 263 70
57 451 76
25 302 69
28 288 63
36 385 72
57 402 79
44 365 75
24 209 27
31 290 89
52 346 65
23 254 57
60 395 59
48 434 69
34 220 60
51 374 79
50 308 75
34 220 82
46 311 59
23 181 67
37 274 85
40 303 55
30 244 63

1. Ajusta el modelo que explica la cantidad de grasas en función del peso

A1. Calcula y representa gráficamente la recta de regresión, junto con la correspondiente nube de puntos

Peso (X2) Grasas (X1) X^2 y^2 XY


84 354 7056 125316 29736
73 190 5329 36100 13870
65 405 4225 164025 26325 500
70 263 4900 69169 18410 450
76 451 5776 203401 34276 400
69 302 4761 91204 20838 350
63 288 3969 82944 18144 300
72 385 5184 148225 27720 250
200
150
100
400
350
300
250
79 402 6241 161604 31758 200
75 365 5625 133225 27375 150
27 209 729 43681 5643 100
89 290 7921 84100 25810
50
65 346 4225 119716 22490
0
57 254 3249 64516 14478 20 30
59 395 3481 156025 23305
69 434 4761 188356 29946
60 220 3600 48400 13200
79 374 6241 139876 29546
75 308 5625 94864 23100
82 220 6724 48400 18040
59 311 3481 96721 18349
67 181 4489 32761 12127
85 274 7225 75076 23290
55 303 3025 91809 16665
63 244 3969 59536 15372
Sumas 1717 7768 121811 2559050 539813
Medias 68.68 310.72

25

B1. ¿Cuánto vale el coeficiente de correlacion al cuadrado en este caso?

Sxy= 6306.76 𝑅^2=(𝑆𝐶_𝑅)/𝑆_𝑦𝑦


SCR 10231.7262
Syy 145377.04

R2 0.07038062

C1. ¿Cuánto valen los estimadores de todos los parametros del modelo?

bo 199.2975017

b1 1.622342724

D1. Constrasta la hipotesis de que la pendiente de la recta es cero a nivel de 0.05

Suma de
cuadrados
𝑌 ̂ ∑▒ 〖 (𝑥_𝑖−𝑥 ̅) 〗 ^2
∑▒ 〖 (𝑦 ̂_𝑖−𝑦 ̅) 〗 ∑▒^2〖 (𝑦_𝑖−
Peso (X2) Grasas (X1)
𝑦 ̂_𝑖) 〗 ^2
84 354 335.574 234.7024 617.736
73 190 317.729 18.6623999999999 49.119
65 405 304.750 13.5424000000001 35.644
70 263 312.861 1.74239999999998 4.586
76 451 322.596 53.5823999999999 141.029
69 302 311.239 0.1024 0.270
63 288 301.505 32.2624000000001 84.915
72 385 316.106 11.0224 29.011
79 402 327.463 106.5024 280.314
75 365 320.973 39.9423999999999 105.128
27 209 243.101 1737.2224 4572.362
89 290 343.686 412.9024 1086.757
65 346 304.750 13.5424000000001 35.644
57 254 291.771 136.4224 359.063
59 395 295.016 93.7024000000001 246.624
69 434 311.239 0.1024 0.270
60 220 296.638 75.3424000000001 198.301
79 374 327.463 106.5024 280.314
75 308 320.973 39.9423999999999 105.128
82 220 332.330 177.4224 466.975
59 311 295.016 93.7024000000001 246.624
67 181 307.994 2.82240000000002 7.429
85 274 337.197 266.3424 701.012
55 303 288.526 187.1424 492.558
63 244 301.505 32.2624000000001 84.915
Sumas 1717 7768 7768 3887.44 10231.7262
Medias 68.68 310.72

E1. Calcula un intervalor de confianza para la pendiente de la recta de nivel 95%

Intervalo de confianza Limite inf. Limite sup.


Nivel de conf. 95% -0.921 1.622 4.166

F1. Calcula y representa los intervalos de confianza al 95% de la cantidad de grasas media para los individuos entre 30 y 90 kg.

𝑆_( 𝑖𝑛𝑑) Lim. Inf. Predic Lim. Sup. Predic


Peso (X2) X^ ∑▒ 〖 (𝑥_𝑖−𝑥 ̅) 〗 ^2 𝑦 ̂
_ (𝑝^± ) 𝑡_(𝛼,𝑛−2) 𝑠_(𝑦 ̂_𝑝 )
55 288.53 187.1424 22.97 241.01 336.0
57 291.77 136.4224 21.24 247.84 335.7
59 295.02 93.7024 19.66 254.35 335.7
59 295.02 93.7024 19.66 254.35 335.7
60 296.64 75.3424 18.94 257.46 335.8
63 301.51 32.2624 17.13 266.06 337.0
63 301.51 32.2624 17.13 266.06 337.0
65 304.75 13.5424 16.29 271.06 338.4
65 304.75 13.5424 16.29 271.06 338.4
+ 67 307.99 2.8224 15.78 275.35 340.6
69 311.24 0.1024 15.65 278.86 343.6
69 311.24 0.1024 15.65 278.86 343.6
70 312.86 1.7424 15.73 280.32 345.4
72 316.11 11.0224 16.17 282.65 349.6
73 317.73 18.6624 16.52 283.55 351.9
75 320.97 39.9424 17.47 284.83 357.1
75 320.97 39.9424 17.47 284.83 357.1
76 322.60 53.5824 18.05 285.26 359.9
79 327.46 106.5024 20.14 285.79 369.1
79 327.46 106.5024 20.14 285.79 369.1
82 332.33 177.4224 22.65 285.48 379.2
84 335.57 234.7024 24.49 284.92 386.2
85 337.20 266.3424 25.44 284.56 389.8
89 343.69 412.9024 29.48 282.71 404.7

24

G1. Lleva a cabo el diagnostico de los supuestos de una regresión lineal: (los 5 supuestos)

1. La relación entre x y y es lineal

CM
SC (Suma de g.l. Cuadrados p-valor
Fuente de Cuadrados) medios Fc (calculada)
variación
Regresión 10231.7262 1 10231.7262 1.74130864011907 0.199958473
Error 135145.3138 23 5875.883209
Total 145377.04 24 16107.60941

Hipotesis: Respuesta
Ho: βi=0 Se acepta Ho,por lo tanto no existe evidencia estadistica de que hay
Ha: βi≠0

2. Los errores tienen media cero


Y
Grasas (X1) 𝑋 ̂ ei
354 335.574 -18.426
190 317.729 127.729
405 304.750 -100.250
263 312.861 49.861
451 322.596 -128.404 Media ei= 0.00
302 311.239 9.239
288 301.505 13.505
385 316.106 -68.894
402 327.463 -74.537
365 320.973 -44.027
209 243.101 34.101
290 343.686 53.686
346 304.750 -41.250
254 291.771 37.771
395 295.016 -99.984
434 311.239 -122.761
220 296.638 76.638
374 327.463 -46.537
308 320.973 12.973
220 332.330 112.330
311 295.016 -15.984
181 307.994 126.994
274 337.197 63.197
303 288.526 -14.474
244 301.505 57.505

3. Los errores tienen varianza constante s2

Prueba Breusan-Pagan
b0= 199.2975017
b1= 1.622342724
X Y yi est ei ei^2 gi v indep
27 209 243.1008 -34.1008 1162.8615 0.000035
55 303 288.5264 14.4736 209.4865 0.000006
57 254 291.7710 -37.7710 1426.6512 0.000043
59 395 295.0157 99.9843 9996.8558 0.000300
59 311 295.0157 15.9843 255.4971 0.000008
60 220 296.6381 -76.6381 5873.3930 0.000176
63 288 301.5051 -13.5051 182.3875 0.000005
63 244 301.5051 -57.5051 3306.8358 0.000099
65 405 304.7498 100.2502 10050.1069 0.000302
65 346 304.7498 41.2502 1701.5808 0.000051
67 181 307.9945 -126.9945 16127.5939 0.000484
69 302 311.2391 -9.2391 85.3619 0.000003
69 434 311.2391 122.7609 15070.2264 0.000453
70 263 312.8615 -49.8615 2486.1684 0.000075
72 385 316.1062 68.8938 4746.3587 0.000143
73 190 317.7285 -127.7285 16314.5750 0.000490
75 365 320.9732 44.0268 1938.3586 0.000058
75 308 320.9732 -12.9732 168.3041 0.000005
76 451 322.5955 128.4045 16487.7031 0.000495
79 402 327.4626 74.5374 5555.8274 0.000167
79 374 327.4626 46.5374 2165.7317 0.000065
82 220 332.3296 -112.3296 12617.9402 0.000379
84 354 335.5743 18.4257 339.5068 0.000010
85 274 337.1966 -63.1966 3993.8145 0.000120
89 290 343.6860 -53.6860 2882.1870 0.000087
135145.3138
5405.8126
33295591.7757

4. Los errores no estan correlacionados

ei vs. Y est
150

100

50

-50

-100

-150
220 240 260 280 300 320 340 360

5. Los errores se distribuyen normalmente

Prueba Anderson Darling

n ei y ord asc y ord desc 2i-1


1 -34.10 -127.73 128.40 1
2 14.47 -126.99 122.76 3
3 -37.77 -112.33 100.25 5
4 99.98 -76.64 99.98 7
5 15.98 -63.20 74.54 9
6 -76.64 -57.51 68.89 11
7 -13.51 -53.69 46.54 13
8 -57.51 -49.86 44.03 15
9 100.25 -37.77 41.25 17
10 41.25 -34.10 18.43 19
11 -126.99 -13.51 15.98 21
12 -9.24 -12.97 14.47 23
13 122.76 -9.24 -9.24 25
14 -49.86 14.47 -12.97 27
15 68.89 15.98 -13.51 29
16 -127.73 18.43 -34.10 31
17 44.03 41.25 -37.77 33
18 -12.97 44.03 -49.86 35
19 128.40 46.54 -53.69 37
20 74.54 68.89 -57.51 39
21 46.54 74.54 -63.20 41
22 -112.33 99.98 -76.64 43
23 18.43 100.25 -112.33 45
24 -63.20 122.76 -126.99 47
25 -53.69 128.40 -127.73 49

H1. Diagnostique que dato de este modelo ocasiona mayor influencia

Prueba de Distancia de Puntos de Cook


𝑀𝑆_𝐸(𝑖) =(𝑀𝑆_𝐸−(𝑒_𝑖^2)/(1−ℎ_1 )(𝑛−𝑘−1) )((𝑛−𝑘−1)/(𝑛−𝑘−2))

𝑠(𝑖)=𝑒_𝑖/√(𝑀𝑆_𝐸(𝑖) (1−ℎ_𝑖))

ℎ_𝑖=1/𝑛+ 〖 (𝑥_𝑖−𝑥 ̅) 〗 ^2/𝑆𝑆𝑥

n X Y ei(residual) hi(Leverenge) MSE(i) mod (Errors(i)


cu (Rstudentizada)
1 84 354 18.43 0.10037454 6137.71637126596 0.247964747
2 73 190 -127.73 0.044800691 5342.36526504048 -1.78802709
3 65 405 100.25 0.043483629 5655.35436794027 1.363041957
4 70 263 -49.86 0.040448213 6032.3077201895 -0.65537417
5 76 451 128.40 0.053783467 5325.93130479483 1.808785354
6 69 302 -9.24 0.040026341 6151.45283427664 -0.12023018
7 63 288 -13.51 0.048299138 6146.56127699073 -0.17657583
8 72 385 68.89 0.042835388 5919.55528779934 0.915255658
9 79 402 74.54 0.067396539 5872.00474608813 1.007239303
10 75 365 44.03 0.050274731 6058.49823341899 0.580410916
11 27 209 -34.10 0.486880826 6047.77002347915 -0.61214914
12 89 290 -53.69 0.146214475 5994.93602445804 -0.75040274
13 65 346 41.25 0.043483629 6070.97596555522 0.541315947
14 57 254 -37.77 0.07509312 6082.23569761705 -0.50359137
15 59 395 99.98 0.064103883 5647.04017267823 1.375331695
16 69 434 122.76 0.040026341 5408.13558901119 1.703752257
17 60 220 -76.64 0.059380981 5858.34533900903 -1.03240517
18 79 374 46.54 0.067396539 6045.10417677792 0.619800504
19 75 308 -12.97 0.050274731 6147.24843617398 -0.16978837
20 82 220 -112.33 0.085639907 5498.55624544811 -1.58420458
21 59 311 15.98 0.064103883 6142.68729876116 0.210814261
22 67 181 -126.99 0.04072603 5355.10184464219 -1.77186077
23 85 274 -63.20 0.108513572 5942.35622762901 -0.86827487
24 55 303 14.47 0.088140267 6144.74738801522 0.193357928
25 63 244 -57.51 0.048299138 5990.22722905247 -0.76161315
Sumas 1717 7768 Construcción del Modelo y el ANOVA
Media 68.68 310.72
n= 25 b0 b1
SS= 161.9766667 6057.376667 A= 25 1717
1717 121811
k= 2

A-1= 1.2534 -0.0177


-0.0177 0.0003

ANOVA

Fuente Var SC gl
Regresión 10231.7261996582 1
Error 135145.313800342 23
Total 145377.04 24
ependientes la grasa corporal (X1; grs /cm2) y el peso (x2;kgs)

Grasas (X1)
500
450
400
350
300
250
200
150
100
400
350
300
250
200
150
100
50
0
20 30 40 50 60 70 80 90 100

bo 199.2975017

b1 1.622342724

Y = 199.298+1.6223* X

Error Total
(𝑦 ̂_𝑖−𝑦 ̅) 〗 ∑▒^2〖 (𝑦_𝑖−∑▒ 〖 (𝑦_𝑖−𝑦 ̅) 〗 ^2
SC (Suma de g.l.
𝑦 ̂_𝑖) 〗 ^2
(yi-b0-bixi)^2 Fuente de Cuadrados)
339.507 1873.158 339.50676926 variación
16314.575 14573.318 16314.574967 Regresión 10231.7262 1
10050.107 8888.718 10050.106856 Error 135145.3138 23
2486.168 2277.198 2486.168424 Total 145377.04 24
16487.703 19678.478 16487.703103
85.362 76.038 85.361886657 Para la pendiente, se utilizara b1
182.388 516.198 182.38754575
4746.359 5517.518 4746.3587312 tc= 1.319586541
5555.827 8332.038 5555.8274402 𝑠_𝑏1^2 1.512
1938.359 2946.318 1938.3585884 𝑠_𝑒^2 5875.883209
1162.862 10346.958 1162.8615088 𝑠_𝑒^ 76.65430979
2882.187 429.318 2882.1870423
1701.581 1244.678 1701.5807511 Intervalo de confianza
1426.651 3217.158 1426.6512346 Nivel de confianza 95%
9996.856 7103.118 9996.8557614 α= 5%
15070.226 15197.958 15070.226373 gl= 23
5873.393 8230.118 5873.3930305 𝑡_𝑡^ = 2.06865761
2165.732 4004.358 2165.7317475
168.304 7.398 168.30407437
12617.940 8230.118 12617.940179
255.497 0.078 255.49712946
16127.594 16827.278 16127.593943
3993.814 1348.358 3993.8144554
209.486 59.598 209.48649997
3306.836 4451.558 3306.8357585
135145.3138 145377.04 135145.3138

los individuos entre 30 y 90 kg.

. Sup. Predic
Intervalos de confianza de la cantidad de grasas para los indi-
viduos entre 30 y 90 kg
450

400

350

300

250

200

150

100

50

0
50 55 60 65 70 75 80 85 90 95

Ft (tablas) α Nivel de significancia


4.2793443091 0.05

videncia estadistica de que haya una relación lineal entre x y y


Ho: se= constante, se presenta homocedasticidad
media
Ha: se≠ constante, se presenta heterocedasticidad
varianza

Prueba estadística
Estadística de prueba: B.P
Prueba 1 n R2 auxiliar= 0.708437668
Prueba 2 1/2 SCR aux= 1.021307E-08
Valor critico
chi cuadrada= 5.991464547
a= 0.05
(d1,d2) k=gl 2

Criterio: Si el estadistico de prueba B-P > valor crítico, se rechaza a Ho, hay hetocedasticidad
Resp 1 Existe homocedasticidad
Resp 2 Existe homocedasticidad

Por lo tanto, podemos decir que los errores tienen varianza constante

ei vs Xi(Peso(X2))
150

100

50

-50

-100

-150
360 20 30 40 50 60 70 80 90 100

nderson Darling

PEA (Yi) 1-PEA(Y


(2i-1)[lnPEA(Yi)+ln(1-PEA(Y
n+1-i) n+1-i)]

0.044 0.044 -6.250


0.045 0.051 -18.216 Media 0.000
0.067 0.091 -25.496 Des. Est 75.040
0.154 0.091 -29.866
0.200 0.160 -30.969
0.222 0.179 -35.475
0.237 0.268 -35.845 S(2i-1)[lnPEA(Yi)+ln(1-PEA(Yn+1-i)]
0.253 0.279 -39.768
0.307 0.291 -41.026 Estadistico de Prueba 𝐴^2
0.325 0.403 -38.635
0.429 0.416 -36.228 Valor Critico
0.431 0.424 -39.098 a= 0.01
0.451 0.549 -34.899
0.576 0.569 -30.115 Criterio Se rechaza Ho, si A2n > VC(Aa,n)
Se acepta Ho, se concluye que existe evidencia
0.584 0.571 -31.811 Conclusion: estadistica que la variable Yi se comporta como u
0.597 0.675 -28.165 distribución normal
0.709 0.693 -23.480
0.721 0.747 -21.653
0.732 0.763 -21.538
0.821 0.778 -17.483
0.840 0.800 -16.303
0.909 0.846 -11.289
0.909 0.933 -7.413
0.949 0.955 -4.635
0.956 0.956 -4.404

−𝑘−1)/(𝑛−𝑘−2))𝐷_𝑖=(𝑒_𝑖^2)/(𝑘+1)(𝑀𝑆_𝐸 ) (ℎ_𝑖/(1−ℎ_𝑖 )^2 )


p=número de parametros=k

𝐸(𝑖) (1−ℎ_𝑖))

Analizar
a= t-test Cook D>0.25 DFFITS>1 DFFITS> formula
0.01 0.01 0.25 1 0.738548946
t-test D(i)'cook
DFFITS (Diferencia de ajuste)
Criterio 1 Criterio 2 Criterio 3 Criterio 4
0.8063621066 0.002388659 0.0828267949Hay problemas con el dato - - -
0.0869554295 0.045444159 -0.3872304064 - - - -
0.1860655983 0.027096752 0.2906202776 - - - -
0.5187289287 0.006195818 -0.13455653 - - - -
0.0835768429 0.056186694 0.4312371458 - - - -
0.9053449149 0.000210328 -0.0245502989 - - - -
0.8613872046 0.000551746 -0.0397787112 - - - -
0.3695540745 0.012589126 0.1936201075 - - - -
0.3242996138 0.024422937 0.2707714985 - - - -
0.5672812512 0.006129054 0.1335400249 - - - -
0.5464437759 0.121988747 -0.5962926507 - - - -
0.4606206031 0.032795975 -0.310538322 - - - -
0.593494989 0.004587743 0.1154163964 - - - -
0.6193379277 0.007104402 -0.1434925492 - - - -
0.1822775833 0.041504775 0.3599447127 - - - -
0.1019031801 0.037132366 0.3478962382 - - - -
0.3126168232 0.022362199 -0.2593982099 - - - -
0.5414814253 0.009520369 0.1666181123 - - - -
0.8666611534 0.000532174 -0.0390646391 - - - -
0.1268018719 0.073322238 -0.4848313859 - - - -
0.8348888134 0.001060769 0.0551732203 - - - -
0.0896674255 0.04049132 -0.3650852642 - - - -
0.3942137719 0.030934853 -0.3029297277 - - - -
0.8483760534 0.001259737 0.0601153177 - - - -
0.4540301037 0.010003608 -0.1715749536 - - - -

C
7768 Recomendación
539813
Ningun dato muestra mayor influencia sobre el modelo

b0= 199.2975
b1= 1.6223427

CM F p-valor
10231.7262 1.74130864 0.1999584734
5875.8832087
CM
Cuadrados p-valor
medios Fc (calculada)
Ft (tablas) α Nivel de significancia
10231.7262 1.74130864 0.199958473 4.279344309 0.05
5875.883209
16107.60941

Error cuadratico medio 5875.883209

Hipotesis
Ho:b1=0
Ha:b1 ≠1

Se acepta Ho, existe evidencia estadística de que b1 no es significativo


para el modelo
para los indi-

85 90 95
Regresion auxiliar: gi vs X para verificar la homocedasticidad del modelo

Resumen

Estadísticas de la regresión
Coeficiente de 0.168337479
Coeficiente de 0.028337507
R^2 ajustado -0.01390869
Error típico 0.000174504
Observaciones 25

ANÁLISIS DE VARIANZA
hay hetocedasticidad Grados de libertad
Suma de cuadrados
Promedio de los cuadrados
Regresión 1 2.042613E-08 2.042613E-08
Residuos 23 7.0039E-07 3.045174E-08
Total 24 7.208161E-07

Coeficientes Error típico Estadístico t


Intercepción 4.926752E-06 0.000195365 0.025218151
Variable X 1 2.292246E-06 2.798815E-06 0.819005874
-630.060718

0.202428732

0.751

A2n > VC(Aa,n)


o, se concluye que existe evidencia
e la variable Yi se comporta como una
distribución normal

número de parametros=k

FITS> formula

SSx=(xi-xmed)^2 X^2
0 234.7024 7056
0 18.6624 5329
0 13.5424 4225
0 1.7424 4900
0 53.5824 5776
0 0.1024 4761
0 32.2624 3969
0 11.0224 5184
0 106.5024 6241
0 39.9424 5625
0 1737.2224 729
0 412.9024 7921
0 13.5424 4225
0 136.4224 3249
0 93.7024 3481
0 0.1024 4761
0 75.3424 3600
0 106.5024 6241
0 39.9424 5625
0 177.4224 6724
0 93.7024 3481
0 2.8224 4489
0 266.3424 7225
0 187.1424 3025
0 32.2624 3969
3887.44 0 121811

a sobre el modelo
mocedasticidad del modelo

F Valor crítico de F
0.670770622 0.421188698
Probabilidad Inferior 95% Superior 95% Inferior 95.0%Superior 95.0%
0.980098484 -0.00039922 0.0004090707 -0.000399217 0.000409071
0.421188698 -3.49754E-06 8.082036E-06 -3.49754E-06 8.082036E-06
∑▒ 〖 (𝑦 ̂_𝑖−𝑦 ̅∑▒
) 〗 〖 ^2(𝑦_𝑖−𝑦 ̂_𝑖) 〗 ^2
∑▒ 〖 (𝑦_𝑖−𝑦 ̅) 〗 ^2

SCT SCR SCE

XY yi est (Yi-Ymed)^2 (Yiest-Ymed)^2(Yi-Yest)^2


29736 335.57 617.73575803 339.50676926 1873.1584
13870 317.73 49.119360563 16314.574967 14573.3184
26325 304.75 35.643541479 10050.106856 8888.7184
18410 312.86 4.5859896822 2486.168424 2277.1984
34276 322.60 141.02865791 16487.703103 19678.4784
20838 311.24 0.2695163817 85.361886657 76.0384
18144 301.51 84.914505007 182.38754575 516.1984
27720 316.11 29.010911773 4746.3587312 5517.5184
31758 327.46 280.31388173 5555.8274402 8332.0384
27375 320.97 105.12823363 1938.3585884 2946.3184
5643 243.10 4572.3622602 1162.8615088 10346.9584
25810 343.69 1086.7574301 2882.1870423 429.3184
22490 304.75 35.643541479 1701.5807511 1244.6784
14478 291.77 359.06319951 1426.6512346 3217.1584
23305 295.02 246.62433402 9996.8557614 7103.1184
29946 311.24 0.2695163817 15070.226373 15197.9584
13200 296.64 198.30088902 5873.3930305 8230.1184
29546 327.46 280.31388173 2165.7317475 4004.3584
23100 320.97 105.12823363 168.30407437 7.3984
18040 332.33 466.97503202 12617.940179 8230.1184
18349 295.02 246.62433402 255.49712946 0.0784
12127 307.99 7.4285452704 16127.593943 16827.2784
23290 337.20 701.01210878 3993.8144554 1348.3584
16665 288.53 492.55803232 209.48649997 59.5984
15372 301.51 84.914505007 3306.8357585 4451.5584
539813 7768 10231.7262 135145.3138 145377.04
Un investigador desea saber si esta relacionada la relacion entre la edad (Y) y dos variables independientes la grasa corporal (X

Los datos proporcionados del estudio son los siguientes:

Edad (Y) Grasas (X1) Peso (X2)


46 354 84
20 190 73
52 405 65
30 263 70
57 451 76
25 302 69
28 288 63
36 385 72
57 402 79
44 365 75
24 209 27
31 290 89
52 346 65
23 254 57
60 395 59
48 434 69
34 220 60
51 374 79
50 308 75
34 220 82
46 311 59
23 181 67
37 274 85
40 303 55
30 244 63

1. Ajusta el modelo que explica la cantidad de grasas en función de la edad

A2. Calcula y representa gráficamente la recta de regresión, junto con la correspondiente nube de puntos

Edad (Y) Grasas (X1) X^2 y^2 XY


46 354 2116 125316 16284
20 190 400 36100 3800
52 405 2704 164025 21060 500
30 263 900 69169 7890 450
57 451 3249 203401 25707 400
25 302 625 91204 7550 350
28 288 784 82944 8064 300
36 385 1296 148225 13860 250
200
150
100
400
350
300
250
57 402 3249 161604 22914 200
44 365 1936 133225 16060 150
24 209 576 43681 5016 100
31 290 961 84100 8990
50
52 346 2704 119716 17992
0
23 254 529 64516 5842 15 20 25
60 395 3600 156025 23700
48 434 2304 188356 20832
34 220 1156 48400 7480
51 374 2601 139876 19074
50 308 2500 94864 15400
34 220 1156 48400 7480
46 311 2116 96721 14306
23 181 529 32761 4163
37 274 1369 75076 10138
40 303 1600 91809 12120
30 244 900 59536 7320
Sumas 978 7768 41860 2559050 323042
Medias 39.12 310.72

25

B2. ¿Cuánto vale el coeficiente de correlacion al cuadrado en este caso?

Sxy= 19157.84 𝑅^2=(𝑆𝐶_𝑅)/𝑆_𝑦𝑦


SCR 101932.6657
Syy 145377.04

R2 0.70116069

C2. ¿Cuánto valen los estimadores de todos los parametros del modelo?

bo 102.5751422

b1 5.320676324

D2. Constrasta la hipotesis de que la pendiente de la recta es cero a nivel de 0.05

Suma de
cuadrados
Edad (Y) Grasas (X1) 𝑌 ̂ ∑▒ 〖 (𝑥_𝑖−𝑥 ̅) ∑▒ 〖 (𝑦 ̂_𝑖−𝑦 ̅) 〗 ∑▒
〗 ^2 ^2〖 (𝑦_𝑖−
𝑦 ̂_𝑖) 〗 ^2

46 354 347.326 47.3344 1340.018


20 190 208.989 365.5744 10349.264
52 405 379.250 165.8944 4696.404
30 263 262.195 83.1744 2354.634
57 451 405.854 319.6944 9050.419
25 302 235.592 199.3744 5644.209
28 288 251.554 123.6544 3500.606
36 385 294.119 9.7344 275.577
57 402 405.854 319.6944 9050.419
44 365 336.685 23.8144 674.176
24 209 230.271 228.6144 6471.981
31 290 267.516 65.9344 1866.576
52 346 379.250 165.8944 4696.404
23 254 224.951 259.8544 7356.373
60 395 421.816 435.9744 12342.259
48 434 357.968 78.8544 2232.336
34 220 283.478 26.2144 742.119
51 374 373.930 141.1344 3995.458
50 308 368.609 118.3744 3351.132
34 220 283.478 26.2144 742.119
46 311 347.326 47.3344 1340.018
23 181 224.951 259.8544 7356.373
37 274 299.440 4.4944 127.235
40 303 315.402 0.7744 21.923
30 244 262.195 83.1744 2354.634
Sumas 978 7768 7768 3600.64 101932.6657
Medias 39.12 310.72

E2. Calcula un intervalor de confianza para la pendiente de la recta de nivel 95%

Intervalo de confianza Limite inf. Limite sup.


Nivel de conf. 95% 3.822 5.321 6.819

F2. Calcula y representa los intervalos de confianza al 95% de la cantidad de grasas media para los individuos entre 30 y 90 año

𝑆_( 𝑖𝑛𝑑) Lim. Inf. PredicLim. Sup. Predic


Edad (Y) 𝑌 ̂ ∑▒ 〖 (𝑥_𝑖−𝑥 ̅) 〗 ^2 𝑦 ̂
_(𝑝^± ) 𝑡_(𝛼,𝑛−2) 𝑠_(𝑦 ̂_𝑝 )
20 208.9886687 365.5744 16.45 174.97 243.0
23 224.9506977 259.8544 14.66 194.62 255.3
23 224.9506977 259.8544 14.66 194.62 255.3
24 230.271374 228.6144 14.09 201.12 259.4
25 235.5920503 199.3744 13.54 207.59 263.6
28 251.5540793 123.6544 11.98 226.77 276.3
30 262.1954319 83.1744 11.06 239.31 285.1
30 262.1954319 83.1744 11.06 239.31 285.1
31 267.5161082 65.9344 10.64 245.50 289.5
+ 34 283.4781372 26.2144 9.62 263.59 303.4
34 283.4781372 26.2144 9.62 263.59 303.4
36 294.1194899 9.7344 9.15 275.18 313.1
37 299.4401662 4.4944 9.00 280.82 318.1
40 315.4021952 0.7744 8.89 297.00 333.8
44 336.6849005 23.8144 9.55 316.93 356.4
46 347.3262531 47.3344 10.18 326.28 368.4
46 347.3262531 47.3344 10.18 326.28 368.4
48 357.9676058 78.8544 10.96 335.30 380.6
50 368.6089584 118.3744 11.87 344.06 393.2
51 373.9296347 141.1344 12.36 348.36 399.5
52 379.2503111 165.8944 12.87 352.62 405.9
52 379.2503111 165.8944 12.87 352.62 405.9
57 405.8536927 319.6944 15.70 373.38 438.3
57 405.8536927 319.6944 15.70 373.38 438.3
60 421.8157216 435.9744 17.53 385.55 458.1
24

G2. Lleva a cabo el diagnostico de los supuestos de una regresión lineal: (los 5 supuestos)

1. La relación entre x y y es lineal

CM
SC (Suma de g.l. Cuadrados p-valor
Fuente de Cuadrados) medios Fc (calculada)
variación
Regresión 101932.6657 1 101932.6657 53.9644395787 1.794101E-07
Error 43444.37429 23 1888.885839
Total 145377.04 24 103821.5515

Hipotesis: Respuesta
Ho: βi=0 Se rechaza Ho, por lo tanto existe evidencia estadistica de que haya
Ha: βi≠0

2. Los errores tienen media cero

Grasas (X1) 𝑋 ̂ ei


354 347.326 6.674
190 208.989 -18.989
405 379.250 25.750
263 262.195 0.805
451 405.854 45.146 Media ei= 0.000
302 235.592 66.408
288 251.554 36.446 Por lo tanto, se cumple el supuesto 2
385 294.119 90.881
402 405.854 -3.854
365 336.685 28.315
209 230.271 -21.271
290 267.516 22.484
346 379.250 -33.250
254 224.951 29.049
395 421.816 -26.816
434 357.968 76.032
220 283.478 -63.478
374 373.930 0.070
308 368.609 -60.609
220 283.478 -63.478
311 347.326 -36.326
181 224.951 -43.951
274 299.440 -25.440
303 315.402 -12.402
244 262.195 -18.195

3. Los errores tienen varianza constante s2

Prueba Breusan-Pagan
b0= 102.5751422
b1= 5.320676324
Edad (Y) Grasas (X1) 𝑌 ̂
ei ei^2 gi v indep
46 354 347.326 6.6737 44.5389 0.000010
20 190 208.989 -18.9887 360.5695 0.000080
52 405 379.250 25.7497 663.0465 0.000148
30 263 262.195 0.8046 0.6473 0.000000
57 451 405.854 45.1463 2038.1891 0.000455
25 302 235.592 66.4079 4410.0158 0.000983
28 288 251.554 36.4459 1328.3051 0.000296
36 385 294.119 90.8805 8259.2671 0.001842
57 402 405.854 -3.8537 14.8509 0.000003
44 365 336.685 28.3151 801.7449 0.000179
24 209 230.271 -21.2714 452.4714 0.000101
31 290 267.516 22.4839 505.5254 0.000113
52 346 379.250 -33.2503 1105.5832 0.000247
23 254 224.951 29.0493 843.8620 0.000188
60 395 421.816 -26.8157 719.0829 0.000160
48 434 357.968 76.0324 5780.9250 0.001289
34 220 283.478 -63.4781 4029.4739 0.000899
51 374 373.930 0.0704 0.0050 0.000000
50 308 368.609 -60.6090 3673.4458 0.000819
34 220 283.478 -63.4781 4029.4739 0.000899
46 311 347.326 -36.3263 1319.5967 0.000294
23 181 224.951 -43.9507 1931.6638 0.000431
37 274 299.440 -25.4402 647.2021 0.000144
40 303 315.402 -12.4022 153.8144 0.000034
30 244 262.195 -18.1954 331.0737 0.000074
43444.3743
1737.7750
4484318.2175

4. Los errores no estan correlacionados

ei vs. Y est
100

80

60

40

20

-20

-40

-60

-80
150 200 250 300 350 400 450

En el gradico de Y estimada vs. e_i se aprecia


aleatoriedad en el comportamiento de los
datos por lo que se considera que es bueno Correlacion entre ei vs yi est
este modelo.
Resp
r_eiy= 0.0000

Correlacion baja o nula y es satisfactoria para el modelo ya


que existe aleatoriedad entre ei y Y est
Correlacion baja o nula y es satisfactoria para el modelo ya
que existe aleatoriedad entre ei y Y est

5. Los errores se distribuyen normalmente

Prueba Anderson Darling

n ei e ord asc e ord desc 2i-1


1 6.674 -63.478 90.881 1
2 -18.989 -63.478 76.032 3
3 25.750 -60.609 66.408 5
4 0.805 -43.951 45.146 7
5 45.146 -36.326 36.446 9
6 66.408 -33.250 29.049 11
7 36.446 -26.816 28.315 13
8 90.881 -25.440 25.750 15
9 -3.854 -21.271 22.484 17
10 28.315 -18.989 6.674 19
11 -21.271 -18.195 0.805 21
12 22.484 -12.402 0.070 23
13 -33.250 -3.854 -3.854 25
14 29.049 0.070 -12.402 27
15 -26.816 0.805 -18.195 29
16 76.032 6.674 -18.989 31
17 -63.478 22.484 -21.271 33
18 0.070 25.750 -25.440 35
19 -60.609 28.315 -26.816 37
20 -63.478 29.049 -33.250 39
21 -36.326 36.446 -36.326 41
22 -43.951 45.146 -43.951 43
23 -25.440 66.408 -60.609 45
24 -12.402 76.032 -63.478 47
25 -18.195 90.881 -63.478 49

H2. Diagnostique que dato de este modelo ocasiona mayor influencia

Prueba de Distancia de Puntos de Cook


𝑀𝑆_𝐸(𝑖) =(𝑀𝑆_𝐸−(𝑒_𝑖^2)/(1−ℎ_1 )(𝑛−𝑘−1) )((𝑛−𝑘−1)/(𝑛−𝑘−2))

𝑠(𝑖)=𝑒_𝑖/√(𝑀𝑆_𝐸(𝑖) (1−ℎ_𝑖))

ℎ_𝑖=1/𝑛+ 〖 (𝑥_𝑖−𝑥 ̅) 〗 ^2/𝑆𝑆𝑥


obs X Y ei(residual) hi(Leverenge) MSE(i) mod (Erro
s(i) (Rstudentizada)
1 46 354 6.67 0.053 1976.593 0.154
2 20 190 -18.99 0.142 1958.832 -0.463
3 52 405 25.75 0.086 1944.286 0.611
4 30 263 0.80 0.063 1978.800 0.019
5 57 451 45.15 0.129 1867.429 1.119
6 25 302 66.41 0.095 1746.692 1.671
7 28 288 36.45 0.074 1910.500 0.867
8 36 385 90.88 0.043 1567.990 2.346
9 57 402 -3.85 0.129 1978.021 -0.093
10 44 365 28.32 0.047 1938.788 0.659
11 24 209 -21.27 0.103 1954.799 -0.508
12 31 290 22.48 0.058 1953.270 0.524
13 52 346 -33.25 0.086 1921.228 -0.794
14 23 254 29.05 0.112 1933.572 0.701
15 60 395 -26.82 0.161 1938.016 -0.665
16 48 434 76.03 0.062 1685.386 1.912
17 34 220 -63.48 0.047 1777.431 -1.543
18 51 374 0.07 0.079 1978.833 0.002
19 50 308 -60.61 0.073 1790.157 -1.488
20 34 220 -63.48 0.047 1777.431 -1.543
21 46 311 -36.33 0.053 1912.468 -0.854
22 23 181 -43.95 0.112 1875.227 -1.077
23 37 274 -25.44 0.041 1946.688 -0.589
24 40 303 -12.40 0.040 1971.201 -0.285
25 30 244 -18.20 0.063 1962.006 -0.424
Sumas 978 7768 Construcción del Modelo y el ANOVA
Media 39.12 310.72
n= 25 b0 b1
SS= 150.0266667 6057.376667 A= 25 978
978 41860
k= 2

A-1= 0.4650 -0.0109


-0.0109 0.0003

ANOVA

Fuente Var SC gl
Regresión 101932.665711 1
Error 43444.374289 23
Total 145377.04 24
3. De ambos modelos cual es el modelo que mejor describe la cantidad de grasa que tiene una persona

Despues de realizar ambos modelos, y las mismas pruebas para cada uno, podemos decir que el segundo mode
la edad, describe mejor la cantidad de grasas que tiene una per
independientes la grasa corporal (X1; grs /cm2) y el peso (x2;kgs)

ube de puntos

Grasas (X1)
500
450
400
350
300
250
200
150
100
400
350
300
250
200
150
100
50
0
15 20 25 30 35 40 45 50 55 60 65

bo 102.5751422

b1 5.320676324

Y = 102.575+5.3207* X

Error Total
(𝑦 ̂_𝑖−𝑦 ̅) 〗 ∑▒
^2〖 (𝑦_𝑖− ∑▒ 〖 (𝑦_𝑖−𝑦 ̅) 〗 ^2 g.l.
𝑦 ̂_𝑖) 〗 ^2 SC (Suma de
(yi-b0-bixi)^2 Fuente de Cuadrados)
44.539 1873.158 44.538897544335 variación
360.570 14573.318 360.56953828148 Regresión 101932.6657 1
663.046 8888.718 663.04648072242 Error 43444.37429 23
0.647 2277.198 0.6473297901836 Total 145377.04 24
2038.189 19678.478 2038.1890649156
4410.016 76.038 4410.0157830697 Para la pendiente, se utilizara b1
1328.305 516.198 1328.3051375079
8259.267 5517.518 8259.2671217675 tc= 7.34604925
14.851 8332.038 14.850947247664 𝑠_𝑏1^2 0.525
801.745 2946.318 801.74486183892 𝑠_𝑒^2 1888.885839
452.471 10346.958 452.47135091022 𝑠_𝑒^ 43.46131428
505.525 429.318 505.52538834161
1105.583 1244.678 1105.5831853083 Intervalo de confianza
843.862 3217.158 843.86196680382 Nivel de confianza 95%
719.083 7103.118 719.08292758263 α= 5%
5780.925 15197.958 5780.9249740225 gl= 23
4029.474 8230.118 4029.4739049275 𝑡_𝑡^ = 2.06865761
0.005 4004.358 0.0049512709965
3673.446 7.398 3673.4458392293
4029.474 8230.118 4029.4739049275
1319.597 0.078 1319.5966650523
1931.664 16827.278 1931.6638242514
647.202 1348.358 647.20205591102
153.814 59.598 153.81444491829
331.074 4451.558 331.07374287231
43444.37429 145377.04 43444.374289015

para los individuos entre 30 y 90 años

. Sup. Predic
Intervalos de confianza
500

450

400

350

300

250

200

150

100

50

0
25 30 35 40 45 50 55 60 65

Ft (tablas) α Nivel de significancia


4.279344309 0.05

evidencia estadistica de que haya una relación lineal entre x y y


mple el supuesto 2

Ho: se= constante, se presenta homocedasticidad


media
Ha: se≠ constante, se presenta heterocedasticidad
varianza

Prueba estadística
Estadística de prueba: B.P
Prueba 1 n R2 auxiliar= 0.065289909
Prueba 2 1/2 SCR aux= 6.988611E-09
Valor critico
chi cuadrada= 5.991464547
a= 0.05
(d1,d2) k=gl 2
Criterio: Si el estadistico de prueba B-P > valor crítico, se rechaza a Ho, hay hetocedasticidad
Resp 1 Existe homocedasticidad
Resp 2 Existe homocedasticidad

Por lo tanto, podemos decir que los errores tienen varinza constante

0.0000

ei vs Xi(Peso(X2))
100

80

60

40

20

-20

-40

-60

450 -80
15 20 25 30 35 40 45 50 55 60 65

En el gradico de xi vs. e_i se aprecia


aleatoriedad en el comportamiento de los datos Correlacion entre ei vs yi est
por lo que se considera que es muy bueno este
modelo.
Resp
r_eiy= 0.0000

Correlacion baja o nula y es satisfactoria para el modelo ya


que existe aleatoriedad entre e i y xi
Correlacion baja o nula y es satisfactoria para el modelo ya
que existe aleatoriedad entre e i y xi

a Anderson Darling

PEA (Yi) 1-PEA(Y(2i-1)[lnPEA(Yi)+ln(1-PEA(Y


n+1-i) n+1-i)]

0.0679 0.0163 -6.805


0.0679 0.0370 -17.965 Media 0.000
0.0771 0.0593 -26.938 Des. Est 42.546
0.1508 0.1443 -26.793
0.1966 0.1958 -29.314
0.2173 0.2474 -32.159 S(2i-1)[lnPEA(Yi)+ln(1-PEA(Yn+1-i)]
0.2643 0.2529 -35.175
0.2749 0.2725 -38.869 Estadistico de Prueba 𝐴^2
0.3086 0.2986 -40.537
0.3277 0.4377 -36.897 Valor Critico
0.3344 0.4925 -37.876 a= 0.01
0.3853 0.4993 -37.907
0.4639 0.5361 -34.788 Criterio Se rechaza Ho, si A2n > VC(Aa,n)
0.5007 0.6147 -31.820 Conclusion:
Se acepta Ho, se concluye que existe eviden
0.5075 0.6656 -31.474 estadistica que la variable Yi se comporta com
0.5623 0.6723 -30.154 distribución normal
0.7014 0.6914 -23.880
0.7275 0.7251 -22.388
0.7471 0.7357 -22.140
0.7526 0.7827 -20.636
0.8042 0.8034 -17.911
0.8557 0.8492 -13.731
0.9407 0.9229 -6.363
0.9630 0.9321 -5.073
0.9837 0.9321 -4.250

((𝑛−𝑘−1)/(𝑛−𝑘−2))
𝐷_𝑖=(𝑒_𝑖^2)/(𝑘+1)(𝑀𝑆_𝐸 ) (ℎ_𝑖/(1−ℎ_𝑖 )^2 )
p=número de parametros=k

𝑀𝑆_𝐸(𝑖) (1−ℎ_𝑖))

Analizar
a= t-test Cook D>0.25 DFFITS>1 DFFITS> formula
0.01 0.01 0.25 1 0.738548946
t-test D(i)'cook
DFFITS (Diferencia de ajuste)
Criterio 1 Criterio 2 Criterio 3 Criterio 4
0.879 0.00047 0.037 - - - -
0.648 0.01222 -0.188 - - - -
0.547 0.01206 0.187 - - - -
0.985 0.00001 0.005 - - - -
0.275 0.06103 0.430 - - - -
0.108 0.09070 0.542 - - - -
0.395 0.02034 0.246 - - - -
0.028 0.06792 0.495 - - - -
0.927 0.00044 -0.036 - - - -
0.517 0.00726 0.146 - - - -
0.616 0.01028 -0.173 - - - -
0.605 0.00587 0.130 - - - -
0.436 0.02011 -0.244 - - - -
0.490 0.02119 0.249 - - - -
0.513 0.02904 -0.291 - - - -
0.068 0.07176 0.491 - - - -
0.137 0.03704 -0.344 - - - -
0.999 0.00000 0.000 - - - -
0.150 0.05496 -0.417 - - - -
0.137 0.03704 -0.344 - - - -
0.402 0.01380 -0.202 - - - -
0.293 0.04851 -0.383 - - - -
0.562 0.00513 -0.122 - - - -
0.778 0.00118 -0.058 - - - -
0.675 0.00420 -0.110 - - - -

C
7768 Recomendación
323042 Ningun dato muestra mayor influencia sobre el modelo

b0= 102.5751
b1= 5.320676

CM F p-valor
101932.6657 53.96443958 1.7941011E-07
1888.885839
una persona

odemos decir que el segundo modelo, en donde la cantidad de grasas esta en función de
antidad de grasas que tiene una persona
CM
Cuadrados p-valor
medios Fc (calculada)
Ft (tablas) α Nivel de significancia
101932.6657 53.96443958 1.794101E-07 4.279344309 0.05
1888.885839
103821.5515

Error cuadratico medio 1888.885839

Hipotesis
Ho:b1=0
Ha:b1 ≠1

Se rechaza Ho, existe evidencia estadística de que b1 es significativo


para el modelo
55 60 65
Regresion auxiliar: gi vs X para verificar la homocedasticidad del modelo

Resumen

Estadísticas de la regresión
Coeficiente de 0.05110378
Coeficiente de 0.002611596
R^2 ajustado -0.04075312
Error típico 0.000481754
Observaciones 25

ANÁLISIS DE VARIANZA
y hetocedasticidad Grados de libertad
Suma de cuadrados
Promedio de los cuadrados
Regresión 1 1.397722E-08 1.397722E-08
Residuos 23 5.338007E-06 2.320873E-07
Total 24 5.351984E-06

Coeficientes Error típico Estadístico t


Intercepción 0.000464599 0.000328523 1.41420576
Variable X 1 -1.97025E-06 8.028526E-06 -0.24540578
-631.840377

0.273615093

0.751

A2n > VC(Aa,n)

o, se concluye que existe evidencia


e la variable Yi se comporta como una
distribución normal

número de parametros=k

FITS> formula
SSx=(xi-xmed)^2 X^2
0 47.33 2116
0 365.57 400
0 165.89 2704
0 83.17 900
0 319.69 3249
0 199.37 625
0 123.65 784
0 9.73 1296
0 319.69 3249
0 23.81 1936
0 228.61 576
0 65.93 961
0 165.89 2704
0 259.85 529
0 435.97 3600
0 78.85 2304
0 26.21 1156
0 141.13 2601
0 118.37 2500
0 26.21 1156
0 47.33 2116
0 259.85 529
0 4.49 1369
0 0.77 1600
0 83.17 900
3600.64 0 41860

fluencia sobre el modelo


mocedasticidad del modelo
F Valor crítico de F
0.060223998 0.808318764

Probabilidad Inferior 95% Superior 95% Inferior 95.0% Superior 95.0%


0.170696198 -0.000215 0.0011441997 -0.000215002 0.0011442
0.808318764 -1.85785E-05 1.4638024E-05 -1.857852E-05 1.463802E-05
∑▒ 〖 (𝑦 ̂_𝑖−𝑦 ̅)∑▒
〗 〖^2(𝑦_𝑖−𝑦 ̂_𝑖) 〗 ^2
∑▒ 〖 (𝑦_𝑖−𝑦 ̅) 〗 ^2

SCT SCR SCE


XY yi est (Yi-Ymed)^2 (Yiest-Ymed)^2 (Yi-Yest)^2
16284 347.33 1340.02 44.54 1873.16
3800 208.99 10349.26 360.57 14573.32
21060 379.25 4696.40 663.05 8888.72
7890 262.20 2354.63 0.65 2277.20
25707 405.85 9050.42 2038.19 19678.48
7550 235.59 5644.21 4410.02 76.04
8064 251.55 3500.61 1328.31 516.20
13860 294.12 275.58 8259.27 5517.52
22914 405.85 9050.42 14.85 8332.04
16060 336.68 674.18 801.74 2946.32
5016 230.27 6471.98 452.47 10346.96
8990 267.52 1866.58 505.53 429.32
17992 379.25 4696.40 1105.58 1244.68
5842 224.95 7356.37 843.86 3217.16
23700 421.82 12342.26 719.08 7103.12
20832 357.97 2232.34 5780.92 15197.96
7480 283.48 742.12 4029.47 8230.12
19074 373.93 3995.46 0.00 4004.36
15400 368.61 3351.13 3673.45 7.40
7480 283.48 742.12 4029.47 8230.12
14306 347.33 1340.02 1319.60 0.08
4163 224.95 7356.37 1931.66 16827.28
10138 299.44 127.23 647.20 1348.36
12120 315.40 21.92 153.81 59.60
7320 262.20 2354.63 331.07 4451.56
323042 7768 101932.66571 43444.374289 145377.04

You might also like