Nothing Special   »   [go: up one dir, main page]

Estadistica

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 25

“UNIVERSIDAD NACIONAL SAN CRISTOBAL DE

HUAMANGA”
ESCUELA DE FORMACION PROFESIONAL CIENCIAS FISICO
MATEMATICAS

INTEGRANTES :

3) En el estudio de cierta comunidad se verifico lo siguiente:

a) la proporción de individuos solteros es de 0.4

b) la proporción de individuos que reciben hasta 10 salarios mínimos es de 0.2

c) la proporción de individuos que reciben hasta 20 salarios mínimos es de 0.7

d) la proporción de individuos que reciben hasta 20 salarios mínimos es de 0.7

e) la proporción de individuos que reciben hasta 10 salarios mínimos entre los solteros
es de 0.3
1) construye la distribución conjunta de las variables estado civil y faja salarial y las
respectivas distribuciones marginales.

Solución

<10 <10.20] >20 TOTAL


soltero 0.12 0.19 0.09 0.4
casado 0.08 0.31 0.21 0.6
TOTAL 0.2 0.5 0.3 1

5.- he aquí los gastos de publicidad (como porcentajes de gastos totales) y los
beneficios de operación netos (como porcentaje de ventas) en una muestra de 10
pequeñas joyerías.

Gastos de Publicidad
(X) 1.2 0.7 1.5 1.8 0.5 3.4 1.0 3.0 2.8 2.5
Beneficios (Y) 2.7 2.4 2.7 3.3 1.1 5.8 2.2 4.2 4.4 3.8

a) Representar los datos en un diagrama de dispersión.


b) Hallar el coeficiente de correlación entre X e Y.
c) Halla la ecuación de la recta que mejor se ajuste a estos datos y representar la
recta en el gráfico de la parte (a).
SOLUCION

TOTAL
Gastos de Publicidad
(X) 1.2 0.7 1.5 1.8 0.5 3.4 1 3 2.8 2.5 18.4
Beneficios (Y) 2.7 2.4 2.7 3.3 1.1 5.8 2.2 4.2 4.4 3.8 32.6
𝑋2 1.44 0.49 2.25 3.24 0.25 11.56 1 9 7.84 6.25 43.32
𝑌2 7.29 5.76 7.29 10.89 1.21 33.64 4.84 17.64 19.36 14.44 122.36
XY 3.24 1.68 4.05 5.94 0.55 19.72 2.2 12.6 12.32 9.5 71.8
a)

GRAFICA de gastos publicitarios segun los


beneficios
7

0
0 0.5 1 1.5 2 2.5 3 3.5 4

b)
(18.4)2 (32.6)2
𝑆𝐶𝑥 = 43.32 − 𝑆𝐶𝑦 = 122.36 −
10 10
𝑆𝐶𝑥 = 9.464𝑆𝐶𝑦 = 16.084

(18.4)(32.6)
𝑆𝑃xy = 71.8 −
10
𝑆𝑃𝑥𝑦 = 11.816
 Hallando el coeficiente de Correlación:
𝑆𝑃𝑥𝑦
𝑟=
√(𝑆𝐶𝑥)(𝑆𝐶𝑦)
11.816
𝑟= = 0.958
√(9.46)(16.08)

Lo que quiere decir que los gastos de publicidad y el beneficio existe una
correlación alta y directa.

 Hallando el coeficiente de regresión:


𝑆𝑃𝑥𝑦
𝑏=
𝑆𝐶𝑥
11.816
𝑏= = 1.249
9.46
Esto quiere decir que por cada gasto de publicidad, el beneficio se incrementa
en 1.249.

 Hallando el coeficiente de determinación:


𝑟 2 = (𝑟)2
𝑟 2 = (0.958)2 = 0.918
Esto nos indica que el 91.8% de la variabilidad de los gastos de publicidad es
causada por la variabilidad de los beneficios y que el 8.2% restantes se debe a
otros factores.

𝑎 = 𝑌̅ − 𝑏𝑋̅
32.6 18.4
𝑎=( ) − 1.249 ( ) = 0.96
10 10

𝑌̂ = 𝑎 + 𝑏𝑋
𝑌̂ = 0.96 + 1.249𝑋

c)

7. Se extrae una muestra aleatoria de 200 habitantes de una ciudad para analizar la
actitud frente a un cierto proyecto de alcaldía. El resultado fue lo siguiente.

Local de Residencia
Opinión Urbano Sub-urbano Rural Total
A favor 30 35 35 100
En contra 60 25 15 100
Total 90 60 50 200
a) Calcule las proporciones en relación al total de las columnas.

Solución

La distribución conjunta de las proporciones (en porcentajes) con relación a los


totales de cada columna de las variables X e Y.

Local de Residencia (Y)


Opinión (X) Urbano Sub-urbano Rural Total
A favor 33.3% 58.3% 70% 50%
En contra 66.7% 41.7% 30% 50%
Total 100% 100% 100% 100%

Así podemos decir que (f11 /f.1) * 100 = (30/90)*100 = 33.3% de los habitantes
están a favor frente al proyecto de alcaldía con residencia de urbano.

(f11 /f.1) * 100 = (60/90)*100 = 66.7% están en contra frente al proyecto de


alcaldía.

Este tipo de distribuciones sirve para comparar la distribución del local de


residencia de los habitantes conforme a su opinión.

b) ¿Ud. diría que la opinión es independiente del local de residencia?

Solución

Distribución conjunta de los habitantes según su opinión (X) y local de residencia


(Y).

Local de Residencia
Opinión Urbano Sub-urbano Rural Total
A favor 30 35 35 100
En contra 60 25 15 100
Total 90 60 50 200
Tenemos:

(F1.* F.1)/n = (100*90)/200 = 45 ≠ 30=F11

(F1.* F.2)/n = (100*60)/200 = 30 ≠ 35=F12

(F1.* F.3)/n = (100*50)/200 = 25 ≠ 35=F13

(F2.* F.1)/n = (100*90)/200 = 45 ≠ 60=F21

(F2.* F.2)/n = (100*60)/200 = 30 ≠ 25=F22

(F2.* F.3)/n = (100*50)/200 = 25 ≠ 15=F23

Este resultado nos indica que no hay independencia entre las dos variables,

Es decir que la opinión no es independiente del local de residencia.

c) Encuentre una medida de dependencia entre las variables.


Solución

Para descubrir el grado de dependencia entre dos variables, es necesario


cuantificarla en único número. De un modo general, la cuantificación del grado de
dependencia de dos variables es dado por las llamadas coeficientes de asociación o
correlación.

Ahora hallaremos el estadígrafo denotado X2 (chi-cuadrado) y dado por:

X2= ∑ ∑ (Fij- (Fi. *F.j)/n)2 / (Fi. *F.j)/n luego:

X2 = (30-45)2/45 + (35-30)2/30 + (35-25)2/25 + (60-45)2/45 + (25-30)2/30 + (15-


25)2/25

X2 = 5 + 0.83 + 4 + 5 + 0.83 + 4

X2 = 19.66

Hallando el coeficiente de contingencia definido por:

C = √X2 / (X2 + n)

C = √19.66 / (19.66+ 200) = √19.66 / 219.66 = √0.0895019576

C = 0.2991687778 ∼ 0.299

C =0.299

Entonces 0.299 (29.9%) indica un alto grado de dependencia entre las dos
variables.
9. considere las tasas de interés y el número de nuevas construcciones. Las tasas de
interés(x) proporcionan un indicador clave para predecir el número de
construcciones (y) si las tasas bajan, el número de construcciones aumenta y si
suben, el número de construcciones disminuye. Suponga que los datos de la tabla
representan a las tasas de interés en primeras hipotecas y el registro de nuevas
construcciones iniciadas en los 8 años referidos.

año 1969 1970 1971 1972 1973 1974 1975 1976


Tasa de 6.5 6.0 6.5 7.5 8.5 9.5 10 9
interés (%)
Licencias de 2165 2984 2780 1940 1750 1535 962 1310
construcción

SOLUCION

año 1969 1970 1971 1972 1973 1974 1975 1976


Tasa de 6.5 6.0 6.5 7.5 8.5 9.5 10 9 63.5
interes(%)(X)
Licencias de 2165 2984 2780 1940 1750 1535 962 1310 15426
construcción(y)

𝑋2 𝑌2 XY
520,25 33143750 115464

a) encuentre la recta de mínimoscuadrados para estimar el número de licencias


de construcción a partir de las tasas de interés.

𝑋̅ =63.5/8=7.9375

̅̅̅
𝑌 =15426/8= 1928.2500; n=8
∑ 𝑥𝑦
COV(X, Y) = − ̅̅̅
𝑌 𝑋̅ = 115464/8 − (7.9375)(1928.2500) = −872.484375
𝑛

∑ 𝑥2 520.25
𝑉𝑥 = − 𝑋̅ 2 = − (7.94)2=65.031-63.044=2.02734
𝑛 8

Hallando coeficiente de regresión

𝑐𝑜𝑣(𝑥, 𝑦) −872.484
𝑏= = = −430.35
𝑉𝑥 2.02734

𝑎 = 𝑌̅ − 𝑏𝑋̅=1928.2500-(-430.35)(7.9375)=5344.55
Por tanto la recta de mínimos cuadrados queda:

𝑦 = 𝑎 + 𝑏𝑥 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑦 = 5344.2 − 430.4𝑥

b) calcule el coeficiente de correlación para estos datos

𝑆𝑃𝑋𝑌
𝑟=
√(𝑆𝐶𝑋)(𝑆𝐶𝑌)

∑𝑋 ∑𝑌 (63.5)(15426)
𝑆𝑃𝑋𝑌 = ∑ 𝑋𝑌 − = 115464 − = −6979.875
𝑛 8
(∑ 𝑋)2 (63.5)2
𝑆𝐶𝑋 = ∑ 𝑋 2 − = 520.25 − = 16.21875
𝑛 8
(∑ 𝑦)2 (15426)2
𝑆𝐶𝑦 = ∑ 𝑦 2 − = 33143750 − = 3398565.5
𝑛 8
𝑆𝑃𝑋𝑌 6979.875 6979.875
𝑟= =− =− = −0.94
√(𝑆𝐶𝑋)(𝑆𝐶𝑌) √(16.21875)(3398565.5) 7424.317086

c) si los indicadores económicos indican que la tasa de interés para primeras hipotecas
será del 8.5% el próximo año, pronostique el número de licencias de construcción que
se otorgaran durante el año entrante.

𝑦 = 5344.2 − 430.4𝑥

𝑦 = 5344.2 − 430.4(8.5) = 5344.2 − 3658.4 = 1686

11. una compañía x de dedetización afirma que el proceso que ella utiliza garantiza que
el efecto sea más prolongado que aquella obtenida por sus competidores. Una
muestra de varios ambientes dedetizados fue escogida y se anotó la duración del
efecto de dedetizacion. Los resultados se dan en la tabla siguiente:

Duración del efecto de dedetizacion


12. Compañía Menos de 4 De 4 a 8 meses. Más de 8 meses.
meses.
X 64 120 16
Y 104 175 21
z 27 48 5
¿Ud. cree que existe alguna evidencia a favor o en contra de la afirmación hecha por
la compañía x?

SOLUCION:

Para obtener una evidencia, bastara hallar los promedios de cada uno de ellos:
(64×2)+(120×6)+(16×10)
̅x = = 5.04
200

(104×2)+(175×6)+(21×10)
̅y= = 4.89
300

(27×2)+(48×6)+(5×10)
̅z= = 4.9
80

Como se puede ver, el promedio de la compañía x es mayor, es decir; que los


productos de esta compañía tienen un efecto más prolongado, es una evidencia a
favor de la afirmación hecha por dicha compañía.

13.𝑺𝒆𝒂 𝒅𝒐𝒔 𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆𝒔 𝑿 𝒆 𝒀 , 𝒅𝒆 𝒍𝒂𝒔 𝒒𝒖𝒆 𝒔𝒆 𝒄𝒐𝒏𝒐𝒄𝒆

𝟑
𝑺𝑿 = 𝟏𝟓 , 𝒓 = ,
𝟖
̅ = 𝟏𝟓𝟎 𝒆 𝒀
𝑪. 𝑽𝒀 = 𝒄𝒐𝒆𝒇𝒊𝒄𝒊𝒆𝒏𝒕𝒆 𝒅𝒆 𝒗𝒂𝒓𝒊𝒂𝒄𝒊𝒐𝒏 = 𝟎. 𝟏𝟓, 𝑿 ̅
= 𝟐𝟎𝟎. 𝑯𝒂𝒍𝒍𝒂𝒓 𝒍𝒂 𝒗𝒂𝒓𝒊𝒂𝒏𝒛𝒂

𝑿+𝒀

𝑺𝑶𝑳𝑼𝑪𝑰𝑶𝑵

𝑆𝑌 𝑆𝑌
𝑖) 𝑐𝑜𝑚𝑜 𝑠𝑎𝑏𝑒𝑚𝑜𝑠 𝐶𝑉𝑌 = , 𝑟𝑒𝑒𝑚𝑝𝑙𝑎𝑧𝑎𝑛𝑑𝑜 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑟𝑒𝑠𝑝𝑒𝑐𝑡𝑖𝑣𝑜𝑠 𝑡𝑒𝑛𝑒𝑚𝑜𝑠
𝑌̅ 200
= 0.15 ↔ 𝑆𝑌 = 30

𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑜𝑏𝑡𝑒𝑛𝑒𝑚𝑜𝑠 𝑣𝑎𝑟(𝑋) = 𝑆𝑋2 = 225 𝑦 𝑣𝑎𝑟(𝑌) = 𝑆𝑌2 = 900.

𝑆𝑋𝑌 3 ∗ 15 ∗ 30
𝑟= 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑐𝑜𝑣 (𝑋, 𝑌) = 𝑆𝑋𝑌 = = 168.75
𝑆𝑋 𝑆𝑌 8

ℎ𝑎𝑙𝑙𝑎𝑚𝑜𝑠 𝑙𝑎 𝑣𝑎𝑟(𝑋 + 𝑌) 𝑙𝑜 𝑞𝑢𝑒 𝑒𝑠 𝑖𝑔𝑢𝑎𝑙 𝑎 ∶


𝑣𝑎𝑟(𝑋 + 𝑌) = 𝑣𝑎𝑟(𝑋) + 𝑣𝑎𝑟(𝑌) + 𝑐𝑜𝑣(𝑋, 𝑌) Entonces obtenemos:

𝑣𝑎𝑟(𝑋 + 𝑌) = 225 + 900 + 2(168.75)= 1462.5

Por lo tanto la respuesta de la suma de varianzas es 1462.5

15. Se ha medido el contenido de oxigeno, Y, en miligramos/litro, del lago Titicaca, a


una profundidad de X metros, obteniendo los siguientes datos.

X 15 20 30 40 50 60 70
Y 6.5 5.6 5.4 5.0 4.6 1.4 0.1

Se pide:

a) Obtener una recta de regresión de Y en X.

b) Hallar el coeficiente de correlación.

c) Para una profundidad comprendida entre 75 y 80 metros, ¿qué contenido de


oxigeno se podría predecir?

Solución:

X Y X2 Y2 XY
15 6.5 225 42.25 97.5
20 5.6 400 31.36 112
30 5.4 900 29.16 162
40 5.0 1600 25 200
50 4.6 2500 21.16 230
60 1.4 3600 1.96 84
70 0.1 4900 0.01 7
285 28.6 14125 150.9 892.5

(285)2
a) *𝑆𝐶𝑋 = 14125 − 7

SCX= 14125 − 11603.571

SCX= 2521.429

(28.6)2
∗ 𝑆𝐶𝑌 = 150.9 −
7
SCY= 150.9 – 116.85143
SCY= 34.04857

(285)(28.6)
∗ 𝑆𝑃𝑋𝑌 = 892.5 −
7
SPXY = 892.5 - 1164.4286

SPXY = -271.9286
−271.9286
*𝑏 = 2521.429

b = -0.107

* a = Ȳ - bẌ

a = 4.086 – (-0.107) (40.714)

a = 8.578

ECUACION DE REGRECION:

Rpta: Y = 8.578 – O.107X

−271.9286
b)∗ Ƿ =
√(2521.429)(34.04857)

Rpta: Ƿ = - 0.88

c) * Y= 8.578 – 0.107(75)

Y = 0.6

* Y = 8.578 – 0.107(80)

Y = 0.02

Rpta: Está comprendido entre 0.6 y 0.02

17. Con el objeto de estudiar la relación entre las variables consumo de energía
eléctrica (X) y volumen de producción en las empresas industriales (Y), se tomó una
muestra de 40 empresas, para los cuales se calcularon los siguientes valores:

∑𝒙𝒊 = 𝟐𝟏. 𝟑𝟒 , ∑𝒚𝒊 = 𝟑𝟎. 𝟕𝟐 , ∑𝒙𝟐𝒊 = 𝟐𝟐. 𝟏𝟔

∑𝒚𝟐𝒊 = 𝟗𝟒. 𝟗𝟔 , ∑𝒙𝒊 𝒚𝒊 = 𝟑𝟐. 𝟏𝟑

Se pide:
a) Determinar las rectas de regresión Y en X y X en Y
b) Determinar el coeficiente de correlación rectilínea.
SOLUCION:

Primero resolvemos las medias y las varianzas de Y y X, tenemos:

∑𝑥𝑖 21.34
𝑋̅ = = = 0.534
𝑛 40

∑𝑦𝑖 30.72
𝑌̅ = = = 0.768
𝑛 40

∑𝑥𝐼2 ∑𝑥𝑖 2 22.16 21.34 2


𝑆𝑥2 = −( ) = −( ) = 0.269
𝑛 𝑛 40 40

∑𝑦𝐼2 ∑𝑦𝑖 2 94.96 30.72 2


𝑠𝑦2 = −( ) = −( ) = 1.784
𝑛 𝑛 40 40

∑𝑥𝑖 𝑦𝑖 32.13
𝑐𝑜𝑣(𝑥𝑦) = − 𝑋̅𝑌̅ = − (0.534)(0.768) = 0.393
𝑛 40

Ahora hallaremos "α" 𝑦 "𝛽"

𝑐𝑜𝑣(𝑥𝑦) 0.393
β= = 0.269 = 1.461
𝑆𝑥2

∑𝑦 ∑𝑥 30.72 21.34
α=𝑌̅ − 𝛽𝑋̅ = 𝑛 𝑖 − (1.461)( 𝑛 𝑖 )= 40 – (1.461) ( 40 )=-0.0114

SOLUCION(a)

Entonces la recta de regresión es:

𝑌̂ = −0.0114 + 1.461𝑋
SOLUCION (b)

Ahora calculamos el coeficiente de correlación, se tiene:

𝒄𝒐𝒗(𝒙𝒚) 𝟎. 𝟑𝟗𝟑
𝒓= = = 𝟎. 𝟓𝟔𝟕
√𝑺𝒙 √𝑺𝒚 √𝟎. 𝟐𝟔𝟗√𝟏. 𝟕𝟖𝟒

19, Se quiere verificar la relación entre el tiempo de reacción y el número de


alternativas presentadas a individuos acostumbrados a tomar decisiones se le planeo
un experimento donde al participante se le pide clasificar objetos según un criterio
previamente discutido. Participaron en el experimento 15 ejecutivos divididos
aleatoriamente en grupos de 5.

Numero de objetos 2 3 4
T. de reacción 1,2,3,3,4 2,3,4,4,5 4,5,5,6,7

2 3 4 ni Xi Wi Wini Wi2ni Wiwjnij


1 1(3) 1 1 -3 -3 9 3
2 1(2) 1(0) 2 2 -2 -4 8 2
3 2(2) 1(0) 3 3 -1 -3 3 2
4 1(0) 2(0) 1(0) 4 4 0 0 0 0
5 1(0) 2(2) 3 5 1 3 3 2
6 1(2) 1 6 2 2 4 2
7 1(3) 1 7 3 3 9 3
nj 5 5 5 15 28 -2 36 14
Yj 2 3 4 9
Wj -1 0 1
WJnj -5 0 5 0
W2jnj 5 0 5 10
7 0 7 14

Hallando las varianzas marginales

36 −2 2
𝑆𝑥2 2
= 1 ( − ( ) ) = 2.382
15 15

10
𝑆𝑦2 = 12 ( −) = 0.66
15
2
14 −2 0
𝑆𝑥𝑦 = 12 ( − ( ) ( ) ) = 0.93
15 15 11

Si observamos la posición de los puntos de este diagrama de dispersión se evidencia


que hay una dependencia lineal. A medida que aumenta el número de objetos
aumenta también el tiempo de reacción.

CORRELACION:

0.93
𝑟= = 0.74
(1,54)(0.81)
21) En un estudio de la relación existente entre x e y (que se cree que carece de
errores), se obtuvieron los siguientes datos:

̅)𝟐 = 𝟏𝟒𝟒; ∑(𝒙𝒊 − 𝒙


𝒏 = 𝟏𝟖; ∑(𝒚𝒊 − 𝒙 ̅)(𝒚𝒊 − 𝒚
̅) = 𝟐𝟖𝟖;

̅ = 𝟓, 𝜶 = 𝟏𝟎
𝒙

Obtenga la ecuación de la línea de regresión de y en x

Solución:

Nos pide hallar la ecuación y =  + b𝑥̅

Puesto que ya nos da los valores de  y 𝑥̅ debemos hallar el valor de b.

Sabemos que:
𝜎𝑥𝑦
𝑏=
𝜎𝑥2

Para hallar 𝜎𝑥𝑦 dividimos ∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) entre n entonces:

∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) 288


= = 16
𝑛 13

Igualmente para hallar 𝜎𝑥2 hacemos:

∑(𝑥𝑖 − 𝑥̅ )2 144
= =8
𝑛 18

Reemplazando en los valores de b tenemos:

𝜎𝑥𝑦 16
𝑏= = =2
𝜎𝑥2 8

Entonces la ecuación de la línea de regresión de y en x es:

𝑦𝑖 = 𝛼 + 𝑏𝑥̅ i) 𝛼 = 𝑦̅ − 𝑏𝑥̅

𝑦𝑖 = 10 + 2𝑥𝑖 reemplazamos
10=𝑦̅ − 2(5)

̅=0
𝒚

23. Se ha tomado un grupo de matrimonios (con hijos) y se les ha preguntado a que


edad tuvieron su primer hijo. La información se da en la siguiente tabla (X=edad del
marido, Y=edad de la mujer).

[ 15 ,17> [ 17 ,19> [ 19,21> [ 21 ,23> [ 23 ,27>


[ 16 ,18> 5 2
[ 18 ,20> 3 9 1
[ 20 ,25> 4 6 10
[ 25 ,28> 5 7
[ 28 ,32> 3 4

Se pide:

a) ¿Cuántos matrimonios fueron encuestados?


b) Hallar las distribuciones marginales.
c) Hallar la distribución condicionada de X dado Y=22
d) Hallar la recta de regresión de X sobre Y.
e) Hallar la recta de regresión de Y sobre X.

Solución:

Y [ 15 [ 17 [ [ 21 [ 23 Total Xi Wi Wini Wi2ni WiWjnij


X ,17> ,19> 19,21> ,23> ,27> Ni.
[ 16 5 (20) 2 (4) 7 17 -2 -14 28 (24)
,18>
[ 18 3 (3) 9(0) 1(-1) 13 19 -1 -13 13 (2)
,20>
[ 20 4(0) 6(0) 10(0) 20 22.5 0 0 0 (0)
,25>
[ 25 5(5) 7(14) 12 26.5 1 12 12 (19)
,28>
[ 28 3(6) 4(8) 7 30 2 14 28 (14)
,32>
Total 5 5 13 15 21 59 -1 81 (59)
n.j
Yi 16 18 20 22 24
Wj -2 -1 0 1 2
Wjnj -10 -5 0 15 42 42
Wj2nj 20 5 0 15 84 114
(20) (7) (0) (10) (22) (59)

a) Fueron encuestados 59 matrimonios


b) Medidas y varianzas marginales
X=22.46 Y=21.42

σx2=5.49 σy2=5.70

Desviación típica marginal

σx= 2.34 σy= 2.38

Covarianza

σxy=4.04

b=4.04/5.49=0.73

Correlación

r=4.04/(2.34)(2.38)=0.72

Coeficiente de determinación

r2=0.52

Ecuación de la regresión lineal

Y=a+bX

Hallando el valor de a: (coeficiente de regresión)

21.42 =a+ (0.73) 22.46 entonces a=5.0242 la ecuación de la recta de regresión


seria:

Y=5.02 +0.73X

c) Hallar la distribución condicionada de X dado Y=22 entonces reemplazando


en la ecuación tenemos:
22=5.0242 +0.73X
16.97/0.73=X
X=23.24

d) Y e) hallando:

Y=5.02 +0.73X X=5.02 +0.73Y


25.en el ajuste de una recta de regresión a una distribución bidimensionales sabe
que
𝑿̅ = 𝟏𝟐 ,
𝒀̅ = 𝟏𝟏

Y r=0

¿Cuáles son las rectas de regresión? .Represéntese.

Solución:

27.Calcule las medidas, varianza y covarianza de las muestras originales.

Solución: 𝑀(𝐶𝑋𝑖 ) = 𝑀(𝑋𝑖 )𝐶  Despejando 𝑌 de la


ecuación :
 Despejando 𝑋 de la 𝑋̅ = 𝑀(𝐴 )20 + 15
ecuación : 𝑌 − 16
𝐵=
𝑋̅ = 𝑀(𝐴 )20 + 15 15
𝑋 − 15
𝐴=
20 𝑋̅ = (13)20 + 15 𝑌 = (15𝐵 + 16)

𝑋 = (20𝐴 + 15) 𝑋̅ = 275 𝑌̅ = 𝑀(15𝐵 + 16)

𝑋̅ = 𝑀(20𝐴 + 15) 𝑀(𝑋𝑖 ) + 𝐶 = 𝑀(𝑋𝑖 + 𝐶)

𝑀(𝑋𝑖 ) + 𝐶 = 𝑀(𝑋𝑖 + 𝐶) 𝑌̅ = (15𝐵 + 16)

𝑋̅ = (20𝐴 + 15) 𝑌̅ = 𝑀(15𝐵 + 16)

𝑋̅ = 𝑀(20𝐴 + 15) 𝑌̅ = 𝑀(15𝐵 ) + 16

𝑋̅ = 𝑀(20𝐴 ) + 15
𝑀(𝐶𝑋𝑖 ) = 𝑀(𝑋𝑖 )𝐶  Al tener 𝑋 y 𝑌  Varianza de 𝑌
despejados podemos hallar
𝑌̅ = 𝑀(𝐵)15 + 16 las varianzas respectivas 𝑉(𝑋𝑖 ) = 𝑉(𝑋𝑖 + 𝐶)
 Varianza de 𝑋
𝑌̅ = 𝑀(𝐵 )15 + 16 𝑉(15𝐵 + 16)
𝑉(𝑋𝑖 ) = 𝑉(𝑋𝑖 + 𝐶) = 𝑉(15𝐵)
𝑌̅ = (15)15 + 16

𝑉(20𝐴 + 15) 𝑉(𝐶𝑋𝑖 ) = 𝑉(𝑋𝑖 )𝐶 2


𝑌̅ = 241
= 𝑉(20𝐴)

𝑉(𝐶𝑋𝑖 ) = 𝑉(𝑋𝑖 )𝐶 2 𝑉(15𝐵) = 𝑉(𝐵)152

𝑉(𝐵)152 = (0.25)152

𝑉(20𝐴) = 𝑉(𝐴)202 = 56.25

𝑉(𝐴)202 = (0.64)202

= 256

Haremos la covarianza:

𝑋 = (20𝐴 + 15)

𝑌 = (15𝐵 + 16)

𝑐𝑜𝑣(𝑋 + 𝐶, 𝑌 + 𝐷) = 𝑐𝑜𝑣(𝑋, 𝑌)
𝑐𝑜𝑣(20𝐴 + 15,15𝐵 + 16) = 𝑐𝑜𝑣(20𝐴, 15𝐵)

𝑐𝑜𝑣(𝑋 × 𝐶, 𝑌 × 𝐷) = 𝐶 × 𝐷 × 𝑐𝑜𝑣(𝑋, 𝑌)

𝑐𝑜𝑣(20𝐴, 15𝐵) = 20 × 15𝑐𝑜𝑣(𝐴, 𝐵)

300 × 𝑐𝑜𝑣(𝐴, 𝐵) = 300(−0.016)

𝑐𝑜𝑣(𝑋, 𝑌) = −4.8

29.J
a) Tenemos el centro de gravedad

𝑦 15 11 7 3 -55

𝑥 -5 -4 -3 -2 -1

−5−4−3−2−1
 𝑥̅ = = −3
5

15+11+7+3−55
 𝑦̅ = = −3.8
5

𝑥̅ , 𝑦̅ = (−3, −3.8) …………. centro de gravedad.

 Haremos para 𝑥𝑖

 ∑ 𝑥𝑖 𝑦𝑖 = (−5 × 15) + (−4 × 11) + (−3 × 7) + (−2 × 3) + (−1 × −55)

∑ 𝑥𝑖 𝑦𝑖 = −91

 ∑ 𝑥𝑖 2 = (−5)2 + (−4)2 + (−3)2 + (−2)2 + (−1)2

∑ 𝑥𝑖 2 = 55

𝑥̅ 2 = (−3)2 = 9

𝛼 = 𝑦̅ − 𝛽𝑥̅

−91−(5×−3(−3.8))
 𝛽= 55−(5×9)
𝛽 = −14.8

𝛼 = 𝑦̅ − 𝛽𝑥̅

 𝛼 = (−3.8) − (−14.8)(−3)

𝛼 = −48.2

𝑦̂𝑖 = 𝛼 + 𝛽𝑥̂𝑖

𝑦̂𝑖 = −48.2 + (−14.8)𝑥̂𝑖 ……………………….. Recta de regresión.

 Haremos para 𝑦𝑖

 ∑ 𝑥𝑖 𝑦𝑖 = (−5 × 15) + (−4 × 11) + (−3 × 7) + (−2 × 3) + (−1 × −55)

∑ 𝑥𝑖 𝑦𝑖 = −91

 ∑ 𝑦𝑖 2 = (15)2 + (11)2 + (7)2 + (3)2 + (−55)2

∑ 𝑦𝑖 2 = 3429

𝑦̅ 2 = (−3.8)2 = 14.44

𝛼 = 𝑦̅ − 𝛽𝑥̅

−91−(5×−3(−3.8))
 𝛽= 55−(5×14.44)

𝛽 = 0.044

𝛼 = 𝑥̅ − 𝛽𝑦̅

 𝛼 = (−3) − (0.044)(−3.8)

𝛼 = −3.1672 ~ − 3.167

𝑥
̂𝑖 = 𝛼 + 𝛽𝑦̂𝑖

𝑥
̂𝑖 = −3.167 + (0.044)𝑦̂𝑖 ……………………….. Recta de regresión.

b) Completando las coordenadas.

Por otro lado tenemos:

𝑥
̂𝑖 = −3.167 + (0.044)𝑦̂𝑖

Con𝑦̂𝑖 = −5

̂𝑖 = −3.167 + (0.044) − 5
𝑥

𝑥
̂𝑖 = −2.947

Completando la coordenada tendremos:


(−2.947, −5)

También tenemos:

𝑥
̂𝑖 = −3.167 + (0.044)𝑦̂𝑖

Con𝑦̂𝑖 = 11

𝑥
̂𝑖 = −3.167 + (0.044)11

𝑥
̂𝑖 = −3.651

Completando la coordenada tendremos:

(−3.651,11)

La respuesta a la pregunta es si aumenta pues la relación entre las variables es inversamente proporcional.

c) Calcule la distribución condicionada de la variable𝑥 dado 𝑦 = 11 la media y desviación típica.


 Dado que tenemos una sola coordenada con 𝑦 = 11 el acierto al tomar ese dato será de 1 es decir
perfecto y sin error.
 Dado que la coordenada que acompaña a 𝑦 = 11 y es𝑥 = −4 se tiene:

𝑥 −4
𝑦 1
1
𝑥̅ = ∑ 𝑥 × ℎ𝑥⁄𝑦=11

𝑥̅ = (−4)1

𝑥̅ = −4

La desviación típica será 0 pues la desviación de una constante 𝑥 = −4 es cero.

31.- Se ha observado que para predecir la demanda (consumo) de combustible para calefacción, resulta
ser más preciso el pronóstico a largo plazo de la temperatura y el uso de la relación temperatura
consumo que al tratar de pronosticar directamente demanda analizando las ventas de combustible. Un
distribuidor de combustible mantiene un registro de ventas mensuales de combustible y de temperatura
máxima en esos meses. A continuación aparecen los datos de nueve de estos meses seleccionados al
azar.

Volumen de Ventas(Y) 26.2 17.4 7.8 12.3 35.9 42.1 26.4 19.0 10.1
Promedios de
temperatura máxima
(X) 46.5 54.6 65.2 62.3 41.9 38.6 43.7 52.0 59.8

a) ¿presentan los datos suficiente evidencia de las ventas de combustible estas relacionadas
linealmente con la temperatura?
b) Encuentre la recta de mínimos cuadrados para estos datos.
c) Grafica los puntos y la recta como una verificación de sus cálculos.

SOLUCION

TOTAL
Promedios de
temperatura
máxima (X) 46.5 54.6 65.2 62.3 41.9 38.6 43.7 52 59.8 464.6
Volumen de
Ventas(Y) 26.2 17.4 7.8 12.3 35.9 42.1 26.4 19 10.1 197.2

𝑋2 2162.25 2981.16 4251.04 3881.29 1755.61 1489.96 1909.69 2704 3576.04 24711.04

𝑌2 686.44 302.76 60.84 151.29 1288.81 1772.41 696.96 361 102.01 5422.52

XY 1218.3 950.04 508.56 766.29 1504.21 1625.06 1153.68 988 603.98 9318.12

a)

GRAFICA volumen de ventas segun


temperatura
45

40

35

30

25

20

15

10

0
0 10 20 30 40 50 60 70

Pues representando en la gráfica de nota que la venta de combustible está relacionado linealmente con la
temperatura (en Fahrenheit), pues mientras más venta de combustible para calefacción la temperatura
disminuye y al contrario sucede pues mientras menos combustible se venda, la temperatura se aumenta.
Puesto que la relación es de -0.9627 y este resultado se acerca a -1 y esto quiere decir que es inversa y
perfecta.

b)
(464.6)2 (197.2)2
𝑆𝐶𝑥 = 24711.04 − 𝑆𝐶𝑦 = 5422.52 −
9 9
𝑆𝐶𝑥 = 727.356𝑆𝐶𝑦 = 1101.649

(464.6)(197.2)
𝑆𝑃xy = 9318.12 −
9
𝑆𝑃𝑥𝑦 = −861.782
 Hallando el coeficiente de Correlación:
𝑆𝑃𝑥𝑦
𝑟=
√(𝑆𝐶𝑥)(𝑆𝐶𝑦)
−861.782
𝑟= = −0.9627
√(464.6)(197.2)
Lo que quiere decir que la venta de combustible y la diminución de la temperatura existe una
correlación baja y directa.

 Hallando el coeficiente de regresión:


𝑆𝑃𝑥𝑦
𝑏=
𝑆𝐶𝑥
−861.782
𝑏= = −1.1848~ − 1.185
727.356
Nos indica que por cada venta de combustible, la temperatura máxima (en grados Fahrenheit)
disminuye en -1.185 grados.

 Hallando el coeficiente de determinación:


𝑟 2 = (𝑟)2
𝑟 2 = (−0.9627)2 = 0.9268

Esto nos indica que el 92.27% de la variabilidad de ventas de combustibles es causada por la
variabilidad de promedio de la temperatura máxima y el 7.73% restante se debe a otros factores.

𝑎 = 𝑌̅ − 𝑏𝑋̅
197.2 464.6
𝑎=( ) − (−1.1848) ( ) = 83.073
9 9

𝑌̂ = 𝑎 + 𝑏𝑋
𝑌̂ = 83.073 − 1.185𝑋

c)

También podría gustarte