Estadistica
Estadistica
Estadistica
HUAMANGA”
ESCUELA DE FORMACION PROFESIONAL CIENCIAS FISICO
MATEMATICAS
INTEGRANTES :
e) la proporción de individuos que reciben hasta 10 salarios mínimos entre los solteros
es de 0.3
1) construye la distribución conjunta de las variables estado civil y faja salarial y las
respectivas distribuciones marginales.
Solución
5.- he aquí los gastos de publicidad (como porcentajes de gastos totales) y los
beneficios de operación netos (como porcentaje de ventas) en una muestra de 10
pequeñas joyerías.
Gastos de Publicidad
(X) 1.2 0.7 1.5 1.8 0.5 3.4 1.0 3.0 2.8 2.5
Beneficios (Y) 2.7 2.4 2.7 3.3 1.1 5.8 2.2 4.2 4.4 3.8
TOTAL
Gastos de Publicidad
(X) 1.2 0.7 1.5 1.8 0.5 3.4 1 3 2.8 2.5 18.4
Beneficios (Y) 2.7 2.4 2.7 3.3 1.1 5.8 2.2 4.2 4.4 3.8 32.6
𝑋2 1.44 0.49 2.25 3.24 0.25 11.56 1 9 7.84 6.25 43.32
𝑌2 7.29 5.76 7.29 10.89 1.21 33.64 4.84 17.64 19.36 14.44 122.36
XY 3.24 1.68 4.05 5.94 0.55 19.72 2.2 12.6 12.32 9.5 71.8
a)
0
0 0.5 1 1.5 2 2.5 3 3.5 4
b)
(18.4)2 (32.6)2
𝑆𝐶𝑥 = 43.32 − 𝑆𝐶𝑦 = 122.36 −
10 10
𝑆𝐶𝑥 = 9.464𝑆𝐶𝑦 = 16.084
(18.4)(32.6)
𝑆𝑃xy = 71.8 −
10
𝑆𝑃𝑥𝑦 = 11.816
Hallando el coeficiente de Correlación:
𝑆𝑃𝑥𝑦
𝑟=
√(𝑆𝐶𝑥)(𝑆𝐶𝑦)
11.816
𝑟= = 0.958
√(9.46)(16.08)
Lo que quiere decir que los gastos de publicidad y el beneficio existe una
correlación alta y directa.
𝑎 = 𝑌̅ − 𝑏𝑋̅
32.6 18.4
𝑎=( ) − 1.249 ( ) = 0.96
10 10
𝑌̂ = 𝑎 + 𝑏𝑋
𝑌̂ = 0.96 + 1.249𝑋
c)
7. Se extrae una muestra aleatoria de 200 habitantes de una ciudad para analizar la
actitud frente a un cierto proyecto de alcaldía. El resultado fue lo siguiente.
Local de Residencia
Opinión Urbano Sub-urbano Rural Total
A favor 30 35 35 100
En contra 60 25 15 100
Total 90 60 50 200
a) Calcule las proporciones en relación al total de las columnas.
Solución
Así podemos decir que (f11 /f.1) * 100 = (30/90)*100 = 33.3% de los habitantes
están a favor frente al proyecto de alcaldía con residencia de urbano.
Solución
Local de Residencia
Opinión Urbano Sub-urbano Rural Total
A favor 30 35 35 100
En contra 60 25 15 100
Total 90 60 50 200
Tenemos:
Este resultado nos indica que no hay independencia entre las dos variables,
X2 = 5 + 0.83 + 4 + 5 + 0.83 + 4
X2 = 19.66
C = √X2 / (X2 + n)
C = 0.2991687778 ∼ 0.299
C =0.299
Entonces 0.299 (29.9%) indica un alto grado de dependencia entre las dos
variables.
9. considere las tasas de interés y el número de nuevas construcciones. Las tasas de
interés(x) proporcionan un indicador clave para predecir el número de
construcciones (y) si las tasas bajan, el número de construcciones aumenta y si
suben, el número de construcciones disminuye. Suponga que los datos de la tabla
representan a las tasas de interés en primeras hipotecas y el registro de nuevas
construcciones iniciadas en los 8 años referidos.
SOLUCION
𝑋2 𝑌2 XY
520,25 33143750 115464
𝑋̅ =63.5/8=7.9375
̅̅̅
𝑌 =15426/8= 1928.2500; n=8
∑ 𝑥𝑦
COV(X, Y) = − ̅̅̅
𝑌 𝑋̅ = 115464/8 − (7.9375)(1928.2500) = −872.484375
𝑛
∑ 𝑥2 520.25
𝑉𝑥 = − 𝑋̅ 2 = − (7.94)2=65.031-63.044=2.02734
𝑛 8
𝑐𝑜𝑣(𝑥, 𝑦) −872.484
𝑏= = = −430.35
𝑉𝑥 2.02734
𝑎 = 𝑌̅ − 𝑏𝑋̅=1928.2500-(-430.35)(7.9375)=5344.55
Por tanto la recta de mínimos cuadrados queda:
𝑆𝑃𝑋𝑌
𝑟=
√(𝑆𝐶𝑋)(𝑆𝐶𝑌)
∑𝑋 ∑𝑌 (63.5)(15426)
𝑆𝑃𝑋𝑌 = ∑ 𝑋𝑌 − = 115464 − = −6979.875
𝑛 8
(∑ 𝑋)2 (63.5)2
𝑆𝐶𝑋 = ∑ 𝑋 2 − = 520.25 − = 16.21875
𝑛 8
(∑ 𝑦)2 (15426)2
𝑆𝐶𝑦 = ∑ 𝑦 2 − = 33143750 − = 3398565.5
𝑛 8
𝑆𝑃𝑋𝑌 6979.875 6979.875
𝑟= =− =− = −0.94
√(𝑆𝐶𝑋)(𝑆𝐶𝑌) √(16.21875)(3398565.5) 7424.317086
c) si los indicadores económicos indican que la tasa de interés para primeras hipotecas
será del 8.5% el próximo año, pronostique el número de licencias de construcción que
se otorgaran durante el año entrante.
𝑦 = 5344.2 − 430.4𝑥
11. una compañía x de dedetización afirma que el proceso que ella utiliza garantiza que
el efecto sea más prolongado que aquella obtenida por sus competidores. Una
muestra de varios ambientes dedetizados fue escogida y se anotó la duración del
efecto de dedetizacion. Los resultados se dan en la tabla siguiente:
SOLUCION:
Para obtener una evidencia, bastara hallar los promedios de cada uno de ellos:
(64×2)+(120×6)+(16×10)
̅x = = 5.04
200
(104×2)+(175×6)+(21×10)
̅y= = 4.89
300
(27×2)+(48×6)+(5×10)
̅z= = 4.9
80
𝟑
𝑺𝑿 = 𝟏𝟓 , 𝒓 = ,
𝟖
̅ = 𝟏𝟓𝟎 𝒆 𝒀
𝑪. 𝑽𝒀 = 𝒄𝒐𝒆𝒇𝒊𝒄𝒊𝒆𝒏𝒕𝒆 𝒅𝒆 𝒗𝒂𝒓𝒊𝒂𝒄𝒊𝒐𝒏 = 𝟎. 𝟏𝟓, 𝑿 ̅
= 𝟐𝟎𝟎. 𝑯𝒂𝒍𝒍𝒂𝒓 𝒍𝒂 𝒗𝒂𝒓𝒊𝒂𝒏𝒛𝒂
𝑿+𝒀
𝑺𝑶𝑳𝑼𝑪𝑰𝑶𝑵
𝑆𝑌 𝑆𝑌
𝑖) 𝑐𝑜𝑚𝑜 𝑠𝑎𝑏𝑒𝑚𝑜𝑠 𝐶𝑉𝑌 = , 𝑟𝑒𝑒𝑚𝑝𝑙𝑎𝑧𝑎𝑛𝑑𝑜 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑟𝑒𝑠𝑝𝑒𝑐𝑡𝑖𝑣𝑜𝑠 𝑡𝑒𝑛𝑒𝑚𝑜𝑠
𝑌̅ 200
= 0.15 ↔ 𝑆𝑌 = 30
𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑑𝑒 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑜𝑏𝑡𝑒𝑛𝑒𝑚𝑜𝑠 𝑣𝑎𝑟(𝑋) = 𝑆𝑋2 = 225 𝑦 𝑣𝑎𝑟(𝑌) = 𝑆𝑌2 = 900.
𝑆𝑋𝑌 3 ∗ 15 ∗ 30
𝑟= 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑐𝑜𝑣 (𝑋, 𝑌) = 𝑆𝑋𝑌 = = 168.75
𝑆𝑋 𝑆𝑌 8
X 15 20 30 40 50 60 70
Y 6.5 5.6 5.4 5.0 4.6 1.4 0.1
Se pide:
Solución:
X Y X2 Y2 XY
15 6.5 225 42.25 97.5
20 5.6 400 31.36 112
30 5.4 900 29.16 162
40 5.0 1600 25 200
50 4.6 2500 21.16 230
60 1.4 3600 1.96 84
70 0.1 4900 0.01 7
285 28.6 14125 150.9 892.5
(285)2
a) *𝑆𝐶𝑋 = 14125 − 7
SCX= 2521.429
(28.6)2
∗ 𝑆𝐶𝑌 = 150.9 −
7
SCY= 150.9 – 116.85143
SCY= 34.04857
(285)(28.6)
∗ 𝑆𝑃𝑋𝑌 = 892.5 −
7
SPXY = 892.5 - 1164.4286
SPXY = -271.9286
−271.9286
*𝑏 = 2521.429
b = -0.107
* a = Ȳ - bẌ
a = 8.578
ECUACION DE REGRECION:
−271.9286
b)∗ Ƿ =
√(2521.429)(34.04857)
Rpta: Ƿ = - 0.88
c) * Y= 8.578 – 0.107(75)
Y = 0.6
* Y = 8.578 – 0.107(80)
Y = 0.02
17. Con el objeto de estudiar la relación entre las variables consumo de energía
eléctrica (X) y volumen de producción en las empresas industriales (Y), se tomó una
muestra de 40 empresas, para los cuales se calcularon los siguientes valores:
Se pide:
a) Determinar las rectas de regresión Y en X y X en Y
b) Determinar el coeficiente de correlación rectilínea.
SOLUCION:
∑𝑥𝑖 21.34
𝑋̅ = = = 0.534
𝑛 40
∑𝑦𝑖 30.72
𝑌̅ = = = 0.768
𝑛 40
∑𝑥𝑖 𝑦𝑖 32.13
𝑐𝑜𝑣(𝑥𝑦) = − 𝑋̅𝑌̅ = − (0.534)(0.768) = 0.393
𝑛 40
𝑐𝑜𝑣(𝑥𝑦) 0.393
β= = 0.269 = 1.461
𝑆𝑥2
∑𝑦 ∑𝑥 30.72 21.34
α=𝑌̅ − 𝛽𝑋̅ = 𝑛 𝑖 − (1.461)( 𝑛 𝑖 )= 40 – (1.461) ( 40 )=-0.0114
SOLUCION(a)
𝑌̂ = −0.0114 + 1.461𝑋
SOLUCION (b)
𝒄𝒐𝒗(𝒙𝒚) 𝟎. 𝟑𝟗𝟑
𝒓= = = 𝟎. 𝟓𝟔𝟕
√𝑺𝒙 √𝑺𝒚 √𝟎. 𝟐𝟔𝟗√𝟏. 𝟕𝟖𝟒
Numero de objetos 2 3 4
T. de reacción 1,2,3,3,4 2,3,4,4,5 4,5,5,6,7
36 −2 2
𝑆𝑥2 2
= 1 ( − ( ) ) = 2.382
15 15
10
𝑆𝑦2 = 12 ( −) = 0.66
15
2
14 −2 0
𝑆𝑥𝑦 = 12 ( − ( ) ( ) ) = 0.93
15 15 11
CORRELACION:
0.93
𝑟= = 0.74
(1,54)(0.81)
21) En un estudio de la relación existente entre x e y (que se cree que carece de
errores), se obtuvieron los siguientes datos:
̅ = 𝟓, 𝜶 = 𝟏𝟎
𝒙
Solución:
Sabemos que:
𝜎𝑥𝑦
𝑏=
𝜎𝑥2
∑(𝑥𝑖 − 𝑥̅ )2 144
= =8
𝑛 18
𝜎𝑥𝑦 16
𝑏= = =2
𝜎𝑥2 8
𝑦𝑖 = 𝛼 + 𝑏𝑥̅ i) 𝛼 = 𝑦̅ − 𝑏𝑥̅
𝑦𝑖 = 10 + 2𝑥𝑖 reemplazamos
10=𝑦̅ − 2(5)
̅=0
𝒚
Se pide:
Solución:
σx2=5.49 σy2=5.70
Covarianza
σxy=4.04
b=4.04/5.49=0.73
Correlación
r=4.04/(2.34)(2.38)=0.72
Coeficiente de determinación
r2=0.52
Y=a+bX
Y=5.02 +0.73X
d) Y e) hallando:
Y r=0
Solución:
𝑋̅ = 𝑀(20𝐴 ) + 15
𝑀(𝐶𝑋𝑖 ) = 𝑀(𝑋𝑖 )𝐶 Al tener 𝑋 y 𝑌 Varianza de 𝑌
despejados podemos hallar
𝑌̅ = 𝑀(𝐵)15 + 16 las varianzas respectivas 𝑉(𝑋𝑖 ) = 𝑉(𝑋𝑖 + 𝐶)
Varianza de 𝑋
𝑌̅ = 𝑀(𝐵 )15 + 16 𝑉(15𝐵 + 16)
𝑉(𝑋𝑖 ) = 𝑉(𝑋𝑖 + 𝐶) = 𝑉(15𝐵)
𝑌̅ = (15)15 + 16
𝑉(𝐵)152 = (0.25)152
𝑉(𝐴)202 = (0.64)202
= 256
Haremos la covarianza:
𝑋 = (20𝐴 + 15)
𝑌 = (15𝐵 + 16)
𝑐𝑜𝑣(𝑋 + 𝐶, 𝑌 + 𝐷) = 𝑐𝑜𝑣(𝑋, 𝑌)
𝑐𝑜𝑣(20𝐴 + 15,15𝐵 + 16) = 𝑐𝑜𝑣(20𝐴, 15𝐵)
𝑐𝑜𝑣(𝑋 × 𝐶, 𝑌 × 𝐷) = 𝐶 × 𝐷 × 𝑐𝑜𝑣(𝑋, 𝑌)
𝑐𝑜𝑣(𝑋, 𝑌) = −4.8
29.J
a) Tenemos el centro de gravedad
𝑦 15 11 7 3 -55
𝑥 -5 -4 -3 -2 -1
−5−4−3−2−1
𝑥̅ = = −3
5
15+11+7+3−55
𝑦̅ = = −3.8
5
Haremos para 𝑥𝑖
∑ 𝑥𝑖 𝑦𝑖 = −91
∑ 𝑥𝑖 2 = 55
𝑥̅ 2 = (−3)2 = 9
𝛼 = 𝑦̅ − 𝛽𝑥̅
−91−(5×−3(−3.8))
𝛽= 55−(5×9)
𝛽 = −14.8
𝛼 = 𝑦̅ − 𝛽𝑥̅
𝛼 = (−3.8) − (−14.8)(−3)
𝛼 = −48.2
𝑦̂𝑖 = 𝛼 + 𝛽𝑥̂𝑖
Haremos para 𝑦𝑖
∑ 𝑥𝑖 𝑦𝑖 = −91
∑ 𝑦𝑖 2 = 3429
𝑦̅ 2 = (−3.8)2 = 14.44
𝛼 = 𝑦̅ − 𝛽𝑥̅
−91−(5×−3(−3.8))
𝛽= 55−(5×14.44)
𝛽 = 0.044
𝛼 = 𝑥̅ − 𝛽𝑦̅
𝛼 = (−3) − (0.044)(−3.8)
𝛼 = −3.1672 ~ − 3.167
𝑥
̂𝑖 = 𝛼 + 𝛽𝑦̂𝑖
𝑥
̂𝑖 = −3.167 + (0.044)𝑦̂𝑖 ……………………….. Recta de regresión.
𝑥
̂𝑖 = −3.167 + (0.044)𝑦̂𝑖
Con𝑦̂𝑖 = −5
̂𝑖 = −3.167 + (0.044) − 5
𝑥
𝑥
̂𝑖 = −2.947
También tenemos:
𝑥
̂𝑖 = −3.167 + (0.044)𝑦̂𝑖
Con𝑦̂𝑖 = 11
𝑥
̂𝑖 = −3.167 + (0.044)11
𝑥
̂𝑖 = −3.651
(−3.651,11)
La respuesta a la pregunta es si aumenta pues la relación entre las variables es inversamente proporcional.
𝑥 −4
𝑦 1
1
𝑥̅ = ∑ 𝑥 × ℎ𝑥⁄𝑦=11
𝑥̅ = (−4)1
𝑥̅ = −4
31.- Se ha observado que para predecir la demanda (consumo) de combustible para calefacción, resulta
ser más preciso el pronóstico a largo plazo de la temperatura y el uso de la relación temperatura
consumo que al tratar de pronosticar directamente demanda analizando las ventas de combustible. Un
distribuidor de combustible mantiene un registro de ventas mensuales de combustible y de temperatura
máxima en esos meses. A continuación aparecen los datos de nueve de estos meses seleccionados al
azar.
Volumen de Ventas(Y) 26.2 17.4 7.8 12.3 35.9 42.1 26.4 19.0 10.1
Promedios de
temperatura máxima
(X) 46.5 54.6 65.2 62.3 41.9 38.6 43.7 52.0 59.8
a) ¿presentan los datos suficiente evidencia de las ventas de combustible estas relacionadas
linealmente con la temperatura?
b) Encuentre la recta de mínimos cuadrados para estos datos.
c) Grafica los puntos y la recta como una verificación de sus cálculos.
SOLUCION
TOTAL
Promedios de
temperatura
máxima (X) 46.5 54.6 65.2 62.3 41.9 38.6 43.7 52 59.8 464.6
Volumen de
Ventas(Y) 26.2 17.4 7.8 12.3 35.9 42.1 26.4 19 10.1 197.2
𝑋2 2162.25 2981.16 4251.04 3881.29 1755.61 1489.96 1909.69 2704 3576.04 24711.04
𝑌2 686.44 302.76 60.84 151.29 1288.81 1772.41 696.96 361 102.01 5422.52
XY 1218.3 950.04 508.56 766.29 1504.21 1625.06 1153.68 988 603.98 9318.12
a)
40
35
30
25
20
15
10
0
0 10 20 30 40 50 60 70
Pues representando en la gráfica de nota que la venta de combustible está relacionado linealmente con la
temperatura (en Fahrenheit), pues mientras más venta de combustible para calefacción la temperatura
disminuye y al contrario sucede pues mientras menos combustible se venda, la temperatura se aumenta.
Puesto que la relación es de -0.9627 y este resultado se acerca a -1 y esto quiere decir que es inversa y
perfecta.
b)
(464.6)2 (197.2)2
𝑆𝐶𝑥 = 24711.04 − 𝑆𝐶𝑦 = 5422.52 −
9 9
𝑆𝐶𝑥 = 727.356𝑆𝐶𝑦 = 1101.649
(464.6)(197.2)
𝑆𝑃xy = 9318.12 −
9
𝑆𝑃𝑥𝑦 = −861.782
Hallando el coeficiente de Correlación:
𝑆𝑃𝑥𝑦
𝑟=
√(𝑆𝐶𝑥)(𝑆𝐶𝑦)
−861.782
𝑟= = −0.9627
√(464.6)(197.2)
Lo que quiere decir que la venta de combustible y la diminución de la temperatura existe una
correlación baja y directa.
Esto nos indica que el 92.27% de la variabilidad de ventas de combustibles es causada por la
variabilidad de promedio de la temperatura máxima y el 7.73% restante se debe a otros factores.
𝑎 = 𝑌̅ − 𝑏𝑋̅
197.2 464.6
𝑎=( ) − (−1.1848) ( ) = 83.073
9 9
𝑌̂ = 𝑎 + 𝑏𝑋
𝑌̂ = 83.073 − 1.185𝑋
c)