Mathematics">
Estadistica
Estadistica
Estadistica
(67$'Ë67,&$'(6&5,37,9$
ESTADÍSTICA DESCRIPTIVA
Nº 1.- Hallar: Media, moda, mediana, 1er cuartil, 6º decil, 52 percentil de la siguiente
distribución:
Xi 1 2 3 4 5 6
ni 2 15 9 6 3 1
Solución
Xi 1 2 3 4 5 6
ni 2 15 9 6 3 1
; Q 2 30 27 24 15 6 104
Ni 2 17 26 32 35 36
MEDIA → ; =
∑ ; Q ✁ ✁
=
104
= 2,89
1 36
MEDIANA → Me = Valor de la variable que deja por debajo suya el 50% de los
valores, valor central de la distribución
1 36
= = 18 Valor de la variable cuya frecuencia acumulada sea 18, en este caso
2 2
Me = 3
36
T
1 → = 9 Valor de la variable que deja el 25% de los valores debajo suya, el valor
4
4
de la variable que ocupa el lugar 9º T =2
1
4
60
6º decil es = al percentil 60 T
60 → 36 = 21,6 El valor de la variable que ocupa el
100
100
lugar 22 T =3
60
100
52
Percentil 52 T
60 → 36 = 18,72 El valor de la variable que ocupa el lugar 19
100
100
T =3
52
100
1
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 2.- De las 283 personas encuestadas en 1993 sobre si se encontraban afiliados a algún
sindicato, 86 contestaron afirmativamente. Con los resultados afirmativos y clasificados
según la edad obtenemos la siguiente tabla:
Solución
; = edad de las personas encuestadas
Media = ; ; =
∑ ; Q ✄ ✄
=
3200
= 37,21
1 86
Mediana = Me
86
Intervalo mediano es el intervalo que contiene a la mediana, como N/2 es = 43
2
el intervalo mediano es aquel que contiene a los valores que ocupan los lugares 43 y
44, es decir el intervalo (25 - 35)
1 1
1 − 1 86 − 0
−1
= / −1 + 2 & = 25 +
2 10 = 34,55
☎
Me = T
1
Q 45
☎ ☎
2 ☎
Moda = Mo
Intervalo modal es aquel que contiene la moda, la moda se encuentra en el intervalo
que presenta mayor densidad de frecuencia, en este caso como los intervalos son de
igual amplitud, el de mayor densidad de frecuencia coincide con el de mayor
frecuencia, es decir el intervalo (25 - 35), y dentro de él consideramos como la
moda, la marca de clase, es decir
Moda = Mo = 30.
1
✟
F ✆
1
1
✟
0 / F
Como todos los ci son iguales la formula
✆
Q Q
✝
1 1
✆ ✆
✟
F F
1 1
✆ ✆
nos queda:
Q 23
+1
0 = / −1 + ✠
F = 25 + 10 = 35 . es la moda
+ Q −1 23 + 0
✡
Q
✠ ✠
✠ +1 ✠
2
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Li-1 - Li ni fi Ni
0 - 10 60 f1 60
10 - 20 n2 0,4 N2
20 - 30 30 f3 170
30 - 100 n4 0,1 N4
100 - 200 n5 f5 200
Solución
N = 200
N2 = N3 - n3 = 170 - 30 = 140
N2 = N2 - n1 = 140 - 60 = 80
Q
4
f4 = n4 = f4 N = (0,1) 200 = 20
1
N4 = N3 + n4 = 170 + 20 = 190
n5 = N5 - N4 = 200 - 190 = 10
Q 60
1
f1 = = = 0,3
1 200
Q 30
3
f3 = = = 0,15
1 200
Q 10
5
f5 = = = 0,05
1 200
Li-1 - Li ni fi Ni
0 - 10 60 0,30 60
10 - 20 80 0,40 140
20 - 30 30 0,15 170
30 - 100 20 0,10 190
100 - 200 10 0,05 200
3
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 4.- Se desea conocer la media de edad de los tres grupos de teatro infantil que funcionan
en un barrio.
Solución
= = = 3,66 años
1 30
30 110
GRUPO B
= = = 4,8 años
1 5
5 24
GRUPO C
= = = 4,8 años
1 15
15 72
1 ;
✏
1 ;
✎
1 ;
✍
;
1 ✏
1 ✎
1 ✍
30 + 5 + 15
204
= = DxRV
50
4
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 5.- Se ha tomado una muestra de 65 personas que leen más de 5 revistas al mes, y se ha
clasificado según el nivel cultural. Calcular la mediana.
Solución
Nivel cultural ni Ni
1 7 7
2 5 12
3 8 20
4 15 35
5 30 65
65
Valor de la variable que deja por debajo suya el 50% de los valores.
Como N/2 es 32,5, será el valor de la variable que ocupa el lugar inmediatamente
siguiente al 32,5; en nuestro caso el nivel 4 "bachiller o similar"
Luego: El 50% de las personas que leen 5 revistas o más tienen un nivel cultural igual o
inferior a "bachiller" y lógicamente el otro 50% tienen un nivel superior a "bachiller".
5
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 6.- Se desea estudiar las alturas de un grupo de 20 alumnos, a través de sus promedios.
Realizar el estudio:1º) Con los datos sin agrupar.
2º)Con los datos agrupados en intervalos de amplitud 10 cm.
Las alturas fueron expresadas en cm.: 162-166-168-170-172-174-180-164-166-168-
168-172-178-182-164-166-168-170-176-188.
Solución
1º Sin agrupar:
Xi ni Ni Xini
162 1 1 162
164 2 3 328
166 3 6 498 N = 20
168 4 10 672
170 2 12 340 N/2 = 10
172 2 14 344
174 1 15 174 ∑ ; Q✑ ✑
176 1 16 176
178 1 17 178
180 1 18 180 0HGLD ;
∑X iQ ✒
3.422
182 1 19 182 N 20
188 1 20 188 FP
20 3422
Moda Mo = Valor de la variable que más veces se repite, en este caso el valor
168 es la moda, que se repite cuatro veces.
Li-1 - Li Xi ni Ni Xini
160 - 170
170 - 180
165
175
10
7
10
17
1650
1225
∑ ; Q ✑ ✑
= 3.430
(67$'Ë67,&$'(6&5,37,9$
1
✖
F
1
✓
1
✖
0 / F
Como todos los ci son iguales la formula
✓
Q Q
✔
1 1
✓ ✓
✖
F F
1 1
✓ ✓
nos queda:
Q 7
1
✘
0 /
1 F 160 10 170 cm. es la moda
✙
1 Q 1 70
✙ ✗ ✙
Q ✙
✘
✙ ✗
Como vemos hay pequeñas diferencias. Lo que se consigue agrupando los datos es
rapidez y facilidad de cálculos a cambio de perder información
7
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
1
3.- 50+150+ 275 = 337,5 tubos
2
U
500 − 200
U U
T = 900 T = 700 + 100 400 = 900
100 100 275
67,5% de 500 = 0,675 (500) = 337,5 tubos. El número mínimo de tubos con una
duración inferior a 900 horas serán 338 tubos.
8
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 8.- Calcular: Media, moda, mediana, 1er y 3er cuartil. Varianza, desviación típica y
coeficiente de variación. De los siguientes datos obtenidos de una investigación en un
establecimiento benéfico que tiene acogidos a 112 personas de diversas edades:
Solución
45 55 65 75 85
Nº Personas ( Q ) 13 ✜
24 29 35 11 112
1 ✜
13 37 66 101 112
; Q ✢ ✢
¦ ; Q 7350
= =
✤ ✤
; 65,625 años
1 112
Moda Mo
Intervalo que presenta mayor densidad de frecuencia, en este caso como todos los
intervalos tienen la misma amplitud, el intervalo modal es (70.- 80) y dentro del
intervalo podemos considerar la moda igual a la marca de clase o también aplicar la
formula:
Q ✥
1
★
F 1 11
✥
1
★
0 / F
✦
✥
Q Q
70 + 10 = 72,75 años
1 1 11 + 29
✥ ✥
★
F F
1 1
✥ ✥
1 1
1 − 1 112 − 37
−1
= T2 = / −1 + 2 & = 60 +
2 10 = 66,55 años
✩
Me = T
1
Q 29
✩ ✩
2 4 ✩
1 1
1 − 1 112 − 13
−1
= / −1 + 4 & = 50 +
4 10 = 56,25 años
✪
T
1
Q 24
✪ ✪
4 ✪
9
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
3 3
1 − 1 112 − 66
−1
= / −1 + 4 & = 70 +
4 10 = 75,14 años
✫
T
3
Q 35
✫ ✫
4 ✫
¦
2
; Q 2 497800
− 65,625 2 = 138
✬ ✬
2
6 ✭
; =
1 112
6 ✮ = 6 ✮
2
= 138 = 11,75 años
6
( )= 11,75
✯
&9 ; = = 0,18
; 65,625
10
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
1 3,5 6 8 9,5
Nº Alumnos 30 52 38 25 5
; Q ✱ ✱
¦ ; Q 687,5
= =
✳ ✳
; 4,58
1 150
¦
2
; Q 2 4086,25
− 4,58 2 = 6,23
✴ ✴
2
6 ✵
; =
1 150
6 ✶ = 6 ✶
2
= 6,23 = 2,497
6
( )= 2,497
✷
&9 ; = = 0,5451
; 4,58
11
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 10.- Dada la siguiente distribución relativa a una muestra de 100 personas que emigran
de una zona rural a una urbana clasificada según la edad.
a).- Calcular: media, mediana y moda.
b).- Calcular el recorrido intercuartílico.
c).- Calcular el coeficiente de variación.
Solución
Edades 11 - 20 20 - 30 30 - 50 50 – 70
; ✸
15,5 25 40 60
Nº Personas 40 30 20 10 100
densidad 4,44 3 2 3
; Q ✹ ✹
40 70 90 100
¦ ; Q 2770
= =
✻ ✻
; 27,70 años
1 100
Moda Mo
Intervalo que presenta mayor densidad de frecuencia, en este caso como todos los
intervalos no tienen la misma amplitud, el intervalo modal es (11.- 20) TXH WLHQH
PD\RU GHQVLGDG GH IUHFXHQFLD y dentro del intervalo podemos considerar la moda
Q ✼
1
✿
30
F ✼
1
1
✿
0 / F 10 9 = 20 años
11 +
✼
Q Q
✽
1
✼
1 30
+0
✿
F F 10
1 1
✼ ✼
Mediana:
1 100
= = 50 Será el valor de la variable que ocupa el lugar 75, y está en el intervalo
2 2
mediano (20 – 30)
1 1
1 − 1 100 − 40
−1
= T2 = / −1 + 2 & = 20 +
2 10 = 23,33 años
❀
Me = T
1
Q 30
❀ ❀
2 4 ❀
12
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1 1
1 − 1 100 − 0
−1
= / −1 + 4 & = 11 +
4 9 = 16,625 años
❁
T
1
Q 40
❁ ❁
4 ❁
3 3
1 − 1 100 − 70
−1
= / −1 + 4 & = 30 +
4 20 = 35 años
❂
T
3
Q 20
❂ ❂
4 ❂
Re = T
3 − T 1 = 35 – 16,625 = 18,375 años
4 4
¦
2
; Q 2 96360
− 27,7 2 = 196,31
❃ ❃
2
6 ❄
; =
1 100
6 ❅ = 6 ❅
2
= 196,31 = 14 años
6
( )= 14
❆
&9 ; = = 0,50
; 27,7
13
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Xi 2 3 4 5
ni 5 9 10 6
Solución
−;
2 2
; Q ; Q ; Q ; = Q = Q
=
❇ ❍ ❍
❈ ❉ ❉ ❊ ❊ ■ ■
= ●
6 ❋
La media será: ; =
∑ ; Q ❏ ❏
=
107
= 3,56667
1 30
La varianza será: 6 ▲
2
=
∑ ; ❑
2
Q ❑
−; =
2 411
− 3,56667 2 = 0,978888
1 30
=+ 6 ▼
2
= 6 ❖
= + 0,97888 = 0,98938
= =
∑ = Q P P
=
0
=0 6 ❘
2
=
∑ = ◗
2
Q ◗
−; =
2 30
− 02 = 1
1 30 1 30
6 ❚
=+ 6 ❙
2
= 6 ❯
=+ 1= 1
14
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
1
2 = Número de pisos de Mendebaldea = 12
945 1017
;1 = = 94,5P 2 ; 2 = = 84,75P 2
10 12
1
1;1 + 12 ; 2 10(94,5) + 12(84,75) 1962
; ❱ ❲❳❱ ❨❬❩ = = = = 89,18 P 2
1 + 1
1 2 10 + 12 22
15
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 13.- Dada la siguiente distribución del número de hijos de 100 familias, calcular
sus cuartiles:
Xi ni Ni
0 14 14
1 10 24
2 15 39
3 26 65
4 20 85
5 15 100
total 100
Solución
1
100 = 25 T
1 = Valor de la variable que ocupa el lugar 25 T
1 =2
4 4 4
2
100 = 50 T
1 = Valor de la variable que ocupa el lugar 50 T
2 =3
4 4 4
3
100 = 75 T
1 = Valor de la variable que ocupa el lugar 75 T
3 =4
4 4 4
16
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 14.- El paro registrado en Navarra en el mes de Junio, por sexos y grupos de edad, fue:
VARONES MUJERES
Li-1- Li ni Li-1-Li ni
< 20 842 < 20 1493
20-24 1439 20-24 3140
25-29 1412 25-29 3381
30-34 872 30-34 2841
35-39 628 35-39 1919
40-44 516 40-44 1516
45-49 453 45-49 944
50-54 456 50-54 487
55-59 666 55-59 318
> 59 319 >59 101
Solución
; ❪ Q ❫ 1 ❫ ; Q
❴ ❴
; ❵
Q ❵ Q ❛
1 ❜ < Q
❝ ❝
< ❞
Q ❞
VARONES
¦ ; Q 263.873,5
= =
❡ ❡
; 34,7 años
1 7.603
Moda Mo
Intervalo que presenta mayor densidad de frecuencia, en este caso como todos los
intervalos tienen la misma amplitud, el intervalo modal es (20-25) y dentro del
intervalo podemos considerar la moda igual a la marca de clase o también aplicar
la formula:
17
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Q ❢
1
✐
F
1 1412
❢
1
✐
0 / F
❣
❢
Q Q
20 + 5 = 23,13años
1 1 1412 + 842
❢ ❢
✐
F F
1 1
❢ ❢
1
7603 = 3801,5 Intervalo mediano = (30 – 35)
2
1 1
1 − 1 7603 − 3693
−1
= T2 = / −1 + 2 & = 30 +
2 5 = 30,62años
❥
Me = T
1
Q 872
❥ ❥
2 4 ❥
1
7603 = 1900,75 Intervalo = (20 – 25)
4
1 1
1 − 1 7603 − 842
−1
= / −1 + 4 & = 20 +
4 5 = 23,68años
❦
T
1
Q 1439
❦ ❦
4 ❦
60
7603 = 4561,8 Intervalo = (30 – 35)
100
60 60
1 − 1 7603 − 3693
−1
100 100
60 = / − 1 + & = 30 + 5 = 34,98 años
❧
T
Q 872
❧ ❧
100 ❧
¦
2
; Q 2 10.532.314
− 34,7 2 = 180,78
♠ ♠
2
6 ♥
; =
1 7603
6 ♦ = 6 ♦
2
= 180,78 = 13,44 años
6
( )= 13,44
♣
&9 ; = = 0,387
; 34,7
MUJERES
< =
∑ < q
=
514.231,5
31,86 años
1 16140
18
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Moda Mo
Intervalo que presenta mayor densidad de frecuencia, en este caso como todos los
intervalos tienen la misma amplitud, el intervalo modal es (25-30) y dentro del
intervalo podemos considerar la moda igual a la marca de clase o también aplicar
la formula:
Q r
1
✉
F 1 1412
r
1
✉
0 / F
s
r
Q Q
20 + 5 = 23,13años
1 1 1412 + 842
r r
✉
F F
1 1
r r
1
16140 = 8070 Intervalo mediano = (30 – 35)
2
1 1
1 − 1 16140 − 8014
−1
= T2 = / −1 + 2 & = 30 +
2 5 = 30,01años
✈
Me = T
1
Q 2841
✈ ✈
2 4 ✈
1
16140 = 4035 Intervalo = (20 – 25)
4
1 1
1 − 1 16140 − 1493
−1
= / −1 + 4 & = 20 +
4 5 = 20,81años
✇
T
1
Q 3140
✇ ✇
4 ✇
60
16140 = 9684 Intervalo = (30 – 35)
100
60 60
1 − 1 16140 − 8014
−1
= + 100 & = 30 +
100 5 = 32,94 años
①
T /
60 −1
Q 2841
① ①
100 ①
6 ④
2
=
∑ < ③
2
Q ②
−< =
2 17.986.026
− 31,86 2 = 99,2724
1 16140
6 ⑤ = 6 ⑤
2
= 99,2724 = 9,96 años
6
( )= 9,96
⑥
19
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 15.- Calcular la mediana del salario de una determinada empresa con 34 empleados.
; ⑦
1 3 3 15 6 2 4
Solución
; ⑧
1 3 3 15 6 2 4
1 ⑧
1 4 7 22 28 30 34
1
34 = 17 → Me = 50.000 Valor de la variable que ocupa el lugar central. Valor que
2
deja el 50% de los valores por debajo suya.
20
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
10 18 24 28 32 42 45
1
45 = 22,5 → Me = Valor de la variable que ocupa el lugar central. Valor que deja el
2
50% de los valores por debajo suya.
1 1
1 − 1 45 − 18
−1
= T2 = / −1 + 2 & = 27 +
2 6 = 31,5 años
⑨
Me = T
1
Q 6
⑨ ⑨
2 4 ⑨
El 50% de las personas que asisten a conciertos tienen menos de 31,5 años
21
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 17.-El número de varones jóvenes clasificados según la edad en el censo de 1987 era el
siguiente. Calcular la desviación típica.
; ⑧
19 20 21 22 23
Q ⑧
Solución
; ⑧
19 20 21 22 23
Q ⑧
¦ ; Q 12.785
= = 20,99 ≅ 21 años
❷ ❷
;
1 609
¦
2
; Q 2 269.639
− 212 = 2,06
❸ ❸
2
6 ❹
; =
1 609
6 ❺ = 6 ❺
2
= 2,06 = 1,435 Años
6
( )= 1,435
❻
&9 ; = = 0,068
; 21
22
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 18.-Los ingresos mensuales de 4 personas son: 60.000, 75.000, 65.000 y 150.000 ptas.
La media aritmética de estos valores, ¿puede ser representativa? dígalo en %.
Solución
; ❼
2
; ❼
Q ❽ 1 ❽ ; Q
❾ ❾
; ❿
Q ❿
60 1 1 60 3.600
65 1 2 65 4.225
75 1 3 70 5.625
150 1 4 75 22.500
4 350 35.950
¦ ; Q 350
= =
➀ ➀
; 87,5 miles
1 4
¦
2
; Q 2 35.950
− 87,5 2 = 1.331,25
➁ ➁
2
6 ➂
; =
1 4
6 ➃ = 6 ➃
2
= 1331,25 = 36,48 miles
6
( )= 36,48
= 0,417 → 41,7%
➄
&9 ; =
; 87,5
23
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
15 25 40 60
Nº Empleados = Q ➆
40 30 20 10 100
Q 4 3 1 0,5
=
➇
G ➇
F ➇
1 ➆
40 70 90 100
; Q ➈ ➈
Q ➉
¦ ; Q 2.750
= =
➊ ➊
; 27,5 miles
1 100
1
100 = 50 La mediana es el valor de la variable que ocupa el lugar central,
2
en nuestro caso el lugar 50.
Intervalo mediano = Es aquel en el que se encuentra la mediana (20 – 30)
1 1
1 − 1 100 − 40
−1
Me = T 1 = T 2 = / −1 + 2 & = 20 +
2 10 = 23,33 miles
➋
Q 30
➋ ➋
2 4 ➋
Moda Mo
Intervalo que presenta mayor densidad de frecuencia, en este caso como
todos los intervalos no tienen la misma amplitud, el intervalo modal es el
que presenta mayor densidad de frecuencia, (10-20) y dentro del intervalo
podemos considerar la moda igual a la marca de clase o también aplicar
la formula:
24
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Q ➌
1
➏
30
F
1
➌
1
➏
0 / F 10 10 = 20 miles
10 +
➌
Q Q
➍
1
➌
1 30
+0
➏
F F 10
1 1
➌ ➌
¦
2
; Q 2 95.750
− 27,5 2 = 201,25
➐ ➐
2
6 ➑
; =
1 100
6 ➒ = 6 ➒
2
= 201,25 = 14,186 miles
6
( )= 14,186
➓
&9 ; = = 0,51
; 27,5
25
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 20.- Se han seleccionado una muestra de 176 personas que han respondido mejor a la
pregunta: ¿Cree Vd. que dentro de un año la situación política será mejor, igual o peor que
ahora? Se ha clasificado la respuesta según la edad del entrevistado.
1.- Desarrollar la distribución.
2.- Calcular medidas de tendencia central, de variabilidad o dispersión.
3.- Calcular las unidades Z para los siguientes valores: (18, 23, 29, 35, 44, 69)
; ➔
10 9 19 27 42 42 27
Solución
; = edad de las personas que han respondido a la pregunta = marca de clase del
→
intervalo i-esimo
/
−1 − / = Intervalo i-esimo
→ →
Q →
G ↔
= = densidad de frecuencia
& ↕
/ ↕
−1 −/ ↕
; ↕
Q ↕
1 ➙ I ➛ ) ➛
% %acumulado & ➛ G ➛ ; Q
➝ ➝
; ➞
2
Q ➞
= I 100
➜
( ) 100)
➛
Media = ;
¦ ; Q 7398,5
= =
➟ ➟
; 42 años
1 176
Moda Mo
Valor de la variable que más veces se repite
26
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Q ➠
1
➤
F
1 2,7
➠
1
➤
0 / F
➡
➠
Q Q
22 + 4 = 24,18años
1 1 2,7 + 2,25
➠ ➠
➤
F F
1 1
➠ ➠
24,18 años es la edad que más veces se repite, es decir la más común entre los
entrevistados.
Mediana = Me
1
176 = 88 La mediana es el valor de la variable que ocupa el lugar central,
2
en nuestro caso el lugar 88.
Intervalo mediano = Es aquel en el que se encuentra la mediana (36-46)
1 1
1 − 1 176 − 65
−1
Me = T 1 = T 2 = / −1 + 2 & = 36 +
2 10 = 41,60 años
➥
Q 41
➥ ➥
2 4 ➥
1 1
1 − 1 176 − 38
−1
= / −1 + 4 & = 26 +
4 10 = 28,22 años
➦
T
1
Q 27
➦ ➦
4 ➦
3
176 = 132 El 1º cuartil es el valor de la variable que ocupa el lugar 132.
4
Intervalo en el que se encuentra el 3º cuartil (46-61)
3 3
1 − 1 176 − 107
−1
= / −1 + 4 & = 70 +
4 15 = 54,93años
➧
T
3
Q 42
➧ ➧
4 ➧
2
Varianza = 6 ➨
6 ➫
2
=
∑ ; ➩
2
Q ➩
−; =
2 351.991,75
− 42,04 2 = 232,59
1 176
Desviación = 6 ➭
27
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
6 ➯ = 6 ➯
2
= 232,59 = 15,25 años
6
( )= 15,25
➲
&9 ; = = 0,36
; 42,04
28
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
/ −/ ➳
−1
➳
; ➵ Q ➵ I ➸ )➸
; Q ➺ ➺
; Q ; Q 3 T 3➽ −T ➽
∑ ∑
➻ ➻ ➼ ➼ ➼ ➼
; Q ➻ ➻
; Q ➼ ➼
acumulado
308.979.270 0,2113 0,2113 45,25 21,13 24,21
319.379.700 0,2184 0,4297 73,31 42,97 30,34
210.518.490 0,1440 0,5737 86,52 57,37 29,15
276.832.520 0,1893 0,7630 96,38 76,30 20,08
125.860.500 0,0861 0,8491 98,59 84,91 13,68
105.037.500 0,0718 0,9209 99,51 92,09 7,42
41.192.500 0,0282 0,9491 99,73 94,91 4,82
59.216.500 0,0405 0,9896 99,95 98,96 0,99
15.349.500 0,0104 1 100 100 0
1.462.366.500 1 130,60
➾
−1
∑( 3 ➽ −T ➽ )
130,60
* = =1
➽
➽
➾
−1
= = 0,187 No existe demasiada concentración, El coeficiente
∑
699,24
3 ➽
=1
está comprendido entre 0 y 1, a mayor índice mayor concentración.
29
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 22.- A partir de los siguientes datos sobre ingresos mensuales por hogar (en euros) de
cierta localidad
a) Obtener razonadamente: El ingreso anual medio por hogar. Y El ingreso más común.
c) Si la cantidad máxima disponible para gastos de alquiler de una vivienda es la tercera
parte del ingreso mensual, ¿qué precio sería inaccesible a la mitad de los hogares?
d) ¿Es cierto que el 80 % de los ingresos totales de dicha población recae sobre el 20 %
de los hogares con mayores ingresos?
Solución
/ −/ & Q G ; ; Q 1 4 % 3 %
−1
∑ ; Q
➽ ➽
➚ ➚ ➪ ➶ ➹ ➹ ➹ ➘ ➘ ➹ ➹
30
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1.- ; =
∑ ; Q
7.431.000
➴ ➴
=
= 3.480,5621 Euros
1 2.135
2.- El ingreso más común será el valor que más veces se repita, es decir la moda:
Intervalo modal, aquel en el que se encuentra la moda, es el intervalo que tenga
mayor densidad de frecuencia (3.600 – 4.200)
Q ➷
1
➱
320
F ➷
1
1
➱
0 / F 600
Moda = 3.600 + 600 = 3.904,76
➷
Q Q
➬
1
➷
1 320 310
+
➱
F F 600 600
1 1
➷ ➷
Euros.
3.- Mediana = Me
1
2135 = 1067,5 La mediana es el valor de la variable que ocupa el lugar central,
2
en nuestro caso el lugar 1068
Intervalo mediano = Es aquel en el que se encuentra la mediana (3.000 – 3.600)
1 1
1 − 1 2135 − 779
−1
Me = T 1 = T 2 = / −1 + 2 & = 3.000 +
2 600 = 3.558,38 Euros
✃
Q 310
✃ ✃
2 4 ✃
4.- No parece a simple vista que sea cierta ya que no se aprecia excesiva concentración.
No obstante vamos a calcular los porcentajes que los valores acumulados ; Q representan ❐ ❐
sobre el total de ingresos 7.431.000 (que denominamos 4 ❒ ), así como los porcentajes
acumulados de hogares sobre el total de hogares 2.135 (que denominamos 3 ❮ ). Calculamos
ambos en el sentido creciente de la variable Ingresos.
31
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
; ❰
Q ❰
8 Ï = ; Ï +N
[1 Q1 [ Ï +N
[2 Q2 [2 +k
[ Q [ +k
3 3 3
. . .
. . .
. . .
. . .
. . .
[ Ð
Q Ð
[ Ð
+k
8 Ï = ; Ï +N
Es un cambio de origen
Media Aritmética
; =
∑ ; Q Ñ Ñ
8 =
∑ 8 Q Ò Ò
=
∑( ; Ó + N )Q Ó
=
∑ ; Q Ô Ô
+
∑ NQ Õ
=
∑ ; Q Ö Ö
+N
∑ Q ×
=; +N
1 1 1 1 1 1
Varianza
∑( ) ∑( ) ∑ (( + N )− ( ))
2 2 2
; −; Q 8 −8 Q ; ; +N Q
= =
Ø Ø Ú Ú Ú Ú
2 2
6 Ù
6 Û
= =
1 1 1
∑( ) ∑( )
2 2
; Ü +N− ; −N Q Ü ; Ý −; Q Ý
2
= = = 6 Þ
1 1
32
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 24.- En una caja de reclutas se han medido la altura de 110 jóvenes obteniéndose la
tabla:
Solución
U
1 − 1 −1 á
PERCENTIL r-esimo T â
= / −1 á + 100 & á
Q
100
á
U
1 − 1 −1 ã
DECIL r-esimo T ä
= / −1 ã
+ 10 & ã
Q
10
ã
1º.-
21
1.1.- Percentil 21 ⇒ 110 = 23,1
100
Valor de la variable que ocupa el lugar 24, se encuentra en el intervalo (1,60-1,70)
21 21
1 − 1 110 − 18
−1 ã
100 100
T
21 = / −1 + ã
& = 1,60 + 0,10 = 1,6164 metros ã
Q 31
100
ã
87
1.2.- Percentil 87 ⇒ 110 = 95,7
100
Valor de la variable que ocupa el lugar 96, se encuentra en el intervalo (1,90 -2,00)
87 87
1 − 1 110 − 93
−1 ã
Q 17
100
ã
33
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
3
1.3.- Decil 3 ⇒ 110 = 33
10
Valor de la variable que ocupa el lugar 33-34, se encuentra en el intervalo (1,60-1,70)
3 3
1 − 1 110 − 18
−1 ã
T
3 = / −1 + 10
ã
& = 1,60 +
10 0,10 = 1,6483 metros
ã
Q 31
10
ã
2º.- Se consideran "bajos" a aquellos cuya altura está bajo el percentil 3. ¿Cuál es la altura
máxima que puede alcanzar?
3
Percentil 3 ⇒ 110 = 3,3
100
Valor de la variable que ocupa el lugar 4, se encuentra en el intervalo (1,55-1,60)
3 3
1 − 1 110 − 0
−1 ã
100 100
T
3 = / −1 + ã
& = 1,55 + 0,10 = 1,559 metros
ã
Q 18
100
ã
3º.- Se consideran "altos" aquellos cuya altura está sobre el percentil 82. ¿Cuál es su altura
mínima?
82
Percentil 82 ⇒ 110 = 90,2
100
Valor de la variable que ocupa el lugar 91, se encuentra en el intervalo (1,80-1,90)
82 82
1 − 1 110 − 73
−1 ã
Q 20
100
ã
U
1 − 1 −1
ã
T ä
= / −1
ã
+ 100 & ã
= 1,78 Hallar r
Q
100
ã
100
24 0,10
Por tanto T
62 = 1,78 ⇒ En el percentil 62
100
34
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
20
16
15
10
0 4 6 8 10
Solución
35
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
S
: ç
=.
100
; =
∑ ; Q è è
6 ê
2 ¦ ; é
2
Q é
;
2
6 ì
6 ë
2
&9
6 í
1 1 ;
Método I
< =
∑ < Q î î
=
∑( ; î
+ & )Q î
=
∑ ; Q î î
+
& ∑ Q î
= ; +&
1 1 1 1
∑( ) ∑ (( + & )− ( )) ∑( )
2 2
< −< Q ; ; +& Q ; −; Q
= = = =6 2
ð ð ð ð ð ð
2
6
ï
1 1 1
6 ó
=+ 6 ó
2
=+ 6 ò
2
=6 ò
6 6
( )= =
õ ô
&9 <
< ; +&
Método II
: =
∑ : Q ö ö
=
∑( ; . Q ö
) ö
=.
∑ ; Q ö ö
= .*;
1 1 1
∑( ) ∑ (( * . )− ( )) ∑( )
2 2
: −: Q ; ; *. Q ; −; Q
= = = =
ø ø ø ø ø ø
2 2 2
6 ù
. . *6 2 ÷
1 1 1
6 û
=+ 6 û
2
=+ .
2
*62 = . *6 ú ú
6 . *6 6
( )= = = = &9 ( ; )
ý
ü ü
&9 :
: . *; ;
36
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Luego:
6
Con el sueldo actual CV(X) =
þ
6 6
( )= =
ÿ
6 . *6 6
( )= = = = &9 ( ; )
✂ ✁ ✁
Por tanto
CV (Y) < CV (W) ⇒ Luego el Método I presenta menor dispersión en términos
relativos. Luego hace disminuir la desigualdad de los salarios.
37
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
2
/
1 / Q ; ; Q ; QL 1 & Q
✄ ✄ ✄ ✠
G
✆ ✝ ✝ ✝ ✟
☎
✞
F ✠
0 - 20 6 10 60 600 6 20 0,3
20 - 40 40 30 1200 36000 46 20 2,0
40 - 50 30 45 1350 60750 76 10 3,0
50 - 60 28 55 1540 84700 104 10 2,8
60 - 70 48 65 3120 202800 152 10 4,8
70 - 80 40 75 3000 225000 192 10 4,0
80 - 90 8 85 680 57800 200 10 0,8
200 10950 667650
¦ ; Q 10950
= =
✡ ✡
; 54,75 años
1 200
¦
2
; Q 2 667650
− 54,75 2 = 340,68 años
☛ ☛
2
6 ☞
; =
1 200
6 ✌ = 6 ✌
2
= 340,68 = 18,45 años
1 1
1 − 1 200 − 46
−1 ✍
T
1 = / −1 + 4 ✍ & = 40 +
4 10 = 41,33DxRV ✍
Q 30
4
✍
2 2
1 − 1 200 − 76
−1 ✍
T = / −1 + 4 & = 50 +
4 10 = 58,57 DxRV
2 ✍ ✍
Q 28
4
✍
3 3
1 − 1 200 − 104
−1 ✎
T = / −1 + 4 & = 60 +
4 10 = 69,58DxRV
3 ✎ ✎
Q 48
4
✎
(67$'Ë67,&$'(6&5,37,9$
Percentil 70
70
200 140 ,QWHUYDOR (60 70)
100
70 70
1 1 200 104
✏
1
T /
100 & 60 100 10 67,5DxRV
70 ✏
1 ✏
Q 48
100
✏
Q ✒
1
✕
40
F ✒
1
1
✕
0 / F 10
✓
✒
Q Q
60 10 65,88 años
✒
1
✒
1 40 28
F F 10 10
1 1
✒ ✒
Hospital ; ✖ 54,75DxRV 1 ✗
200
Clínica ; ✘ 55,8DxRV ... 1 ✙
150
Media Total
;
✚ ✚
1 ✛
+1 ✚
39
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 28.- Una residencia de ancianos tiene 5 tipos de habitaciones, cuyos precios, así como
los ingresos obtenidos, son los siguientes:
Solución
En primer lugar hay que hallar el número de habitaciones de cada precio
Como los ingresos correspondientes a las habitaciones de 200 unidades han sido 16.000
unidades esto indica que el número de habitaciones de este precio será:
16000
Q 80KDELWDFLRQHV
1
200
De la misma manera:
20000 37500
Q 40KDELWDFLRQHV Q 50KDELWDFLRQHV
2 3
500 750
30000 26000
Q 30KDELWDFLRQHV Q 20KDELWDFLRQHV
4 5
1000 1300
Luego la distribución de los precios por habitación será:
Xi ni X i ni ;ni ✜
2
=
129.500
= 588,64XQLGDGHV
1 220
Para comprobar si este promedio es representativo calcularemos el Coeficiente de
Variación
¦
2
6 ; ✦
Q ✦
2
2 2
&9 ;
✣
6 ✥
6 ✤
6 ✧
; 1
105.125.000
6★
2
= − 588,64 2 = 131.343,86 6 = + 131,343,86 = 362,4 ✩
220
362,4
&9 ( ; ) 0,61
588,64
Para poder comparar las estructuras de precios entre dos residencias, compararemos los
coeficientes de variación de ambas. Será más homogénea aquella que tenga menor
coeficiente de variación. En este caso como la otra residencia tiene un coeficiente de 0,75
>0,61. Quiere decir que la primera residencia tiene una estructura más homogénea ya que
presenta menor dispersión.
40
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
; −1 ; −6
1.- < = 2.- 7 =
2 4
Solución
; −1
1.- < =
2
; −1
∑ Q 1
[∑ − 1∑ Q ]
✪
∑ ; Q
1 ∑ ; ∑
✪
< Q 2 Q Q
✪ ✪ ✪
= = = 2 = −1 =
✪ ✪ ✪ ✪ ✪
<
1 1 1 2 1 1
=
1
2
(; −1 = ) ; −1 6 −1
2
=
2
= 2,5
6 ✫
=+ 6 ✫
2
2
; −1 ; − 1
∑ 2 −
∑( ) ( )
✭
Q
1 ∑ 1
2 2
−< −;
✭
6
2
=
< ✭
Q ✭
= 2
=
; ✭
Q ✭
= 62
4 4
✮ ✬
1 1 1
1 2 6 4
=+ = =2 2
=
✱
6 6 = 6
✯
✰ ✰
4 2 2
Los cambios de origen No afectan a la desviación típica
Los cambios de escala Si afectan a la desviación típica
; −6
2.- 7 =
4
; −6
∑ Q 1
[∑ − 6∑ Q ]
✲
∑ ; Q
1 ∑ ; ∑
✲
7 Q 4 Q Q
✲ ✲ ✲
= = = 4 = −6 =
✲ ✲ ✲ ✲ ✲
7
1 1 1 4 1 1
=
1
4
(; −6 = ) ; −6 6−6
4
=
4
=0
6 ✳
=+ 6 ✳
2
41
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
2
; −6 ; − 6
∑ 4 −
∑( ) ( )
✵
Q
1 ∑ 1
2 2
−7 −;
✵
6
2
=
7 ✵
Q ✵
= 4
=
; ✵
Q ✵
= 62
16 16
✶ ✴
1 1 1
1 2 6 4
=+ 2
= = =1
✹
6 6 6 =
✷
✸ ✸
16 4 4
; −; ; −6
= = =7
✺ ✺
= ✺ ✺
6 ✻
42
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 30.- De dos regiones con la misma población, de un determinado país, se han tomado
sendas muestras sobre las rentas percibidas. La información recogida es la siguiente:
REGION I REGION II
Renta (en miles) Nº Familias Renta (en miles) Nº Familias
10-20 24 05-15 10
20-30 36 15-25 42
30-40 20 25-55 35
40-50 20 55-75 20
50-100 50 75-95 13
a) Hállese la renta media de las muestras de cada región y del conjunto de las dos regiones.
¿Cuál de las dos rentas medias es más representativa?
b) ¿Es posible decir si una región posee un nivel de vida superior a la otra, si medimos este
nivel a través de la renta?
d) ¿Cuál es el nivel de renta percibido por un mayor número de familias en la primera
región?
e) Si en la segunda región clasificamos a una familia en el grupo en donde se encuentra el
50 % de las menos favorecidas. ¿Cuál sería el tope de renta que podría percibir?
Solución
REGIÓN I
/ −/ Q 1 ; ; Q ;
2
Q & Q
−1
=
✼ ✼ ✼ ❁
G
✽ ✽ ✾ ✾ ✿ ✿
& ❁
REGIÓN II
/ −/ Q 1 ; ; Q ;
2
Q & Q
−1
=
❁ ❁ ❁ ❁ ❁ ❁ ❁ ❄
G
❂ ❂
& ❄
43
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Región I ⇒ ; =
∑ ; ❆ Q❆
=
6.610
= 44,06
1
1 150
Región II ⇒ ; =
∑ ; ❇ Q❇
=
4.745
= 39,54
2
1 120
1
1;1 + 1 2 ; 2 150 * 44,06 + 120 * 39,54
; ❈ ❉❊❈ ❋❍● = = = 42.05
1 + 1 150 + 120
1 2
2.- Para estudiar cual de las dos medias es más representativa debemos calcular sus
correspondientes coeficientes de variación. Y será más representativa aquella que
tenga menor coeficiente de variación.
6■
&9 =
;
¦
2
; ▲ Q▲ 2
2 2
Región I 6❑ 6❏ 6▼ ;
1
¦
2
; ◆ Q◆
− (44,06 ) = 553,04
2 2 374150 2
6❖ ; =
1 150
6❑ 6❏
2
= + 553.04 = 23,52
6P 23,52
&9 (1) = = = 0,53
; 44,06
¦
2
; ▲ Q▲ 2
2 2
Región II 6 6P 6▼ ;
1
¦
2
; ▲ Q▲
− (39,54 ) = 538,46
2 2 252225 2
6▼ ; =
1 120
6 6P
2
= + 538,46 = 23,20
6◗ 23,20
&9 ( 2) = = = 0,58
; 39,54
Por tanto la renta media de la Región I es más representativa que la renta media de la
Región II, aunque la dispersión relativa de ambas no es muy diferente.
44
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
4.- El nivel de renta percibido por un mayor número de familias en la región I será la
MODA.
Como la distribución viene dada en intervalos de desigual amplitud, hallaremos el
intervalo modal, que es en el que se halla la moda, y es el que presenta mayor
densidad de frecuencia, es decir: (20 – 30)
Y dentro de ese intervalo tomaremos como MODA el valor central Mo = 25
O también podemos utilizar la formula
Q ❘
1
❯
F
1 2
❘
1
❯
0 / F
❙
❘
Q Q
20 + 10 = 24,56 24,18años
1 1 2 + 2,4
❘ ❘
❯
F F
1 1
❘ ❘
.- Mediana = Me
1
120 = 60 La mediana es el valor de la variable que ocupa el lugar central, en
2
nuestro caso el lugar inmediatamente siguiente al 60.
Intervalo mediano = Es aquel en el que se encuentra la mediana, en el que se
encuentran los valores que ocupan los lugares 60 y 61 (25 – 55)
1 1
1 − 1 120 − 52
−1
= T2 = / −1 + 2 & = 3.000 +
2 30 = 31,85
❱
Me = T
1
Q 35
❱ ❱
2 4 ❱
45
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 31.- El Servicio Central de Correos realiza una encuesta por muestreo sobre el franqueo
medio de las cartas (en unidades monetarias) que diariamente tiene que distribuir en el
Hospital de Navarra. La información recogida, sobre una muestra de 500 cartas es la
siguiente:
Franqueo 3 4 5 7 10 12 18 20 25
Nº Cartas 145 132 84 50 48 22 10 8 1
Solución
Franqueo ; ❲ 3 4 5 7 10 12 18 20 25
Nº Cartas Q ❳ 145 132 84 50 48 22 10 8 1 500
; Q ❨ ❨ 435 528 420 350 480 264 180 160 25 2842
; ❩
2
Q ❩ 1305 2112 2100 2450 4800 3168 3240 3200 625 23000
Media aritmética: ; =
∑ ; Q = 2842 = 5,684 unidades monetarias ❬ ❬
1 500
Para verificar si esta media es representativa hallaremos el coeficiente de variación, es
decir una medida de la dispersión relativa.
6
=
❭
&9
;
6 ❫
2
=
∑ ; ❪
2
Q ❪
−; 2 =
23000
− (5,684) = 13,7
2
6 ❴
=+ 6 ❴
2
= 13,7 = 3,7
1 500
6
3,7
= = 0,65 Como es menor de 1 podemos decir que no hay gran dispersión y
❴
&9 =
; 5,684
por tanto la media es bastante representativa.
2.- Si la muestra anterior es significativa del total de cartas que diariamente se reparten en
el hospital, calcúlese si el servicio es rentable, teniendo en cuenta que se reparten 35.000
cartas al día y que el costo diario del servicio es de medio millón de unidades monetarias.
Para determinar si el servicio es rentable debemos estimar los ingresos diarios por este
servicio, para ello supondremos que el franqueo medio de la muestra es el franqueo medio
del total de las 35.000 cartas, es decir el franqueo medio de la población.
Ingresos = (350.000) 5,684 = 1.989.400 u.m.
Beneficio = Ingresos –Costes = 1.989.400-2.000.000 = -106.000 u.m.
Como el beneficio es negativo, significa que el servicio de correos, en este supuesto No es
rentable.
46
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº Salario Desviación
empleados medio/mes típica 6[
Solución
1.- El salario medio del conjunto será la media ponderada de los salarios
medios de cada categoría:
1 ;
❜
1 ;
❛
1 ;
❵
;
1 ❜
1 ❛
1 ❵
200
2.- Existirá mayor homogeneidad en aquella categoría que tenga menor dispersión,
para poder comparar las dispersiones hallamos los coeficientes de variación, que es
una medida de dispersión relativa, tendrá mayor homogeneidad la categoría que
tenga menor coeficiente de variación, en este caso los administrativos.
6[
CV=
;
47
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
/ ❝
−1 −/ ❝
7 11 15 10 5 2
Ni 7 18 33 43 48 50
; Q ❞ ❞
Calcúlese: Media, mediana, moda, tercer cuartil, sexto decil, trigésimo percentil
Solución
¦ ; Q 1760
Media → = =
❡ ❡
; 35,2
1 50
1 1
1 − 1 50 − 18
−1
Mediana → = T2 = / −1 + 2 & = 30 +
2 10 = 34,66
❢
0H
Q 15
❢ ❢
4 ❢
Q ❣
1
❥
F 1 11
❣
1
❥
0 / F
❤
❣
Q Q
30 + 10 = 34,76
1 1 11 + 10
❣ ❣
❥
F F
1 1
❣ ❣
1 1
1 − 1 50 − 7
−1
1º Cuartil → = / −1 + 4 & = 20 +
4 10 = 25
❦
T
1
Q 11
❦ ❦
4 ❦
3 3
1 − 1 50 − 33
−1
3º Cuartil → = / −1 + 4 & = 40 +
4 10 = 44,5
❧
T
3
Q 10
❧ ❧
4 ❧
6º Decil = Percentil 60
60
50 = 30 ⇒ ,QWHUYDOR(30 − 40)
100
48
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
60 60
1 − 1 50 − 18
−1
= / −1 + 100 & = 30 +
100 10 = 38
♠
T
60
Q 15
♠ ♠
100 ♠
Percentil 30
30
50 = 15 ⇒ ,QWHUYDOR (30 − 40)
100
30 30
1 − 1 50 − 7
−1
= / −1 + 100 & = 30 +
100 10 = 37,27
♥
T
30
Q 11
♥ ♥
100 ♥
49
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
/ ♦
−1 −/ ♦
10 12 12 10 7
Ni 10 22 34 44 50
Solución
1 1
1 − 1 50 − 10
−1
1º Cuartil → = / −1 + 4 & = 1+
4 1 = 1,208
♣
T
1
Q 12
♣ ♣
4 ♣
2 1
1 − 1 50 − 22
−1
2º Cuartil → = / −1 + 4 & = 2+
4 1 = 2,25
q
T
2
Q 12
q q
4 q
3 3
1 − 1 50 − 34
−1
3º Cuartil → = / −1 + 4 & = 3+
4 1 = 3,35
q
T
3
Q 10
q q
4 q
50
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
; r
2 3 5 1 6 8 3 2 6 36
; s
2 4 9 25 1 36 64 9 4 36 188
Solución
Xi ni X i ni X i 2 ni
1 1 1 1
2 2 4 8
3 2 6 18
5 1 5 25
6 2 12 72
8 1 8 64
9 36 188
Media: ; =
∑ ; Q t t
=
36
=4
1 9
¦
2
; Q 2 188
− 4 2 = 4,89
✉ ✉
2
Varianza: 6 ✈
; =
1 9
Desviación Típica: 6 ①
6 ✇
2
= + 4,89 = 2,21
=
; 4
Si, es representativo ya que el CV es menor de 1
51
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
/ ③
−1 −/ ③
7-9 9 - 11 11 - 12 12 - 13 13 - 14 14 - 15 15 - 17 17 - 19
Q ③
4 18 14 27 42 31 20 1
Solución
intervalos ni Xi Ni X i ni Xi2ni
7 -9 4 8 4 32 256
9 – 11 18 10 22 180 1800
11 – 12 14 11,5 36 161 1851,5
12 – 13 27 12,5 63 337,5 4218,75
13 – 14 42 13,5 105 567 7654,5
14 – 15 31 14,5 136 449,5 6517,75
15 – 17 20 16 156 320 5120
17 - 19 1 18 157 18 324
157 2065 27742,5
La media será: ; =
∑ ; Q ④ ④
=
2065
= 13,15DxRV
1 157
La varianza será: 6 ⑥
2
=
∑ ; ⑤
2
Q ⑤
−; =
2 27742,5
− 13,15 2 = 3,78DxRV 2
1 157
=+ 6 ⑦
2
= 6 ⑨ = + 3,78 = 1,94DxRV
6
1,94
&9 =
= 0,15 Es muy representativo ya que se acerca bastante a 0
⑧
; 13,15
Para analizar la simetría de la distribución hallaremos las distancias entre cuartiles, para
ello primero hallaremos los cuartiles:
1º cuartil será:
1
157 = 39,25 El 1º cuartil será el valor de la variable que ocupa el lugar
4
inmediatamente siguiente al 39.25 y se encuentra en el intervalo (12 – 13) por tanto,
aplicando la formula:
52
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1 1
1 − 1 200 − 46
−1 ⑩
T
1 = / −1 + 4
⑩ & = 40 +
4 10 = 41,33DxRV
⑩
Q 30
4
⑩
T /
2 −1
Q 42
❶ ❶
4 ❶
3º cuartil será:
3
157 = 117,75 El 3º cuartil será el valor de la variable que ocupa el lugar
4
inmediatamente siguiente al 117,75 y se encuentra en el intervalo (14 – 15) por tanto,
aplicando la formula:
3 3
1 − 1 157 − 105
−1
= + 4 & = 60 +
4 1 = 14,41 años
❷
T /
3 −1
Q 31
❷ ❷
4 ❷
T
3 − T 2 = T 2 − T 1 14,41 –13,37 ≠ 13,37 – 12,12 1,04 ≠ 1,25 Hay una pequeña
4 4 4 4
diferencia, esto nos indica que hay una pequeña asimetría
Vamos hacer lo mismo entre dos percentiles 30 y 70, y ver si las distancias a la mediana
son iguales:
El percentil 30 será:
30
157 = 47,1 El 30 percentil será el valor de la variable que ocupa el lugar
100
inmediatamente siguiente al 47.1 y se encuentra en el intervalo (12 – 13) por tanto,
aplicando la formula:
30 30
1 − 1 157 − 36
−1
= + 100 & = 12 +
100 1 = 12,41 años
❸
T /
30 −1
Q 27
❸ ❸
100 ❸
El percentil 70 será:
70
157 = 109,9 El 70 percentil será el valor de la variable que ocupa el lugar
100
inmediatamente siguiente al 109.9 y, que se encuentra en el intervalo (14 – 15) por
tanto, aplicando la formula:
70 70
1 − 1 157 − 105
−1
= / − 1 + 100 & = 14 +
100 1 = 14,158 años
❹
T
70
Q 31
❹ ❹
100 ❹
53
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
T
70 − T 2 = T 2 − T 30 14,158 –13,37 ≠ 13,37 – 12,41 0,788 ≠ 0,96 Sigue
100 4 4 100
habiendo una pequeña diferencia, esto nos indica que hay una pequeña asimetría
54
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 37.- Dado el número de horas semanales trabajadas por un colectivo de 100 empleados,
obtener:
1.- La variable tipificada Z
2.- Valores de la media y varianza de la Z
Solución
−1 − / −;
2 2
/ ; Q ; Q ; Q ; = Q = Q
=
❺ ❺ ➀ ➀
❻ ❻ ❼ ❼ ❽ ❽ ➁ ➁
= ❿
6 ❾
La media será: ; =
∑ ; Q ➂ ➂
=
673
= 6,73
1 100
La varianza será: 6 ➄
2
=
∑ ; ➃
2
Q ➃
−; =
2 8081
− 6,73 2 = 35,5171
1 100
=+ 6 ➅
2
= 6 ➇
= + 35,5171 = 5,9596
= =
∑ = Q ➈ ➈
=
0
=0 6 ➉
2
=
∑ = ➃
2
Q ➃
2
−; =
100
− 02 = 1
1 100 1 100
6 ➋
=+ 6 ➊
2
= 6 ➌
=+ 1= 1
55
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
No es necesario establecer la tabla de doble entrada ya que ningún par de valores se
repite.
Y = Consumo
X = Renta en miles
< ➍ ; ➎ < ➏2 ; ➐ 2 Q➐ ➐
; <
Renta ; =
∑ ; ➒ = 165 = 33
1 5
Renta 6 ➣2 = ∑ ; → 2 Q→
−; =
2 5.875
− 332 = 86
1 5
Renta 6 ➙ =+ 6 ↕ 2 = + 86 = 9,27
6 ➡➟➠ 356
U = = 0,9673 U
2
= (0,9673) 2 = 0,9357 93,57% de fiabilidad
6➡ 6➠ (9,27)(39,70)
56
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Como es bastante grande nos indica que es buena la relación lineal entre Consumo y Renta.
Por lo que establecemos esa relación:
&RQVXPR
<
= ;
= Re QWD
; Re QWD < &RQVXPR
<
*
= 31,38 + 4,14 ; ➥ ;
*
= −3,96 + 0,22<➦
57
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
; ➧ 10 20 30 40 50
➨
< 200 180 150 120 100
Solución
No es necesario establecer la tabla de doble entrada ya que ningún par de valores se
repite.
; =
∑ ; ➲ = 150 = 30
1 5
6 ➺ 2
=
∑ ; ➸ 2 Q➸
−; =
2 5.500
− 30 2 = 200
1 5
6 ➽ =+ 6 ➼2 = + 200 = 14,14
La covarianza 6 ➪➟➶ = ∑
19.900 ➚ ➾
; <
− ;< =
− (150)(30) = -520
1 5
Covarianza negativa por tanto relación inversa, cuando una variable crece la otra decrece y
viceversa.
6 ➘➟➹ − 520
U = = −0,9971 U
2
= (−0,9971) 2 = 0,9943 99,43% de fiabilidad
6➘ 6➹ (36,88)(14,14)
58
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Como es bastante grande nos indica que es buena la relación lineal entre las dos variables.
Por lo que establecemos esa relación:
< ;
; <
<
*
= 228 − 2,6 ; ➱ ;
*
= 87 − 0,38<✃
Significados
covariación pero no nos dice si es muy grande o no. Es una medida en términos absolutos
59
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 40.- El consumo y la renta mensual de 100 familias expresadas en 104 pesetas, son los
siguientes: X= (Consumo) Y = (Renta).
X/Y 15 25 35 45
30 10 15 -- --
40 5 20 25 --
50 -- 15 5 5
Solución
Y 15 25 35 45 Q Ï Ð Ð
; Q ; Ñ 2 QÑ Ò Ó ÒÓ
; < Q 1 Ô
X
30 10 15 - - 25 750 22500 15750 25
40 5 20 25 - 50 2000 80000 58000 75
50 - 15 5 5 25 1250 62500 38750 100
Q Õ 15 50 30 5 100 4.000 165.000 112.500
< Q Ö Ö 225 12250 1050 225 2750
< × 2 Q× 3775 31250 36750 10125 81500
1 Ø 15 65 95 100
Solución
4000 165000
; = = 40 6 Ù2 = − (40) 2 = 50 6 Ú = 50 = 7,07
100 100
2750 81500 Ü =
< = = 27,5 6 Û2 = − (27,5) 2 = 58,75 6 58,75 = 7,66
100 100
Ý➟Þ =
112500
6 − (40)(27,5) = 25
100
25
U = = 0,46 U
2
= (0,46) 2 = 0,213 21,3% de fiabilidad
(7,07)(7,66)
6 ß➟à 25 6 â➟á 25
E = = = 0,5 E
’
= = = 0,425
6 ß 2
50 6 á 2
58,75
<
*
= 47,5 + 0,5 ; ã ;
*
= 28,3 + 0,4257<ä
60
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1.- ;
*
= 28,3 + 0,4257< å
= 60
Sustituimos en la recta de regresión ;
*
= 28,3 + 0,4257< å
;
*
= 28,3 + 0,4257(60 ) = 53,8
25
3.- U = = 0,46 U
2
= (0,46) 2 = 0,213 21,3% de fiabilidad
(7,07)(7,66)
61
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Años t 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995
Ahorro X 1,9 1,8 2,0 2,1 1,9 2,0 2,2 2,3 2,7 3,0
Renta Y 20,5 20,8 21,2 21,7 22,1 22,3 22,2 22,6 23,1 23,5
Ajústese un modelo lineal que explique el comportamiento del ahorro en función de la renta.
Solución
10 10
Covarianza
484,64
6 ï➟ð = − (2,19)(22) = 0,284
10
Coeficiente de correlación Coeficiente de determinación
0,284
U = = 0,85 = (0,85) 2 = 0,723 72,3% de fiabilidad
2
U
(0,365)(0,915)
Coeficiente de regresión de Y/X Coeficiente de regresión de X/Y
6 ➟
ñ ò 0,284 6 ô➟ó 0,284
E = = = E = = = 0,34
’
2,13
6 ñ 2
0,133 6 ó 2
0,838
Ordenada en el origen Ordenada en el origen
D = < − E ; = 22 − 2,13( 2,19) = 17,33 D = ; − E < = 2,19 − 0,34( 22) = −5, 29
’ ’
Coeficientes de regresión:
b = 2,13 Nos indica lo que varia la renta, al variar el ahorro en una unidad
b’= 0,34 Nos indica lo que varia el ahorro, al variar la rente en una unidad
Al ser positivos nos indican que las variaciones son en el mismo sentido.
62
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
= I ø
100 ; ù
S ù
3ú
%
Productividad Cualificado Cualificado Técnico
% acumulado
; (En %) (En %) (En %)
1 10 5 - 4,5 4,5 4,5
2 20 20 10 17 34 21,5
3 30 20 40 28 84 49,5
4 30 40 30 35 140 84,5
5 10 15 20 15,5 77,5 100
100 340
; =
∑ ; Q ÷ ÷
=
∑ ; û
S û
=
340
= 3,4 Coeficiente de productividad media.
1 100 100
63
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Coeficiente Personal No ; þ
S þ
; ÿ
2
S ÿ
Productividad Cualificado
; (1) (En %)
1 10 10 10
2 20 40 80
3 30 90 270
4 30 120 480
5 10 50 250
100 310 1090
; (1) =
∑ ;
(S
=
310
= 3,1 6 ✂
2
(1) =
∑ ; ✁
2
S ✁
−; =
2 1090
− (3,1) 2 = 1,29
100 100 100 100
6 1,1358
(1) = 2
= 1,29 = 1,1358 (1)= = = 0,36 Homogeneidad
☎
6 ✄ 6 ✄ &9
; 3,1
aceptable ya que es menor de 1. Nos dice que hay una dispersión bastante pequeña.
Coeficiente Personal No ; ✆
S ✆
; ✝
2
S ✝
Productividad Cualificado
; (2) (En %)
1 5 5 5
2 20 40 80
3 20 60 180
4 40 160 640
5 15 75 375
100 340 1280
; ( 2) =
∑ ; ✞
(S ✞
=
340
= 3,4 6 ✠
2
(2) =
∑ ; ✟
2
S ✟
−; =
2 1280
− (3,4) 2 = 1,24
100 100 100 100
6 1,1135
( 2) = 2
= 1,24 = 1,1135 (2)= = = 0,32 Homogeneidad
☛
6 ✡ 6 ✡ &9
; 3,4
aceptable ya que es menor de 1. Nos dice que hay una dispersión bastante pequeña.
64
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
EDAD
DÍAS DE 20 - 28 29 - 37 38 - 46 47 - 55 56 - 64
AUSENCIA
65 – 71 0 1 8 7 16
58 – 64 2 6 10 2 4
51 – 57 5 9 5 0 1
44 – 50 14 6 2 2 0
Solución
< =
∑ < ✕
=
5872
= 58,72 días ; =
∑ ; ✖
=
4101
= 41,01 años
1 100 1 100
6 ✘ 2
=
∑ < ✗2 2
−< =
351560
− (58,72 2 = 67,56
1 100
6 ✚2 = ∑ ; ✙ 2 Q✙
−; =
2 182365
− (41,01) 2 = 141,83
1 100
6 ✛ =+ 6 ✛ 2 = + 67,56 = 8,2 días 6 ✢ =+ 6 ✜ 2 = + 141,83 = 12 años
6 ✥✧✦ = ∑ ; < ✤ ✣
− ;< =
248082
− (41,01)(58,72) = 72,71
1 100
65
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
6 ✩✧★
72,71
U = = 0,74 U 2 = (0,74) 2 = 0,546 54,6% de fiabilidad. Es decir el
6✩ 6★ (12)(8,2)
54,6% de las variaciones de la edad explican las variaciones de los días de ausencia, y
viceversa.
Como es bastante grande nos indica que es buena la relación lineal entre Edad y días de
ausencia. Por lo que establecemos esa relación:
<
*
= 37,7 + 0,51; ✮ ;
*
= −22,18 + 1,07<✯
66
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
; ✰ 5 10 15
<✱
100 1 2 2
125 1 7 4
150 2 1 5
Solución
; ✰ 5 10 15 Q ✳ < Q ✴ ✴ < ✵ 2 Q✵
< ✲
100 1 2 2 5 500 50000
125 1 7 4 12 1500 187500
150 2 1 5 8 1200 180000
Q ✶ 4 10 11 25 3200 417500
; Q ✷ ✷ 20 100 165 285
; ✸ 2 Q✸ 100 1000 2475 3575
; < Q ✹ ✺ ✹✺ 2625 12250 21750 36625
< =
∑ < ✻
=
3200
= 128 ; =
∑ ; ✼
=
285
= 11,4
1 25 1 25
6 ✾2 = ∑ <✽
2
−< =
2 417500
− 128 2 = 316 6 ✿ =+ 6 ✿ 2 = + 316 = 17,77
1 25
6 ❁2 = ∑ ; ❀ 2 Q❀
−; =
2 3575
− (11,4) 2 = 13,04 6 ❃ =+ 6 ❂ 2 = + 13,04 = 3,61
1 25
6 ❆✧❇ = ∑ ; < ❅ ❄
− ;< =
36625
− (128)(11,4) = 5,8
1 25
6 ❉✧❈ 5,8
U = = 0,09 U
2
= (0,09) 2 = 0,00817 0,8% de fiabilidad.
6❉ 6❈ (3,61)(17,77)
Es decir solamente el 0,8% de las variaciones de una variable vienen explicadas por las
variaciones de la otra variable. Como U 2 es muy pequeño nos indica que es muy mala la
relación lineal entre las variables. Aun y todo establecemos la relación:
<
<
*
= 122,9 + 0,44 ; ■ ;
;
*
= 9,05 + 0,018<❏
; <
67
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
; ❑ < ▲ ; ▼2 < ◆2 ▼
; <
5 5
Covarianza
3871500
6 ❙✧❚ = − (260)(2835) = 37200
5
Coeficiente de correlación Coeficiente de determinación
37200
U = = 0 ,9965 U
2
= (0,9965) 2 = 0,9931 99,31% de fiabilidad
(56 ,56 )( 659 ,88 )
Coeficiente de regresión de Y/X Coeficiente de regresión de X/Y
6 ❯✧❱ 37200 6 ❯✧❱ 37200
E = = = 11,625 E = = = 0,08
’
6❯ 6❱
2 2
3200 435450
Ordenada en el origen Ordenada en el origen
D = < − E ; = 2835 − 11,625( 260) = −1875 D = ; − E < = 260 − 0,08( 2835) = 33, 2
’ ’
Coeficientes de regresión:
b = 11,625 Nos indica lo que varia la renta, al variar el ahorro en una unidad
b’= 0,08 Nos indica lo que varia el ahorro, al variar la rente en una unidad
Al ser positivos nos indican que las variaciones son en el mismo sentido.
r = 0,9965 Fiabilidad muy grande
U
2
= 0,9931 ≅ 1 ⇒ 100% de fiabilidad, bondad de las estimaciones. Es decir el 100% de
las variaciones de una variable vienen explicadas por las variaciones de la otra variable,
a través de las rectas de regresión, que al ser r prácticamente 1 coincidirán ambas rectas.
68
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 46.- En un estudio sobre alcohólicos se informa que el 40% de los mismos tienen padre
alcohólico y el 6% madre alcohólica. El 42% tienen al menos uno de los padres
alcohólicos.
1.- Porcentaje de personas que tengan ambos padres alcohólicos.
2.- Porcentaje de personas que tengan madre alcohólica si lo es el padre.
3.- Porcentaje de personas que tengan madre alcohólica pero no un padre alcohólico.
4.- Porcentaje de personas que tengan madre alcohólica si el padre no lo es
Solución
P = padre alcohólico %(P) = 40%
M = madre alcohólica %(M) = 6% %(P ∪ M) = 42%
P
SI NO
SI %0 ∩3 %0 ∩3 %0
M NO %0 ∩3 %0 ∩3 %0
%3 %3 100
Padre alcohólico
SI NO
Madre SI 4 2 6
alcohólica NO 36 58 94
40 60 100
1.- %(P ∩ M ) = 4%
4
2.- %( 0 ) = 100 = 10%
3
40
3.- %( ( 3 ∩ 0 ) = 2%
%( 0 ∩ 3) 2
4.- %( 0 ) = 100 = 100 = 33,33%
3 %( 3) 6
69
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 47.- Realizada una encuesta entre fumadores se obtuvieron los resultados sobre las
variables:
X: Nº de cigarrillos fumados diariamente
Y: Horas de sueño diarias
Que hemos recogido en la siguiente tabla
X 2 - 6 6 - 12 12 – 14 14 - 20 20 - 30 Q ❨ ; ❩ Q ❩ ; ❬ 2 Q❬ 1 ❭
4 9 13 17 25
Y
4-6 0 2 8 26 36 72 360 1800 72
6-7 4 10 16 20 26 76 494 3211 148
7-8 18 24 14 12 14 82 615 4612,5 230
8-9 28 26 10 4 2 70 595 5057,5 300
Q ❪ 50 62 48 62 78 300 2064 14681
; Q ❫ ❫ 200 558 624 1054 1950 4386
; ❴ 2
Q ❴ 800 5022 8112 17918 48750 80602
❵ ❛
; < Q ❵❛ 1700 4284 4342 6528 11775 28629
1 ❜ 50 112 160 222 300
Solución
4386 80602
; = = 14,63 6 ❝2 = − (14,63) 2 = 54,63 6 ❞ = 54,63 = 7,39
300 300
❣✧❤ =
28629
6 − (14,63)(6,88) = −5,23
300
− 5,23
U = = −0,56 U
2
= (−0,56) 2 = 0,315 31,5% de fiabilidad
(7,39)(1,26)
<
*
= 8,28 − 0,096 ; ♠ ;
*
= 37,13 − 3,27<♥
70
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Y
4-6 5 26 + 2 36 = 28,86
6 10
6-7 5 20 + 2 26 = 26,86
6 10
7-8 5 12 + 2 14 = 12,80
6 10
8-9 5 4 + 2 2 = 3,73
6 10
72,25
72,25
100 = 24,08%
300
2.- Obtener el número mínimo de cigarrillos diarios que fuma uno de los fumadores del
30% que más fuma.
70
Hay que hallar el percentil 70 → 300 = 210 El valor de la variable que ocupa
100
el lugar 210, que esta en el intervalo (14 – 20)
70
1 − 1
100
−1
210 − 160
= / −1 + & = 14 + 6 = 18,84 Cigarrillos
♦
T
70
Q 62
♦ ♦
100 ♦
4.- Estimar el consumo de tabaco para una población de 1.500 personas de las que son
fumadoras el 32%
32% de 1.500 será → 0,32 (1.500) = 480 personas fumadoras
Cada persona fumadora, fuma un promedio de 14,63 cigarrillos, es decir 15
cigarrillos por persona fumadora al día
Luego será: → 480(15) = 7.200 cigarrillos
5.- Estimar el número de horas de sueño diarias para una persona que fuma 35 cigarrillos al
día.
<
*
= 8,28 − 0,096 ; ♣
Para X = 35 <
*
= 8,28 − 0,096(35)= 4,9 ⇒ 5 horas de sueño diarias
6.- Porcentaje de personas fumadoras que duermen entre 6 y 8 horas sabiendo que no
fuman más de 15 cigarrillos al día
71
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
81,33
% (Duerme entre (6 – 8) / No fuma más de 15) = 100 = 47,748%
170,33
72
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 48.- Un estudio indica que el 10% de la población de Pamplona tiene 65 o más años, y
que el 1% de la población padece deficiencia cardiaca moderada. Además el 10,4% de la
población tiene 65 o más años o padece deficiencia cardiaca moderada.
1.- Porcentaje de personas que tengan 65 o más y padezcan la enfermedad.
2.- Porcentaje de personas que Si tienen 65 o más padezcan de deficiencia cardiaca
3.- Porcentaje de personas que Si no tienen 65 tengan la enfermedad
Solución
A $
B 0,6 0,4 1
%
9,4 89,6 99
10 90 100
1.- %( $ ∩ % ) = 0,6%
%( % ∩ $) 0,6
2.- %( % )= =, 100 = 6%
$
%( $) 10
%( % ∩ $ ) 0,4
3.- %( %
)= = 100 = 0 , 444 %
$ %( $ ) 90
73
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 49.- Se estima que el 30% de los ciudadanos de Navarra son obesos y el 3% sufre de
diabetes. El 2% son obesos y sufre diabetes. ¿Cuál es el porcentaje de personas que son
obesas o sufren diabetes?
Solución
Suceso A = ser obeso %(A) = 30%
Suceso B = Padecer Diabetes %(B) = 3%
%( $ ∩ % )= 2 %
A $
B 2 1 3
%
28 69 97
30 70 100
74
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 50.- De 300 estudiantes 100 cursan Antropología y 80 Estadística. Estas cifras incluyen
30 estudiantes que cursan ambas asignaturas. ¿Cuál es el porcentaje de estudiantes que
cursan Antropología o Estadística?
Solución
100
Suceso A = Estudiar A %(A) = 100 = 33,33%
300
80
Suceso E = Estudiar E P(E) = 100 = 26,67%
300
30
3 ( $ ∩ ( )= 100 = 10%
300
A $
E 30 50 80
(
70 150 220
100 200 300
30 + 50 + 70
% ($ ∪ % )= 100 = 50%
300
A $
E 10 16,67 26,67
(
23,33 50 73,33
33,33 66,67 100
75
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 51.- Se estima que entre la población total de Europa el 55% padece de obesidad, el
20% es hipertensa, y el 60% es obesa o hipertensa. ¿Es, de hecho, independiente el que
una persona sea obesa de que padezca hipertensión?
Solución
Suceso (
$ )
∩ % = suceso (
$ ∪% ) % ( ∪ ) = 100 – 60 = 40%
$ %
A $
B 15 5 20
%
40 40 80
55 45 100
76
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 52.- Se sabe por informes recientes que el 18% de los estudiantes sufren de depresión
en algún periodo de su escolarización, que el 2% piensa en el suicidio y que el 19% sufre
de depresión o piensa en el suicidio.
1.- ¿Cuál es el porcentaje de estudiantes que sufren depresión y piensen en el suicidio? 2.-
¿Cuál es el porcentaje de estudiantes que sufren depresión pero no piense en el suicidio?
Solución
Suceso A = Sufrir depresión %(A) = 18%
Suceso B = Pensar en suicidio %(B) = 2%
Sufrir depresión R pensar en suicidio = Suceso ( $ ∪ % ) %(A ∪ B) = 19%
Sufrir depresión \ pensar en suicidio = Suceso (A ∩ B)
Sufrir depresión \QR pensar en suicidio = Suceso (A ∩ % )
No sufrir depresión y no pensar en el suicidio = suceso (
$ ∩% )
Suceso (
$ )
∩ % = suceso (
$ ∪% ) % (
$ )
∪ % = 100 – 19 = 81%
A $
B 1 1 2
%
17 81 98
18 82 100
% $ = 100 = 17,347%
17
% 98
77
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 53.- Se estima que el 15% de la población adulta padece de hipertensión, pero que el
75% de todos los adultos creen no tener este problema. Se estima también que el 6% de la
población tiene hipertensión pero no es consciente de padecer dicha enfermedad. ¿Cuál es
el porcentaje de personas que creyendo que no tienen hipertensión, y sin embargo la
tienen?
Solución
A $
B 6 69 75
%
9 16 25
15 85 100
6
%( $ ) = 100 = 8%
%
75
Es decir un 8% de personas que creen no tener problemas de hipertensión, padecen
de hecho la enfermedad.
78
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 54.- Dados los siguientes valores de las variables X e Y ajustar una recta por mínimos
cuadrados y dar una medida del ajuste realizado.
Y 16 19 22 25
X 52 39 45 51
Solución
<q 16 19 22 25 82
; r 52 39 45 51 187
< s2 256 361 484 625 1726
; t2 2704 1521 2025 2601 8851
; < ✈ ✉ 832 741 990 1275 3838
187 8851
; = = 46,75 6 ②2 = − (46,75) 2 = 27,19 6 ③ = 27,19 = 5,21
4 4
④✧⑤ =
3838
6 − (46,75)(20,5) = 1,125
4
1,125
U = = 0,064 U
2
= (0,064) 2 = 0,0041
(3,35)(5,21)
79
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 55.- En una residencia de ancianos tenemos: El 20% casados, el 30% solteros y el 50%
viudos. El 5% de los casados tienen mal carácter, el 10% de los solteros y el 20% de los
viudos también tienen mal carácter.
1.- Hallar el porcentaje de personas que tengan mal carácter y estén casadas.
2.- Sabiendo que tienen mal carácter hallar el porcentaje de personas que estén casadas.
Solución
Estado civil
C S V
Tener mal SI 1 3 10 14
Carácter
NO 19 27 40 86
20 30 50 100
80
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
190
Suceso A = ser mujer (190) %(A) = 100 = 36,40%
522
332
Suceso $ = No ser mujer (522 − 190) = 332 %( $ ) = 100 = 63,6%
522
A $
4 ❷❹❸ =
(112)(210)− (78)(122) = 14004 = 0,424
(112)(210)+ (78)(122) 30036
0,424 es el grado de asociación entre sexo y delincuencia, se atraen el ser mujer con ser
delincuente
81
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
82
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 58.- Deseamos analizar la posible relación entre el color de la piel y el tener o no los
ojos azules, para ello tomamos una muestra de 200 personas de las cuales 79 tienen piel
clara y entre estas hay 49 con ojos azules, mientras que entre los que tienen piel oscura
tenemos 25 con ojos azules.
Solución
A $
B 49 25 74
%
30 96 126
79 121 200
49 25 74
≠ ≠ No se mantienen las proporciones, condición necesaria para ser
79 121 200
Independientes
Luego A y B 12 son Independientes
4 ❺❹❻ =
(49)(96)− (30)(25) = 3954
= 0,7249
(49)(96)+ (30)(25) 5454
0,7249 es el grado de asociación entre el color de la piel y el de los ojos, tener piel clara
y tener ojos azules, se atraen
83
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
PRÁCTICA RELIGIOSA
Grupos nunca Varias Algunas Solo Domingos Varias a la
Pacifistas al año al mes domingos y festivos semana
Muy cercano 77 31 18 16 25 4
Cercano 161 119 57 67 62 3
Distante 42 26 36 34 21 2
Muy Distante 14 18 6 13 12 0
Solución
PRÁCTICA RELIGIOSA
Grupos nunca Varias Algunas Solo Domingos Varias a la TOTAL
Pacifistas al año al mes domingos y festivos semana
Muy cercano 77 31 18 16 25 4 171
Cercano 161 119 57 67 62 3 469
Distante 42 26 36 34 21 2 161
Muy Distante 14 18 6 13 12 0 63
TOTAL 294 194 117 130 120 9 864
PRÁCTICA RELIGIOSA
Grupos Nunca Varias Algunas Solo Domingos Varias a la TOTAL
Pacifistas al año al mes domingos y festivos semana
Muy cercano 58,4 38,4 23,1 25,7 23,8 1,6 171
Cercano 159,6 105,3 63,5 70,6 65,1 4,9 469
Distante 54,8 36,2 21,8 24,2 22,4 1,6 161
Muy Distante 21,2 14,1 8,6 9,5 8,7 0,9 63
TOTAL 294 194 117 130 120 9 864
χ2 =
∑( 2% − 7( )
2
=
(77 − 58,4)2 +
31 − 38,4 2 (18 − 23,1)
+
2
+ ....................... = 7,2
7( 58,4 38,4 23,1
COEFICIENTE DE CONTINGENCIA
χ2 7, 2
& = = = 0,09 No Parece demasiado grande
χ2 + 1 7,2 + 864
84
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 60.- Se esta estudiando la relación existente entre los años de estudio realizados por los
padres y los estudios realizados por los hijos. Para ello se toma una muestra de 7 personas.
ENTREVISTADOS PADRES HIJOS
A 12 12
B 10 8
C 6 6
D 16 11
E 8 10
F 9 8
G 12 11
Solución
< =
∑ < ❼
=
66
= 9,43 años ; =
∑ ; ❽
=
73
= 10,43 años
1 7 1 7
6❿
2
=
∑ <❾
2
−<
2
=
666
− (9,43) 2 = 6,2 6➁
2
=
∑ ; ➀ 2 Q➀ 2
−; =
825
− (10,43) 2 = 9,07
1 7 1 7
6 ➂ =+ 6 ➂ 2
= + 6,2 = 2,49 años 6 ➄ =+ 6 ➃ 2 = + 9,07 = 3,01 años
6 ➇✧➈ = ∑ ; < ➆ ➅
− ;< =
720
− (9,43)(10,43) = 4,5
1 7
6 ➊✧➉ 4,5
U = = 0,60 U
2
= (0,60) 2 = 0,36 36% de fiabilidad. Aunque no es
6➊ 6➉ (3,01)(2,49)
bastante grande nos indica que no es demasiado buena la relación lineal entre ambas
variables. De todas formas establecemos esa relación:
6 ➋✧➌ 4,5
E = = = 0,49 D = < − E ; = 9,43 − 0,49(10,43) = 4,32
6➋
2
9,07
Recta: <➎ * = 4,32 + 0,49 ; ➍
85
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 61.- Hallar las rectas de regresión de las variables X e Y correspondientes a las edades
de hombres y mujeres a la hora de contraer matrimonio, y hallar el grado de correlación.
Esposo 40 36 20 18 60 50
Esposa 27 25 17 16 37 32
Solución
Esposo Esposa
X Y ;
2
<
2
;<
< =
∑ < ➏
=
154
= 25,6 años ; =
∑ ; ➐
=
224
= 37,3 años
1 6 1 6
6 ➒2 = ∑ < ➑ 2
−< =
2 4292
− (25,6) 2 = 59,97
1 6
6 ➔2 = ∑ ; ➓ 2 Q➓
−; =
2 9720
− (37,3) 2 = 228,71
1 6
6 → =+ 6 → 2 = + 59,97 = 7,74 años 6 ↔ =+ 6 ➣2 = + 228,71 = 15,12 años
6 ➛✧➜ = ∑ ; < ➙ ↕
− ;< =
6428
− (25,6)(37,3) = 116,45
1 6
6 ➞✧➝ 116,45
U = = 0,995 U
2
= (0,995) 2 = 0,99 99% de fiabilidad. Es bastante
6➞ 6➝ (15,12)(7,74)
grande nos indica que es buena la relación lineal entre ambas variables. Establecemos esa
relación:
6 ➟✧➠ 116,45
E = = = 0,50 D = < − E ; = 25,6 − 0,50(37,3) = 6,95
6➟
2
228,71
Recta: <➢ * = 6,95 + 0,50 ; ➡
86
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 62.- Dadas las variables estadísticas correspondientes a las edades de 5 niños y sus
pesos respectivos, hallar las rectas de regresión y su representación gráfica.
Edad 2 4 6 7 8
Peso 15 19 25 33 34
Solución
Edad Peso
X Y ;
2
<
2
;<
2 15 4 225 30
4 19 16 361 76
6 25 36 625 150
7 33 49 1089 231
8 34 64 1156 272
27 126 169 3456 759
< =
∑ < ➤
=
126
= 25,2 Kg. ; =
∑ ; ➥
=
27
= 5,4 años
1 5 1 5
6 ➧2 = ∑ < ➦ 2
−< =
2 3456
− (25,2) 2 = 56,16 6 ➩2 = ∑ ; ➨ 2 Q➨
−; =
2 169
− (5,4) 2 = 4,64
1 5 1 5
6 ➫ =+ 6 ➫ 2
= + 56,16 = 7,5 Kg. 6 ➯ =+ 6 ➭ 2
= + 4,64 = 2,15 años
6 ➵✧➸ = ∑ ; < ➳ ➲
− ;< =
759
− (25,2)(5,4) = 15,72
1 5
6 ➻✧➺
15,72
U = = 0,974 U
2
= (0,974) 2 = 0,95 95% de fiabilidad. Es bastante
6➻ 6➺ (2,15)(7,5)
grande nos indica que es buena la relación lineal entre ambas variables. Establecemos esa
relación:
6 ➼✧➽ 15,72
E = = = 3,38 Es lo que varia Y al variar X en una unidad
6 ➼ 2
4,64
D = < − E ; = 25,2 − 3,38(5,4) = 6,948
Recta: <➚ * = 6,948 + 3,38 ; ➾
87
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Yj 14 - 18 18 - 22 22 - 26 26 - 30
Xi
3-5 0,00 0,01 0,09 0,40
5-7 0,08 0,06 0,03 0,01
7-9 0,30 0,02 0,00 0,00
Solución
Yj 14 - 18 18 - 22 22 - 26 26 - 30 I ➪
; ➪
I ➪
; ➶
2
I ➶
Xi
3-5 0,00 0,01 0,09 0,40 0,50 2,00 8,00
5-7 0,08 0,06 0,03 0,01 0,18 1,08 6,48
7-9 0,30 0,02 0,00 0,00 0,32 2,56 20,48
I ➹
< ➘
I ➘
I ➷ ➬
I ➮
= 5,64 6 ✃
➱ ➱
I ❐
= 22,24 6 ❮
❒ ❒
88
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
6 Ò✧Ó = ∑ Ð Ñ
; < I ÐÑ − ;< = 116,24 – (5,64)(22,24) = −9,1936
Xi / Yj < 22 ; Ô I Õ Õ
) ; Õ IÕ ; Ö2 I Ö
4 0,01 4 0,021 0,021 0,084 0,336
6 0,14 6 0,298 0,319 1,788 10,728
8 0,32 8 0,681 1 5,448 43,584
0,47 1 7,32 54,648
= ∑ ;× ∑
2
; I × = 7,32 6 Ù2 = ; Ø2 I Ø − ; = 54,648 − (7,32) 2 = 1,0656
6 Û 1,032
6 Ú = 1,0656 = 1,032 &9 ( ; )= = = 0,141
; 7,32
Xi / Yj > 26 ; Õ I Õ Õ
) ; Õ IÕ ; Ü2 I Ü
4 0,4 4 0,976 0,976 3,904 15,616
6 0,01 6 0,024 1 0,144 0,864
8 0,0 8 0 1 0 0
0,41 1 4,048 16,48
= ∑ ;× ∑
2
; I × = 4,048 6 Þ2 = ; Ý2 I Ý − ; = 16,48 − (4,048) 2 = 0,093696
6 0,306098
6 ß = 0,093696 = 0,306098 &9 ( ; )= = = 0,075
; 4,048
Es más homogénea la que sea menos dispersa, es decir la que tenga menor coeficiente de
variación. Es decir la distribución de Xi / Yj > 26 es más homogénea que la distribución
de Xi / Yj < 22
18 - 22 22 - 26 totales
0,01 0,09 0,10
0,06 0,03 0,09
0,02 0,00 0,02
0,09 0,12 0,21
89
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Yj 14 - 18 18 - 22 22 - 26 26 - 30 totales
I à
I á
16 20 24 28
< ã
I ã
1 0,25 − 0
T
1 = =0,25 → ,QWHUYDOR(14 − 18) = 14 + 4 = 16,25
4 4 0,445
2 0,5 − 0,445
T
2 = =0,50 → ,QWHUYDOR(18 − 22) = 18 + 4 = 18,66
4 4 0,333
3 0,75 − 0,445
T
3 = =0,75 → ,QWHUYDOR(18 − 22) = 18 + 4 = 21,66
4 4 0,333
T
2 − T
1 = 18,66 – 16,25 = 2,41 T
3 − T
2 = 21,66 – 18,66 = 3
4 4 4 4
Para que la distribución fuera simétrica, deberían de ser iguales ambas distancias.
FRECUENCIAS OBSERVADAS
Yj 14 - 18 18 - 22 22 - 26 26 - 30 I å
Xi
3-5 0,00 0,01 0,09 0,40 0,50
5-7 0,08 0,06 0,03 0,01 0,18
7-9 0,30 0,02 0,00 0,00 0,32
I æ
Yj 14 - 18 18 - 22 22 - 26 26 - 30 I å
Xi
3-5 0,19 0,045 0,06 0,205 0,50
5-7 0,0684 0,0162 0,0216 0,0738 0,18
7-9 0,1216 0,0288 0,0384 0,1312 0,32
I ç
(67$'Ë67,&$'(6&5,37,9$
Como 6ì✧í = −9,1936 < 0 Correlación inversa o negativa, ambas variables varían en
sentido contrario cuando una aumenta la otra disminuye y viceversa.
6 ï✧î − 9,1936
U = = = -0,9916 U
2
= (−0,9916) 2 = 0,98337
6 ï 6 î (1,777)(5,217)
98,337% de fiabilidad, o bondad del ajuste. El 98,337% de las variaciones de una variable
vienen explicadas por las variaciones de la otra variable a través de las rectas de regresión.
Como es suficientemente bueno establecemos la recta de regresión.
6 ð✧ñ − 9,1936
E = = = −2,9 Es lo que varia Y al variar X en una unidad
6 ð 2
3,16
D = < − E ; = 22,24 + 2,9(5,64) = 38,65
Recta: Y/X < ó * = 38,65 − 2,9 ; ò
6 ð✧ñ − 9,1936
E ’= = = −0,413 Es lo que varia X al variar Y en una unidad
6ñ
2
22,22
D ’= ; − E’< = 5,64 + 0,413(22,24) = 14,83
Recta: X/Y ; õ * = 14,83 − 0,413<ô
5.- Suponiendo que el día 30 de Junio ingresas en Ubarmin por rotura de menisco,
analiza las posibilidades que tienes de que el 6 de Julio, puedas oír el cohete desde la
plaza del Castillo.
; õ = 14,83 − 0, 413<ô
*
6.- En el mes de marzo una persona estuvo ingresada en Ubarmin por rotura de menisco
7 días y afirma tener 18 años. Comentar posible veracidad y fiabilidad de su
afirmación.
; õ = 14,83 − 0, 413<ô
*
ô = 38,65 − 2,9 ; õ
*
<
91
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 64.- A un grupo de alumnos se les examina de teoría (X) y práctica (Y) de una
asignatura. La nota global de dicha asignatura (Z) se obtiene de la siguiente forma:
Zi = X + Y
Se pide: Comparar la Homogeneidad de la distribución de la nota global en los dos casos
siguientes:
1.- las variables X e Y están totalmente correlacionadas
2.- Las variables X e Y son totalmente independientes
Solución
Zi = X + Y
= =
∑ = Q ù ù
=
∑( ; ù
+< ø
) Q ù ø
=
∑ ; Q ù ù
+
∑ < Q ø ø
= ; +<
1 1 1 1
6 ü
2
=
∑( = ú
−= ) = ∑ ((2
; ú
+ < )− û
(
; +< )) 2
Q ú û
=
∑ (( ; ú
−; + ) ( < û
−< ))
2
Q ú û
=
1 1 1
∑( ) ∑( ) ∑( )( )
2 2
; −; Q < −< Q ; −; < −< Q
= + +2
2
+ 2
+ 26 ✁
ý ý þ þ ý þ ý þ
= 6 ÿ
6 ÿ
1 1 1
6 ✂
&9 ( = )=
=
6 ✝ 2 + 6 ✞ 2 + 2 6 ✝✆✞
A.1.- r = +1 ⇒ 6 ✄✆☎ > 0 ⇒ &9 ( = )=
; +<
6 ✝ 2 + 6 ✞ 2 − 2 6 ✝✆✞
A.2.- r = −1 ⇒ 6 ✄✆☎ < 0 ⇒ &9 ( = )=
; +<
6 ☛2 + 6✡2
B.- r = 0 ⇒ 6 ✟✆✠ = 0 ⇒ &9 ( = )=
; +<
El CV(Z) en el caso A.-1 siempre será mayor que el CV(Z) del caso B
El CV(Z) en el caso A.-2 siempre será menor que el CV(Z) del caso B
Luego la más homogénea será cuando existe correlación perfecta negativa.
92
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 65.- Un hospital adquiere una nueva maquina para rellenar bombonas de oxigeno. Al
cabo de un mes, se eligen 100 bombonas al azar y se comprueba su peso:
peso en Kg. (45 - 48) (48 - 50) (50 - 53) (53 - 55)
Nº bombonas 10 48 30 12
Ni 10 58 88 100
Se supone que si el 75% de las bombonas pesan menos de 52 Kg., la maquina será
aceptada como buena, en caso contrario la maquina será devuelta. ¿Cree usted que el
hospital aceptara la maquina? Explique clara y exactamente el porqué de su respuesta.
Solución
Habrá que comprobar que el 75% de las bombonas pesan más o menos de 52 kilos.
Para ello hallaremos el percentil 75 y comprobaremos si es mayor o menor de 52.
O También podemos hallar bajo que percentil se encuentra el valor 52 y comprobar
si es mayor o menor que 75.
El percentil 75 será:
75
100 = 75 El percentil 75 será el valor de la variable que ocupa el lugar
100
inmediatamente siguiente al 75 y, que esta en el intervalo (50 – 53). Aplicando la
formula:
75 75
1 − 1 100 − 58
−1
= / −1 + 100 & = 14 +
100 3 = 51,7 < 52
☞
T
75
Q 30
☞ ☞
100 ☞
Por tanto No devolverá la maquina ya que 75% de las bombonas pesan menos de
52 kilos
De la otra forma:
T ✍
= / ✌
−1 + 100 & ✌
Q ✌
100
(T 75 − / −1 ) * Q ✎ ✎
(52 − 50)(30)
U = 100
+1 = ✎
+ 58 = 78
& ✎
93
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 66.-A una feria acuden 600 firmas expositoras que ocupan otros tantos “Stands”. La
superficie de estos, así como el personal asignado a cada uno vienen dados en la siguiente
tabla:
Personal m2 X
Y 10 - 20 20 - 30 30 - 70 70 - 130 total
0-2 74 10 0 0 84
2-6 46 86 22 2 156
6 - 10 18 76 26 12 132
10 - 12 2 60 50 22 134
12 - 18 0 30 26 38 94
totales 140 262 124 74 600
1.- Superficie aproximada de la feria teniendo en cuenta que hay 60.000 m2 desocupados.
2.- Distribución, en frecuencias relativas, de la superficie de los “Stands” en que trabajan
entre 5 y 15 personas.
3.- Distribución del personal asignado en “Stands” con superficie entre 25 y 70 m2.
Analizar la posible simetría de dicha distribución.
4.- Distribuciones de: Nº personas asignadas a un “Stand” / superficie > 30 m2
Nº personas asignadas a un “Stand” / superficie < 30 m2
¿Cuál de las dos es más homogénea y por qué?
5.- % de “Stands” que tengan asignadas menos de10 personas sabiendo que ocupan más
de 25 m2.
6.- Analizar y establecer la posible relación lineal entre ambas variables
7.- Estimar el número de personas que podemos esperar que tenga asignado un “Stand”
con 78 m2. Dar una media de la bondad de dicha estimación.
Solución
m2 X
Personal 15 25 50 100
Y 10 - 20 20 - 30 30 - 70 70 - 130 Q ✏
< Q
✑ ✑
<
✒
2
Q ✒
1 0-2 74 10 0 0 84 84 84
4 2-6 46 86 22 2 156 624 2496
8 6 - 10 18 76 26 12 132 1056 8448
11 10 - 12 2 60 50 22 134 1474 16214
15 12 - 18 0 30 26 38 94 1410 21150
Q ✓ 140 262 124 74 600 4648 48392
; Q ✔ ✔ 2100 6550 6200 7400 22250
2 31500 163750 310000 740000 1245250
; ✕
Q ✕
; < Q
✖ ✗ ✖ ✗ 6360 51800 61800 91600 211560
94
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
/ −/
✔
−1
✔
Frecuencias absolutas Q ✔
I ✘
10 - 20 1 46 + 18 + 2 + 1 0 = 31,5 0,090
4 2
20 – 30 1 86 + 76 + 60 + 1 30 = 172,5 0,490
4 2
30 – 70 1 22 + 26 + 50 + 1 26 = 94,5 0,270
4 2
70 - 130 1 2 + 12 + 22 + 1 38 = 53,5 0,150
4 2
352 1
3.- Distribución del personal asignado en “Stands” con superficie entre 25 y 70 m2.
Analizar la posible simetría de dicha distribución.
/ ✙
−1 −/ ✙
Frecuencias absolutas Q ✙
1 ✚
0–2 1 10 + 0 = 5 5
2
2–6 1 86 + 22 = 65 70
2
6 – 10 1 76 + 26 = 64 134
2
10 – 12 1 60 + 50 = 80 214
2
12 - 18 1 30 + 26 = 41 255
2
255
1 63,75 − 5
T
1 = 255 =63,75 → ,QWHUYDOR(2 − 6) = 2 + 4 = 5,615
4 4 65
2 127,5 − 70
T
2 = 255 = 127,5 → ,QWHUYDOR(6 − 10) = 6 + 4 = 9,594
4 4 64
3 191,25 − 134
T
3 = 255 = 191,25 → ,QWHUYDOR(10 − 12) = 10 + 2 = 11,431
4 4 80
T
2 − T
1 = 9,594 – 5,615 = 3,979 T
3 − T
2 = 11,431 – 9,594 = 1,837
4 4 4 4
Para que la distribución fuera simétrica, deberían de ser iguales ambas distancias. Por tanto
No es simétrica.
(67$'Ë67,&$'(6&5,37,9$
/ ✛
−1 −/ ✛
Q ✜
< ✢
< Q
✣ ✣
<✥
2
Q ✤
> 30 ;
0–2 0+0=0 1 0 0
2–6 22 + 2 = 24 4 96 384
6 – 10 26 + 12 = 38 8 304 2432
10 – 12 50 + 22 = 72 11 792 8712
12 - 18 26 + 38 = 64 15 960 14400
198 2152 25928
=
2152
= 10,87
1 198
La varianza será: 6 ★
2
=
∑ < ✧
2
Q ✧
−< =
2 25928
− 10,87 2 = 12,82
1 198
=+ 6 ✩
2
= + 12,82 = 3,58
6 3,58
= = = 0,329
✪
/ ✫
−1 −/ ✫
Q ✬
< ✭
< Q
✮ ✮
<✰
2
Q ✯
< 30 ;
0–2 74 + 10 = 84 1 84 84
2–6 46 + 86 = 132 4 528 2112
6 – 10 18 + 76 = 94 8 752 6016
10 – 12 2 + 60 = 62 11 682 7502
12 - 18 0 + 30 = 30 15 450 6750
402 2496 22464
=
2496
= 6,20
1 402
La varianza será: 6 ✳
2
=
∑ < ✲
2
Q ✲
−< =
2 22464
− 6,20 2 = 17,44
1 402
=+ 6 ✴
2
= + 17,44 = 4,1762
6 4,1762
= = = 0,6735
✵
(67$'Ë67,&$'(6&5,37,9$
5.- % de “Stands” que tengan asignadas menos de10 personas sabiendo que ocupan más
de 25 m2.
148
% de Stand” con (menos de 10 personas / más de 25 m2) = 100 = 44,985%
329
140 * 84
74 ≠ = 19,6
600
< =
∑ <✶ Q✶ = 4648 = 7,75 . ; =
∑ ; ✷ Q✷ = 22250 = 37,08
1 600 1 600
6✹
2
=
∑ < ✸2
−< =
2 48392
− (7,75) 2 = 20,65
1 600
6 ✻ 2
=
∑ ; ✺ 2 Q✺
−; =
2 1245250
− (37,08) 2 = 700,5
1 600
6 ✼ =+ 6 ✼2 = + 20,65 = 4,54 6 ✾ =+ 6 ✽ 2 = + 700,5 = 26,46
6 ❁✆❂ = ∑ ; < ❀ ✿
− ;< =
211560
− (37,08)(7,75) = 65,23
1 600
6 ❄✆❃
65,23
U = = 0,543 U 2 = (0,543) 2 = 0,295 29,5% de fiabilidad. Es
6❄ 6❃ (26,46)(4,54)
bastante pequeña nos indica que es bastante pequeña la relación lineal entre ambas
variables. Solamente el 29,5% de las variaciones de una variable vienen explicadas por las
variaciones de la otra variable a través de las rectas de regresión.
Establecemos esa relación:
Recta Y/X
6 ❅✆❆ 65,23
E = = = 0,09 Es lo que varia Y al variar X en una unidad
6 ❅ 2
700,5
D = < − E ; = 7,75 − 0,09(37,08) = 4,3
Recta: <❈ = 4,3 + 0,09 ; ❇
*
97
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
7.- Estimar el número de personas que podemos esperar que tenga asignado un “Stand”
con 78 m2. Dar una media de la bondad de dicha estimación.
98
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
= I ▼
100 ; ◆
S ◆
3❖
%
Productividad Cualificado Cualificado Técnico
% acumulado
; (En %) (En %) (En %)
1 10 5 - 4,5 4,5 4,5
2 20 20 10 17 34 21,5
3 30 20 40 28 84 49,5
4 30 40 30 35 140 84,5
5 10 15 20 15,5 77,5 100
100 340
; =
∑ ; Q ▲ ▲
=
∑ ; P
S P
=
340
= 3,4 Coeficiente de productividad media.
1 100 100
Coeficiente Personal No ; ❙
S ❙
; ❚
2
S ❚
99
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Productividad Cualificado
; (1) (En %)
1 10 10 10
2 20 40 80
3 30 90 270
4 30 120 480
5 10 50 250
100 310 1090
; (1) =
∑ ; ❯
(S ❯
=
310
= 3,1 6 ❲
2
(1) =
∑ ; ❱
2
S ❱
−; =
2 1090
− (3,1) 2 = 1,29
100 100 100 100
6 1,1358
(1) = 2
= 1,29 = 1,1358 (1)= = = 0,36 Homogeneidad
❨
6 ❳ 6 ❳ &9
; 3,1
aceptable ya que es menor de 1. Nos dice que hay una dispersión bastante pequeña.
Coeficiente Personal No ; ❩
S ❩
; ❬
2
S ❬
Productividad Cualificado
; (2) (En %)
1 5 5 5
2 20 40 80
3 20 60 180
4 40 160 640
5 15 75 375
100 340 1280
; ( 2) =
∑ ; ❭
(S ❭
=
340
= 3,4 6 ❫
2
(2) =
∑ ; ❪
2
S ❪
−; =
2 1280
− (3,4) 2 = 1,24
100 100 100 100
6 1,1135
( 2) = 2
= 1,24 = 1,1135 (2)= = = 0,32 Homogeneidad
❵
6 ❴ 6 ❴ &9
; 3,4
aceptable ya que es menor de 1. Nos dice que hay una dispersión bastante pequeña.
100
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 68.- En los últimos 10 años (1.988 - 1.997) el número de personas menores de 18 años
ingresadas en Ubarmin han sido: 28 - 30 - 29- 30 - 32 - 34 - 33 - 33 - 34 - 35
1.- ¿Podemos confirmar la aparente tendencia lineal creciente, del número de personas,
menores de 18 años, ingresadas en Ubarmin en los últimos años? ¿Con que fiabilidad?
2.- Pronosticar el número de personas, menores de 18 años, que cabe esperar para el año
2.005. Suponiendo que se mantiene la tendencia lineal.
3.- Analizar la representatividad del número medio de ingresos en Ubarmin de personas
menores de 18 años, en los últimos 10 años.
Solución
1994 28 1 784 1 28
1995 30 2 900 4 60
1996 29 3 841 9 87
1997 30 4 900 16 12
1998 32 5 1024 25 160
1999 34 6 1156 36 204
2000 33 7 1089 49 231
2001 33 8 1089 64 264
2002 34 9 1156 81 306
2003 35 10 1225 100 350
318 55 10164 385 1810
; =
∑ ; ❛
=
318
= 31,8 < =
∑ ❜
<
=
55
= 5,5
1 10 1 10
6 ❞2 = ∑ ; ❝ 2 Q❝
−; =
2 10164
− (31,8) 2 = 5,16 6 ❢ =+ 6 ❡ 2 = + 5,16 = 2,27
1 10
6 ❤ 2
=
∑ < ❣2 385
−< =
2
− (5,5) 2 = 8,25 6 ✐ = + 6 ✐ 2 = + 8,25 = 2,87
1 10
6 ❧✆♠ =
∑ ; ❦ <❥ − ; < = 1810 − (31,8)(5,5) = 6,1
1 10
6 ♦✆♥ 6,1
U = = 0,936 U
2
= (0,936) 2 = 0,8767 87,67% de fiabilidad. Es
6♦ 6♥ (2,27)(2,87)
bastante grande nos indica que es buena la relación lineal entre ambas variables.
Establecemos esa relación:
6 ♣✆q 6,1
E = = = 1,18 Es lo que varia Y al variar X en una unidad
6♣
2
5,16
D = < − E ; = 5,5 − 1,18(31,8) = −31,36
Recta: <s = −31,36 + 1,18 ; r
*
101
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
6 ✉✆t 6,1
E ’= = = 0,74 Es lo que varia X al variar Y en una unidad
6 t 2
8,25
D ’= ; − E’< = 31,8 − 0,74(5,5) = 27,73
Recta: ; ✇ * = 27,73 + 0,74<✈
1.- ¿Podemos confirmar la aparente tendencia lineal creciente, del número de personas,
menores de 18 años, ingresadas en Ubarmin en los últimos años? ¿Con que fiabilidad?
2.- Pronosticar el número de personas, menores de 18 años, que cabe esperar para el año
2.005. Suponiendo que se mantiene la tendencia lineal.
2,27 6 ⑤
&9 (; ) = 0,071 Menor de 1 y además muy pequeño, Luego poca dispersión,
=
; 31,8
es decir es muy homogénea la distribución, los datos son muy parecidos, la media es muy
representativa del conjunto.
102
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 69.- En una clase el 30% de alumnos varones y el 10% de mujeres son repetidores.
Sabiendo que en una clase de 160 alumnos hay 90 varones. Calcular el porcentaje de
alumnos que siendo repetidores sean mujeres.
Solución
B 27 7 34
%
63 63 126
90 70 160
% (Mujer/repetidor) = % $ =
(
0XMHU ∩ Re SHWLGRUD )
=
7
100 = 20,588 %
% (Re SHWLGRUD ) 34
Es decir el 20,588% de los repetidores son mujeres.
103
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Sabiendo que:
Xi = peso, en kilos, de los niños nacidos en maternidad en una semana
Yj = peso, en gramos, que pierden los recién nacidos en esos primeros días
1.- Analizar y establecer la posible relación lineal entre ambas variables.
2.- Pronosticar el peso de un niño que ha perdido en esos días 400 gramos de peso. Dar una
medida de la fiabilidad de dicho pronóstico.
3.- Calcular el peso medio de los niños nacidos en maternidad que han perdido menos de
200 gramos. Compararla con la media de los que si han perdido mas de 200 gramos. Y
decir cual es mas representativa y porque.
4.- distribución de X/ 100 < Y< 400 ¿podemos afirmar que es simétrica?
5.- Distribuciones marginales de ambas variables. ¿Cuál es más homogénea? ¿Por qué?
Solución
< Q
⑦ ⑦
<
⑧
2
Q ⑧
Y 2 3 4 5
100 50-150 14 28 21 7 70 7000 700000
200 150-250 4 8 6 2 20 4000 800000
300 250-350 6 12 9 3 30 9000 2700000
400 350-450 4 8 6 2 20 8000 3200000
Q 28 ⑨ 56 42 14 140 28000 7400000
; Q ⑩ ⑩ 56 168 168 70 462
2 112 504 672 350 1638
; ❶
Q ❶
; < Q
❷ ❸ ❷ ❸ 11200 33600 33600 14000 92400
Y
50-150 14 28 21 7 70
150-250 4 8 6 2 20
250-350 6 12 9 3 30
350-450 4 8 6 2 20
Q ⑩ 28 56 42 14 140
104
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
; =
∑ ; ❹ Q❹ = 462 = 3,3 < =
∑ <❺ Q❺ = 28000 = 200 .
1 140 1 140
6 ❼ 2
=
∑ ; ❻ 2 Q❻
−; =
2 1638
− (3,3) 2 = 0,81 6 ❾ =+ 6 ❽ 2 = + 0,81 = 0,9
1 140
6 ➀2 = ∑ < ❿2 7400000
−< =
2
− (200) 2 = 12857,14 6 ➁ = + 12857,14 = 113,39
1 140
6 ➄✆➅ =
∑ ; ➃ < ➂
− ;< =
92400
− (3,3)(200) = 0 Incorrelación total
1 140
2.- Pronosticar el peso de un niño que ha perdido en esos días 400 gramos de peso. Dar una
medida de la fiabilidad de dicho pronóstico.
3.- Calcular el peso medio de los niños nacidos en maternidad que han perdido menos de
200 gramos. Compararla con la media de los que si han perdido mas de 200 gramos. Y
decir cual es mas representativa y porque.
(1) = Niños nacidos en maternidad que han perdido menos de 200 gramos.
Q ➆ 16 32 24 8 80
; Q ➇ ➇ 32 96 96 40 264
; ➈ 2 Q➈ 64 288 384 200 936
; (1) =
∑ ; ➉ ( Q➉
=
264
= 3,3 6 ➋ 2 (1) = ∑ ; ➊ 2 Q➊
−; =
2 936
− (3,3) 2 = 0,81
1 80 1 80
6➍ 0,9
6 ➌ (1) = 6 ➌2 = 0,81 = 0,9 &9 (1)= = = 0,2727
; 3,3
(2) = Niños nacidos en maternidad que han perdido más de 200 gramos.
105
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Q ➎ 12 24 18 6 60
; Q ➏ ➏
24 72 72 30 198
2 48 216 288 150 702
; ➐
Q ➐
; ( 2) =
∑ ; ➑
(Q
➑
=
198
= 3,3 6 ➓
2
(2) =
∑ ; ➒
2
Q ➒
−; =
2 702
− (3,3) 2 = 0,81
1 60 1 60
6 0,9
( 2) = 2
= 0,81 = 0,9 (2)= = = 0,2727
→
6 ➔ 6 ➔ &9
; 3,3
Son igual de homogéneas además tienen la misma media, y son igual de representativas. Es
porque las variables son independientes y por tanto se mantienen las proporciones.
4.- distribución de X/ 100 < Y< 400 ¿podemos afirmar que es simétrica?
Q ➣
19 38 28,5 9,5 95
; Q ➣ ➣
Q ➐
1 ↔
19 57 85,5 95
; =
∑ ; Q ↕ ↕
=
315,5
= 3,3
1 95
1 23,75 − 19
T
1 = 95 =23,75 → ,QWHUYDOR(2,5 − 3,5) = 2,5 + 1 = 2,625
4 4 38
2 47,5 − 19
T
2 = 95 = 47,5 → ,QWHUYDOR(2,5 − 3,5) = 2,5 + 1 = 3,25
4 4 38
3 71,25 − 57
T
3 = 95 = 71,25 → ,QWHUYDOR(3,5 − 4,5) = 3,5 + 1= 4
4 4 28,5
T
2 − T
1 = 3,25 – 2,625 = 0,625 T
3 − T
2 = 4 – 3,25 = 0,75
4 4 4 4
Para que la distribución fuera simétrica, deberían de ser iguales ambas distancias. Por tanto
No es simétrica.
106
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
5.- Distribuciones marginales de ambas variables. ¿Cuál es más homogénea? ¿Por qué?
X Q ➙ Y Q ➛
; =
∑ ; Q
➜
462
= 3,3
➜
= < =
∑ < Q
28000
➝ ➝
=
= 200 .
1 140 1 140
6 ➞ = + 0,81 = 0,9 6 ➟ = + 12857,14 = 113,39
6
0,9 6 113,39
( ; )= = 0,2727= &9 (< )= = = 0,56
➡
➠
&9
; 3,3 < 200
Es más homogénea la distribución de la variable X (peso de los recién nacidos) que la
distribución de la variable Y (peso, en gramos, que pierden los recién nacidos en esos
primeros días) Ya que presenta un coeficiente de variación menor, es decir tiene menor
dispersión por tanto es más homogénea.
107
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 71.- Un hospital adquiere una nueva maquina para rellenar bombonas de oxigeno. Al
cabo de un mes, se eligen 100 bombonas al azar y se comprueba su peso:
Peso en Kg. (45 - 48) (48 - 50) (50 - 53) (53 - 55)
Nº bombonas 10 48 30 12
Se supone que si el 75% de las bombonas pesan menos de 52 Kg., la maquina será
aceptada como buena, en caso contrario la maquina será devuelta. ¿Cree usted que el
hospital aceptara la maquina? Explique clara y exactamente el porqué de su respuesta.
Solución
Habrá que comprobar que el 75% de las bombonas pesan más o menos de 52 kilos.
Para ello hallaremos el percentil 75 y comprobaremos si es mayor o menor de 52.
O También podemos hallar bajo que percentil se encuentra el valor 52 y comprobar
si es mayor o menor que 75.
El percentil 75 será:
75
100 = 75 El percentil 75 será el valor de la variable que ocupa el lugar
100
inmediatamente siguiente al 75 y, que esta en el intervalo (50 – 53). Aplicando la
formula:
75 75
1 − 1 100 − 58
−1
= / −1 + 100 & = 14 +
100 3 = 51,7 < 52
➢
T
75
Q 30
➢ ➢
100 ➢
Por tanto No devolverá la maquina ya que 75% de las bombonas pesan menos de
52 kilos
De la otra forma:
T ➥
= / ➤
−1 + 100 & ➤
Q ➤
100
(T 75 − / −1 ) * Q ➦ ➦
(52 − 50)(30)
U = 100
+1 = ➦
+ 58 = 78
& ➦
108
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 72.- Realizada una encuesta entre fumadores se obtuvieron los resultados, de la tabla,
sobre las variables: X: Nº de cigarrillos fumados diariamente
Y: Horas de sueño diarias
Nº DE CIGARRILLOS
Horas 2 -6 6 - 12 12 - 14 14 - 20 20 - 30 total
4-6 0 2 8 26 36 72
6-7 4 10 16 20 26 76
7-8 18 24 14 12 14 82
8-9 28 26 10 4 2 70
total 50 62 48 62 78 300
Solución
,QWHUYDORV ; ➧
Q ➨ 1 ➨
5 2
4-6 5 26+ 36 =28,87 28,87
6 10
5 2
6-7 6,5 20+ 26 =21,86 50,73
6 10
5 2
7-8 7,5 12+ 14 =12,80 63,53
6 10
5 2
8-9 8,5 4+ 2 =3,73 67,26
6 10
67,26
67,26
= 22,42%
300
2).- Obtener el número mínimo de cigarrillos diarios que fuma uno de los fumadores
del 30% que más fuma.
Percentil 70
70
300 = 210 ⇒ ,QWHUYDOR(14 − 20)
100
70 70
1 − 1 300 − 160
−1➩
T
70 = / −1 + 100
➩ & = 60 +
➩
100 6 = 18,84FLJDUULOORV
Q 62
100
➩
109
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
4).- Estimar el consumo de tabaco para una población de 1.500 personas de las que son
fumadoras el 32%
5).- Estimar el número de horas de sueño diarias para una persona que fuma 35
cigarrillos al día.
6).- Porcentaje de personas fumadoras que duermen entre 6 y 8 horas sabiendo que no
fuman más de 15 cigarrillos al día
Menos de 15 Más de 15
cigarrillos cigarrillos
Menos de 6 horas de 14,33 57,67 72
sueño
Entre 6 y 8 horas de 91,33 66,67 158
sueño
Más de 8 horas de 64,67 5,33 70
sueño
170,33 129,67
Duermen entre 6 y 8 horas 91,33
% = 100 = 53,62%
No fuman más de 15 cigarrillos 170,33
110
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 73.- Una empresa decide hacer un reajuste entre sus empleados. La clasificación se lleva a
cabo mediante un Test, que arroja las siguientes puntuaciones:
Nº de Empleados Ni
Puntuación
0 – 30 94 94
30 – 50 140 234
50 – 70 160 394
70 – 90 98 492
90 - 100 8 500
La planificación óptima de la empresa exige que el 65% sean Administrativos, el 20% Jefes de
Sección, el 10% Jefes de Departamento y el 5% Inspectores, según sea la puntuación obtenida
(estas categorías van de menor a mayor puntuación) Calcular la puntuación máxima para ser
Administrativo, Jefe de Sección y Jefe de Departamento.
Solución
65
siguiente a (500) = 325
100
85
inmediatamente siguiente a (500) = 425
100
95
inmediatamente siguiente a (500) = 475
100
El último 5% Inspectores.
Luego hay que hallar los tres puntos que dividirán la distribución en cuatro partes:
T
65 T 85 T
95
100 100 100
U
1 − 1 −1
➫
= 100
Aplicando la formula del percentil: T ➭
/ ➫
−1 + & ➫
Q
100
➫
65
(500) − 234
T
65 = / − 1 + 100
➯ (20) = 61,375 SXQWRV.
100
160
(67$'Ë67,&$'(6&5,37,9$
85
(500) − 394
T = / −1 + 100 (20) = 76,326 SXQWRV.
85 ➲
100
98
95
(500) − 394
T = / −1 + 100 (20) = 86,53 SXQWRV.
95 ➳
100
98
112
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
14 − 15,5 82,4 − 75
= ➾ (* ) = = −0,6 = ➚ (* ) = = 0,24 = * ( ) = −0,6 + 0,24 = −0,36
2,5 30,6
La posición relativa más alejada de la media es 0,561 Luego en términos relativos esta
más cerca de la media - 0,36
En este caso como se supone que es mejor estar por encima de la media tendrá mejor
posición el alumno F que tiene posición más alejada de la media pero por encima
113
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
/ −/ ; Q 1 1
➹
−1
* 100 =
➪ ➪
3
➶ ➶ ➶ ➹
; Q ➘ ➘
; Q ; Q 3 T 3 −T
*100= T
➬ ➬
∑ ∑
➴ ➴ ➷ ➷ ➷ ➷
; Q ; Q
➷
➴ ➴ ➷ ➷
acumulado
320 0.275 0.275 0.882 0.275 0.607
935 0.805 1.080 2.758 1.080 1.678
7385 6.35 7.430 14.40 7.430 6.966
14940 12.85 20.28 32.70 20.28 12.42
17050 14.66 34.94 49.80 34.94 14.86
40740 35.03 69.97 81.91 69.97 11.94
17460 15.01 84.98 92.61 84.98 7.63
20100 7.39 100 100 100 0
116290
➮
−1
∑( 3➬ −T ➬ )
56,101
* = =1
➬
➬
➮
−1
= = 0,2004
∑
275,0056
3 ➬
=1
No existe demasiada concentración, El coeficiente está comprendido entre 0 y 1, a
mayor índice mayor concentración.
114
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 76.- Se conocen las ventas de un cierto número de empresas. Y se desea obtener las
ventas medias de este número de empresas.
Ventas (millones) 4 5 6 7
Empresas 10 3 3 10
Solución
; ➬ Q ➬ ; Q
➱ ➱
4 10 40
5 3 15
6 3 18
7 10 70
26 143
Ventas Medias ; =
∑ ; Q ✃ ✃
=
143
= 5,5 millones .
1 26
115
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 77.- De una encuesta realizada entre 100 familias han agrupado la masa de salarios
según la siguiente distribución:
Solución
; ➱ Q ➱ ; Q
➱ ➱
Salario medio
1000 20 20000
2000
3000
30
30
60000
90000 ; =
∑ ; Q ❐ ❐
=
250.000
= 2.500
1 100
4000 20 80000
100 250.000
.
2.- Obtener el salario medio con cambio de origen 2.000 8
❒ =; ❒
− 2000
8
❮ =; ❮
− 2000 Q
❮
8 Q
❮ ❮
Salario medio
-1000
0
20
30
-20000
0 8 =
∑ 8 Q ❰ ❰
=
50000
= 500
1 100
1000 30 30000
2000 20 40000
100 50.000 ; = 8 + 2.000 = 2.500
;
3.- Obtener el salario medio con cambio de unidad 1.000 8 =
Ï
1.000
Ï
; Q 8 Q Salario medio
8 =
Ð
1.000
Ð
❮ ❮ ❮
1 20 20
2 30 60 8 =
∑ 8 Q ❰ ❰
=
50000
= 500
3 30 90 1 100
4 20 80
100 250 ; = 8 + 2.000 = 2.500
116
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
; − 2000
=
Ñ
8 Ñ
1000
8
❮ ❮ ❮
1000
-1
0
20
30
-2
0 8 =
∑ 8 Q Ó Ó
=
5
= 0,05
1 100
1 30 3
2 20 4
100 5 ; = 8 *1000 + 2.000 = 2.500
117
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
Xi ni Ni Xi ni
1 6 6 6
2 5 11 10
3 3 14 9
4 3 17 12
5 3 20 15
20 52
valores de la variable
7
2
Frecuencia
0 N = 20,00
1,0 2,0 3,0 4,0 5,0
valores de la variable
118
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1 .- Dados los siguientes valores: 2,38; 2,06; 2,15; 2,47; 2,21; 2,36; 2,32; 2,32; 2,24;
2,15; 2,10; 2,13; 2,49; 2,41; 2,29; 2,36; 2,22; 2,46; 2,19; 2,06.
1.- Obtener la tabla estadística de valores agrupados, comprendidos entre 2,00 y 2,50; con
una amplitud de 0,10 para cada intervalo
2.- Obtener el histograma de frecuencias
Solución
INTERVALOS ni Xi
2 – 2,10 2 2,05
2,10 – 2,20 5 2,15
2,20 – 2,30 4 2,25
2,30 – 2,40 5 2,35
2,40 – 2,50 4 2,45
20
valores de la variable
6
2
Frecuencia
0 N = 20,00
2,05 2,15 2,25 2,35 2,45
valores de la variable
119
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
6ROXFLyQ
×
; Ô
I
Õ
Q Ö
= I Ö
(50) 1 ×
= ∑Q ×
=1
×
7,90 0,10 5 5
8,10 0,20 10 15
8,30 0,40 20 35
8,50 0,30 15 50
120
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
6ROXFLyQ
; Ö
Q
Ø 1 Ø ; Q
Ù Ù
5.000 60 60 300.000
6.000 50 110 300.000
7.000 70 180 490.000
8.000 80 260 640.000
9.000 50 310 450.000
Media = ; =
∑ Xini =
3.422
= 171,1 cm.
N 20
Moda Mo = Valor de la variable que más veces se repite, en este caso el valor
168 es la moda, que se repite cuatro veces.
121
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 82-. Realizada una encuesta entre 100 pacientes de un hospital sobre dos características
x e y se obtuvieron los siguientes resultados:
Solución
; =
∑ ; Q à à
=
1.650
= 16,50 < =
∑ á
< Q á
=
840
= 8,4 .
1 100 1 100
6 ã2 = ∑ ; â Qâ
2
−; =
2 587.500
− (16,5) 2 = 5602,75 6 å =+ 6 ä 2 = + 5602,75 = 74,85
1 100
6 ç2 = ∑ < æ2
149.000
−< =
2
− (8,4) 2 = 1419,44 6 è = + 1419,44 = 37,67
1 100
6 ë✆ì =
∑ ; ê <é − ; < = 295.000 − (16,5)(8,4) = 2811,4 Correlación positiva
1 100
í
6 î
= (0,9971) = 0,9942 99,42% de fiabilidad
2811,44
U = í = = 0,9971 2 2
U
î
6 6 (74,85)(37,67)
(1 − ) = (1 − 0,9942) = 0,0058
U
2
0,58% No explicado
74,85 6 ï 6ð 37,67
&9 ( ; )= = 4,536 = &9 (< )= = = 4,484
; 16,5 < 8,4
ñ✆ò
6 2811,4
E = ñ2 = = 0,5 Es lo que varia Y al variar X en una unidad
6 5602,75
D = < − E ; = 8,4 − 0,5(16,5) = 0,15 Recta <
: <ô * = 0,15 + 0,5 ; ó
;
6 ö✆õ 2811,4
E ’= = = 1,98 Es lo que varia X al variar Y en una unidad
6 õ 2
1419,44
D ’= ; − E’< = 16,5 − 1,98(8,4) = −0,13 Recta ;
: ; ø * = −0,13 + 1,98<÷
<
122
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
74,85 6 6 37,67
( ; )= = 4,536 =
&9 (< )= = = 4,484
ù ú
&9
; 16,5 < 8,4
Ambas tienen mucha dispersión ya que los coeficientes son mayores de 1 luego hay muy
poca homogeneidad.
2º.- Hallar r y explicar su Significado
û
6 2811,44
U = = = 0,9971
ü
(74,85)(37,67 )
û
6 6
6 2811,4
E ’= = = 1,98 Coeficiente de regresión de ;
þ
2 <
ý
6 1419,44
5º.- Estimar el valor de X para Y =9
= −0,13 + 1,98< ; ✁ = −0,13 + 1,98(9 ) = 17,69
* *
; ÿ
7º.- Significado del valor del coeficiente de regresión lineal de la recta de Y*/X
6 ✂☎✄ 2811,4
E = = = 0,5 Es lo que varia Y al variar X en una unidad
6 ✂ 2
5602,75
8º.- Hallar y explicar el Significado de (1 - r2)
( )
1 − U 2 = (1 − 0,9942 ) = 0,0058 0,58% De la variación de una variable que No
viene explicado por las variaciones de la otra variable.
9º.- Es cierto que la variable X es más dispersa que la variable Y, ya que tiene una mayor
varianza
No, la varianza mide dispersión absoluta, para comparar dispersiones es necesario
medidas de dispersión relativas, en este caso utilizamos el coeficiente de variación, es algo
mayor el de la variable X por lo que será un poco más dispersa, pero ambas son demasiado
dispersas.
10.- Significado de la Covarianza entre X e Y
6 ✞☎✟ =
∑ ; ✝ <✆ − ; < = 295.000 − (16,5)(8,4) = 2811,4 Correlación positiva Ambas
1 100
variables varían en el mismo sentido.
11º.- % de la variación de X explicada por la variación de Y
= (0,9971) = 0,9942 99,42%
2 2
U
123
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
Es de Indices, no entra
124
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 84.- En un museo se sabe que el precio medio de las entradas es de 76 Pts. Los adultos
deben pagar sus correspondientes entradas a 100 Pts. Y los niños a 20 Pts. ¿Que porcentaje
de adultos y niños visitan el museo?
Solución
125
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 85.- En un barrio de una ciudad, el 20% de las viviendas tienen una superficie entre 50
y 60 m2, el 25% entre 60 y 70 m2, el 20% entre 70 y 80 m2, el 25% entre 80 y 100 m2 y, el
10% entre 100 y 120 m2. Determínese:
1.- La superficie media por vivienda
2.- El tipo de vivienda más frecuente.
Solución
126
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
127
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
128
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
129
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1
∑∑ ; < Q = −15
☛ ☞ ☛ ☞
1
✠
¿Pueden ser las rectas de regresión entre las variables X e Y las siguientes:
2X − Y = 1 X – 3Y = −2
Diga razonadamente El Porqué.
Solución
130
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Edad actual
Grado
Madurez (3 - 9) (9-13) (13-17) (17-23) (23-27)
0 5 3 3 2 0
1 2 5 6 8 1
2 1 10 15 17 5
3 0 2 5 4 1
4 0 0 1 3 1
∑ ; Q
✎ ✎
= 1.598 ∑ < Q
✏ ✏ = 174 ∑ ; ✑
2
Q ✑ = 28.058
∑ < ✒
2
Q ✒ =402 ∑ ; < Q
✓ ✔ ✓ ✔ = 2.960
Solución
131
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1
Si entre las variables X e Y se establece la recta de regresión Y* = - 3 + 2X, con
una fiabilidad del 96%. Podemos afirmar que (señale todas las afirmaciones ciertas
marcando V, y todas las falsas marcando F):
132
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1 Señale todas las expresiones que son ciertas, marcando V, y las que son falsas marcando
F
1 Que significa que entre dos variables haya un coeficiente r = -0,999 (señale todos los
133
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1 Que significa que entre dos variables haya un coeficiente r = 0 (señale todos los
significados ciertos marcando la V, y todos los falsos marcando la F):
134
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
135
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1 - Sea una distribución (Xi ni) con las siguientes características:
; = 7 Mo = 5 S2 = 3,4 N = 50
Solución
136
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1 Cincuenta y cinco alumnos reciben puntuaciones de una asignatura (Z): En Teoría
352%/(0$6
Solución
137
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
hospital en los turnos de mañana y de tarde. Se han hecho las siguientes anotaciones X =
tiempo máximo de concentración y rendimiento por la mañana y Z = tiempo máximo de
concentración y rendimiento por la tarde (al mismo grupo de personas). Así se obtuvo los
siguientes datos (en horas)
Solución
138
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1 .-En dos compañías de seguros médicos, el pago de indemnizaciones durante el año
10 0 - 20 11
12 20 - 40 12
30 40 - 50 41
40 50 - 100 20
10 100 - 150 8
- ¿Qué porcentaje del montante total de las indemnizaciones que ha pagado la compañía
6ROXFLyQ
- ¿Qué porcentaje del montante total de las indemnizaciones que ha pagado la
compañía B corresponde al 20% de los pagos más bajos?
1
∑ ∑ =
✚
; Q ; Q T (100)
; Q 1 ; Q
✙ ✙
✘ ✘ ✚
1
= =1
✕ ✖ ✖ ✗ ✗
=1
✙
3 (100)
∑
✙
; Q ✙ ✙
∑ Q ✛ = 1 = 92 ∑ ; Q
✜ ✜
= 4.815
3 (VHODFXPXODGRGH Q H[SUHVDGRHQSRUFHQWDMHV
✢ ✢
T HVHODFXPXODGRGH ; Q H[SUHVDGRHQSRUFHQWDMHV
✢ ✢ ✢
o
139
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
3RU WDQWR HO GHO PRQWDQWH WRWDO GH ODV LQGHPQL]DFLRQHV TXH KD
SDJDGRODFRPSDxtD%FRUUHVSRQGHDOGHORVSDJRVPiVEDMRV
; ✣
Q ✣
1 ✣
0 – 20 11 11
20 – 40 12 23
40 – 50 41 64
50 – 100 20 84
100 - 150 8 92
20
92 = 18,4 El percentil 20 será el valor de la variable que ocupa el lugar
100
inmediatamente siguiente a 18,4 y que está en el intervalo (20 – 40).
Aplicando la formula del percentil será:
U 20
1 − 1 −1✤
92 − 11
T ✥
= / ✤
−1 + 100 & ✤
T
20 = 20 + 100 (20) = 32,33
Q ✤
12
100 100
80
(92) = 73,6 El percentil 80 será el valor de la variable que ocupa el lugar
100
inmediatamente siguiente a 73,6 y está en el intervalo (50 – 100).
Aplicando la formula del percentil será:
140
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
U 80
1 − 1 −1
✤
92 − 64
T ✥
= / ✤
−1 + 100 & ✤
T
80 = 50 + 100 (50) = 74
Q ✤
20
100 100
141
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
2 2
; < ; < ;<
87 3 7569 9 261
95 8 9025 64 760
98 6 9604 36 588
99 8 9801 64 792
100 7 10000 49 700
105 5 11025 25 525
115 8 13225 64 920
125 9 15625 81 1125
; =
∑ ; ✦
=
824
= 103 < =
∑ < ✧
=
54
= 6,75
1 8 1 8
6 ✩2 = ∑ ; ★ 2 Q★
−; =
2 185874
− (103) 2 = 125,25 6 ✫ =+ 6 ✪ 2 = + 125,25 = 11,19
1 8
6 ✭ 2
=
∑ < ✬2 392
−< =
2
− (6,75) 2 = 3,4375 6 ✮ = + 6 ✮ 2 = + 3,4375 = 1,85
1 8
6 ✱☎✲ =
∑ ; ✰ <✯ − ; < = 5671 − (103)(6,75) = 13,625
1 8
6 ✴☎✳ 13,625
U = = 0,66 U
2
= (0,66) 2 = 0,43 43% de fiabilidad. Es bastante
6✴ 6✳ (11,19)(1,85)
pequeña nos indica que no es buena la relación lineal entre ambas variables. Establecemos
esa relación:
6 ✵☎✶ 13,625
E = = = 0,1 Es lo que varia Y al variar X en una unidad
6✵
2
125,25
D = < − E ; = 6,75 − 0,1(103) = −4,45
Recta: <✸ = −4,45 + 0,1; ✷
*
142
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
6 ✺☎✹ 13,625
E ’= = = 3,96 Es lo que varia X al variar Y en una unidad
6 ✹ 2
3,4375
D ’= ; − E’< = 103 − 3,96(6,75) = 76,24
Recta: ; ✼ * = 76,24 + 3,96<✻
1 95 + 98
T
1 ⇒ 8=2 ⇒ T
1 = = 96,5
4
4 4
2
2 99 + 100
0 ✽ = T
2 ⇒ 8=4 ⇒ T
2 = = 99,5
4
4 4
2
3 105 + 115
T
3 ⇒ 8=6 ⇒ T
3 = = 110
4
4 4
2
'LVWDQFLDVHQWUHFXDUWLOHV
0 ✽ - T
1 = 99,5 – 96,5 = 3
4
T
3 - 0 ✾ = 110 – 99,5 = 10,5
4
143
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1 En un estudio sobre alcohólicos se informa que el 40% de los mismos tienen un
padre alcohólico y el 6% madre alcohólica. El 42% tienen al menos uno de los padres
alcohólicos.
Se pide: obtener razonadamente los porcentajes de personas alcohólicas que:
1. - Tenga ambos padres alcohólicos.
2. - Tenga madre alcohólica si lo es el padre.
3. - Tenga madre alcohólica y no padre alcohólico.
4. - Tenga madre alcohólica si el padre no lo es.
Solución
P = padre alcohólico %(P) =40%
M = madre alcohólica %(M) = 6% %(P ∪ M) = 42 %
( ) ( )
% 3 ∩ 0 = % 3 ∪ 0 = 100 - %(3 ∪ 0 ) 100 – 42 = 58%
Padre alcohólico
SI NO
Madre SI 4 2 6
alcohólica NO 36 58 94
40 60 100
%( 0 ∩ 3 ) 2
4.- %( 0 ) = 100 = 100 = 33%
3 %( 3 ) 6
144
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1 Cincuenta y cinco alumnos reciben puntuaciones de una asignatura (Z): En Teoría
(X) y en problemas (Y) del 1 al 5 reflejándose en la siguiente tabla:
;<
5 4 4 2 0
4 4 2 4 1
1 4 5 3 1
0 3 2 2 0
0 0 2 1 1
Solución
145
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
2
; ✿
Q
❀ ; Q ❁ ❁
; ❂
Q
❂
1 15 15 15
2 43 86 172
3 76 228 684
4 11 44 176
6 5 30 180
La media será: ; =
∑ ; Q ❃ ❃
=
403
= 2,686 extracciones
1 150
La varianza será: 6 ❅
2
=
∑ ; ❄
2
Q ❄
−; =
2 1227
− 2,686 2 = 0,965 extracciones2
1 150
=+ 6 ❆
2
= 6 = + 0,965 = 0,9825 extracciones
❈
Que mide Dispersión en términos absolutos, viene expresada en las mismas unidades
que la variable
Que es una medida de Dispersión relativa. Indica que a mayor valor implica mayor
Dispersión y por tanto menor Homogeneidad y menor representatividad de la media.
6 0,9825
&9 = = 0,3658
❇
; 2,686
146
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1 .-Se desea analizar la relación entre la madurez de la persona (medida por un test
Solución
147
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 105.- Realizada una encuesta entre fumadores se obtuvieron los resultados, de la tabla,
sobre las variables: X: Nº de cigarrillos fumados diariamente Y: Horas de sueño diarias
X 2 -6 6 - 12 12 - 14 14 - 20 20 - 30 total
Y
4-6 0 2 8 26 36 72
6-7 4 10 16 20 26 76
7-8 18 24 14 12 14 82
8-9 28 26 10 4 2 70
total 50 62 48 62 78 300
Solución
,QWHUYDORV ; ❉
Q ❊
1 ❊
5 2
4-6 5 26+ 36 =28,87 28,87
6 10
5 2
6-7 6,5 20+ 26 =21,86 50,73
6 10
5 2
7-8 7,5 12+ 14 =12,80 63,53
6 10
5 2
8-9 8,5 4+ 2 =3,73 67,26
6 10
67,26
67,26
= 22,42%
300
2).- Obtener el número mínimo de cigarrillos diarios que fuma uno de los
fumadores del 30% que más fuma.
Percentil 70
70
300 = 210 ⇒ ,QWHUYDOR(14 − 20)
100
70 70
1 − 1 300 − 160
−1 ❋
T = / −1 + 100 & = 60 +
100 6 = 18,84FLJDUULOORV
70 ❋ ❋
Q 62
100
❋
148
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
4).- Estimar el consumo de tabaco para una población de 1.500 personas de las que son
fumadoras el 32%
5).- Estimar el número de horas de sueño diarias para una persona que fuma 35 cigarrillos
al día.
6).- Porcentaje de personas fumadoras que duermen entre 6 y 8 horas sabiendo que no
fuman más de 15 cigarrillos al día
Menos de 15 Más de 15
cigarrillos cigarrillos
Menos de 6 horas de 14,33 57,67 72
sueño
Entre 6 y 8 horas de 91,33 66,67 158
sueño
Más de 8 horas de 64,67 5,33 70
sueño
170,33 129,67
149
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1 .- Tomamos el número de pulsaciones por minuto de 15 pacientes que acuden a una
Solución
2
; ❊
Q ❊
; Q
● ●
; ❍
Q
❍ 1 ●
65 1 65 4225 1
68 1 68 4624 2
69 1 69 4761 3
70 1 70 4900 4
72 1 72 5184 5
73 1 73 5329 6
75 1 75 5625 7
78 1 78 6084 8
83 1 83 6889 9
84 1 84 7056 10
85 1 85 7225 11
86 2 172 14792 13
94 1 94 8836 14
100 1 100 10000 15
La media será: ; =
∑ ; ■
Q ■
=
1188
= 79 , 2 pulsaciones por
1 15
minuto
1
La mediana (15) = 7,5 Será el valor de la variable que ocupa el lugar
2
inmediatamente siguiente a 7,5 es decir, el valor 78 pulsaciones por minuto.
La varianza será:
6 ❑
2
=
∑ ; ❏
2
Q ❏
2
−; =
95530
− 79,2 2 = 96,026 pulsaciones2
1 15
=+ 6 ▲
2
= 6 = + 96,026 = 9,799 pulsaciones
◆
150
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
6 9,799
&9 = = 0,12373
▼
; 79,2
151
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1 .- A lo largo de los doce meses del año, en un servicio de cirugía se realizan las
siguientes apendicectomías 8 - 12 - 7 - 1 - 20 - 6 - 8 - 16 - 9 - 3 - 4 - 5
Hallar: Medidas de tendencia central, cuartiles, Medidas de dispersión
Solución
Tiempo ; ❖
; P
Q ◗
1 ◗
(ordenada)
Enero 8 1 1 1
Febrero 12 3 1 2
Marzo 7 4 1 3
Abril 1 5 1 4
Mayo 20 6 1 5
Junio 6 7 1 6
Julio 8 8 2 8
Agosto 16 9 1 9
Septiembre 9 12 1 10
Octubre 3 16 1 11
Noviembre 4 20 1 12
Diciembre 5 99
99
∑ ; ❘
= 99 ∑ ; ❙
2
= 1145 1 = 12
; =
∑ ; ❚
=
99
= 8,25 6 ❱
2
=
∑ ; ❯
2
−; =
2 1145
− 8.25 2 = 27,354
1 12 1 12
6 5,25
6 = 27,354 = 5,25 = = = 0,634
❳
&9
; 8,25
12 1
0 ❨
=6 =
2 2
La mediana será el valor de la variable, media aritmética de los que ocupan el lugar
7+8
6 y el lugar 7, es decir, la mediana será: = 7,5
2
0 ❩
Es el valor de la variable que más veces se repite, es decir, el valor 8
152
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Característica A
SI NO
característica % SI 57 32 89
NO 82 91 173
139 123 262
1.- porcentaje de personas que presentan una sola de las dos características
2.- porcentaje de personas que no tienen ninguna característica
3.- porcentaje de personas que teniendo la característica A no tienen la característica B
4.- porcentaje de personas que tienen ambas características
5.- porcentaje de personas que teniendo la característica B tienen también la característica
A
6.- porcentaje de personas que presentan alguna característica
Solución
82 + 32 57
1.- 100 = 43,51% 5.- 100 = 64,04%
262 89
91 57 + 32 + 82
2.- 100 = 34,73% 6.- 100 = 65,26
262 262
82
3.- 100 = 58,99%
139
57
4.- 100 = 21,75%
262
153
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1,55-1,60 18
1,60-1,70 31
1,70-1,80 24
1,80-1,90 20
1,90-2,00 17
1.- Se consideran "altos" aquellos cuya altura está sobre el percentil 82. ¿Cuál es su altura mínima?
2.- ¿En qué percentil estará un joven de altura 1,78?
Solución
$OWXUD 1 1
❬
-yYHQHV
1,55-1,60 18 18
1,60-1,70 31 49
1,70-1,80 24 73
1,80-1,90 20 93
1,90-2,00 17 110
1.- Se considera altos aquellos cuya altura está sobre el percentil 82, es decir (100-82)=18,
el 18% de los más altos, son aquellos que se consideran altos, y su altura mínima será el
percentil 82.
Habrá que hallar el percentil 82, ya qué
82
(110) = 90,2 El percentil 82, será aquel valor de la variable que ocupe el lugar
100
inmediatamente siguiente a 90,2 y está en el intervalo (1,80 – 1,90). Aplicando la
formula del percentil:
U 82
1 − 1 −1
❭
110 − 73
T ❪
= / ❭
−1 + 100 & ❭
T
82 = 1,80 + 100 (0,10) = 1,886
Q ❭
20
100 100
2.- La altura 1,78 está en el intervalo (1,70 – 1,80). Tenemos que hallar el % de
valores que hay debajo del valor 1,78 luego despejaremos “r” de la formula del percentil:
U
1 − 1 −1
❭
T ❪
= / ❭
−1 + 100 & ❭
Q ❭
100
154
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
(T − / −1 )Q
100 (1,78 − 1,70)(24) 100
❴
❫ ❫
U
= 100
+ 1 −1 * = + 49 = 62
❫
Por tanto T
62 = 1,78 metros
100
El 62% de los reclutas miden menos de 1,78 metros luego (100 – 62) = 38, el 38%
restante medirán más de 1,78 metros.
155
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1.-Se desea analizar la relación entre la madurez de la persona (medida por un test
Y
X (2-6) (6-8) (8-14) (14-18) (18-24) (24-30)
15 5 6 6 4 0 6
20 8 12 0 9 4 12
25 15 6 6 3 12 6
Solución
156
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
6ROXFLyQ
( / −1 − / )
❵ ❵
Marca de clase Q ❜
1 ❜
; Q
❝ ❝
; ❞
2
Q ❞
;
Hb. gr. ❛
¦ ; Q 747
= =
❡ ❡
; 12,45 Hb.gr.
1 60
Q
+1
❢
F 14
= / −1 + +1
12 + 1 = 12,53+E.JU.
❢
0 F
14 + 12
❢ ❢
Q Q
❣
+1
+ −1
❢ ❢
F F
+1 −1
❢ ❢
1 1
1 − 1 60 − 22
−1 ❤
0 ✐
= / −1 + 2
❤ & = 12 +
2 1 = 12,47 +E.JU. ❤
Q 17 ❤
157
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1
60 = 15 El 1º cuartil será el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 15, y está en el intervalo (11-12)
1 1
1 − 1 60 − 10
−1 ❥
T = / −1 + 4 & = 11 +
4 1 = 11,416 +E.JU.
1 ❥ ❥
Q 12
4
❥
2
60 = 30 El 2º cuartil será el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 30, y está en el intervalo (12-13)
2 2
1 − 1 60 − 22
−1 ❦
T
2 = / −1 + 4
❦ & = 12 +
4 1 = 12,47 +E.JU. ❦
Q 17
4
❦
3
60 = 45 El 3º cuartil será el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 45, y está en el intervalo (13-14)
3 3
1 − 1 60 − 39
−1 ❧
T = / −1 + 4 & = 13 +
4 1 = 13,428 +E.JU.
3 ❧ ❧
Q 14
4
❧
De este modo:
El 25% de los pacientes tienen un contenido de Hb. menor de 11,416gr.
El 50% de los pacientes tienen un contenido de Hb. menor de 12,53 gr.
El 75% de los ingresados tienen un contenido de Hb. menor de 13,428 gr.
0HGLGDVGHGLVSHUVLyQ
¦
2
; Q 2 9419
− 12,45 2 = 1,98 Hb.gr.2
♠ ♠
2
Varianza: 6 ♥
; =
1 60
Desviación típica: 6 ♦ = 6 ♦
2
= 1,98 = 1,4 Hb.gr.
6 1,4
Coeficiente de variación: &9 = = = 0,1124
♣
; 12,45
158
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
50-80 15 5 0 0 0
80-110 20 30 10 0 0
110-150 4 26 34 16 0
150-220 0 6 13 7 4
220-300 0 0 3 3 2
300-500 0 0 0 0 2
Sabiendo que:
Solución
159
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1 El consumo y la renta mensual de 100 familias expresadas en 104 pesetas, son los
siguientes: C = Consumo Y = Renta.
C/Y 15 25 35 45
30 10 15 -- --
40 5 20 25 --
50 -- 15 5 5
Solución
160
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1 .- En un hospital, los análisis efectuados para la determinación de urea en orina a un
grupo de 60 pacientes visitados, han dado los siguientes resultados ordenados:
1 paciente con 9,3 grs/l 1 paciente con 9,5 grs/l 2 paciente con 9,8 grs/l
1 paciente con 10 grs/l 1 paciente con 10,1 grs/l 2 paciente con 10,2 grs/l
2 paciente con10,3 grs/l 2 paciente con 10,4 grs/l 3 paciente con 10,5 grs/l
4 paciente con 10,6 grs/l 1 paciente con 10,7 grs/l 6 paciente con 10,8 grs/l
2 paciente con 10,9 grs/l 3 paciente con 11 grs/l 2 paciente con 11,1 grs/l
4 paciente con 11,2 grs/l 3 paciente con 11,3 grs/l 2 paciente con 11,4 grs/l
4 paciente con 11,5 grs/l 3 paciente con 11,6 grs/l 2 paciente con 11,7 grs/l
2 paciente con 11,8 grs/l 2 paciente con 12 grs/l 2 paciente con 12,2 grs/l
1 paciente con 12,3 grs/l 1 paciente con 12,5 grs/l 1 paciente con 12,7 grs/l
1 paciente con 13,2 grs/l
6ROXFLyQ
( / −1 − / )
q q
Marca de clase Q s
1 s
; Q
t t
; ✉
2
Q ✉
; r
668 ¦ ; Q
= =
✈ ✈
Q
+1
✇
F 13
= / −1 + +1
10,5 + (0,5) = 10,81JU.
✇
0 F
13 + 8
✇ ✇
Q Q
①
+1
+ −1
✇ ✇
F F
+1 −1
✇ ✇
161
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
2 2
1 − 1 60 − 28
−1 ②
0 ③
= / −1 + 4 ② & = 11 +
4 (0,5) = 11,077 JU.
②
Q ② 13
1
60 = 15 El 1º cuartil será el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 15, y está en el intervalo (10,5-11)
1 1
1 − 1 60 − 12
−1 ④
T
1 = / −1 + 4
④ & = 10,5 +
4 ④ (0,5) = 10,6 JU.
Q 16
4
④
2
60 = 30 El 2º cuartil será el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 30, y está en el intervalo (11-11,5) el 2º cuartil es la
Mediana.
2 2
1 − 1 60 − 28
−1 ⑤
T = / −1 + 4 & = 11 +
4 * 0,5 = 11,077 JU.
2 ⑤ ⑤
Q 13
4
⑤
3
60 = 45 El 3º cuartil será el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 45, y está en el intervalo (11,5-12)
3 3
1 − 1 60 − 41
−1 ⑥
T
3 = / −1 + 4
⑥ & = 11,5 +
4 (0,5) = 11,68 JU.
⑥
Q 11
4
⑥
De este modo: el 25% de los pacientes tienen un contenido de Urea. menor de10,6
gr..
162
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
176
174
172
170
168
166
164
altura del hijo
162
160
158
158 160 162 164 166 168 170 172
0HGLGDVGHGLVSHUVLyQ
¦
2
; Q 2 7475,25
− 11,13 2 = 0,5875 JU 2 .
⑦ ⑦
2
Varianza: 6 ⑧
; =
1 60
Desviación típica: 6 ⑨ = 6 ⑨
2
= 0,5875 = 0,766 JU.
6 0,766
Coeficiente de variación: &9 = = = 0,0688
⑩
; 11,13
163
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1 .- Medimos las alturas de un grupo de 11 padres y sus respectivos hijos y obtenemos los
siguientes resultados:
altura del padre 160 165 170 168 163 164 162 166 164 166 162
altura del hijo 165 160 175 170 165 175 163 170 170 166 168
Solución
<
*
= D + E; <
*
= 33,56 + 0,8165 ; (esta hecho con el programa SPSS.11)
❶
174
172
170
168
166
164
162
160 Observada
158 Lineal
158 160 162 164 166 168 170 172
164
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
;<
0 1 2 2 0
1 2 1 1 2
0 3 4 3 1
0 1 0 3 0
1 1 2 4 0
Solución
165
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
PULSO 68 70 71 71 73 73 74 75 76
TEMPERATURA 36.5 37 37.2 36.8 37.3 37.5 38 37.4 38
Solución
166
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1 - Se conocen las ventas de agua oxigenada a hospitales y clínicas de un cierto
número de empresas que son:
Solución
167
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
6ROXFLyQ
'$7266,1$*583$55(8(/72&21(/352*5$0$6366
9$/25(6
Porcentaje Porcentaje
Frecuencia Porcentaje válido acumulado
Válidos 14 2 3,6 3,6 3,6
15 2 3,6 3,6 7,1
16 2 3,6 3,6 10,7
19 2 3,6 3,6 14,3
21 4 7,1 7,1 21,4
22 3 5,4 5,4 26,8
23 5 8,9 8,9 35,7
24 4 7,1 7,1 42,9
25 1 1,8 1,8 44,6
26 6 10,7 10,7 55,4
27 2 3,6 3,6 58,9
28 1 1,8 1,8 60,7
29 3 5,4 5,4 66,1
32 5 8,9 8,9 75,0
34 2 3,6 3,6 78,6
36 2 3,6 3,6 82,1
38 5 8,9 8,9 91,1
43 2 3,6 3,6 94,6
45 3 5,4 5,4 100,0
Total 56 100,0 100,0
(VWDGtVWLFRV
VALORES
N Válidos 56
Perdidos 0
Media 27,68
Mediana 26,00
Moda 26
168
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
(VWDGtVWLFRV
VALORES
N Válidos 56
Perdidos 0
Desv. típ. 8,315
Varianza 69,131
Coeficiente variación 0,3009
$*583$'26(1,17(59$/26'($03/,78'
LQWHUYDORV
2
Q ❷
1 ❸ ; ❸ ; Q ❹ ❹
; ❺
Q
❺
1566 ¦ ; Q
= 27,96 = =
❻ ❻
Q
+1
❼
F 7
= / −1 + +1
23 + (2) = 24
❼
0 F
7+7
❼ ❼
Q Q
❽
+1
+ −1
❼ ❼
F F
+1 −1
❼ ❼
169
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1 1
1 − 1 56 − 24
−1
= / −1 + 2 & = 25 +
2 (2) = 26,14
❾
0 ❿
Q 7
❾ ❾
1
56 = 14
4
El 1º cuartil será el valor de la variable que ocupe el lugar inmediatamente siguiente
al 14, y está en el intervalo (21 23)
1 1
1 − 1 56 − 8
−1
= / −1 + 4 & = 21 +
4 (2) = 22,71
➀
T
1
Q 7
➀ ➀
4 ➀
El 2º cuartil es la mediana T
2 = T 1 = 0 = 26,14 ➁
4 2
3
56 = 42 El 3º cuartil será el valor de la variable que ocupe el lugar
4
inmediatamente siguiente al 42, y está en medio de los intervalos (31- 33) y (33
35), así que uniremos ambos y formaremos un único intervalo de (31 - 35) en el
que se encontrará el 3º percentil, y aplicando la formula tendremos:
3 3
1 − 1 56 − 37
−1
= / −1 + 4 & = 31 +
4 (4) = 33,857.
➂
T
5+2
3
Q
➂ ➂
4 ➂
0HGLGDVGHGLVSHUVLyQ
¦
2
; Q 2 47380
− 27,96 2 = 64
➃ ➃
2
Varianza: 6 ➄
; =
1 56
Desviación típica: 6 ➅ = 6 ➅
2
= 64 = 8
6 8
Coeficiente de variación: &9 = = = 0,286
➆
; 27,96
Como vemos no hay demasiadas diferencias entre los resultados obtenidos con los
valores sin agrupar y con los valores agrupados en intervalos, en el segundo caso
perdemos información y ganamos rapidez.
170
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
6ROXFLyQ
2
; ➇
Q ➈ ; Q ➉ ➉
; ➊
Q ➊ 1
➉
1 5 5 5 5
3 12 36 108 17
4 20 80 320 37
6 8 48 288 45
10 5 50 500 50
¦ ; Q 219
= =
➋ ➋
; 4,38
1 50
0HGLGDVGHGLVSHUVLyQ
¦
2
;
1221 Q 2
− 4,38 2 = 5,2356 medida de dispersión
➌ ➌
2
9DULDQ]D 6 ➍
; =
1 50
absoluta, viene expresada en unidades al cuadrado
2,288 6
: &9 =
= 0,522 medida de dispersión relativa. =
➏
&RHILFLHQWHGHYDULDFLyQ
; 4,38
Se considera aceptable si esta entre 0 y 1. Mide el grado de homogeneidad de la
distribución. Y también el grado de representatividad de la media.
171
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
PULSO 74 70 68 77 75 66 69 75 76 69
TEMPERATURA 35.5 37 37 35.8 36.3 37.8 38.7 37.7 38.4 39
172
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Edades..........(18 - 26)..... (26 - 36) ...(36 - 50) .... (50 - 60) .... (60 - 70)
Nº Empleados .... 7............... 13 ............ 20 ...............15............... 5
Solución
173
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
; ➐
1 3 4 6 10 TOTALES
Q ➑
5 12 20 8 5 50
1 ➑
5 17 37 45 50
; Q ➒ ➒
5 36 80 48 50 219
; ➓
2
Q ➓
5 108 320 288 500 1221
¦ ; Q 219
= =
➔ ➔
; 4,38
1 50
Moda Mo Valor De la variable que más veces se repite, es decir el que presenta
mayor frecuencia absoluta
Mo = 4
Me = Valor central de la distribución, valor de la variable que deja por debajo el 50% de
1 50
los valores = = 25 valor de la variable que ocupa el lugar 25
2 2
Me = 4
¦
2
; Q 2 1221
− (4,38) 2 = 5,2356
→ →
2
6 ➣
6 ↔ = 6 ↔
2
= 5,2356 = 2,228
6
( )= 2,228
↕
174
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Xi 6 13 14 16 21
ni 15 14 20 18 15
Solución
; ➙
6 13 14 16 21 Totales
Q ➛
15 14 20 18 15 82
1 ➛
15 29 49 67 82
; Q ➜ ➜
¦ ; Q 1155
= =
➞ ➞
; 14,085
1 82
¦
2
; Q 2 18049
− (14,085) 2 = 21,71
➟ ➟
2
6 ➠
6 ➡ = 6 ➡
2
= 21,71 = 4,66
6
( )= 4,66
➢
Moda Mo Valor De la variable que más veces se repite, es decir el que presenta
mayor frecuencia absoluta Mo = 14
Me = Valor central de la distribución, valor de la variable que deja por debajo el 50% de
1 82
los valores = = 41 valor de la variable que ocupa el lugar 41 Me = 14
2 2
1 82
T Valor de la variable que deja por debajo el 25% de los valores
1 = = 20,5 valor
4
4 4
de la variable que ocupa el lugar 21 T = 13
1
4
3 3
T Valor de la variable que deja por debajo el 75% de los valores 1 = 82 = 61,5
3
4
4 4
valor de la variable que ocupa el lugar 62 T = 16
3
4
175
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1Dada la distribución
Xi 450 367 965 146 349
ni 23 69 47 78 95
1.- Calcular La media, la mediana y la moda.
2.- Hallar El percentil 67
3.- Explicar el Significado de los resultados obtenidos.
Solución
; ➤
¦ ; Q 125.571
= =
➨ ➨
; 402,47
1 312
¦
2
; Q 2 70.952.359
− (402,47) 2 = 65.429,3
➩ ➩
2
6 ➫
; = Medidas de dispersión
1 312
absolutas
6 ➭ = 6 ➭
2
= 65.429,3 = 255,79
6
( )= 255,79
➯
67 67
T Valor de la variable que deja por debajo el 67% de los valores 1 = 312 = 209,04
67
100
100 100
valor de la variable que ocupa el lugar 210 T = 367
67
100
176
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Solución
177
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
/ ➲
−1 −/ ➲
10.000-16.000 16.000-22.000 22.000-28.000 28.000-34.000 34.000-40.000
Q ➲
135 215 320 225 105
Solución
178
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1Un análisis de la relación entre el consumo de tabaco y el número de personas con cáncer
de pulmón se resume en la siguiente recta de regresión estimada:
Siendo ; el nº de años durante los cuales una persona ha fumado, e < el porcentaje de
cancerígenos habidos en cada grupo de personas según sus años de fumador.
1.- Explíquese el significado de los resultados -2 y 1,2 en la recta de regresión.
2.- ¿Cuál es la expectativa respecto a la tasa de cancerígenos para personas que han fumado 30
años?
3.- Si U hubiese sido = 1 ¿Podríamos decir que el tabaco fue la única causa del cáncer de pulmón?
Solución
179
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1 Supongamos que el Coeficiente de variación de una distribución es 0,2 y su media es 30.
Solución
180
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Xi 10 20 30 40 50
Yj 50 45 38 32 29
Solución
181
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1 .-La distribución de las acciones de una determinada sociedad, entre sus accionistas,
según la edad de estos, viene expresada por intervalos en la tabla siguiente:
Edad X
Nº Acciones menos
Y de 18 (18-26) (26-36) (36-46) (46-64)
0-20 2 3 1 2 2 10
20-28 8 4 3 10 7 32
28-32 9 10 16 10 5 50
32-48 1 2 1 2 2 8
20 19 21 24 16 100
1.- Capital aproximado de la sociedad, supuesto un valor nominal para cada título de
1.200. Ptas...
2.- Promedio de acciones por accionista.
3.- En el supuesto que en la Junta General de accionistas los votos se establecen en
proporción al número de acciones poseídas, ¿qué mínimo de acciones debe tener un
accionista para que su poder decisorio sea mayor al de la mitad de los socios?
4.- Analizar y establecer la posible relación entre la edad y el número de acciones de los
accionistas.
5.- Probabilidad de que una persona tomada al azar tenga menos de 26 años sabiendo que
posee más de 28 acciones
6.- Estimar el número de acciones que podemos esperar que posea una persona con 30
años. Dar una media de la bondad de dicha estimación.
7.- Distribuciones de:
1.- Nº acciones / edad > 35
2.- Nº acciones / 26 < edad < 46
¿Cuál de las dos es más homogénea y por qué?
Solución
182
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
Nº 132.- De una población de 100 personas, se ha observado que 30 de ellas están en paro.
Los padres de 11 de estas 30 tampoco tienen empleo. Estúdiese si el paro es una situación
que se reproduce dentro de las familias, teniendo en cuenta que de las 100 personas
observadas 40 tienen padres en desempleo.
Solución
183
'(3$57$0(172'((67$'Ë67,&$(,19(67,*$&,Ï123(5$7,9$
(67$'Ë67,&$'(6&5,37,9$
1.- Se han estudiado las calificaciones de 100 alumnos en dos asignaturas: Economía
Además se sabe que el coeficiente de correlación lineal entre ambas variables es 0,85.
Obtener razonadamente, demostrando brevemente el porqué de sus respuestas, y
explicando el significado de los resultados:
1.- ¿Qué nota se puede esperar de un alumno que ha obtenido 125 puntos en Economía, en
la asignatura de Estadística? Bondad de la estimación.
2.- Se puede decir que aquellos alumnos que obtienen mayor calificación en Economía,
sean los mismos que obtienen mayor calificación en Estadística
3.- Un alumno que obtiene 120 puntos en Economía y 3,5 en Estadística ¿En cuál obtuvo
mejor calificación relativa?
Solución
184