Problemas Resueltos de Estadist - Sergio Zubelzu
Problemas Resueltos de Estadist - Sergio Zubelzu
Problemas Resueltos de Estadist - Sergio Zubelzu
de estadística
SERGIO ZUBELZU AINHOA ERCORECA
PROFESOR ASOCIADO. UNIVERSIDAD COMPLUTENSE DE MADRID PROFESORA ASOCIADA DE ESTADÍSTICA EN LA UNIVERSIDAD
Y UNIVERSIDAD ANTONIO DE NEBRIJA ANTONIO DE NEBRIJA Y EN EL DEPARTAMENTO DE ESTADÍSTICA
DE LA UNIVERSIDAD CARLOS III DE MADRID
Problemas resueltos
de estadística
EDICIONES PIRÁMIDE
COLECCIÓN «ECONOMÍA Y EMPRESA»
Director:
Miguel Santesmases Mestre
Catedrático de la Universidad de Alcalá
Prólogo ............................................................................................................... 9
© Ediciones Pirámide 7
Prólogo
© Ediciones Pirámide 9
Prólogo
LOS AUTORES
10 © Ediciones Pirámide
1 Resumen de conceptos estadísticos
CONTENIDO
CONOCIMIENTOS PREVIOS
Para abordar con éxito el estudio de este capítulo, el alumno deberá dis-
poner de los siguientes conocimientos previos:
OBJETIVOS
Al finalizar el estudio de este capítulo el alumno deberá ser capaz de:
© Ediciones Pirámide 11
Problemas resueltos de estadística
N a i 1 ni
X n N f F i a
x1 n1 N1 f1 F1
x2 n2 N2 f2 F2
i n
f a na i 1
ni
xa na Na fa Fa
Fa i 1 f i
i a
Si los resultados del experimento son continuos, basta con agrupar en interva-
los y trabajar con el centro del intervalo (marca de clase).
12 © Ediciones Pirámide
Resumen de conceptos estadísticos
Se trata de números que proporcionan información acerca del centro del con-
junto de datos. Esta característica, que genéricamente se ha denominado centro,
adopta distinta forma según el indicador del que se trate.
x
1
i n
n
i n
i 1
xi ni fi ni
i n
i 1
ni i 1 xi fi
i n
i 1 i
i1 ni
i n
i n 1
g i 1
ni
x
i
i j 1
i 1
ni i 1 ni 2
i n
Me x j /
i1 i ni ni 2
i n
i n in
i j 1 i 1
Mo x j / n j máx.
© Ediciones Pirámide 13
Problemas resueltos de estadística
ar
1
i n
n
i n
i 1
xir ni fi ni
i n
i 1
ni i 1 xir fi
i n
i 1 i
r
1
i n
n
x x
i n
i 1 i
r
ni f i ni
i n
i 1
ni i 1 xi x f i
i n r
i 1 i
i 1 ni i 1 ni
i j 1 in
x x j / ; 0 1
i
i n
ni 1 i 1 ni
i i n
n
i 1 i
j 1
1 1
x x ni i n xi2 ni x
in in
2
2 2
ni
i n
ni
i 1 i i 1
i 1 i 1
2
CV x
14 © Ediciones Pirámide
Resumen de conceptos estadísticos
R xMax. xmin.
RI Q3 Q1
1.1.5. Asimetría
0 Asimetría negativa
x Mo
AS P 0 Simétrica
0 Asimetría positiva
0 Asimetría negativa
AS F 33 0 Simétrica
0 Asimetría positiva
© Ediciones Pirámide 15
Problemas resueltos de estadística
1.1.6. Curtosis
0 Leptocúrtica
C F 44 3 0 Mesocúrtica
0 Platicúrtica
16 © Ediciones Pirámide
Resumen de conceptos estadísticos
© Ediciones Pirámide 17
Problemas resueltos de estadística
Se trata de agrupar los resultados en una tabla de frecuencias con entradas tan-
to por filas como por columnas. El significado de las frecuencias absolutas y rela-
tivas es equivalente al referido en la estadística descriptiva univariante.
X\Y y1 y2 … ym X
x1 n11/f11 n12/f12 … n1m/ f1m n1·/ f1·
x2 n21/f21 n22/f22 … n2m/ f2m n2·/f2·
xn nn1/fn1 nn2/fn2 … nnm/fnm nn·/f1·
i n j m
Y n·1/f·1 n·2/f·2 … n·m/ f·m i 1 j1
nij /1
18 © Ediciones Pirámide
Resumen de conceptos estadísticos
nij ni· n· j
fij fi· f· j
Y y1 y2 … ym X
Y/X=x2 n21/f21 n22/f22 … n2m/ f2m n2·/f2·
1
cov xy xy a11 a10 a01
in j m
xi y j nij x y
in n i 1 j 1
i 1 i
xy xy x y 1 xy 1
© Ediciones Pirámide 19
Problemas resueltos de estadística
Y 0 1 X 1 xy x2 ; 0 y 1 x
R 2 xy2
1.3. PROBABILIDAD
P A 0
PE 1
P A B P A P B A, B incompatibles
P A 1 P A
P 0
P A B P A P B P A B
A B P A P B
20 © Ediciones Pirámide
Resumen de conceptos estadísticos
P A B P A B P B
P A B P A
P A B P A P B
P B A P B
P B i 1 P Ai B i 1 P B Ai P Ai
i n i n
P Ai B P Ai B P B P Ai B P Ai B
in
i 1
P B Ai P Ai P B Ai P Ai
in
i 1
© Ediciones Pirámide 21
Problemas resueltos de estadística
F xi F xi
0 P X xi 1
i n
f xi P X xi pi i 1 P X xi 1
F a i 1 P X xi
i a
3. Momentos
ar i 1 xir P X xi
i n
22 © Ediciones Pirámide
Resumen de conceptos estadísticos
a1 E X i 1 xi P X xi
i n
r i 1 xi E X P X xi
i n r
2 2 i 1 xi E X P X xi
i n 2
d r x t
x t E e itX i 1 xi e itx
in
i ar
i r
r
dt t 0
P X xi ; Y y j pij
i a j b
F a;b P X a; Y b P X xi ; Y y j
i 1 j 1
© Ediciones Pirámide 23
Problemas resueltos de estadística
2. Momentos:
ars E X rY s
rs E X E X Y E Y
r s
X E X 1
E V E 1
X 2 E X 2
x21 x x
W 2 1
x x x2
12 2
f xi ; y j P X xi ;Y y j
f X Y yj
f yj P Y y j
24 © Ediciones Pirámide
Resumen de conceptos estadísticos
i. Dominio de definición.
Dx 0,1
P X xi p xi 1 p
1 xi
x t 1 p peit
E X p
v. Varianza.
V X p 1 p
© Ediciones Pirámide 25
Problemas resueltos de estadística
i. Dominio de definición.
Dx 0,1, 2,3,..., n
n!
P X xi p xi 1 p i
n x
xi ! n xi !
x t 1 p peit
n
E X np
v. Varianza.
V X np 1 p
i. Dominio de definición.
Dx 0,1,2,3,...,
26 © Ediciones Pirámide
Resumen de conceptos estadísticos
e xi
P X xi
xi !
x t e ee
it
E X
v. Varianza.
VX
i. Dominio de definición.
Dx 1,..., N
1
P X xi
N
eit eitN 1
x t
N eit 1
© Ediciones Pirámide 27
Problemas resueltos de estadística
N
E X
2
v. Varianza.
N 2 1
V X
12
F x F x F x F x 0
dF ( x )
f ( x)
dx
28 © Ediciones Pirámide
Resumen de conceptos estadísticos
0 F x ; f x 1
F 0; F 1
x2 x1 F x2 F x1
F x F x F x
f x dx 1
1. Momentos
x E X f x dx
r
r
x E X f x dx
2 2
2
d r x t
x t E e itX
xe dx itx
r i ar
r
dt t 0
© Ediciones Pirámide 29
Problemas resueltos de estadística
F x; y f x; y dxdy
Con el mismo concepto que los modelos de probabilidad para variables aleato-
rias discretas, pero aplicados a variables aleatorias continuas.
i. Dominio de definición.
Dx a,..., b
1
f x
ba
30 © Ediciones Pirámide
Resumen de conceptos estadísticos
eitb eita
x t
it b a
ab
E X
2
v. Varianza.
b a
2
V X
12
i. Dominio de definición.
Dx 0,1,2...,
f x e x
x
F x f x dx 1 e x
0
x t
it
© Ediciones Pirámide 31
Problemas resueltos de estadística
v. Esperanza matemática.
1
EX
vi. Varianza.
1
V X
2
3. Distribución normal.
i. Dominio de definición.
Dx , ...,
f x 2
1 2
2 1 2
e 2 2
E X
v. Varianza.
V X 2
i. Dominio de definición.
Dx , ...,
32 © Ediciones Pirámide
Resumen de conceptos estadísticos
z t et
2
2
E X 0
v. Varianza.
V X 1
i. Dominio de definición.
Dx 0,1,2...,
E X n
iii. Varianza.
V X 2n
6. Distribución t-Student.
Z Z Z 0;1
T 2
n
2
2 n
© Ediciones Pirámide 33
Problemas resueltos de estadística
i. Dominio de definición.
DT ,...,
E T 0
iii. Varianza.
n
V T n 2
n2
7. Distribución F-Snedecor.
F
n n
2
m m
2
i. Dominio de definición.
DF 0,1,2...,
m
EF
m2
iii. Varianza.
2m2 (m n 2)
V F
n(m 2)2 (m 4)
34 © Ediciones Pirámide
Resumen de conceptos estadísticos
2 1
P[| X | k ] 1 2
P[| X | k ] 1
k k2
Y i 1 X i N i 1 i ; i 1 i2
i n n in i n
X i f xi ; E X i i ;V X i i2
x
Z 0;1
n
© Ediciones Pirámide 35
Problemas resueltos de estadística
x x
t n 1
s n 1 n s n n 1
x
in
nV
2
i 1
(2n )
i
2
2
x x
i n 2
i 1 i
nsn2
n 1 sn21 2
n 1
2 2 2
x1 x2 1 2 Z
0,1
12 n1 22 n2
x1 x2 1 2
t n1 n2 2
1 1 n1sn1 n2 sn2
2 2
n1 n2 n1 n2 2
x1 x2 1 2 t n1 n2 2
1 n1 1 sn 1 n2 1 sn 1
2 2
1
1 2
n1 n2 n1 n2 2
x 1
i n 2
i 1 1i
n1 12 V1 22
F n1 ;n2
x 2 V2 12
i n 2
i 1 2i
n2 22
n1 1 Sn2 1 n1Sn21
2
1
n2 1 22 n2 1 2
36 © Ediciones Pirámide
Resumen de conceptos estadísticos
fn p
Z 0;1
p 1 p n
f n1
f n2 p1 p2
Z 0;1
p1 1 p1 p2 1 p2
n1 n2
L x1 , x2 ,..., xn ; i 1 f xi ;
in
© Ediciones Pirámide 37
Problemas resueltos de estadística
dL x , x ,..., x ; mv
1 2 n
0
d
mv
d 2 L x1 , x2 ,..., xn ; mv
0
d 2
m ar muestra E X r población
B 0 E
2
dB
1
V VCR d
dLn f X ; 2
nE
d
38 © Ediciones Pirámide
Resumen de conceptos estadísticos
lim V 0
n
L X ; g x1 , x2 ,...xn ; h x1 , x2 ,...xn
© Ediciones Pirámide 39
Problemas resueltos de estadística
X N ; xi N ;
IC ; x Z1 2 n
ii. Intervalo de confianza para la media poblacional desconocida la varian-
za poblacional:
IC ; x t1 2 sn 1 n x t 1 2 s n n 1
iii. Intervalo de confianza para la varianza poblacional conocida la media
poblacional:
i n xi 2 i n xi 2 nV nV
IC ; i 1 2 ; 2
; i 1 2 2
2
1 2 2 1 2 2
40 © Ediciones Pirámide
Resumen de conceptos estadísticos
ns 2 ns 2 n 1 s n 1 sn21
2
IC 2 ; 2 n ; 2 n 2 n 1 ;
1 2 2 1 2
2 2
IC 1 2 ; x1 x2 Z1 2 2
1 n1 22 n2
ii. Intervalo de confianza para diferencia entre la media de dos poblaciones
desconocidas las varianzas poblacionales:
1 1 n1sn21 n2 sn22
IC 1 2 ; x1 x2 t
1 n1 n2 n1 n2 2
2
1 1 n1 1 sn2 1 n2 1 sn2 1
IC 1 2 ; x1 x2 t 1 2
1 n1 n2 n1 n2 2
2
n n2 i 1 x1i 1
2 i 1 x1i 1
in 2 in 2
IC 2
;
2
; 2
n1 F1 2 i 1 x2i 2 n1 F 2 i 1 x2i 2
1 2 in 2 in
V V
1
; 1
V2 F1 2 V2 F 2
© Ediciones Pirámide 41
Problemas resueltos de estadística
sn2 1 sn2 1
IC 12 22 ; 2 1 ; 2 1
sn2 1 F1 2 sn2 1 F 2
n1 n2 1 sn2 n1 n2 1 sn21
IC 12 22 ; 1
;
n2 n1 1 sn2 F1 2 n2 n1 1 sn2 F 2
2 2
X 1; p xi 1; p
f n 1 f n
IC p; f n Z1 2
n
f n1 1 f n1 f 1 f
IC p1 p2 ; f n1 f n2 Z
1 n1
n2
n2
n2
2
42 © Ediciones Pirámide
Resumen de conceptos estadísticos
IC ; mv Z1 2 V mv
1.9. CONTRASTES DE HIPÓTESIS PARAMÉTRICOS
Un contraste de hipótesis es una situación ante la que debe optarse por una de
entre dos hipótesis estadísticas con un determinado nivel de significación. Su
solución exige definir un estadístico y una región crítica y concluir entre las dos
hipótesis formuladas.
Los contrastes se resuelven planteando dos hipótesis, hipótesis nula, H0, e hi-
pótesis alternativa, H1, definidas ambas de forma que sean completas en términos
algebraicos. La solución al contraste se obtiene manejando las probabilidades
vinculadas a los dos tipos de errores que pueden cometerse:
P RH 0 H 0
P RH1 H1
X N ; xi N ;
© Ediciones Pirámide 43
Problemas resueltos de estadística
H : H : RH Z Z
x ( ) H0 0 0 1 0 0 0 1
Z0 H0 : 0 H1 : 0 RH 0 Z0 Z
n
H0 : 0 H1 : 0 RH 0 Z0 Z1 2
H : H : RH t t
x ( )H0 x ( )H0 0 0 1 0 0 0 1
t0 H 0 : 0 H1 : 0 RH 0 t0 t
S n 1 n S n 1
H 0 : 0 H1 : 0 RH 0 t0 t1 2
n
H 0 : 2 02 H1 : 2 02 RH 0 02 12
x
i n
nV
2
i 1
H 0 : 2 02 H1 : 2 02 RH 0 02 2
2 i
( ) H 0 ( 2 ) H 0
0 2
02 2 2
H 0 : 0 H1 : 0 RH 0 o
2 2 2 2
2 2
0 1 2
44 © Ediciones Pirámide
Resumen de conceptos estadísticos
H : 2 2 H : 2 2 RH 2 2
0 0 1 0 0 0 1
nSn2 n 1 Sn21
02 H 0 : 2 02 H1 : 2 02 RH 0 02 0 2
( 2 ) H0 ( 2 ) H0
2
0 2
2
H 0 : 2 02 H1 : 2 02 RH 0 o
2
0 12 2
H 0 : 1 2 H1 : 1 2
RH 0 t0 t1
H 0 : 1 2 0 H1 : 1 2 0
x1 x2 1 2 H0 H 0 : 1 2 H1 : 1 2
t0 RH 0 t0 t
1 1 n1sn1 n2 sn2 H 0 : 1 2 0 H1 : 1 2 0
2 2
H : H :
n1 n2 n1 n2 2 0 1 2 1 1 2
RH 0 t0 t1 2
H 0 : 1 2 0 H1 : 1 2 0
© Ediciones Pirámide 45
Problemas resueltos de estadística
H 0 : 12 22 H1 : 12 22
RH 0 F0 F1
H 0 : 2 1 1 H1 : 2 1 1
2 2 2 2
V1 22 H 0 : 12 22 H1 : 12 22
F0 RH 0 F0 F
V2 12 H0 H 0 : 2 1 1 H1 : 2 1 1
2 2 2 2
F0 F 2
H 0 : 12 22 H1 : 12 22
RH 0 o
H 0 : 2 1 1 H1 : 2 1 1
2 2 2 2
F F
0 1 2
F0
S n21 1 22
n1 S n21 n1 1 22
S n22 1 12 H
0
n2 S n22 n2 1 12 H 0
H 0 : 12 22 H1 : 12 22
RH 0 F0 F1
H 0 : 2 1 1 H1 : 2 1 1
2 2 2 2
H 0 : 12 22 H1 : 12 22
RH 0 F0 F
H 0 : 2 1 1 H1 : 2 1 1
2 2 2 2
F0 F 2
H 0 : 12 22 H1 : 12 22
RH 0 o
H : 2
2
1 H : 2
2
1
F0 F1 2
0 2 1 1 2 1
46 © Ediciones Pirámide
Resumen de conceptos estadísticos
X 1; p xi 1; p
H : p p H : p p RH Z Z
f n po 0 0 1 0 0 0 1
Z 0 H 0 : p p0 H1 : p p0 RH 0 Z 0 Z
po 1 p0
n H 0 : p p0 H1 : p p0 RH 0 Z 0 Z1 2
H 0 : p1 p2 H1 : p1 p2
RH 0 Z0 Z1
H 0 : p1 p2 0 H1 : p1 p2 0
Z0
f n1
f n2 p1 p2 H
0
H 0 : p1 p2 H1 : p1 p2
RH 0 Z0 Z
f n1 1 f n1 f 1 f
n2 n2 H 0 : p1 p2 0 H1 : p1 p2 0
H : p p H : p p
n1 n2 0 1 2 1 1 2
RH 0 Z0 Z1 2
H 0 : p1 p2 0 H1 : p1 p2 0
H 0 : 0 H1 : 0 RH 0 Z 0 Z1
iv
mv 0
Z 0iv H 0 : 0 H1 : 0 RH 0 Z 0iv Z
V mv
H 0 : 0 H1 : 0 RH 0 Z 0 Z1 2
iv
© Ediciones Pirámide 47
Problemas resueltos de estadística
P RH 1 H 1
P 1 P RH 0 H 1
H 0 : 0 L X ; 0
k X RC
H1 : 0 H 0 : 0 L X ;1
RC región crítica óptima
H 0 : 1 H1 : 1 L X ; 0 X RC
H1 : 1 L X ;1
H 0 : X f x;
H 1 : X f x;
48 © Ediciones Pirámide
Resumen de conceptos estadísticos
oi ei
2
i k
i 1
k2m 1
ei
oi ei
2
RH 0 i 1 12 k m 1
i k
ei
H 0 : X f x;
H1 : X f x;
i
An x i 1... n
n
Dn max An x F x An x
i
n
i 1... n
P Dn Qks1 Qks1 Ln 2 2n
© Ediciones Pirámide 49
Problemas resueltos de estadística
H 0 : muestra aleatoria
H1 : muestra aleatoria
2n n
1 1 2
n
R
n
N ;
R
1 2
n
2n n 2n n n n
R R
1 2 1 2 1 2
n n n n 1
R 2
1 2 1 2
R R
RH 0 Z1 2
R
H 0 : X eY independientes
H 1 : X eY independientes
oij eij
2
i 1 jk
i 1 j 1
2h -1 k 1
eij
o eij
2
RH 0 i 1 j 1
i 1 jk
12
ij
eij
50 © Ediciones Pirámide
2 Preguntas cortas y tipo test
CONTENIDO
2.1. Introducción.
2.2. Preguntas cortas.
2.3. Preguntas tipo test.
CONOCIMIENTOS PREVIOS
Para abordar con éxito el estudio de este capítulo, el alumno deberá tener
los siguientes conocimientos previos:
OBJETIVOS
Al finalizar el estudio de este capítulo el alumno deberá ser capaz de:
© Ediciones Pirámide 51
Problemas resueltos de estadística
2.1. INTRODUCCIÓN
A lo largo de este capítulo se presenta un conjunto de preguntas cortas y cues-
tiones tipo test. Para cada una de ellas se incluye la solución adecuada junto con
una breve explicación de las razones que justifican dicha selección.
2.1 Según el siguiente gráfico de diagramas de caja de dos variables, razone las si-
guientes cuestiones:
52 © Ediciones Pirámide
Preguntas cortas y tipo test
3. ¿Se puede decir que por debajo del valor 6 se encuentran más del 50 %
de los valores en la variable 1? ¿Y en la variable 2?
Solución:
3. ¿Se puede decir que por debajo del valor 6 se encuentran más del 50 %
de los valores en la variable 1? ¿Y en la variable 2?
© Ediciones Pirámide 53
Problemas resueltos de estadística
En la variable 1 el cuartil 1 es 4, por lo que por debajo del valor 3 existen me-
nos del 25 % de los datos. En la variable 2 el cuartil 1 sí es 3, por lo que se puede
afirmar que por debajo de 3 se encuentran el 25 % de los datos.
2.2 Se realizó un estudio del tiempo (en segundos) que un cierto número de coches
tardan en pasar de 0 a 100 km/h (aceleración). Las mediciones se realizaron dis-
tinguiendo entre vehículos portugueses y españoles y dieron lugar al siguiente
gráfico:
Señale como verdaderas (V) o falsas (F) las siguientes cuestiones según el grá-
fico anterior razonando su respuesta:
2. El tiempo medio de los coches españoles será mayor que el tiempo me-
diano de dichos coches.
54 © Ediciones Pirámide
Preguntas cortas y tipo test
Solución:
Falso, el 25 % de los coches portugueses más rápidos tardan como mucho 6 se-
gundos (cuartil 1), que no coincide con la mediana de los coches españoles, que es
igual a 5.
2. El tiempo medio de los coches españoles será mayor que el tiempo me-
diano de dichos coches.
© Ediciones Pirámide 55
Problemas resueltos de estadística
2.3 Mediante una encuesta realizada entre los alumnos de la universidad se ha reco-
gido información tanto sobre el medio de locomoción utilizado (X) como el tiem-
po empleado en minutos (Y) por los alumnos en llegar a la universidad. El resul-
tado de la encuesta queda recogido en la siguiente tabla:
Y
X (5-15] (15-25] (25-35] (35-45]
A pie 8 4 2 1
Autobús 2 5 6 7
Tren 2 4 5 8
Coche 3 8 4 6
Bicicleta 5 2 0 0
Solución:
12
P X A pie Y 25 0,14 14,63 %
82
56 © Ediciones Pirámide
Preguntas cortas y tipo test
62
P Y 15 0,75 75,61 %
82
P X Autobús 35 Y 45
P X Autobús 35 Y 45
P 35 Y 45
7 82
0,31 31,82 %
22 82
Simplemente debe calcularse el valor medio de los tiempos invertidos por los
alumnos que viajan en coche:
10 3 20 8 30 4 40 6
x 26,19
21
La siguiente figura muestra una recta de regresión ajustada a una muestra de da-
2.4
tos registrados en cinco departamentos de una empresa para poder predecir la
variable Y = «gasto telefónico mensual en euros» en función de la variable X =
«tiempo de conexión a Internet mensual en minutos».
© Ediciones Pirámide 57
Problemas resueltos de estadística
Solución:
58 © Ediciones Pirámide
Preguntas cortas y tipo test
Verdadero, al ser la pendiente positiva, lo que implica que las dos variables
varían en el mismo sentido.
2.5 Un tren lleva a bordo módulos de acumulación de energía (X), medidos en kwh,
que le permite recorrer una determinada distancia (Y), medida en metros, sin ca-
tenaria. Se han recogido datos referentes al número de módulos a bordo así como
la distancia recorrida sin catenaria en 50 trenes, disponiéndose de la siguiente
información:
© Ediciones Pirámide 59
Problemas resueltos de estadística
Solución:
10 14 12 14
P X 1 ; P X 2 ; P X 3 ; P X 3
50 50 50 50
60 © Ediciones Pirámide
Preguntas cortas y tipo test
Y X 300 i 1 y j P Y y j X 300
in
12
0,02 0,04 2 0,04 0,02
22 3 42 2,5 0,91
2
0,75 Fi 1 0,75 0, 48
P75 Li 1 ci 600 400 807,69
fi 0,52
2.6 La distancia recorrida no sólo depende de los módulos de energía a bordo, sino
también de otros factores como son la inclinación del terreno, la temperatura ex-
terior o la carga del tren.
© Ediciones Pirámide 61
Problemas resueltos de estadística
Autonomía 300 500 400 600 800 500 700 600 500 400
Temperatura 30 15 28 18 8 16 12 15 17 32
Solución:
AT
( AT )
AT
AT n A T
i n
i 1 i i
A T
i 1 Ai
i n
n A T n T
2 12 i n
i 1 i
2 12
2.7 El departamento comercial de una empresa dedicada a la venta de ropa por catá-
logo ha hecho un estudio para determinar si existe relación entre el número de
líneas abiertas para pedidos (L) y las ventas realizadas (V), en cientos de euros.
Para ello, se han recogido los datos de dichas variables durante 20 días, obtenién-
dose los siguientes resultados:
Vi 2 458.657; i 1 LV
i 20 i 20
i 1 i i 92.000
62 © Ediciones Pirámide
Preguntas cortas y tipo test
Solución:
SCM 40.107, 44
R2 0,70
SCT 56.931,16
Se puede decir que la variable número de líneas abiertas para pedidos explica
el 70,45 % de la variabilidad de la variable ventas.
b
VL
i 20
i 1
i i nLV
LV
92.000 20
599 2.835
20
20 5,65
L2 i 20
i 1
L nL
2
î
2
19.195 20
599
2
20
2.835 599
a V bL 5,65 27, 46
20 20
Vi 27, 46 5,65 Li
© Ediciones Pirámide 63
Problemas resueltos de estadística
Analizando todas las ventas en el año pasado de una determinada aplicación para
2.8
móviles en distintos países se ha obtenido que la venta media por semana ha sido
de 158 unidades con una varianza de 100 unidades2. A partir de una muestra alea-
toria de 8 semanas del presente año se obtiene una media de 180 paquetes con
varianza 150 paquetes2. A continuación se enuncia un conjunto de hipótesis sobre
los valores poblacionales de las ventas de este producto. Reescríbalas como hipó-
tesis nula y alternativa.
Hipótesis H0 H1
Las ventas medias no han disminuido respecto al año pasado
La varianza no ha disminuido respecto al año pasado
Las ventas medias han aumentado 10 paquetes respecto al año pasado
La varianza poblacional es este año 140 paquetes2
Solución:
Hipótesis H0 H1
Las ventas medias no han disminuido respecto al año pasado µ = 158 µ < 158
2
La varianza no ha disminuido respecto al año pasado σ = 100 σ2 < 100
Las ventas medias han aumentado 10 paquetes respecto al año pasado µ = 168 µ 168
σ2 140
2 2
La varianza poblacional es este año 140 paquetes σ = 140
64 © Ediciones Pirámide
Preguntas cortas y tipo test
X1 X2
Media 16000 0,30
Mediana 15,500 0,50
Varianza 8,410 3,61
Mínimo 9000 -5,300
Máximo 22000 3,70
Rango 13000 900
Cuartil inferior 14000 -0,900
Cuartil superior 17000 1,30
Coeficiente de variación 0,183 6,30
© Ediciones Pirámide 65
Problemas resueltos de estadística
i. 24 %.
ii. 60 %.
iii. 70 %.
66 © Ediciones Pirámide
Preguntas cortas y tipo test
cifra implica que el 60 % de los alumnos han evaluado a su profesora con nota
superior a 3.
Vida en
Bombillas Frecuencia relativa Frecuencia relativa acumulada
horas
(0-500] 8 0,16
(500-1.000] 12 0,4
(1.000-1.500] 0,30 0,7
(1.500-2.500] 0,20
(2.500-3.000] 5 1,0
2.12 La siguiente tabla muestra los estadísticos resumen de las mediciones de 50 torni-
llos con dos calibres diferentes.
Calibre 1 Calibre 2
Media 346,160 351,120
Mediana 346,000 352,000
Moda 345,000 353,000
Varianza 007,402 ,21,900
Rango 011,000 ,16,000
Asimetría 000,590 00,028
Curtosis -0,278 -1,174
Coeficiente de variación 00,786 01,333
© Ediciones Pirámide 67
Problemas resueltos de estadística
iii. El calibre 2 presenta una menor dispersión y por lo tanto se considera que
sus mediciones son mejores que las realizadas con el calibre 1.
2.13 Sea la variable peso que es capaz de levantar un elevador. Para calcular el peso a
partir del cual el elevador pueda levantar con una probabilidad del 30 % se debe
calcular:
i. El percentil 30.
iii. El percentil 3.
El percentil es por definición la medida que deja por debajo de él una canti-
dad de observaciones igual a su orden, de forma que la medida que deja por
debajo de éste el 70/ % de las observaciones (percentil 70) mantiene por encima
suyo el 30 % de observaciones restante. Por ello, el valor del peso tal que por
encima de él permanece una probabilidad del 30 % es el percentil 70.
2.14 Durante una semana se han contado un total de 5.000 visitas realizadas a la pági-
na web de un determinado diario online. Se desea estudiar la relación entre el día
de la semana y el intervalo horario en que se realizan las visitas. Sean X = «día de
la semana» e Y = «intervalo horario» en el que se realizó la visita:
68 © Ediciones Pirámide
Preguntas cortas y tipo test
Basta con sumar las visitas dentro de cada intervalo para calcular las frecuen-
cias relativas de cada día y franja horaria para comprobar que la frecuencia relati-
va de la franja horaria (8:00-13:00] los jueves es igual a 0,0887.
Es una frecuencia absoluta por ser una cantidad de individuos con una edad
igual o inferior a 18 años.
© Ediciones Pirámide 69
Problemas resueltos de estadística
2.16 Dada las siguientes gráficas (etiquetadas como H1, H2, H3, C1, C2 y C3), ¿qué
correspondencias son correctas?
70 © Ediciones Pirámide
Preguntas cortas y tipo test
H H M M M H M M H M
2,20 1,50 4,50 1,10 3,30 2,80 2,40 2,50 1,70 4,50
2.18 La siguiente tabla muestra información sobre la venta en 1998 de prensa diaria
escrita, en ejemplares diarios vendidos por cada mil habitantes para 8 comunida-
des autónomas españolas, relacionándola con su producción económica basada en
el Producto Interior Bruto (PIB) por habitante, en miles de euros.
Asumiendo que existe relación lineal entre ambas variables, se obtiene la si-
guiente recta de regresión para explicar el número de ejemplares vendidos por
cada 1.000 habitantes en función del PIB por habitante en miles de euros:
Y= −23,55 + 12,23X
© Ediciones Pirámide 71
Problemas resueltos de estadística
1. ¿Cuál será la venta de prensa que se podría predecir para una comunidad
cuyo PIB por habitante fuese de 15.000 euros?
i. 159,9 ejemplares.
ii. Cuando el PIB por habitante aumenta en 1.000 euros, el número de ejem-
plares vendidos por cada mil habitantes disminuye en 23,55.
iii. Cuando el PIB por habitante aumenta en 1.000 euros, el número de ejem-
plares vendidos por cada mil habitantes aumenta en 12,23.
i. 0,25/10.
ii. 0,5.
72 © Ediciones Pirámide
Preguntas cortas y tipo test
i. La media aritmética.
iii. La mediana.
© Ediciones Pirámide 73
Problemas resueltos de estadística
2.23 Una fábrica utiliza máquinas de tipo A para el 25 % de sus productos y de tipo B
para el resto. El 2 % de los productos fabricados por las máquinas de tipo A son
defectuosos, así como el 1 % de los fabricados por las máquinas de tipo B. Esco-
gido un producto al azar resulta ser defectuoso. La probabilidad de que fuese
fabricado por la máquina A es:
i. 0,005.
ii. 0,6.
iii. 0,4.
74 © Ediciones Pirámide
Preguntas cortas y tipo test
P A D 0, 25 0,02
P A D 0, 4
P D 0, 25 0,02 0,75 0,01
2.24 El número de clientes en una tienda de venta online que devuelven el producto en
la primera semana después de la compra es una variable aleatoria cuya distribu-
ción de probabilidad es la siguiente:
xi 0 1 2 3 4 5
P[X = xi] 0,05 0,15 k 0,25 0,12 0,06
i. La probabilidad de que como mínimo sean dos clientes que los que de-
vuelven el producto es 0,6.
2.25 Dada una variable aleatoria normal de media 10 y varianza 9, sabemos que dentro
del intervalo [4;16] se recogen aproximadamente…
i. 88 % de los datos.
© Ediciones Pirámide 75
Problemas resueltos de estadística
mente 0,95. Se trata además de un intervalo centrado en la media y con una am-
plitud de ±2σ. Intervalo que se sabe que en una distribución normal concentra el
95 % de los resultados.
2.26 Al vestíbulo de una estación de tren llega una media de 120 pasajeros a la hora.
La llegada de los pasajeros tiene un ritmo medio estable y lo hacen de forma in-
dependiente. La variable aleatoria X = número de pasajeros que llegan en media
hora se distribuye según…
2.27 La probabilidad de que una probeta de cierto material plástico no supere las prue-
bas de resistencia a tracción es del 2 %. Se toman al azar 20 probetas de dicho
material, el número de probetas que no superarán las pruebas de resistencia a
tracción sigue un modelo…
76 © Ediciones Pirámide
Preguntas cortas y tipo test
Basta con transformar la tasa aportada por el enunciado (90 llamadas a la ho-
ra) a minutos y ser consciente de que el experimento puede estudiarse mediante
una distribución exponencial para comprobar que la opción correcta es la i.
0 si x 1
x2 1
x si 1 x 2
2 2
F ( x)
x2 7
3x si 2 x 3
2 2
1 si x 3
© Ediciones Pirámide 77
Problemas resueltos de estadística
i. 0,125.
ii. 0,875.
iii. 0,75.
78 © Ediciones Pirámide
Preguntas cortas y tipo test
ii. Es normal sólo si las poblaciones son normales con la misma varianza.
De entre las tres opciones únicamente resulta cierta en todo caso la primera en
virtud del teorema central del límite y los teoremas de convergencia.
2.35 Al calcular intervalos de confianza para la media poblacional con tamaño mues-
tral n < 30 la distribución t-Student se utiliza:
i. Siempre.
iii. Supuesta población normal y varianza poblacional estimada por ser des-
conocida.
© Ediciones Pirámide 79
Problemas resueltos de estadística
2.36 El menor nivel de significación al cual puede rechazarse la hipótesis nula es:
ii. El p-valor.
80 © Ediciones Pirámide
Preguntas cortas y tipo test
ii. Un par de valores que, con cierta probabilidad, contiene al verdadero va-
lor del parámetro poblacional.
i. Sesgado.
ii. Escoger el valor del parámetro que haga más probable el resultado obte-
nido en la muestra.
© Ediciones Pirámide 81
Problemas resueltos de estadística
2.43 Sabiendo que B ˆ1 1 y V ˆ1 0,5 , y que el estimador insesgado ˆ2 tiene
una varianza igual a 4, según el criterio del error cuadrático medio:
Siendo el error cuadrático medio igual a la varianza del estimador más su ses-
go elevado al cuadrado, no queda más que seleccionar al primer estimador por ser
su error cuadrático medio igual a 1,5 frente al segundo, cuyo error cuadrático
medio es igual a 4.
2.45 Se quiere estimar la renta mínima de los habitantes de Lugo. Para estimar pun-
tualmente dicho parámetro se seguirá el siguiente proceso:
i. Una vez conocido el censo de los lucenses, se toma una muestra aleato-
ria, se propone un estimador adecuado y por último se calcula una esti-
mación sobre una muestra en particular.
82 © Ediciones Pirámide
Preguntas cortas y tipo test
ii. Se recoge información de los últimos 20 lucenses que han engrosado las
cifras del paro y se calcula la renta media de dicha muestra como estima-
ción del parámetro.
2.46 Dada una población normal de media µ y varianza σ2, sabemos que el estadísti-
co media muestral x de una muestra aleatoria simple sigue una distribución
normal de:
© Ediciones Pirámide 83
Problemas resueltos de estadística
IC ;0,05 87,3;95,7
2.49 Para una muestra particular se ha obtenido el p-valor = 0,023 al realizar un de-
terminado contraste de hipótesis. Entonces:
El p-valor representa una medida de que la hipótesis nula, para la muestra se-
leccionada, sea cierta, de forma que si es inferior al nivel de significación fijado
habrá de rechazarse la hipótesis nula por ser poco creíble. Esta circunstancia es la
que se observa en la tercera opción de entre las anteriores.
84 © Ediciones Pirámide
Preguntas cortas y tipo test
El signo negativo implica que la diferencia entre las dos medias será menor
que cero con un nivel de confianza del 95 %. Ello, tal y como se ha planteado el
intervalo, implica que la media poblacional de la variable aleatoria X es menor
que la media poblacional de la variable aleatoria Y.
© Ediciones Pirámide 85
Problemas resueltos de estadística
2.53 Se desea estimar la media µ de una variable aleatoria X. Para ello se toman 10
datos y se calcula la media muestral x y la cuasivarianza muestral sn21 . Enton-
ces:
i. Por el teorema central del límite se sabe que µ será una variable aleatoria
normal
ii. Un estimador de X es x .
iii. Es normal sólo si las poblaciones son normales con la misma varianza.
86 © Ediciones Pirámide
Preguntas cortas y tipo test
Consecuencia directa del teorema central del límite y los teoremas de conver-
gencia, puede aceptarse que si el tamaño de la muestra es elevado, independien-
temente del modelo de probabilidad concreto de cada una de las observaciones, el
modelo de probabilidad de la diferencia de medias muestrales (en la medida en la
que se trata de una combinación lineal de variables aleatorias) convergerá a una
distribución normal.
2.55 Sea X una variable aleatoria que permite modelizar el número de clientes que en
una determinada población tienen instalada fibra óptica en casa. Si se toma una
muestra aleatoria simple de 20 individuos de dicha población, se sabe que X:
2.56 Sea Ho: 2 o2, frente a H1: 2 > o2, para una muestra de tamaño 20 procedente
de una variable aleatoria X distribuida N(;2).
ii. El error tipo II es el que se comete al aceptar H1: > o2 cuando es falsa.
© Ediciones Pirámide 87
3 Cuestiones y problemas teóricos
CONTENIDO
3.1. Introducción.
3.2. Cuestiones y problemas teóricos.
CONOCIMIENTOS PREVIOS
Para abordar con éxito el estudio de este capítulo, el alumno deberá tener
los siguientes conocimientos previos:
OBJETIVOS
Al finalizar el estudio de este capítulo el alumno deberá ser capaz de:
89
© Ediciones Pirámide
89
Problemas resueltos de estadística
3.1. INTRODUCCIÓN
2 a2 a12
Solución:
90 © Ediciones Pirámide
Cuestiones y problemas teóricos
2 E X E X E X 2 E X 2 XE X
2 2
E X 2 E E X E 2 XE X E X 2 E X 2 E X E X
2 2
E X 2 E X 2 E X E X 2 E X a2 a12
2 2 2
P A B C P A C PB C P A B C
Solución:
© Ediciones Pirámide 91
Problemas resueltos de estadística
P A B C
Solución:
P A B C P A B C P A B P C P A B C
P A P B P A B P C P A C B C
P A P B P A B P C P A C P B C P A C B C
P A P B P C P A B P A C P B C P A B C
Solución:
El primer paso para resolver la cuestión planteada pasa por deducir la función
de densidad sin más que derivar la función de distribución expuesta en el enun-
ciado:
92 © Ediciones Pirámide
Cuestiones y problemas teóricos
dF x
dx
f x
d
dx
1 e x e x
Una vez conocida la función de densidad, ha obtenerse la función característi-
ca para posteriormente derivarla hasta obtener los momentos. Primeramente la
función característica:
x t E eitx f xe
itx
dx e e dx e x it dx
x itx
Dx Dx Dx
e x it
it 0 it
d x t d
d
dt t 0 dt it t 0 dt
1
it
t 0
1 i 1 1 1
i ia1 a1 E X
it t 0
2
d 2 x t d 2
dt 2 2
t 0 dt it
d
t 0 dt
2
i it
t 0
2 i 2 2 2
i 2 2 i 2 a2 a2 2
it t 0
3
2 1 1
V X a2 a12
2
2
2
© Ediciones Pirámide 93
Problemas resueltos de estadística
3.5 Sean dos variables aleatorias independientes distribuidas según las leyes binomia-
les expuestas a continuación:
X 1 k1 ; p
X 2 k2 ; p
Demostrar que la variable aleatoria Y, definida como suma de las dos variables
anteriores, se distribuye según un modelo binomial con los siguientes parámetros:
Y X 1 X 2 k1 k2 ; p
Solución:
k1 k2
eitp 1 p eitp 1 p eitp 1 p
k1 k2
Por otro lado, la función característica de la suma de las dos variables aleato-
rias resulta ser el producto de ambas funciones:
x x t x t x t E eitx E eitx
1 2 2 2
1 2
k1 k2
eitp 1 p eitp 1 p eitp 1 p
k1 k2
94 © Ediciones Pirámide
Cuestiones y problemas teóricos
Solución:
De esta forma, sabiendo que la media muestral no es más que una combina-
ción lineal de variables aleatorias, y que según el enunciado el tamaño muestral
es lo suficientemente elevado, podrá aceptarse el siguiente planteamiento:
TCL n
x i 1 xi n N E x ; V x
i n
Simplemente resta por conocer los valores concretos para esperanza mate-
mática y varianza para lo cual se aplican sendos operadores sobre la media
muestral:
1 i n 1
E x E i 1 xi E i 1 xi i 1 E xi E xi kp
i n 1 i n
n n n
1 i n
kp kp
n i 1
1 i n 1
V x V i 1 xi 2 V i 1 xi 2 i 1 V xi V xi kp 1 p
in 1 in
n n n
1 kp 1 p
2 i 1
in
kp(1 p )
n n
© Ediciones Pirámide 95
Problemas resueltos de estadística
TCL n
kp 1 p
x i 1 xi n N kp;
i n
n
TCL n
p 1 p
x i 1 xi n N p;
i n
n
n 1 sn21
2
Solución:
x x
i n 2
i 1 i
x x N 2 0; 2
in 2 i n 1
i 1 i i 1
96 © Ediciones Pirámide
Cuestiones y problemas teóricos
N 2 0; 2 i n 1 N 0;
i n 1
2 2
i 1 i 1 Z 0;1 n 1
i 1 i n 1 2 2
2 2
n 1 sn21 2
n 1
2
3.8 Sea una variable aleatoria distribuida en la población según una distribución de
Poisson de parámetro λ. Si se extrae una muestra de tamaño lo suficientemente
grande, siendo independientes las extracciones, deducir la distribución de proba-
bilidad de la media muestral.
Solución:
x i 1 xi n
i n TCL n
N E x ; V x
Simplemente queda por calcular los valores concretos para la esperanza ma-
temática y la varianza de la distribución normal. Para ello debe recordarse que la
esperanza matemática y la varianza para el modelo de Poisson son iguales al pa-
rámetro λ y trabajar con los referidos operadores de la forma siguiente:
1 i n 1
E x E i 1 xi E i 1 xi i 1 E xi E xi
in 1 in
n n n
1 i n
n i 1
© Ediciones Pirámide 97
Problemas resueltos de estadística
1 i n 1
V xi V xi
1
V x V i 1 xi 2 V i 1 xi 2
in i n
n n n i 1
1 in
n2
n
i 1
x i 1 xi n
i n P
N ; n
Solución:
e n i1
i n
xi
L x1 , x2 ,.., xn ; i 1 f xi ;
in
in
i 1
xi !
d e n i1 i
i n
dLn L x1 ,..., xn ; x
Ln
d d i n xi !
i 1
xi
i n
d
d
n Ln e x Ln
in
i 1 i
Ln i 1 xi ! n i 1
i n
98 © Ediciones Pirámide
Cuestiones y problemas teóricos
dLn L x1 ,..., xn ;
i n
xi
mv x i 1 xi n
i n
0 n i 1
d mv
d 2 Ln L x1 ,..., xn ; d 1 in 1
n i 1 xi 2
in
0 xi 0
d2 d i 1
Solución:
1 i n 1 i n
V x V i 1 xi n 2 V i 1 xi n 2 i 1 V xi
in
n
V xi 2
1 i n
n i 1 n
© Ediciones Pirámide 99
Problemas resueltos de estadística
e x
f x;
x!
Ln f x; xLn Ln x !
dLn f x; 2 x 2 x 2
E
E
E
d 2
1
2
2
2
1
E x E x 2 V X 2 V X
V X
1
B x E x E i 1 xi n i 1 E xi n
i n i n
E i 1 n 0
i n
2
dB
1
VCR d
1
dLn f X ; 2
n 1 n
nE
d
V x VCR
n n
Solución:
e n i1
in
xi
L x1 , x2 ,.., xn ; i 1 f xi ;
in
in
i 1
xi !
Un estimador suficiente según el teorema aludido será aquel que permita ex-
presar la función de verosimilitud como producto de dos funciones, la primera de
las cuales depende del parámetro y de la muestra a través del estimador y la se-
gunda depende de la muestra pero no a través del estimador:
L x1 , x2 ,.., xn ; g x1 , x2 ,.., xn ; h x1 , x2 ,.., xn
x
g x1 , x2 ,...xn ; e n i1 i
i n
L x1 , x2 ,.., xn ; e n i1 i
i n
x 1
1
h x1 , x2 ,...xn x1 !...xn !
x1 !...xn !
Solución:
i n k kx
L x1 , x2 ,..., x n ; k , p i 1 f xi ; k , p i 1 p xi 1 p i
in
xi
in k
i 1 p i 1 i 1 p i 1 i
in in
x kn x
xi
Una vez expuesta la función de verosimilitud debe derivarse respecto del pa-
rámetro para el que se busca un estimador e igualar a cero para comprobar la
primera condición de máximo. Para facilitar el cálculo cabe tomar logaritmos y
operar de la forma siguiente:
Ln L x1 , x2 ,..., xk ; p
i n k
Ln i 1
xi
x Ln p kn x Ln 1 p
i n
i 1 i
i n
i 1 i
i n k
Ln
p i 1 xi
x Ln p kn x Ln 1 p
i n
i 1 i
i n
i 1 i
i n
i 1
xi p kn i 1 xi
i n
1 p
Finalmente se iguala a cero fijando la condición de máximo y refiriéndose ya
al estimador:
in
i 1
xi p mv kn i 1 xi
i n
1 p 0 p
mv mv i 1 xi kn
i n
Por último, la segunda derivada debe ser negativa para confirmar la condición
de máximo:
2
L x1 , x2 ,..., xn ; k , p 0
p 2
p
i n
i 1
xi p kn i 1 xi
i n
1 p
i n
i 1
xi p 2 kn i 1 xi
i n
1 p
2
3.13 Deducir el estimador por el método de los momentos para el parámetro p de una
distribución binomial de parámetros k y p.
Solución:
E X a1 kp i 1 xi n p m i 1 xi kn
i n i n
Puede comprobarse cómo los estimadores por los métodos de los momentos y
de la máxima verosimilitud para el parámetro p de la distribución binomial coin-
ciden.
Solución:
1
B x p E x p E i 1 xi n p E i 1 xi
i n i n
n
1 i n 1 i n
p i 1 E xi E xi p p p p np 0
1
n n i 1 n
V x V i 1 xi n 2 i 1 V xi V xi p 1 p
i n 1 i n
n
1 i n p 1 p
2 i 1
p 1 p
n n
f x; p p x 1 p
1 x
Ln f x; p xLn p 1 x Ln 1 p
Ln f x; p x 1 x x p
p p 1 p p 1 p
Ln f x; p 2 x p 2 x p 2
E E E
p 1 p
p p 1 p 2
1
p 1 p
2
E x p E x p 2 V X p 1 p
2
2
1 1
p 1 p
p 1 p
2
p 1 p
dB x
2
1
dp 1 p 1 p
VCR
Ln f x; p
2
n 1 p 1 p n
nE
p
Puede comprobarse, por tanto, que varianza y cota de Cramer Rao coinciden,
lo que hace que la media muestral sea un estimador eficiente para el parámetro p
de una distribución binomial:
p 1 p p 1 p
V x VCR
n n
Solución:
lim B 0
n
lim V 0
n
lim E x E x
n
lim V x 0 lim V x lim 0
n n
n n
Solución:
L x1 , x2 ,..., xn ; , i 1 f xi ; , i 1 2
in i n 1 2
2 1 2
e 2 2
i1 xi
i n 2
2
n 2
2 n 2
e 2 2
xi
i n 2
Ln L x1 , x2 ,..., xn ; , Ln 2 Ln 2 i 1 2
n n
2 2 2
1
Ln L x1 , x2 ,..., xn ; , 0 2 i 1 xi
i n
mv
i 1 xi
i n
i 1 i i 1 mv i 1 xi n mv 0
0 in x in
mv
i n
i 1 xi n x
i n
mv
2 1 n
2 i 1 i
Ln L x1 , x2 ,..., xn ; , 0 x 2
i n
2
3.17 Se desea obtener el estimador de máxima verosimilitud del parámetro θ del mo-
delo de probabilidad definido por la siguiente función de densidad:
f ( x; ) 1 x 0 x 1
Solución:
L x1 , x2 ,..., xn ; i 1 f xi ; i 1 1 xi
in i n
1
in
xi
n
i 1
d n
Ln L x1 , x2 ,..., xn ; Ln i 1 xi
in
d 1
d n
Ln L x1 , x2 ,..., xn ; 0 Ln i 1 xi
i n
d
1 mv
n
mv 1
Ln xi
in
i 1
d2
Ln L x1 , x2 ,..., xn ; 0
d n
d 1
Ln i n
xi
n
d 2 1
i 1 2
3.18 Se desea obtener el estimador por el método de los momentos del parámetro θ del
modelo de probabilidad definido por la siguiente función de densidad:
f ( x; ) 1 x 0 x 1
Solución:
1 2 1
1
E X xf x dx x 1 x dx 1 x 1dx
1 1
x
Dx 0 0 2 0 2
m 1 2x 1
x m
m 2 1 x
Solución:
P q1 Q q2 1 P LI LS 1
Q
n 1 sn21 2
n 1
2
P LI 2 LS 1
Para llegar a despejar los límites (LI, LS) reflejados en la expresión anterior se
parte de la probabilidad correspondiente referida a la cantidad pivotal y se desa-
rrolla hasta despejar la varianza en el centro del intervalo y los límites en los dos
extremos:
2 n 1 sn21 2
P q1 Q q2 1 P 2 1 2 1
2
n 1 sn21 n 1 sn21
IC ; 2
2
;
1 2 2 2
Solución:
P q1 Q q2 1 P LI LS 1
x
Q t n 1
sn n 1
El esquema del intervalo y de su definición se refleja a continuación:
P LI LS 1
x
P q1 Q q2 1 P t 2 t1 1
sn n 1 2
x s s
P t 2 t1 2 1 P t 2 n x t1 2 n 1
sn n 1 n 1 n
s s
P x t 2 n x t1 2 n
n 1 n 1
s
s
P x t 2 n x t1 2 n t 2 t1 2
n 1 n 1
s s
P x t1 2 n x t1 2 n
n 1 n 1
s
IC ; x t1 2 n
n 1
H 0 : 0
H1 : 0
Solución:
P AH 0 H 1
P 1 P RH 0 H 1
x 0
P AH0 H0 P Z1 P x 0 Z1
n n
x1 0 Z1 P x x1
n
x H1 x1 H1 x1 H1
P AH0 H1 P x x1 H1 P P Z
n n n
x1 H1
P 1 1 P Z
n
1 P Z
0 n Z1 H1
n
1 P Z Z1
n
0 H1
3.22 Proponer una regla que permita decidir entre dos contrastes unilaterales para la
media de una población normal en los términos siguientes:
H 0 : 0
H1 : 1
Solución:
i1 xi 1
i n 2
i1 xi 0 i1 xi 1
i n i n
2 n 2
2
n 2 2 2
L x1 , x2 ,..., xn ; 1 , e 2 2
e 2 2
L x1 , x2 ,..., xn ; 0 , i1 xi 0
i n 2
2
n 2
2 n 2
e 2 2
i1 xi 1 i1 xi 0
i n 2 i n 2
k i 1 xi 0 i 1 xi 1 2 2 Ln k
in 2 i n 2
2 2
e
n 02 12 2 0 1 i 1 xi Ln 2k 2
in
3.23 Se sabe que la función de densidad de una determinada variable aleatoria adopta
la forma siguiente:
f ( x; ) e x x 0
H 0 : 0
H1 : 1
Solución:
1n e
i n
L x1 , x2 ,..., xn ;1
in x
x n
1 e 0 1 i1 i
1 i 1 i
L x1 , x2 ,..., xn ;0 0n e 0
i n
o x
i 1 i
k nLn 1 0 1 i 1 xi Ln k
in
e
0 0
Ln k nLn 1 0 Ln k nLn 1 0
i 1 xi
i n
x
0 1 n 0 1
f x; 2 xe x x0
3. Sea la media muestral el estimador del parámetro . ¿Sería este nuevo es-
timador más eficiente que el estimador calculado en los apartados ante-
riores? Razónese para = 1.
Solución:
L x1 , x2 ,..., xn ; i 1 f xi ; i 1 2 xi e xi
in in
x e i1 i
i n
i n
2n
x
i 1 i
x
x e i1 i
i n
LnL x1 , x2 ,..., xn ; Ln 2 n
i n
i 1 i
2nLn Ln i n
i 1
xi i 1 xi
in
d
d
LnL x1 , x2 ,..., xn ;
d
d
2nLn Ln i n
i 1
xi i 1 xi
in
2n
i 1 xi
in
d 2n 2n
LnL x1 , x2 ,..., xn ; 0 i 1 xi mv i n
in
d mv xi i 1
d2 d 2n 2n
Ln L x1 , x2 ,..., xn ; 0 i 1 xi 2
i n
d 2
d
2n 2n 2n
0
E xi E xi 2n
i n in
i 1 i 1
3. Sea la media muestral el estimador del parámetro . ¿Sería este nuevo es-
timador más eficiente que el estimador calculado en los apartados ante-
riores? Razónese para = 1.
Para pronunciarse respecto de la eficiencia de los dos estimadores ha de calcu-
larse la varianza de cada uno de ellos:
4n 2
i n i n
V ˆmv V 2n x 4n 2
i 1 i
V xi 2n 2
i 1
2n 2
i 1 V xi 2n 2 2
i n
i 1 i
i n
V x V x n
n2 n2 n 2
Simplemente queda particularizar para θ = 1 y pronunciarse respecto del esti-
mador más eficiente:
V ˆmv 2n 2 2n
2 2
V x
n 2
n
CONTENIDO
4.1. Introducción.
4.2. Ejercicios de aplicación.
CONOCIMIENTOS PREVIOS
Para abordar con éxito el estudio de este capítulo, el alumno deberá tener
los siguientes conocimientos previos:
OBJETIVOS
Al finalizar el estudio de este capítulo el alumno deberá ser capaz de:
4.1. INTRODUCCIÓN
A lo largo de este último capítulo del manual se presentará un conjunto de
ejercicios de aplicación numérica en su mayoría. Se trata de ejercicios concebidos
desde una perspectiva global del conocimiento estadístico.
En muchos de los ejercicios expuestos se combinan conceptos de diferentes
unidades teóricas, lo que hace que la solución requiera de una perspectiva
completa del área de conocimiento y una considerable capacidad de interrelación
entre conceptos diferentes.
Los ejercicios expuestos incluyen la solución con explicaciones que permiten
al lector seguir el razonamiento seguido hasta obtener la solución.
4.1 Un televisor tiene un gran número de válvulas, tanto de tipo A como de tipo B,
todas independientes entre sí. El número medio de válvulas tipo A que se es-
tropean al año sigue un modelo cuyo parámetro es 2 y suponiendo estabilidad
e independencia en el proceso. El número de válvulas tipo B que se estropean
se puede representar por una variable aleatoria cuya función de masa es la
siguiente:
P X B i i i 1, 2, 3
P X B i (7 i) i 4, 5, 6
P X
Dx B i 1
e xAi e 2 21
P X A x Ai P X A 1 0, 27
x Ai ! 1!
Comparando ambas probabilidades puede concluirse que es más probable que
se estropee una válvula del tipo A.
P A B P A P A P A B
P X A 2 XB 3 P X A 2 P XB 3 P X A 2 XB 3
P X A 2 1 P X A 2 1 P X A 0 P X A 1 P X A 2
e 2 2 0 e 2 21 e 2 2 2
1 0,32
0! 1! 2!
P X B 3 P X B 4 P X B 5 P X B 6
0,08 (7 4) 0,08 (7 5) 0,08 (7 6) 0,52
Para calcular la intersección debe matizarse una cuestión, puesto que el enun-
ciado especifica que puede asumirse la independencia, con lo que la intersección
se calcula como producto de las probabilidades absolutas ya calculadas anterior-
mente:
PE P X A E P X B E
5 7
P X A P E X A P X B P E X B 0, 27 0, 08 0,16
12 12
Ha de matizarse la nomenclatura empleada en la expresión anterior, puesto
que el suceso E = «válvula estropeada» representa el hecho de que una válvula
del tipo A o B se haya estropeado lo que en realidad implica que XA = 1 o XB = 1.
Por su parte, los sucesos XA y XB en la expresión anterior aluden a los sucesos
seleccionar válvulas del tipo A o B, respectivamente.
Ahora bien, el enunciado especifica que ya se ha seleccionado una válvula que
resulta estar estropeada y que entonces se calcule la probabilidad de que se trate
de una válvula tipo A, lo que obliga a recurrir al teorema de Bayes, puesto que el
especio muestral total no está constituido por todas las válvulas, sino únicamente
por aquellas ya estropeadas. El esquema siguiente refleja la nueva situación:
P X A E P X A P E X A 0,11
P X A E 0,68
PE PE 0,16
H0 : 22 12 H0 : 2 1 1
2 2
H1 : 22 12 H1 : 22 12 1
El estadístico adecuado para resolver el contraste debe incluir las cuasivarian-
zas muestrales por ser la información proporcionada por el enunciado:
22 S n2 1 S n2 1 22
F n1 1; n2 1
1 1
12 S n2 1 S n2 1 12 H
2 2 0
Al tratarse de un contraste bilateral, la región crítica se ubica sobre las dos co-
las de la distribución de probabilidad tal y como muestra el siguiente esquema:
Sn21 1 25
0,89
Sn22 1 28
F0,975 20;15 2,75 No RH 0
1 1
F0,025 20;15 0,38
F0,975 15;20 2,53
4.3 Sea el siguiente conjunto de datos relativos al tiempo de conexión de los usuarios
a una determinada página web:
Población 1 Población 2
Usuario Tiempo (min) Usuario Tiempo (min) Usuario Tiempo (min)
1 13,88 1 01,82 21 02,73
2 15,96 2 05,83 22 02,50
3 14,80 3 03,08 23 03,08
4 12,50 4 02,14 24 14,32
5 12,91 5 02,73 25 09,12
6 14,58 6 02,50 26 02,50
7 15,28 7 13,85 27 02,31
8 16,05 8 12,86 28 05,71
9 12,58 9 03,64 29 00,91
10 14,88 10 12,50 30 12,46
11 15,19 11 03,08 31 13,85
12 15,86 12 02,14 32 14,30
13 12,47 13 03,64 33 01,82
14 15,45 14 02,50 34 05,83
15 12,51 15 03,08 35 06,15
16 14,13 16 03,57 36 02,14
17 14,10 17 05,45 37 03,64
18 14,02 18 02,50 38 01,67
19 13,64 19 03,85 39 03,85
20 16,04 20 14,29 40 02,86
Población 1 Población 2
Tamaño de la muestra 20,000 40,000
Media muestral 14,341 05,420
Cuasidesviación típica 01,265 04,397
Z Kolmogorov-Smirnov 00,541 01,831
p-valor
00,931 00,002
Significación asintótica normal (bilateral)
Solución:
TCL n
N ;
X n
Esto, junto con el hecho de conocer la varianza poblacional, permite utilizar el
pivote siguiente cuyo modelo de probabilidad es conocido al tratarse de una dis-
tribución normal tipificada:
x
Q Z 0;1
n
Con esta información únicamente queda recurrir al concepto de intervalo de
confianza que queda reflejada en la figura siguiente:
x 1 IC ; x Z
P Z 2 Z1
n 2
n
1 2
El resultado numérico final para los límites del intervalo de confianza procede
de sustituir la información disponible en las expresiones incluidas en el gráfico
anterior:
2 2
IC ;0,05 5,42 Z0,975 5,42 1,96 4,80;6,04
40 40
H0 : 12 2
H1 : 12 2
Para resolver el contraste con la información de la que se dispone se utilizará
el siguiente estadístico:
n 1 S n21
n21
12 H 0
Al ser bilateral el contraste, la región de rechazo debe definirse en las dos co-
las de la distribución, y al no ser la distribución chi-cuadrado simétrica, ha de
comprobarse el estadístico con los dos extremos de la región crítica. El esquema
del contraste queda reflejado en la siguiente figura:
n 1 S 2 n 1 S 2
P RH 0 H 0 P n 1
2
n 1
2
12 H 12 H 1 2
2
0 0
n 1 Sn21
2 2
1 H 0
2
RH 0 o
n 1 Sn 1 2
2
12 1 2
H0
Por lo tanto, no queda más que calcular el estadístico sustituyendo con la in-
formación del enunciado y comparar con los valores de los cuantiles para la dis-
tribución chi-cuadrado:
H 0 : 1 2 H : 2 0
0 1
H1 : 1 2 H1 : 1 2 0
x1 x2 1 2 H 0
tn1 n2 2
1 n1 1 sn 1 n2 1 sn 1
2 2
1
1 2
n1 n2 n1 n2 2
x1 x2 1 2 H
RH 0 0
t n n 2
1 n1 1 sn 1 n2 1 sn 1
2 2 1 21
1
1 2
n1 n2 n1 n2 2
x1 x2 1 2 H
p -valor P tn1 n2 2 0
1 n1 1 sn 1 n2 1 sn 1
2 2
1
1 2
n1 n2 n1 n2 2
P tn1 n2 2
14,34 5, 42 0
1
1 20 11, 26 2 40 1 4,392
20 40 20 40 2
P t58
14,34 5,42 0
1
1 20 11,262 40 1 4,392
20 40 20 40 2
13 27
fn1 0,65; fn2 0,67
20 40
H 0 : p1 p 2 0
H 1 : p1 p 2 0
f n1
f n2 p1 p2 H
0
Z 0,1
f n1 1 f n1 f 1 f
n2 n2
n1 n2
El contraste es bilateral, con lo que la región crítica se ubica en las dos colas
de la distribución normal:
P RH 0 H 0 P
f n1
f n2 p1 p2 H
0
Z1 2
f n1 1 f n1 f 1 f
n2 n2
n1 n2
RH 0
f n1
f n2 p1 p2 H
0
Z1 2
f n1 1 f n1 f 1 f
n2 n2
n1 n2
f n1
f n2 p1 p2 H
0
0,65 0,67 0
0,19
f n1 1 f n1 f 1 f
n2 n2
0,65 1 0,65 0,67 1 0,67
n1 n2 20 40
Z1 2 Z0,975 1,96
0,19 1,96 No RH0
H 0 : 100
H 1 : 100
4.4 La longitud aleatoria de las piezas que fabrica una compañía con la línea de pro-
ceso en dos fases se distribuye según la siguiente función de densidad:
3
f (x) ( x 1)( x 3)
4
Se considera que la pieza es correcta cuando su longitud se encuentra entre 2,5
y 4 unidades de longitud.
1. ¿Cuál es la probabilidad de que una pieza sea correcta?
2. Si se empaquetan las piezas en lotes de 5 unidades, ¿cuál es la probabili-
dad de que en un lote haya como mucho 3 piezas correctas?
3. Cada día la empresa produce 500 piezas que empaqueta en lotes de ese
tamaño. La producción diaria se considera correcta si se producen entre
412 y 438 piezas. ¿Cuál es la probabilidad de que la producción de un día
se considere correcta?
4. La misma compañía fabrica la misma pieza con un proceso productivo en
tres fases y sabe que la probabilidad de que las piezas sean correctas se
distribuye según un modelo de Poisson de varianza 432 (piezas/día)2. Se
sabe que la probabilidad de que la cantidad de piezas producidas en un
Solución:
1. ¿Cuál es la probabilidad de que una pieza sea correcta?
El enunciado proporciona una función de densidad a partir de la cual se calcu-
lará la probabilidad buscada mediante una integral definida. Si la pieza se consi-
dera correcta cuando oscila su longitud entre las 2,5 y las 4 unidades, éstos han de
ser los límites de la integral de la función de densidad:
4
3 3 x3
P 2,5 x 4
4
( x 1)( x 3)dx 2x2 3x 0,84
2,5 4
4 3 2,5
El significado de la probabilidad resulta ser el área sombreada bajo el gráfico
de la función de densidad como se observa en el esquema siguiente:
4
3
P 2,5 x 4 4 ( x 1)( x 3)dx
2,5
Y 5;0,84
yj !
P Y y j p y j 1 p
n y j
n ! n y j !
P Y 3 P Y 0 P Y 1 P Y 2 P Y 3
0! 1!
0,84 0 1 0,84 50 0,84 1 1 0,84 51
5! 5 0 !
5! 5 1 !
2! 3!
0,84 2 1 0,84 5 2 0,84 3 1 0,84 53 0,17
5! 5 2 ! 5! 5 3!
3. Cada día la empresa produce 500 piezas que empaqueta en lotes de ese
tamaño. La producción diaria se considera correcta si se producen entre
412 y 438 piezas. ¿Cuál es la probabilidad de que la producción de un día
se considere correcta?
Si los lotes en lugar de estar formados por 5 piezas lo están por 500, el expe-
rimento continuaría pudiendo explicarse mediante un modelo binomial. Sin em-
bargo, el teorema central del límite permite simplificar el cálculo empleando una
distribución normal cuya media es la suma de los valores medios de las distribu-
ciones binomiales originales y cuya desviación típica es la raíz cuadrada de la
suma de las varianzas de las distribuciones binomiales originales.
X n; p X
N np; np 1 p
TCL n
X 500;0,84 X
TCL n
N 500 0,84; 500 0,84 1 0,84
X N 421,5;8,13
N 432; 432
X P 432 X
TCL n
X N 432;20,78
a 432
P X a 0,98 2, 05 a 475
20, 78
6. Esta compañía posee 250 líneas de proceso de dos fases y 150 de tres fa-
ses. Se sabe que un auditor ha acudido un día en el que la producción dia-
ria es correcta. Calcular la probabilidad de que hubiese acudido a una
planta en la que hubiera un proceso productivo en dos fases.
El esquema para resolver el problema responde a los teoremas de la probabili-
dad total y Bayes. El total de líneas de la empresa se encuentran divididas en dos
partes (2 fases y 3 fases) que constituyen un conjunto complementario e incompa-
tible, y el enunciado se interesa por algo que ocurre de forma transversal a las dos
líneas (la producción se realiza de forma correcta, sabiendo que la probabilidad
de que sea correcta en el proceso de dos fases es igual a 0,86 —tercer apartado—
y de que sea correcta en el sistema de tres fases es igual a 0,98 —cuarto apar-
tado—).
Una vez formulado el esquema anterior, el enunciado pregunta de forma ex-
presa por una probabilidad vinculada a un día en el que la producción ha funcio-
nado correctamente, con lo que el espacio muestral estará compuesto por los días
en los que ocurre tal circunstancia. La solución a esta cuestión debe buscarse a
través del teorema de Bayes tal y como muestra el siguiente esquema:
250 150
P C P C 2F P 2F P C 3F P 3F 0,86 0,98 0,90
400 400
P C 2F P 2F 250 400 0,86
P 2F C 0,59
P C 0,9
P i 1.700 816
Pn
i i 270.947 29.031
n 2
i 235.721 70.385
P i
2
409.510 114.178
Se pide:
1. Calcular la recta de regresión lineal que permite predecir la potencia insta-
lada a partir del número de empleados en el sector de industrias oleícolas.
2. Se desea construir un intervalo de confianza para el número de emplea-
dos medio en las industrias vinícolas para un nivel de confianza del 95 %.
Especificar las hipótesis que permiten formular el intervalo y construirlo.
3. Construir un intervalo de confianza para la diferencia entre los valores
medios de la potencia instalada (oleícola-vinícola), para un nivel de signi-
ficación del 5 %.
4. En caso de que la varianza de la potencia fuese significativamente mayor
que 11.000 kW2 la red tendría problemas. ¿Se puede afirmar para una
significación del 5 % que la varianza de la potencia instalada en las in-
dustrias oleícolas es significativamente mayor, o no, que 11.000 kW2?
Solución:
1. Calcular la recta de regresión lineal que permite predecir la potencia ins-
talada a partir del número de empleados en el sector de industrias oleíco-
las.
Se trata de una expresión de regresión lineal simple puesto que únicamente so-
licita incluir una variable explicativa. En esos términos la expresión de la recta
buscada es la siguiente:
Y 0 1 X
11 xy
1
20 x2
0 a10 1a01 y 1 x
Teniendo en cuenta las expresiones anteriores no queda más que operar con
los sumatorios que proporciona el enunciado para obtener los momentos y los
coeficientes de regresión buscados:
i 10
x a10 i 1
n i 10 104, 30
y a01 i 1 Pi N P 170
i 10
x2 20 i 1 ni2 N n i 1 ni N n 12.693, 71
i 10 i 10 2
11 xy 9.363,7
1 2 0,73
20 x 12.693,71
0 a10 1a01 170 0,73 104,3 93,06
x
Q t n1
sn1 n
s s
IC ; x n n 1 t1 2 n 1 ; x n n 1 t1 2 n 1
n n
x
P q1 Q q2 P t 2 t1 2
Sn1 n
s s
IC ; xn n1 t1 2 n 1 ; xn n1 t1 2 n 1
n n
60,7 2, 26
61, 05 61,05
2, 26;60,7
10 10
IC ;0, 05 17, 07;104,33
Q
x1 x2 1 2 t n1 n2 2
1 1 n1sn21 n2 sn22
n1 n2 n1 n2 2
1 1 no sn2o nv sn2v
IC o v ; xo xv t1 2
no nv no nv 2
xo xv o v
P q1 Q q2 P t 2 t1 2
1 1 no sno nv snv
2 2
no nv no nv 2
1 1 no sn2o nv sn2v
IC o v ; xo xv t1 2
no nv no nv 2
1 1 10 12.501 10 7.733,31
170 81,6 t0,975
10 10 10 10 2
1 1 10 12.501 10 7.733,31
170 81,6 2,1
10 10 10 10 2
IC o v ;0,05 11,17;187,97
H 0 : 2 11.000
H1 : 2 11.000
nsn2
n21
2 H 0
nsn2
RH0 12
2 H 0
nsn2 10 12.501
11,36
H 0
2
11.000 11,36 16,91 No RH 0
12 n 1 0,95
2 9 16,91
0,5 x 0
m x 1
P X xi
0,15 x 2
0,05 x 3
Dx
P X xi 1
0, 5 m 0,15 0, 05 1 m 0, 3
P Y 2 1 P Y 2 1 P Y 0 P Y 1 P Y 2
7 7 7
1 0,50 0,57 0,51 0,56 0,52 0,55 0,77
0 1 2
4. Cada adorno se vende a 100 euros aunque se penaliza con 10 euros por
cada hilera que no funciona. Si el coste de fabricación de cada adorno as-
ciende a 20 euros, calcular de manera razonada el beneficio esperado por
adorno.
Ha de proponerse una nueva variable aleatoria que permita estudiar el benefi-
cio y que resulta ser una combinación lineal de la variable previamente manejada
y que alude a las hileras que no funcionan. El planteamiento es el siguiente:
Beneficio B 100 10 X 20 80 10 X
E X D xi P X xi x 1 xi P X xi
x 6
X 80;0,5
TCL n
N 40; 4, 47
40 40
P X 40 P Z P Z 0 0,5
4, 47
Solución:
1. Un cliente compra al azar una bombilla led de esta empresa y después
de un año sigue funcionando. ¿Cuál es la probabilidad de que sea defec-
tuosa?
El enunciado informa acerca de la existencia de dos tipos de bombillas según
su duración media: las primeras que se consideran correctas y cuya duración me-
dia es de diez años (C) y las segundas consideradas defectuosas y cuya duración
media es de un año (D), siendo la duración de ambas sendas variables aleatorias
susceptibles de ser estudiadas mediante modelos exponenciales. Debe prestarse
atención a la definición del parámetro λ que resulta ser la inversa del valor medio
(esperanza matemática) de la distribución.
C = Tiempo de vida de las bombillas correctas:
TC E 1 10
P T 1 D P D 0,03
P D T 1 0,04
P T 1 0,85
P T 3 T 1 P T 3
P T 3 T 1
P T 1 P T 1
P T 3 P T 3 D P D P T 3 C P C
P T 1 P T 1 D P D P T 1 C P C
0,36 1 1 e13 0,9 1 1 e0,13
0,36 1 1 e 11 0,9 1 1 e0,11
0,1 0,05 0,9 0,74
0,78
0,1 0,36 0,9 0,9
4.8 Se lleva a cabo un experimento para estudiar la posible relación entre la capaci-
dad de adhesión de productos de caucho (A) y el tiempo de uso (T) de esos pro-
ductos. Para ello se han recogido datos relativos al tiempo de uso (en cientos de
horas) y la capacidad de adhesión de 16 productos de caucho cuyos resultados
son:
12 10 8 9 7 9 7 8
T
8 6 8 7 5 11 10 11
2,7 3 3,1 3,2 3,4 3,6 3,6 3,2
A
3,7 3,8 3,4 3,5 3,8 3,2 3 3,1
i 16
i 1
Ti 136,00
i 16
i 1
Ai 053,30
i 16
i 1
Ti 2 189,30
i 16
i 1
Ai2 179,09
i 16
i 1
Ti Ai 445,40
CAPACIDAD DE ADHESIÓN
Sin aditivo (A) Con aditivo (A´)
Media 3,33 3,83
Moda 3,20 3,90
Varianza muestral 0,10 0,05
Mínimo 2,70 3,50
Máximo 3,80 4,30
Cuartil inferior 3,10 3,65
Cuartil superior 3,60 3,90
Solución:
1. ¿Existe una relación lineal intensa entre la capacidad de adhesión y el
tiempo de uso de los productos de caucho?
La intensidad de la relación lineal existente entre dos variables se mide me-
diante el coeficiente de correlación lineal entre ambas variables que resulta ser el
cociente entre la covarianza y el producto de las desviaciones típicas:
xy
xy
x y
A a10 i 1 Ai N A 3,33
i 16
T a01 i 1 Ti N T 8,5
i 16
A2 20 i 1 Ai2 N A i 1 Ai N A 0,09
i 16 i 16 2
A A2 0, 09 0,31
T2 20 i 1 Ti 2 NT i 1 Ti NT 3,5
i 16 i 16 2
T T2 3,5 1,87
AT 11 a10 a10 a01
i 16
i 1
i i N
AT
i 16
i 1
Ti NT i 16
i 1
Ai N A 0, 48
Una vez extraídos los datos de las desviaciones típicas y de la covarianza entre
las variables puede calcularse el coeficiente de correlación lineal como sigue:
AT 0, 48
AT 0,82
A T 1,87 0, 31
A 0 1T
AT
1
T2
0 A 1 T
siendo las expresiones anteriores el resultado del método de los mínimos cuadra-
dos. Simplemente resta sustituir en estas expresiones para deducir la recta de
regresión:
AT 0,48
1 0,13
T2 3,5
A 0 1T 4, 49 0,13T
Mediana 3,30
Cuartil 1 3,10
Cuartil 3 3,60
Bigote inferior 2,35
Bigote superior 3,85
Media 3,33
Mediana 3,30
A A
i 16 3
n 0, 05
AS F 33 i 1
1,86
i
A A
32
i 16 2 0, 02
i 1 i n
CAPACIDAD DE ADHESIÓN
Sin aditivo (A) Con aditivo (A´)
Media 3,33 3,83
Moda 3,20 3,90
Varianza muestral 0,10 0,05
Mínimo 2,70 3,50
Máximo 3,80 4,30
Cuartil inferior 3,10 3,65
Cuartil superior 3,60 3,90
H 0 : A A´ H 0 : A A´ 0
H 1 : A A´ H 1 : A A´ 0
xA xA´ A A´ H 0
Z
1 nA 1 nA'
xA xA´ A A´ H
RH0 0
Z1 2
1 nA 1 nA'
x A x A´ A A´ H 3,33 3,83 0
0
3,7
1 nA 1 nA ' 0,38 1 16 1 16 3,7 1,96 RH 0
Z1 2 Z 0,975 1,96
x x A´ A A´
P q1 Q q2 P Z 2 A Z1 2
1 nA 1 nA '
IC A A´ ; x A x A´ Z1 2 1 nA 1 nA '
3,33 3,83 Z 0,975 0,38 1 16 1 16
3,33 3,83 1,96 0,38 1 16 1 16
IC A A´ ;0,05 0,73; 0, 26
El resultado conduce a pensar que el valor medio del producto sin aditivo es
inferior en todo caso al valor medio del producto con aditivo al quedar los dos
límites del intervalo con signo negativo. Con el siguiente esquema gráfico puede
comprobarse la coincidencia del planteamiento con el contraste de hipótesis pre-
viamente planteado:
IC A A ' ; x A x A ' 1 / 2 1 / n A 1 / n A '
4.9 En un almacén hay dos tipos de interruptores. De ellos, 150 son del tipo A y 250
del tipo B. Estos interruptores se comportan con arreglo a diferentes distribucio-
nes de tiempos hasta el fallo. Así, los de tipo A siguen un modelo exponencial de
media 0,25 fallos por año y la vida de los del tipo B sigue una distribución normal
de media 4 años y desviación típica 1,5 años.
1. Una habitación del almacén dispone de un único interruptor, pero se des-
conoce su tipo. Calcular de manera razonada la probabilidad de que al fi-
nal del segundo año el interruptor no se haya averiado.
2. Un interruptor tomado al azar funcionó más de dos años. ¿Cuál es la pro-
babilidad de que dicho interruptor fuera del tipo B? Razonar la respuesta.
3. Acaba de salir al mercado un nuevo interruptor cuyo tiempo de funcio-
namiento en años sigue una distribución normal. Se han muestreado alea-
toriamente 10 de estos interruptores, obteniéndose el tiempo hasta el fallo
de cada uno:
5,1 4,2 6,3 5,7 4,8 5,2 5,5 4,9 5,6 6,1
Solución:
P T 2 P T 2 A P A P T 2 B P B
P T 2 A 1 P T 2 A 1 1 e 42 0,0003
150
P A 0,375
400
2 4
P T 2 B 1 P T 2 B 1 P Z 0,9
1,5
250
P B 0,625
400
P T 2 P T 2 A P A P T 2 B P B
0,0003 0,375 0,9 0,625 0,567
P T 2 B P B 0,9 0,625
P B T 2 0,99
P T 2 0,567
5,1 4,2 6,3 5,7 4,8 5,2 5,5 4,9 5,6 6,1
x
Q t n 1
Sn 1 n
Para calcular los límites del intervalo se requiere conocer la media y cuasides-
viación típica muestrales que proceden directamente de los datos del enunciado:
x i 1 xi n 5,34
i 10
i 10
sn 1 i 1
xi x 2 n 1 0,39 0,63
Simplemente resta deducir los límites del intervalo a partir de la cantidad pi-
votal y obtener el resultado final:
x
P q1 Q q2 P t 2 t1 2
Sn 1 n
s s
IC ; xn n 1 t1 2 n 1 ; xn n 1 t1 2 n 1
n n
IC ;0,05 5,34 t0,975 9
0,63 0,63
t0,975 9 ;5,34
10 10
5,34 2,26
0,63 0,63
2, 26;5,34
10 10
IC ;0,05 4,88;5,79
n 1 sn21
n21
2
n 1 sn21
n21
2
n21 2 2 n 1
n 1 s2
P q1 Q q2 P
n21 1 2
n 1 sn21 n 1 sn21
IC ; ;
n21 1 2 n21 2
10 1 0,39 10 1 0,39
IC ;0,05 ;
2
10 0,975
2
10 0,025
10 1 0,39 10 1 0,39
;
19,02 2,7
IC ;0,05 0, 42;1,14
x H0 5,34 6
p -valor 2 P t n 1 2 P t10 1 0, 001
S n 1 n 0, 63 10
Siendo tan baja la probabilidad no cabe más que descartar la opción de que la
hipótesis nula sea cierta, ya que la probabilidad de que el estadístico se sitúe en la
región de aceptación es ínfima.
4.10 Se sabe que el valor medio de la producción de las 25 plantas de la misma com-
pañía en un país que produce fibras textiles asciende a 4.553,32 t/día con una
desviación típica de 719,38 t/día. Se pide:
Solución:
n 1 sn21
Q n21
2
n 1 sn21
P q1 Q q2 P
n21 2 2
n21 1 2
n 1 sn21 n 1 sn21
IC ; ;
n21 1 2 n21 2
25 1 733,12 25 1 733,12
;
24 0,025 24
0,975
25 1 733,12 25 1 733,12
;
39,36 12, 40
IC ;0,05 572, 25;1.020,05
n 1 sn2 n 1 sn2
L
2 n 1 2 n 1
1
2 2
1 1
n 1 s 2
250
2
1
n
n 1 2
n 1
2 2
La solución pasa por asignar valores a n en la expresión hasta hacer que el ta-
maño deducido sea igual a los grados de libertad más una unidad:
Solución:
x ( ) H0
P AH0 H0 P Z1 P x ()H0 Z1 P x x1
n n
P 1 1 P AH0 H1 1 P x x1 H1
x H1 x1 ( ) H1 x1 ( ) H1
1 P 1 P Z
n n n
n
1 P Z Z1 ( )H0 ( ) H1
25
1 P Z 2,32 100 ( )H1
20
µ ( ) P( ) 1 (m)
102 0,97 0,03
104 0,91 0,09
106 0,80 0,20
108 0,63 0,37
1 2
f ( x) x 0 x6
72
1. ¿Cuál es la probabilidad de que una familia tarde más de 5 años en reno-
var su automóvil, supuesto que ya han pasado más de 3 años desde la
compra del actual?
2. Calcular la probabilidad de que al menos 2 de los 10 clientes renueven el
coche con más de 3 años.
3. Calcule el tiempo en que como máximo se renovarán el 75 % de los coches.
4. Suponga que el Gobierno implementa un sistema de estímulo del sector
del automóvil que consiste en subvencionar a los compradores de coches,
de manera que el coste medio de un coche tipo después de la subvención
viene dado por la siguiente expresión:
C = 18.000 – 1.000X
Obtenga de manera razonada el coste medio del nuevo coche.
Solución:
1. ¿Cuál es la probabilidad de que una familia tarde más de 5 años en reno-
var su automóvil, supuesto que ya han pasado más de 3 años desde la
compra del actual?
P X 5 X 3 P X 5
P X 5 X 3
P X 3 P X 3
1 x 2 72 dx
5
0, 42
0
0, 48
1 x 72 dx
3
2 0,87
0
P X 3 1 P X 3 1 x 2 72 dx 0,87
3
Y 10;0,87
P Y 2 1 P Y 1 1 P Y 0 P Y 1
F a P X a f x dx 0,75
a
C = 18.000 – 1.000X
4.13 En las siguientes tablas y gráficos se recoge información sobre las atenciones
sanitarias no domiciliarias atendidas a través del teléfono 112 de Protección Civil
durante los últimos 180 días en cierta ciudad española. Para cada día se ha obser-
vado el tiempo medio de respuesta (en minutos) de las ambulancias para acciden-
tes con heridos y el número de accidentes atendidos según su tipología (accidente
de tráfico, laboral y otros):
Solución:
1. Describa la forma de la distribución del tiempo medio de respuesta (glo-
bal) e indique la medida de centralización que sería representativa en di-
cha distribución.
El histograma de frecuencias del tiempo de respuesta global presenta cierta
asimetría a la derecha, lo que recomienda no recurrir a la media aritmética como
medida de posición central ya que resulta ser una medida sensible a los valores
extremos. Resultan más robustas en este caso la moda o la mediana.
2. Justifique si son ciertas o falsas las siguientes afirmaciones:
i. En más de la mitad de los casos, el tiempo medio de respuesta de las am-
bulancias durante los fines de semana es más de dos veces superior al de
los días laborables.
La afirmación es verdadera puesto que la mediana de la variable tiempo de
respuesta en fin de semana (16,45) es superior al doble de la mediana del tiempo
de respuesta en días laborables (7,43 × 2 = 14,86).
ii. En el 75 % de los casos el tiempo medio de respuesta de las ambulancias
durante los fines de semana es superior a 30 minutos.
Falso, puesto que por encima del tercer cuartil no queda un 75 % de los datos,
sino el 25 %, tal y como muestra el diagrama de caja correspondiente al tiempo
de respuesta en los fines de semana.
3. Si tuviera que dar un tiempo máximo de respuesta por debajo del cual se
pudiera garantizar que se ha atendido el 75 % de las emergencias de lunes
a viernes, ¿qué tiempo daría?
Aproximadamente 18 minutos, que se corresponde con el tercer cuartil del
diagrama de caja y que es el valor que deja por debajo de él el 75 % de los datos.
H 0 : F L H 0 : F L 0
H1 : F L H1 : F L 0
Al ser el contraste unilateral, la región de rechazo se sitúa sobre una única cola
de la distribución t-Student, tal y como se observa en el esquema siguiente:
xF xL F L H
0
1 nF 1 sn 1 nL 1 sn 1
2 2
1
F L
nF nL n F nL 2
20, 26 12,65 0
2,74
1 1 30 1 345,58 150 1162,56
30 165 30 150 2
tn1 n2 2
1
t178 0,95 1,65 Z 0,95 1,65
2,74 1,65 RH 0
Por lo que debe rechazarse que el tiempo medio de respuesta sea igual en fin
de semana que en día laborable.
5. Obtenga el p-valor del contraste anterior.
El p-valor debe calcularse como la probabilidad de que el estadístico se sitúe
en la región de aceptación del contraste, lo que implica calcular la siguiente pro-
babilidad:
xF xL F L H
P tn1 n2 2 0
1 nF 1 sn 1 nL 1 sn 1
2 2
1
F L
nF n L nF n L 2
20, 26 12,65 0
1 P t178
1
1 30 1 345,58 150 1162,56
30 165 30 150 2
1 P t178 2, 74 1 P Z 2, 74 0, 002
f ( x) k (2 x) 0 x 2
2
2 kx 2
Dx
f x dx 1 k 2 x dx 2kx
0
1 k 1 2
2 0
2
2 x x2
P 0,5 X 2
2
dx x 0,56
0,5 2 4 0,5
Y 4; 0, 56
P Y 4 P Y 0 P Y 1 P Y 2 P Y 3
4!
xi 1
x 3 4 x
0,56 xi 1 0,56 i 0,90
i
xi ! 4 xi !
Solución:
1. ¿Qué decisión adoptará la empresa, al nivel de significación del 1 %?
Se trata de un contraste unilateral superior para la media poblacional que pue-
de formularse de la forma siguiente:
H0 : 250
H1 : 250
x H0
Z
n
x H0
RH 0 Z1
n
x H 0 260 250
2,95
n
20 35 2,95 2,32 RH 0
Z1 Z 0,99 2,32
Debe por tanto rechazarse la hipótesis nula y pensar que las ventas podrían ser
superiores a las 250 unidades.
P 1 1 P AH 0 H1 1 P x x1 H1
x H1 x1 H1 x1 H1
1 P 1 P Z
n n n
1 P Z
0 n Z1 H1
n
n
1 P Z Z1 H0 H1
35
1 P Z 2,32 250 252 1 P Z 1,73 0,041
20
3 1
P X HN xi x 0,1, 2,3, 4
2 x ! 4 x !
e2 2 x
P X HS xi x 0
x!
Solución:
P X 2 P X 2 X HS P X HS P X 2 X HN P X HN
Por tanto, hay que calcular cada una de las probabilidades condicionadas con
las respectivas funciones de cuantía (en realidad, la condición referida a cada
hemisferio se implementa gracias a la existencia de funciones de cuantía específi-
ca para cada suceso), así como las probabilidades absolutas:
P X 2 X HS 1 P X 2 X HS
1 P X 0 X HS P X 1 X HS P X 2 X HS
e 2 20 e 2 21 e 2 2 2
1 1 0,67 0,32
0! 1! 2!
P X 2 X HN 1 P X 2 X HN
1 P X 0 X HN P X 1 X HN P X 2 X HN
3 1 3 1 3 1
1 1 0,68 0,31
2 0! 4 0 ! 2 1! 4 1! 2 2! 4 2 !
300
P X HS 0,75
400
100
P X HN 0, 25
400
P X 2 P X 2 X H S P X HS P X 2 X H N P X H N
0, 75 0, 32 0, 25 0, 31 0, 32
P X HS 0 X HN 0 P X HS 0 P X HN 0 P X HS 0 X HN 0
P X HS 0 P X HN 0 P X HS 0 P X HN 0
e2 20
P X HS 0 1 P X HS 0 1 0,93
0!
3 1
P X HN 0 1 P X HN 0 1 0,86
2 0! 4 0 !
P X HS 0 X H N 0
P X HS 0 P X HN 0 P X HS 0 P X H N 0
0, 93 0, 86 0, 93 0, 86 0, 99
t HS E 2
X HS1 X HS 2 X HS3
P X HS 3 P 3 P X HS1 X HS 2 X HS3 9
3
X HS1 X HS2 X HS3 YHS P HS1 HS2 HS3 P 6 1 P YHS 9 0, 08
P X HS 2,5 X HS
n
N ; n N 2;0,14
2,5 2
1 P X HS 2,5 1 P Z 0
0,14
2
f C 2 c2 1
C 23
C1 C2
Recuento 100,0000 100,00000
Promedio 4,880 3,4900
Mediana 3,580 2,3200
Desviación estándar 4,650 3,5700
Coeficiente de variación 95,28%0 102,30%000
Mínimo 0,028o 0,0065
Máximo 24,080o 16,70000
Rango 24,050o 16,69000
Cuartil inferior 1,790 1,0600
Cuartil superior 6,890 4,8600
Solución:
1. Calcule la probabilidad de que el componente C1 funcione más de 1.500
horas y el componente C2 funcione más de 1.500 horas a la vez.
Ha de calcularse la probabilidad de una intersección de dos sucesos teniendo
en cuenta que ambos procesos son independientes, de forma que puede asumir-
se que la probabilidad de la intersección es igual al producto de ambas probabi-
lidades.
Para ello debe en primer lugar calcularse las probabilidades de que cada uno
de los componentes dure más de 1.500 horas para cada una de las funciones de
densidad especificadas en el enunciado:
P C1 1.500 0, 2e 0,2 c1 dc1 1 F 1,5 e 0,21,5 0, 74
1,5
P C 2 1.500 2 c 23 dc 2 1 F 1,5 2 1,5 2 0, 44
1,5
C1 E 0, 2 Y i 1 C1i
i 70
N nE C1 ; nV C1
TCL n
Y
N 70 1 0, 2 ; 70 1 0, 22
TCL n
Y
TCL n
Y N 350;41,83
400 350
P Y 400 1 P Z 0,12
41,83
X i N 3.000; 200
x i 1 X i 100 N 3.000; 200 100
i 100
x N 3.000; 20
El cálculo de la probabilidad vuelve a ser sencillo una vez que se formula bien
la cuestión solicitada puesto que simplemente resta dividir entre la desviación
típica para obtener la variable tipificada:
4. Se han muestreado 100 componentes de cada tipo (C1 y C2) cuyo resu-
men de estadísticas se muestra a continuación:
C1 C2
Recuento 100,0000 100,00000
Promedio 4,880 3,4900
Mediana 3,580 2,3200
Desviación estándar 4,650 3,5700
Coeficiente de variación 95,28%0 102,30%000
Mínimo 0,028o 0,0065
Máximo 24,080o 16,70000
Rango 24,050o 16,69000
Cuartil inferior 1,790 1,0600
Cuartil superior 6,890 4,8600
BI Q1 1,5 Q3 Q1 5,86
C1
BS Q3 1,5 Q3 Q1 14,55
BI Q1 1,5 Q3 Q1 4, 62
C2
BS Q3 1,5 Q3 Q1 10,55
Comparando los resultados anteriores con los valores máximos y mínimos in-
cluidos en la tabla del enunciado puede comprobarse que sí existen datos atípicos
por ser superiores a los bigotes superiores en ambos casos.
xi 1 2 3 4 5
P[X = xi] 0,15 a b c 0,1
Solución:
1. Calcular a, b y c.
El cálculo de los valores de los parámetros a, b y c debe proceder de la defini-
ción de la función de cuantía, de sus propiedades y de la información adicional
que proporciona el enunciado. De esta forma, se puede construir un sistema de
tres ecuaciones con tres incógnitas en los términos siguientes:
DX
P X xi 1
P X 4 0,65
P X 2 0,6
0,15 a b c 0,1 1
0,15 a b 0,65
b c 0,1 0,6
xi 1 2 3 4 5
P[X = xi] 0,15 0,25 0,25 0,25 0,1
P X 3
P X 3 0,65
Por tanto, suponiendo que el número de visitas que cada trimestre ha de acudir
el técnico es independiente de la cantidad de ocasiones que habría de acudir en
otros trimestres, se puede calcular la probabilidad requerida sin más que multipli-
car:
Y 8; 0, 25
P Y 6 P Y 7 P Y 8
8! 8!
0, 257 0,75 87 0, 258 0,75 88 0
7! 8 7 !
8! 8 8 !
C 80 70 X
Para calcular el valor esperado del coste únicamente queda pendiente calcular
el valor esperado de la variable aleatoria reparaciones trimestrales y operar con
las propiedades de la esperanza matemática:
E X i1 xi P X xi 2,9
i 5
f ( x ) k x 1 1 x 3
3
1. Calcular el valor de k.
2. Sabiendo que en una determinada circunstancia la cantidad promedio de
compras ha sido mayor que 1,5, calcular la probabilidad de que esa canti-
dad sea finalmente inferior a 2.
3. ¿Cuál es la probabilidad de que la cantidad total comprada en 50 plata-
formas (cuya función de densidad es la especificada en el enunciado
siendo independientes entre sí) supere las 132 unidades?
4. ¿Cuál es la probabilidad de que la media de una muestra (media mues-
tral) de 40 plataformas supere las 2,6 unidades?
Solución:
1. Calcular el valor de k.
El valor de la constante k debe ser tal que la función definida constituya una
función de densidad, con lo que su integral a lo largo del dominio de definición
debe ser igual a la unidad. Aprovechando esta característica se despeja el valor de
la constante:
3
k 4
f x dx 1 k x 1 dx x 1 1 k 0, 25
3
3
DX 1 4 1
P 1, 5 X 2
P X 2 X 1, 5
P X 1, 5
P 1,5 X 2 x 1 4 dx 0,05
3 2
1,5
P X 1,5 x 1 4 dx 0,99
3 3
1,5
Una vez conocidas las dos probabilidades anteriores únicamente resta sustituir
y calcular la probabilidad de la intersección:
P 1, 5 X 2 0, 05
P X 2 X 1, 5 0, 05
P X 1, 5 0, 99
Y i 1 X i Y N 50 E X ; 50 V X
i 50 TCL n
Dx 1
2 3
V X x 2 f x dx xf x dx x2 x 1 4 dx 2,6 0,1
3 2
Dx Dx 1
Y N 50 2, 6; 50 0,1
El cálculo de la probabilidad solicitada resulta sencillo sin más que operar con
la distribución normal:
132 130
P Y 132 1 P Z 1 P Z 0,89 1 0,81 0,19
2, 23
TCL n
N E X ; V X n
x
N 2,6; 0,1 40
TCL n
x
De nuevo el cálculo de la probabilidad resulta sencillo sin más que operar con
la distribución normal:
2,6 2,6
P x 2,6 P Z 0,5
0,05
4.20 Se han realizado unas mediciones del peso en gramos de cierta sustancia en un
laboratorio con dos tipos de balanzas (balanza 1 y 2) obteniéndose las siguientes
medidas resumen:
Solución:
H 0 : f x distribución normal
H1 : f x distribución normal
datos (0,9; 0,69), no puede rechazarse la hipótesis nula de que ambos conjuntos
de datos se distribuyen según leyes normales sea cierta puesto que la probabilidad
de que la hipótesis nula sea cierta en ambos casos es superior al 5 % fijado como
límite.
x
Q tn 1
sn 1 n
Se utiliza el estadístico que incluye la cuasivarianza por ser el dato que pro-
porciona el enunciado. Simplemente queda por plantear la probabilidad vinculada
al intervalo de confianza y operar hasta encontrar los límites deseados:
x
P q1 Q q2 P t 2 t1 2
Sn1 n
s s
IC ; x n 1 t1 2 n 1 ; x n 1 t1 2 n 1
n n
1,97 2,12
0,07 0,07
2,12;1,97
17 17
IC ;0,05 1,93;2,01
sn 1
L Z1 2
n
1,96 0, 07
0, 04 2 n 51, 65 52
n
fn p H0
f n i 1 xi n
i n
Z
p H 0
1 p H n
0
H 0 : p 0,15
H1 : p 0,15
fn p H
RH 0 0
Z
p H 0
1 p H n
0
f n p H 0 0,1 0,15
0,97
p H 1 p H 0 n 0,15 1 0,15 48
0
Z Z 0,05 1, 65
0,97 1, 65 No RH 0
sn21 1 22
F n1 1;n2 1
sn22 1 12 H
0
Para estas condiciones la región crítica debe plantearse de forma expresa sobre
las dos colas de la distribución F-Snedecor al no tratarse de una distribución si-
métrica:
sn 1 sn2 1 2
2 2
RH 0 21 22 F 2 21 22 F1 2
sn2 1 1 H 0
n2 1 1 H 0
s
sn21 1 22 0, 07 2
1 0, 49
sn22 1 12 H 0,12
0
F / 2 16;30 F0,05 0, 45; F1 2
F0,95 16;30 1,99
0, 45 0, 49 1,99 No RH 0
4.21 Costes e ingresos de una determinada aleación dependen de una variable aleatoria
X vinculada con la demanda de metal por la industria a través de las siguientes
relaciones:
X 5 25 X
C ;I
7 4
f x x 108 3 x 15
Solución:
1. Calcular la función de distribución de la variable aleatoria X.
La función de distribución de la variable aleatoria es la que procede de inte-
grar la función de densidad. Ha de tenerse en cuenta que la constante de integra-
ción forma parte del resultado al tratarse de una integral indefinida. El resultado
de la integral es el siguiente:
F x f x dx x 216 c
2
F 15 1 15 2 216 c c 0, 04
0 x3
2
F x x 216 0,04 3 x 15
1 x 15
DX 3
25 I 25 1 25 1
E V E EX 10,33 3, 67
4 4 4 4 4
25 X X 5 155 11X
B I C
4 7 28
1 t 100
f t e t 0
100
Calcular la probabilidad de que falle al menos una de las máquinas en las 100
primeras horas.
Solución:
La variable aleatoria que permite estudiar la probabilidad de que falle una má-
quina en las 100 primeras horas se distribuye según un modelo binomial puesto
que cada centrífuga puede fallar o no, y el experimento se ocupa de tres máqui-
nas. El parámetro p del modelo binomial responde a la probabilidad de que una
centrífuga se averíe en menos de 100 horas:
Y 3;0,63
3! 3
P Y 1 1 P Y 0 1 0,630 1 0,63 0,95
0! 3 0 !
4.23 La demanda de semanal de acero fuera del período de máxima producción mun-
dial es una variable aleatoria normalmente distribuida de parámetros 100 y 6 kg,
respectivamente. Sin embargo, en el período de máxima producción (8 semanas),
la demanda semanal se incrementa un 70 %. Supóngase que un año cuenta con 52
semanas.
1. Si en una semana se superó una demanda de 120 kg, ¿cuál es la probabi-
lidad de que se trate de una de las semanas de máxima producción?
2. ¿Cuál es la probabilidad de que la primera semana de enero (período de
máxima producción) supere el doble de la demanda que hay en la última
semana de junio (fuera de máxima producción)?
3. Calcular la probabilidad de que en un año la demanda de acero sea supe-
rior a 5,8 toneladas?
4. Si se toman 3 semanas al azar, ¿cuál es la probabilidad de que la deman-
da en esas tres semanas supere los 500 kg?
Solución:
X N 100; 6
Y N 100 1, 7; 6 1, 7
Las probabilidades referidas a cada uno de los sucesos también pueden calcu-
larse sin problema:
8
P N
52
P N
44
52
1
P U
52
P W 120 U P U P W 120 U P U
P U W 120
P W 120 P Y 120 P N P X 120 P N
120 170
P Y 120 1 P Z 0,9996
10, 2
120 100
P X 120 1 P Z 0,0004
6
Una vez conocidas todas las probabilidades, se opera hasta obtener el resulta-
do final:
P W 120 U P U
P U W 120
P W 120
P W 120 U P U
P Y 120 N P N P Y 120 N P N
0,9996 1 52
0,1247
0,9996 8 52 0,0004 44 52
PY 2X PY 2X 0
E Y 2 X E Y 2 E X 170 2 100 30
V Y 2 X V Y 2 2 V X 10, 2 2 4 6 2 248, 04
Y 2 X N 30;15,74
0 30
P Y 2 X P Y 2 X 0 1 P Z 0,03
15,74
D i 1 X i j 1 Y j
i 44 j 8
E D i 44 E X i j 8 E Y j
D N E D ; V D
i 1 j 1
V D i 1 V X i j 1 V Y j
i 44 j 8
V D i 1 V X i j 1 V Y j 44 10, 2 6 8 6 2 2.416,32
i 44 j 8
D N 5.760; 49,15
5.800 5.760
P D 5.800 1 P Z 0, 21
49,15
S MP 0 DT N 3 100; 3 36 N 300;10,39
S MP 2 DT N 2 170 100; 2 10, 22 36 N 440;7,51
S MP 3 DT N 3 170;
3 10, 22 N 510;5,53
3!
P SMP 0 8 52 44 52 0,60
0 3 0
0! 3 0 !
3!
P SMP 1 8 52 44 52 0,33
1 31
1! 3 1!
3!
P SMP 2 8 52 44 52 0,06
2 3 2
2! 3 2 !
3!
P SMP 3 8 52 44 52 0,01
3 3 3
3! 3 3!
P DT 500 i 0 P DT 500 S MP i P S MP i
i 3
P Z 19, 24 P S MP 0 P Z 9,79 P S MP 1
4.22 Un fabricante produce salchichas cuya longitud siguen una distribución unifor-
me con parámetros 0 y θ. Para estimar la longitud máxima de dichas salchichas,
se toma una muestra aleatoria de 50 salchichas y se definen los siguientes esti-
madores:
1 2 x
1 Max x1 , x2 ,....xn
Solución:
1. ¿Son insesgados los estimadores propuestos?
Los valores para la esperanza matemática y la varianza de una distribución
uniforme son los siguientes:
0
EX
2 2
0 2 2
V X
12 12
Cabe, por tanto, calcular la esperanza matemática de cada uno de los estima-
dores para compararla con la esperanza matemática del modelo en la población y
pronunciarse respecto del sesgo:
E 1 E 2 x E 2 i 1 xi n E i 1 xi i 1 E xi
i n 2 i n 2 i n
n n
2 i n
i 1 2
n
B 1 E 1 0
B 2 E 2 2 2
V 1 V 2 x V 2 i 1 xi n 2 V i 1 xi 2
4 4
in in in
i 1
V xi
n n
4
in
i 1
2 12 2 3n
n2
x
Q t( n 1)
Sn 1
n
Simplemente resta deducir los límites del intervalo a partir de la cantidad pi-
votal y obtener el resultado final:
x
P q1 Q q2 P t 2 t1 2
Sn1 n
s s
IC ; x n 1 t1 2 n 1 ; x n 1 t1 2 n 1
n n
0,98 2,14
0,18 0,18
2,14;0,98
15 15
IC ;0,05 0,88;1,07
f x e x x 0
14 17 27 18 12 8 22 13 19 12
P A 2
P B 1
2
P B 2 1
2
0 1
Tipo de nivel A B C
Muestra 16 50 34
Solución:
1. Calcular, de manera razonada, un estimador de λ por el método de los
momentos y dar una estimación para la muestra dada.
La deducción de los estimadores puntuales por el método de los momentos
exige igualar los momentos centrados respecto del origen (en este caso únicamen-
te de orden uno) poblacionales y muestrales. Habrá, por tanto, de calcularse el
momento poblacional de orden uno para la citada función de densidad:
2 1
E X xf x dx xe x dx xe x dx
DX DX 0 2
Por otra parte, el momento de orden uno muestral resulta ser la media mues-
tral, con lo que igualando ambos puede deducirse el estimador buscado:
EX 1
m 1 x
a1 x
1
m 0, 06
14 17 ... 12 10
E m E 1 x E n
in in in
i 1
xi nE 1 i 1
xi n i 1
E xi
1 1
n n
n
in
i 1
1
La esperanza matemática del estimador es, por tanto, igual al parámetro al que
se refiere con lo que puede afirmarse que el estimador es insesgado:
B m E m 0
P A 2
P B 1
2
P B 2 1
2
0 1
Tipo de nivel A B C
Muestra 16 50 34
A 1 2 B 1 1 C 1 2 1
A x B y 2 Cz
2 yz
2 x 1 2 1 2 z 2 x z 1
2y z z
Ln L x1 ,...xn ; Ln 2 z 2 x z 1
2 y z
zLn 2 2 x z Ln 2 y z Ln 1
dLn L x1 ,...xn ; d
zLn 2 2 x z Ln 2 y z Ln 1
d d
2x z 2y z
1
dLn L x1 ,...xn ; 2x z 2 y z
0
d mv 1 mv
2 x z 1 mv 2 y z mv 2x z
0 mv
mv 1 mv
2x 2 y 2z
d 2 Ln L x1 ,... xn ; d 2 x z 2 y z 2x z 2 y z
0
d 2 d 1 2 1 2
2x z 2 16 34
mv 0, 33
2 x 2 y 2 z 2 16 2 50 2 34
Solución:
1. Calcular el cuartil primero de consumos de energía para cada uno de los
tipos de operaciones.
El primer cuartil es el resultado de la variable tal que divide la distribución de
frecuencias en dos partes dejando un 25 % de los resultados inferiores a él a un
lado y el 75 % restante al otro. Tratándose en ambos casos de distribuciones con-
tinuas, el cuartil debe deducirse mediante la integral de las funciones de densidad.
Sea XC el consumo en las operaciones de compactado y XP el consumo energético
en las operaciones de pintado:
Q
1 x 1
P X C Q1 0, 25
Q1 Q1
f x dx dx 0, 25 Q1 7,5
5 5 15 5 15 5 5
Q 15
P X P Q1 0, 25 P Z 1 0, 25 Q1 13, 66
2
siendo los respectivos parámetros p de los modelos los que proporciona el enun-
ciado.
Simplemente quedan por calcular las probabilidades requeridas y obtener la
intersección entre ambos sucesos:
3!
P YC 1 1 P YC 0 1 0,10 1 0,1 0, 27
3 0
0! 3 0 !
1
1
f x; x 1, 1
x
Solución:
El procedimiento para deducir el estimador de máxima verosimilitud exige en
primer lugar obtener la función de verosimilitud de la muestra:
L x; i 1 f xi ; i 1 1 xi n i 1 1 xi
in in 1 in 1
nLn 1 i 1 Ln 1 xi
in
d d d
LnL x; Ln n i 1 1 xi nLn 1 i 1 Ln 1 xi
i n 1 i n
d d d
n i 1 Ln 1 xi
i n
d
d
LnL x; 0 n mv i 1 Ln 1 xi mv n
i n
i n
i 1
Ln 1 xi
d2 d
LnL x; n i 1 Ln 1 xi n 2
i n
d 2
d
0 si x 4
3
x 115
F x 4,5 x 2 x 26 4 x 5
3 6
1 si x 5
Solución:
1. Los clientes únicamente aceptan los recipientes con pesos comprendidos
entre 410 g y 450 g. Calcular la probabilidad de que un recipiente sea
considerado como aceptable por los clientes.
Se trata de calcular la probabilidad del intervalo requerido, para lo que puede
recurrirse a deducir la función de densidad y obtener la probabilidad a partir de la
integral definida entre los límites del intervalo o, de forma más directa, utilizar la
función de distribución que proporciona el enunciado. Recurriendo a esta segunda
alternativa el cálculo de la probabilidad es sencillo:
450 3 115
4,5 450 450 26
2
3 6
410 3 115
4,5 410 410 26 0, 41
2
3 6
dispuesto a firmar un contrato con ellos para los próximos 5 años. Res-
ponder si el cliente decidirá firmar el contrato.
Se trata de contestar a la cuestión de si entre 15 recipientes la probabilidad de
que al menos dos de ellos tengan el peso adecuado (entre 410 y 450 gramos), es
superior a 0,8. Se trata, por tanto, de un experimento dicotómico (el tarro puede
tener un peso adecuado o no) de parámetros 15 y 0,41 (la probabilidad de que el
llenado sea correcto calculada en el apartado anterior):
Y 15;0, 41
P Y 2 1 P Y 0 P Y 1
15! 15 0 15! 15 1
1 0, 410 1 0, 41 0, 411 1 0, 41 0,99
0!15 0 ! 1!15 1!
X N N 425;10
450 425 410 425
P 410 X N 450 P Z P Z 0,92
10 10
P A P A X N P X N P A X A P X A
0,92 15 45 0, 41 30 45 0,58
P A X N P X N 0, 92 15 45
P X N A 0, 53
P A 0, 58
lo encarga en avión que limita el peso en la bodega a 426 kg, ¿qué proba-
bilidad existe de trasladar todos los tarros en un único avión?
Se trata de calcular una probabilidad vinculada a una nueva variable aleato-
ria resultado de sumar 1.000 variables aleatorias normales de parámetros 426 g
y 10 g. Por tanto, la nueva variable aleatoria también se distribuirá según un
modelo normal con los siguientes parámetros:
426.000 425.000
P YN 426.000 P Z 0,99
1.000 100
xi 1 2 3 4 5 6
P[X = xi] 1/12 1/6 1/4 1/4 1/6 1/12
72 75 83 70 68 74 72 79 80 75
Solución:
1. Calcular la proporción de meses en los que se han pedido al fabricante I
más de dos cartuchos de entre los que se pidió como máximo cuatro car-
tuchos.
Se trata de calcular una probabilidad condicionada ciñéndose el estudio a los
meses de los que se conoce que se pidieron como máximo cuatro cartuchos. El
planteamiento y la solución son los siguientes:
P X 2 X 4
P X 2 X 4
P X 4
P X 2 X 4 P X 3 P X 4 0, 5
P X 4 0, 75
P X 2 X 4 0, 5
P X 2 X 4 0, 66
P X 4 0, 75
E X i 1 xi P X xi
i 6
P X 3 X II P X II
P X II X 3
P X 3
P X 3 P X 3 X II P X II P X 3 X I P X I
e2 23
P X 3 X II 0,18
3!
P X II 0,3
P X 3 X I 0, 25
P X I 0,7
P X 3 P X 3 X II P X II P X 3 X I P X I
0,18 0,3 0, 25 0, 7 0, 22
P X 3 X II P X II 0,18 0,3
P X II X 3 0, 23
P X 3 0, 22
70 80
P T 70 P Z 0,16
100
Y 12;0,16
P Y 2 1 P Y 0 P Y 1
12! 12!
0,160 1 0,16
12 0
0,161 1 0,16 0,59
12 1
1
0! 12 0 !
1! 12 1 !
72 75 83 70 68 74 72 79 80 75
x
t n 1
S n 1 n
x i 1 xi n 748 10 74,8
i 10
x
P q1 Q q2 P t 2 t1 2
Sn1 n
n 1
s sn 1
IC ; xn n 1 t1 2 n 1 ; xn t1 2
n n
74,8 2, 26
4, 68 4, 68
2, 26;74,8
10 10
IC ;0, 05 71, 45;78,15
4.28 Sea la siguiente función de distribución conjunta para las variables aleatorias X e Y:
Solución:
1. Calcular las siguientes probabilidades P X Y , P X Y 1.
El cálculo de la primera de las probabilidades exige deducir la función de den-
sidad marginal de la variable aleatoria X, de forma que el primer paso será obte-
ner la función de densidad conjunta integrando la función de distribución:
f x; y F x; y 1 e4 x 1 e 9 y
y x y x
4e4 x 1 e 9 y 36e 4 x e 9 y
y
A partir de esta función de densidad pueden deducirse sin problema las fun-
ciones de densidad de las variables aleatorias marginales:
f x f x; y dy 36e4 x e9 y dy 4e4 x e9 y 0 4e4 x
DY 0
f x; y dx 36e4 x e9 y dx 9e4 x e9 y 0 9e9 y
f y
DX 0
0 0
1 y 1 y
4e4 x dx e4 x 0 1 e41 y
1 y
P X Y 1 P X 1 Y f x dx
0 0
f x; y f x f y
En este caso puede comprobarse que las variables aleatorias son independientes:
f ( x, y ) x y 0 x, y 1
Solución:
P X 0,5;Y 0,2
0,5
0,2
f x, y dydx
0,5
0,2
x y dydx
0 0 0 0
xy y2 2 0
0,5
dx 0,2 x 0,002 dx
0,2 0,5
0 0
f x x y dy xy y2 2 0 x 1 2
1 1
Basta con calcular la integral de la función de densidad anterior entre los lími-
tes fijados para obtener la probabilidad buscada:
1 y
P X 1 Y Fx 1 Y f x dx
0
1 y 2 1 y
x 1 2 dx x2 2 x 2 0
1 y 1
0 2 2
2. Determinar si las variables X e Y son independientes.
Para comprobar si las variables son independientes ha de contrastarse la vera-
cidad de la siguiente igualdad:
f x; y f x f y
f y x y dx x2 2 xy 0 1 2 y
1 1
f x; y f x f y x y x 1 2 1 2 y
E Y X yf y x dy
DY
f x; y x y
f y x
f x x 1 2
E Y X yf y x dy y x y x 0,5 dy
1
DY 0
yx y2 x 0,5 dy
1 1
y 2 dy
1 1
yxdy
0 x 0,5 0 0
1
1 xy 2 y3 3x 2
x 0,5 2 3 0 6 x 3
www.edicionespiramide.es