Statistics">
Estimacion de La Proporcion y de La Media
Estimacion de La Proporcion y de La Media
Estimacion de La Proporcion y de La Media
Para construir un intervalo de confianza para estimar el parámetro p utilizamos la normal estándar.
Determinamos un intervalo alrededor de la media de Z que tenga una probabilidad predeterminada 1-α:
α/2 1-α
α/2
-Z 2 Z 2
0
P(-Z 2 Z Z 2 ) = 1−
p− p
P( - Z 2 Z 2 ) = 1 −
pq
n
pq pq
P( p - Z 2 p p + Z 2 ) =1 −
n n
29
Navarro
pq
p: p Z 2
n
Esta última expresión tiene el inconveniente de que se necesita conocer el valor de p, que es precisamente
el parámetro que estamos estimando. Para salvar esta dificultad sustituimos p por su estimador puntual
p , lo cual nos proporcionará un intervalo aproximado:
Ejercicio 1: Se desea estimar el % de televidentes del sábado por la tarde que ven el programa “ABC”.
Una muestra aleatoria de 228 televidentes del sábado por la tarde mostró que 90 veían dicho programa.
Determinar un intervalo del 95% de confianza para hacer la estimación.
Solución:
p: Proporción poblacional de televidentes del sábado tarde que ven el programa “ABC”
(q=1-p: Proporción poblacional de televidentes del sábado tarde que no ven el programa “ABC”)
𝑋
Datos muestrales: n=228 y x=90; 𝑝̂ = = 0.395 𝑦 𝑞̂ = 0.605
𝑛
Nivel de confianza de la estimación: 1-=0.95 Z/2=1.96
Intervalo del 95% de confianza para p p: 0.395 0.063; o en porcentaje: % : 39.5 6.3
También se puede expresar así: o.332 ≤ p ≤ 0.458
Cuando trabajamos con una población que no es muy grande y conocemos el tamaño poblacional N, el
intervalo cambia ligeramente al tomar en cuenta el factor de corrección para población finita:
Ejercicio 2: En una comunidad de 1,620 familias se desea estimar el porcentaje de éstas que tienen un
ingreso anual de $3,000.00 o menos. Una muestra aleatoria de 440 familias mostró que 154 tenían un
ingreso tal. Hacer la estimación mediante un intervalo del 95% de confianza.
30
Navarro
Este error no se puede conocer exactamente, pero se puede encontrar una cota superior. Valiéndonos de
la normal estándar tenemos
α/2 α/2
1-α
0
-Z 2 Z 2
P(-Z 2 Z Z 2 ) = 1−
p− p
P(-Z 2 Z 2 ) = 1 −
pq
n
pq pq
P(− Z 2 p− p Z 2 ) = 1−
n n
31
Navarro
pq
P( ¦ p − p ¦ Z 2 ) =1−
n
Esta última ecuación probabilística nos dice que el error, en valor absoluto, al estimar p por medio de p
es, con probabilidad 1-α, menor o igual a
pq
Z 2
n
Esto significa que el error máximo, llamado margen de error, que puede haber con probabilidad 1-α, al
pq
estimar p por medio de
p es E = Z 2
n
2
Z p q
n= 2
E2
Que es la expresión para determinar el tamaño de muestra necesario para estimar p con un error
máximo E y con probabilidad 1-α. La fórmula anterior tiene el inconveniente de que es necesario conocer
el valor de p, el parámetro que deseamos estimar y que no se conoce. Para solventar este inconveniente
se utiliza uno de los tres criterios siguientes:
1. Estudios anteriores de la misma población dan una idea aproximada del valor de p. Usar éste en
la fórmula (recuerde que q=1-p).
2. Mediante la información proporcionada por una muestra piloto, se calcula la proporción de esta
muestra y se usa en vez de p en la fórmula.
3. Se sustituye en la fórmula el valor para p que produce el más grande valor de n. Éste es p=½ y
q=(1-p)=½.
12 Z
2 1 2
Z
n= = 2 2
2
2
E 2 4E
El criterio último es el más utilizado y la fórmula del tamaño de muestra queda así:
2
Z
n= 2
4 E2
Ejercicio 3: Se desea estimar el porcentaje de trabajadores del país que estarían dispuestos a pagar más
por una mejora sustancial en los servicios de salud. ¿De qué tamaño debe ser la muestra si se desea que
el error en la estimación no sobrepase el 3.5%, con una confiabilidad (probabilidad) del 95%?. (no se tiene
idea de este porcentaje ni se dispone de la información de una muestra piloto).
32
Navarro
Solución:
p: Proporción de trabajadores del país que estarían dispuestos a pagar más por una mejora.
(q=1-p: Proporción de trabajadores del país que no estarían dispuestos a pagar más por una mejora.)
𝟏.𝟗𝟔𝟐
𝒏= = 𝟕𝟖𝟒
𝟒(𝟎.𝟎𝟑𝟓)𝟐
Para hacer la estimación debe tomarse una muestra aleatoria de n=784 trabajadores.
pq N − n
E = Z2
n N −1
Manipulando algebraicamente la ecuación anterior se llega al siguiente resultado para el cálculo del tamaño
de muestra (n) en dos pasos:
2 2
Z p q Z
n0 = 2
n0 = 2
2
4 E2
o según el caso.
E
n0
n=
1 + nN0
Ejercicio 4: En una comunidad donde habitan 2,500 familias, Se desea estimar el % de éstas que tienen
adultos analfabetos. ¿De qué tamaño debe ser la muestra aleatoria para que la estimación tenga un margen
de error del 3.5% y con un nivel de confianza del 95 %?.
Solución:
p: Proporción de familias de la comunidad que tienen adultos analfabetos.
(q=1-p: Proporción de familias de la comunidad que no tienen adultos analfabetos).
𝟏.𝟗𝟔𝟐 𝑛0 784
𝒏𝟎 = = 𝟕𝟖𝟒 𝒏= 𝑛 = 784 =597
𝟒(𝟎.𝟎𝟑𝟓)𝟐 1+ 0 1+
𝑁 2,500
Ejercicio 5: Suponga que se realiza el muestreo (del ejercicio 4) y se encuentra que en 200 familias de las
muestreadas hay adultos analfabetos. Determina un intervalo del 95% de confianza para estimar dicho
porcentaje en toda la comunidad.
34
Navarro
x −
Al estandarizar el estimador, obtenemos Z = y podemos plantear las siguientes ecuaciones
x
probabilísticas:
α/2 1-α
α/2
-Z 2 0 Z 2
P(-Z 2 Z Z 2 ) = 1−
x −
P(-Z 2 Z 2 ) = 1−
x
Haciendo el despeje algebraico obtenemos un intervalo del (1-)100% de confianza para la media
poblacional:
: x Z 2 x
: x Z 2
n
N− n
: x Z 2 N−1
n
35
Navarro
(Nótese que es necesario conocer la desviación estándar poblacional σ para calcular el error estándar de
la media x . Si no se conoce σ pero la muestra es grande (n30), se puede sustituir σ por su
estimador muestral S, σ S).
Ejercicio 6: un analista financiero selecciona al azar el 10% de las 950 cuentas incobrables de un comercio,
con el objeto de estimar el monto medio por cuenta (). Después de analizar la muestra obtuvo una media
de 𝑋̅ =35.40($) y una desviación estándar de S=7.50$. Hacer la estimación mediante un intervalo del 90%
de confianza.
Solución:
µ = Monto medio de las 950 cuentas incobrables. (N=950 cuentas)
Datos muestrales: n= 95 cuentas, 𝑋̅ =35.40($), S=7.50($)
N− n
: x Z 2 N−1
n
7.50 950−95
µ: 35.40 ± 1.65 √ $ µ: 35.40 1.21 $. También se puede expresar
√95 949
así:
34.19 ≤ ≤ 36.61 ($).
Distribución t
Si no se conoce σ y la muestra no es suficientemente grande, se puede utilizar un estadístico exacto, como
lo es el estadístico t (ó t-student).
x −
t = S
n
el cual tiene una distribución de probabilidades llamada distribución t. Ésta depende de un parámetro
=n-1 al que se le llama grados de libertad.
La distribución t tiende a la normal estándar a medida que los grados de libertad crecen. A continuación se
dan las gráficas de tres distribuciones t (=1, 2, 5) y la normal estándar
36
Navarro
0.45
0.40
0.35
distrib. normal std. Z
0.30
0.25 distrib. t con =5
0.20 distrib. t con =2
0.10
0.05
0.00 0
Haciendo un trabajo similar al que se hizo con la distribución normal estándar, se puede deducir un intervalo
de confianza para μ cuando no se conoce σ. El intervalo de confianza que resulta cuando utilizamos el
estadístico t es el siguiente:
S
: x t 2
n
El valor del estadístico t se puede leer en tablas o utilizar excel. Este valor depende del nivel de confianza
(1-α) y de los grados de libertad (=n-1).
S N−n
: x t 2 N−1
n
Ejercicio 7: Los datos que se dan corresponden a los tiempos, en minutos, que se tardaron 10 clientes en
recibir el servicio en una estación de gasolina: 5.5 10.0 7.5 12.0 9.5 14.5 10.0 9.5 8.5 y 14.0. Determina
un intervalo del 90% de confianza para estimar el tiempo medio de servicio.
S
Solución: Utilizaremos la expresión : x t 2
n
Datos muestrales: ingresamos los 10 datos en la calculadora con modo estadístico de una variable y
obtendremos n=10, 𝑋̅ =10.1 min. y S=2.78 min.
37
Navarro
Utilizando las propiedades de normalidad que tiene X y con un trabajo algebraico similar al que se hizo
para establecer un intervalo de confianza, se pueden determinar los siguientes resultados:
• Máximo error, E, que se puede cometer con probabilidad 1-α, al estimar µ por medio de X
E = Z2
n
• Tamaño de muestra necesario para estimar µ con un error no más grande que E y con probabilidad
1-α
2
Z 2
n= 2
E2
2
Z 2
n0 = 2
E2
2. Se calcula el n definitivo
n0
n= n0
1+ N
nótese que es necesario conocer σ2 . Si ésta no se conoce hay que estimarla de alguna manera, con una
muestra piloto por ejemplo, y sustituir en la fórmula σ2 por su estimación S2.
Ejercicio 8: Relativo al ejercicio anterior, ¿de qué tamaño debería de tomarse una muestra para estimar
el tiempo medio de servicio
a) con un margen de error de 1.0 min y con probabilidad 0.90. (se sugiere tomar los 10 datos como
una muestra piloto).
b) con un margen de error de 0.5 min y con probabilidad 0.90. (se sugiere tomar los 10 datos como
una muestra piloto).
38