Nothing Special   »   [go: up one dir, main page]

Unidad 3. Estimación Puntual y Por Intervalo

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 23

UNIDAD 3.

ESTIMACIN PUNTUAL Y POR INTERVALO

DEFINICIN, CLASIFICACIN Y PROPIEDADES DE LOS ESTIMADORES

Estimacin de Parmetros

En esta unidad se inicia propiamente el estudio de mtodos estadsticos que comnmente son
empleados para hacer inferencia y tomar decisiones. La inferencia estadstica se ocupa de dos reas
principales: estimacin de parmetros y prueba de hiptesis. En esta primera parte de la unidad se
abordar el tema de estimacin.

En la prctica, es comn que sean empleados datos muestrales para calcular un valor razonable para
la media real de una poblacin, ya que en muchas ocasiones es indispensable contar con esta
informacin que suele ser desconocida. Los motivos por los que una muestra es empleada en lugar
de la poblacin suelen ser de ndole econmicos, de tiempo, tamao poblacional, etc. El hecho es que,
cuando se hace este proceso de clculo, el valor resultante suele llamarse, una estimacin puntual
para la media poblacional.

Recurdese que en la unidad uno se utilizaron datos poblacionales para calcular medidas estadsticas
(media, varianza, etc.); ahora en inferencia estadstica se debe diferenciar entre clculos obtenidos a
partir de una muestra con respecto a los obtenidos a partir de una poblacin, es por ello que
llamaremos parmetros poblacionales () a las estadsticas obtenidas de una poblacin, y
llamaremos simplemente estadsticas (E) a las obtenidas a partir de una muestra.

La estimacin en la inferencia estadstica, consiste en estimar los valores de los parmetros de la


, 2 , . ). Entre
poblacin (, 2 , etc.) a partir de las estadsticas correspondientes de la muestra (X
todos los diferentes parmetros de una poblacin, y 2 son los ms indispensables y requeridos
para describirla por lo que es importante poder estimarlos.

Un estimador es una estadstica (E) que especifica cmo utilizar los datos de la muestra para calcular
una estimacin del parmetro desconocido de la poblacin.

Hay dos formas de presentar la estimacin de un parmetro poblacional, mismas que se presentan
en la siguiente clasificacin:

Puntuales o de punto

Estimadores
Por intervalos de confianza

Un estimador puntual del parmetro es aquel valor que resulta del clculo de la estimacin del
parmetro mediante el estimador en una muestra aleatoria de la poblacin.

Felipe R. Tuz Poot 112


Propiedades de los estimadores puntuales

Hay que tener en cuenta que el estimador siendo una estadstica, es una variable aleatoria ya que es
una funcin de las variables aleatorias de la muestra y por lo tanto resulta tener una distribucin de
probabilidad que ser denominada como la distribucin muestral del estimador.

Como se mencion en la unidad 2, una de las caractersticas que describe una distribucin es su
media, igualmente denominada como la esperanza de la distribucin, pues bien, cuando la esperanza
de la distribucin muestral del estimador resulta ser igual al parmetro de la poblacin que se est
estimando, entonces se dice que el estimador es un estimador insesgado del parmetro (Figura a); si
no sucede as, entonces a este estimador se le denomina un estimador sesgado, lo cual quiere decir
que la media de la distribucin muestral del estimador se encuentra a una distancia por la derecha o
por la izquierda del parmetro al que se le desea hacer una estimacin (Figura b). Ambos estimadores
son puntuales, y sus valores correspondientes se llaman estimaciones insesgadas o sesgadas
respectivamente.

Figura a)

Figura b)

Dicho de otra manera, si E es una estadstica cuya distribucin muestral tiene media , y el
parmetro correspondiente de la poblacin es , se dice que E es un estimador insesgado de si

Por ejemplo, se sabe que se cumple que () = , por lo que se dice que es un estimador insesgado
de , recurdese que () es denotado tambin como .

Felipe R. Tuz Poot 113


Por otra parte, si la estadstica E de la muestra tiende a ser igual al parmetro de la poblacin a
medida que se hace ms grande el tamao de la muestra, entonces la estadstica recibe el nombre de
estimador consistente del parmetro. En smbolos, la estadstica En es un estimador consistente si
lim =

Por ejemplo, el promedio aritmtico es un estimador insesgado y consistente de la media poblacional.


La varianza de la muestra como se mencion en la unidad uno definida como:

=1( )2
2 =
1

es un estimador insesgado y consistente de la varianza de la poblacin 2 .

Si varios estimadores tienen distribuciones muestrales con la misma media, se dice que el estimador
o estadstica que cuenta con la menor varianza es un estimador eficiente de la media poblacional, en
tanto que los estimadores restantes se conocen como estimadores ineficientes de la media muestral.

Por ejemplo, las distribuciones muestrales del promedio aritmtico y de la mediana tienen media
igual a la media de la poblacin. Sin embargo, la variancia de la distribucin muestral del promedio
aritmtico es menor que la varianza de la distribucin de la mediana, por lo que el promedio
aritmtico obtenido de una muestra aleatoria proporciona un estimador ms eficiente para el
parmetro de la media poblacional, que la mediana obtenida de la muestra. El concepto de eficiencia
permite definir entre varios estimadores, cul es el de mejor eficiencia.

Es improbable que incluso el estimador insesgado ms eficaz estime con exactitud el parmetro
poblacional. Es cierto que la precisin aumenta con muestras grandes; pero no hay razn por la cual
se debera esperar que una estimacin puntual de una muestra dada sea exactamente igual al
parmetro poblacional que se supone estima. Hay muchas situaciones en que es preferible
determinar un intervalo dentro del cual se esperara encontrar el valor del parmetro. Tal intervalo
se llama intervalo de confianza, el cual se aborda en el siguiente tema.

Felipe R. Tuz Poot 114


ESTIMACIN DE INTERVALOS DE CONFIANZA A PARTIR DE UNA MUESTRA

Mediante metodologas de la distribucin muestral de la estadstica para el parmetro de inters se


deducen intervalos de confianza, que comprenden con alta probabilidad el valor del parmetro
poblacional desconocido.

En la prctica los estimadores por intervalos son dados en la forma del estimador puntual ms o
menos cierta cantidad, por ejemplo si se desea conocer el peso promedio de una poblacin adecuada,
sta podra ser dada por 7710 (considerando x = 77) es decir, el intervalo sera [67, 87]. Esta cierta
cantidad mencionada, es completamente determinada de acuerdo a la distribucin que le
corresponde al estimador y se denomina error de estimacin.

Dada una muestra aleatoria con una funcin de distribucin la cual consta del parmetro
desconocido, comnmente el intervalo de confianza para es tal que:

(1 < < 2 ) = 1
Donde:
T1 y T2 son estadsticos denominados lmites de confianza inferior y superior
respectivamente. Estos son deducidos tericamente mediante metodologas basadas en el
conocimiento de la distribucin de la cual proviene la muestra y del estimador puntual del
parmetro, por esta razn, se dice que el intervalo de confianza tiene validez cuando
realmente se est utilizando un intervalo de confianza que va de acuerdo a la distribucin de
la muestra aleatoria y ciertas condiciones que han sido involucradas en la deduccin terica
del intervalo correspondiente.
1 representa la confiablidad o probabilidad de que el parmetro se encuentre en el
intervalo mencionado. Comnmente se desea una estimacin y el intervalo proporciona
precisamente esa estimacin, pero con un error de estimacin y es el que precisamente
involucra un valor denominado nivel de significancia. Al valor 1 se le conoce como el
nivel de confianza del intervalo.

En la construccin de un intervalo de confianza para la estimacin de un parmetro , siempre est


involucrada una distribucin. Cuando la distribucin normal estndar es la que se encuentra
involucrada en la construccin, los extremos superior e inferior del intervalo de confianza con un
nivel de confianza de 1 pueden ser obtenidos a travs de las propiedades de la distribucin
normal estndar que se estudiaron en la unidad 2 de acuerdo a lo siguiente:

La simetra de la distribucin indica que se necesita encontrar un valor tal que

( < < ) = 1

que es equivalente a que

1 ( < ) ( > ) = 1

y como

( < ) = ( > )

se concluye que

1 2( > ) = 1

Felipe R. Tuz Poot 115



( > ) =
2

Entonces el valor que se desea es aqul que cumple con la ltima igualdad. Se escribir a partir de
ahora /2 en lugar de para representar al valor crtico asociado al nivel de confianza 1 . Por
ejemplo si se desea un intervalo de confianza del 95% de confianza es decir 1 = 0.95, se utiliza
el valor crtico 0.025 = 1.96, obsrvese en la grfica:

95%

47.5%

-1.96 1.96 Z

La constante /2 que se fija en el intervalo de confianza se conoce como valor crtico o punto crtico.
En la tabla siguiente se presentan diversos valores crticos /2 segn el nivel de confianza que les
corresponden.

VALORES DE /2 PARA DISTINTOS NIVELES DE CONFIANZA PARA INTERVALOS


CONSIDERANDO LIMITE INFERIOR Y LIMITE SUPERIOR

Nivel de confianza en porcentaje


99.73 3.00
99.00 2.58
98.00 2.33
96.00 2.05
95.45 2.00
95.00 1.96
90.00 1.64
80.00 1.28
68.27 1.00
50.00 0.674

En esta tabla se han presentado varios valores crticos, sin embargo, los niveles de confianza ms
comnmente utilizados son: 90%, 95% y 99%

A continuacin se presentarn los procedimientos para determinar el intervalo de confianza para la


media de la poblacin de acuerdo con los supuestos de las variables. Para tener un mejor esquema
se hace un resumen en la siguiente tabla:

Felipe R. Tuz Poot 116


Distribucin de
Parmetro probabilidad de la Distribucin de
Situacin de Estimador del
de inters a Caracterstica de la probabilidad
intervalo
estimar muestra utilizada
aleatoria
Muestra: Proviene de una
poblacin con distribucin
Normal. En ambos casos se

conocida X z / 2 Tamao de muestra: utiliza la distribucin
n
cualquier n normal estndar
Muestra: con distribucin
desconocida. El tamao de
muestra debe ser 30
Muestra: Proviene de una
poblacin con distribucin
Normal. Se utiliza la
Tamao de muestra: distribucin t-student
desconocida X t / 2,n1
s cualquier n con n-1 grados de
n
Muestra con libertad
distribucin
desconocida. El tamao
de muestra debe ser
30

Intervalos de confianza para la media , con conocida

El intervalo de confianza con nivel de confianza 1 , para la estimacin de la media poblacional ,


cuando la desviacin estndar poblacional es conocida, est determinada por la expresin:


/2

Esta frmula es aplicable siempre y cuando se cumpla cualquiera de las siguientes condiciones:
i) La muestra aleatoria es obtenida de una poblacin con distribucin normal o aproximadamente
normal y tamao de muestra cualquier n.
ii) Se desconoce la distribucin poblacional correspondiente a la muestra, pero el tamao de la
muestra n es grande, mayor o igual a 30.
El error de estimacin en este caso es:

Felipe R. Tuz Poot 117



/2

Hay situaciones en el que el tamao de la poblacin se conoce, es finita y se representa por Np , si la
muestra es obtenida sin reemplazo, entonces el intervalo de confianza para la estimacin de la media
poblacional , es determinado por:



/2
1

La estimacin de la media bajo las condiciones anteriormente mencionadas, suelen ser ms exactas

ya que se considera el factor , denominado el factor de correccin por poblacin finita.
1

El error de estimacin en este caso es



/2
1
En muestreo, se ven frmulas similares a stas.

Ejemplo
Las mediciones de los dimetros de una muestra aleatoria de 100 tubos de albaal mostraron una
media de 32 cm. Suponiendo una desviacin estndar poblacional, = 2 cm. Obtnganse los lmites
de confianza del
a) 95%
b) 97%

para el dimetro medio de todos los tubos.

Solucin
En este problema, se observa que el tamao de muestra es grande n=100, se desconoce la
distribucin y el tamao de la poblacin, por tanto el intervalo de confianza se obtiene segn el caso
ii)

a) De la tabla normal estndar, los lmites de confianza del 95% son como se presenta en la grfica:

95%

47.5% 0.025

-1.96 1.96 Z

Entonces:

0.025

2
32 1.96
100

Felipe R. Tuz Poot 118


32 0.392cm.

o sea, se obtiene el intervalo (31.608, 32.392), esto significa que con una probabilidad de 95%, el
valor de se encuentra entre 31.608 y 32.392 cm., es decir,

31.608 < < 32.392

b) Se desea un intervalo del 97% de confianza, entonces se requiere el valor de 0.015 tal que el rea
bajo la curva normal a la derecha de 0.015 sea el 1.5% del rea total, es decir ( > 0.015 ) = 0.015.
De la tabla se obtiene que 0.015 = 2.17. Obsrvese la grfica:

97%

48.5% 0.015

-2.17 2.17 Z

Por lo tanto, los lmites de confianza del 97% son:



0.015


2.17

2
32 2.17 100

32 0.434 cm

y el intervalo de confianza respectivo es (31.566 cm., 32.434 cm.) es decir, con 97% de confianza la
media de los dimetros de los tubos de albaal es tal que 31.566 cm < < 32.434 cm.

Ejemplo
Una muestra aleatoria de 50 calificaciones de cierto examen de admisin tiene un promedio
aritmtico de 72 puntos. Suponiendo desviacin estndar poblacional, = 10, y si el examen se
aplic a 1018 personas, obtener
a) El intervalo de confianza del 95% para la media de las calificaciones.
b) El tamao de muestra necesario para que el error en la estimacin de la media no exceda de
2 puntos, considerando el mismo nivel de confianza.
c) El nivel de confianza para que el intervalo 72 1 puntos contenga a la media
poblacional.

Solucin
Se tiene una poblacin finita y el tamao de muestra es grande.

Felipe R. Tuz Poot 119


a) Los datos son los siguientes: = 72, 0.025 = 1.96, = 10, = 1018 y = 50, la frmula
que se utilizar es la siguiente:



0.025
1

Sustituyendo:
10 1018 50
72 1.96
50 1018 1

72 1.96(1.4142)(0.9756)
72 2.7042

y el intervalo de confianza respectivo es:

69.2598 < < 74.7042

b) Puesto que la poblacin es conocida, el error en la estimacin de la media es:


0.025
1

En este caso se tendra que este error debe cumplir:


0.025 2
1

o sea, para un nivel de confianza de 95%,

10 1018
1.96 2
1018 1

19.6 1018
2
1018 1

Elevando al cuadrado la desigualdad, queda

384.16 1018
( ) 4
1017

o sea, 87.85. Por lo que se requieren al menos 88 elementos en la muestra para que el
error en la estimacin no exceda de 2 puntos, para una confianza de 1 = 0.95.

Felipe R. Tuz Poot 120


Lo anterior indica que si se desea disminuir el error de estimacin se debe aumentar el
tamao de la muestra.

c) Los lmites de confianza son, en este caso

10 1018 50
72 2
50 1018 1

72 2 (1.4142)(0.9756)
o sea
72 1.37972

Puesto que se desea que el valor de la media sea 72 1 puntos, se verifica que

1 = 1.37972
es decir:
1
2 = = 0.725
1.3797

Se observa por interpolacin lineal que: ( > 0.725) = 0.2343. As el rea bajo la curva

normal estndar a la derecha de 2 = 0.725 es 0.2343, lo que indica que 2 = 0.2343 y
entonces = 0.4686. Por lo tanto, el nivel de confianza es 1 = 0.5314 (o 53.14%), tal
como se muestra en la figura:

( )

Se puede observar que si se desea disminuir el error de estimacin sin aumentar el tamao de la
muestra, entonces el nivel de confianza disminuye, o sea, la probabilidad o confianza de que el valor
poblacional se encuentre en el intervalo disminuye.

Intervalo de confianza para la media poblacional, con desconocida

El intervalo de confianza con 1 para estimar la media poblacional , cuando la varianza


poblacional es desconocida, se calcula utilizando la distribucin de student con = 1 grados
de libertad, como se indica en la siguiente frmula:

Felipe R. Tuz Poot 121


Esta frmula es aplicable siempre y cuando se cumpla cualquiera de las siguientes condiciones:
i) La muestra aleatoria es obtenida de una poblacin con distribucin normal o aproximadamente
normal.
ii) Se desconoce la distribucin poblacional correspondiente a la muestra, pero el tamao de la
muestra n es grande, mayor o igual a 30.

Ejemplo
Un da al azar se toma una muestra aleatoria de 10 varillas de la produccin de una laminadora, al
probarlas a la tensin hasta la ruptura se obtiene una resistencia media de 4800 kg./cm.2, con una
desviacin estndar de 200 kg/cm2. Con un nivel de confianza del 95%, estime la resistencia media
de las varillas producidas el da que se tom la muestra. Considere que la variable poblacional
resistencia tiene distribucin normal.

Solucin
Los datos que se tienen son = 10, = 4800 / , = 200/2 y 1 = 0.95. Como se
desconoce la desviacin estndar poblacional y la poblacin tiene distribucin normal, se utiliza:

2

es decir, se estima que la media de la poblacin queda comprendida entre los lmites siguientes:

2 < < + 2

En este caso, considerando la distribucin simtrica de la , el valor de para el 95% de nivel de


confianza y 9 grados de libertad es = 2.262, en la siguiente figura se detalla esta situacin.

95%

47.5% 0.025

-2.262 2.262 t

Sustituyendo valores se tiene


200 200
4800 2.262 < < 4800 + 2.262
10 10

4659.9 < < 4943.1

Ejemplo
Se seleccion una muestra aleatoria de 50 ingenieros de entre un gran nmero de empleados por una
corporacin cuya lnea es la exploracin petrolera. Para cada ingeniero se determin el nmero de
horas trabajadas en una semana particular. Estos datos tuvieron un promedio de 46 y una desviacin
estndar de 3 horas. Para esa semana, estimar las horas promedio trabajadas por todos los
ingenieros de esa corporacin con un coeficiente de confianza igual a 95%.

Felipe R. Tuz Poot 122


Solucin
Los daros que se tienen son = 50, = 3 horas, = 46 y 1 = 0.95. Obsrvese que se cumplen
las caractersticas de la condicin ii): desconocida y tamao de muestra grande 30. Por lo
tanto, el intervalo de confianza est dado por

2

donde tiene 49 grados de libertad. En la tabla 2 no se presentan valores para una distribucin con
49 grados de libertad por lo que se recurrir el programa Excel para determinar dicho valor el cual
es 0.025 = 2.01, por lo tanto sustituyendo los valores se obtiene que
3
46 2.01 ( )
50
y por lo tanto el intervalo de confianza con 95% de confianza para la media es

45.1472 < < 46.8528

En el caso de desconocida y tamao de muestra n 30, puede utilizarse la siguiente aproximacin


de intervalo para la media

2

sta es justificada y fundamentada por el teorema de lmite central, estimando con el valor de ya
que este es un estimador consistente para . De hecho, se puede verificar que los clculos de los
intervalos

2

y

2

son similares; esto no es solo una coincidencia, puesto que por teora de convergencia en
probabilidad la distribucin tiende a una distribucin normal estndar cuando es grande
(estableciendo aqu 30).

Una ventaja de utilizar la aproximacin del intervalo



2

es que en las tablas de la normal estndar se encuentran todos los valores posibles para mientras
que en las tablas de la distribucin -student no siempre es posible encontrar todos los valores de los
grados de libertad como sucedi en el ejemplo anterior, por lo que utilizar la distribucin normal en
lugar de la distribucin t es una buena opcin.

A continuacin, se resolver el ejemplo anterior, pero utilizando la distribucin normal.

Ejemplo
Se seleccion una muestra aleatoria de 50 ingenieros de entre un gran nmero de empleados por una
corporacin cuya lnea es la exploracin petrolera. Para cada ingeniero se determin el nmero de
horas trabajadas en una semana particular. Estos datos tuvieron un promedio de 46 y una desviacin
estndar de 3 horas. Para esa semana, estimar las horas promedio trabajadas por todos los
ingenieros de esa corporacin con un coeficiente de confianza igual a 95%.

Felipe R. Tuz Poot 123


Solucin
Los datos que se tiene son = 50 , = 3 horas, = 46 y 1 = 0.95 . Se observa que es
desconocida, pero el tamao de muestra es grande 30, se cumplen las condiciones para utilizar

la frmula con la distribucin normal 2 , sustituyendo el valor de por la desviacin

estndar muestral .

Los valores crticos para un nivel de confianza de 95% se observa en la grfica como sigue:

95%

47.5% 0.025

-1.96 1.96 Z

Entonces la estimacin es:



2

3
46 1.96 ( )
50
46 0.8316
45.1684 < < 46.8316

Como se puede observar el intervalo que result en este ejemplo es muy parecido al encontrado
cuando se utiliz la distribucin -student.

Si el tamao de la muestra es pequeo ( < 30) y la distribucin de la poblacin no es normal, se


utilizan mtodos no paramtricos, que en este curso no es abordado.

Intervalo de confianza para la proporcin

Intervalo de confianza para la proporcin poblacional , en muestras grandes ( )



La fraccin observada de xitos, o la proporcin de xitos en la muestra
es la que se usa como

estimacin puntual de y se representa mediante =
.

El intervalo
(1 )
2

es el estimador de un intervalo de confianza para , con nivel confianza aproximadamente igual a


1 con muestra grande.

Nota: Aunque existe bibliografa, en la cual presentan algunas condiciones que tiene que cumplir el
valor de p y el valor de n para utilizar este estimador y dan una estimacin mucho ms exacta, aqu,

Felipe R. Tuz Poot 124


no se entrar en detalle con esas especificaciones, simplemente se tendr en consideracin que el
tamao de muestra sea grande 30 , de otro modo no ser vlido emplear el estimador
proporcionado.

Ejemplo
Una inspeccin cuidadosa de 70 soportes de concreto precolado que se ha de usar en una
construccin, revel que 30 estaban fisurados. Estimar la proporcin verdadera de soportes de este
tipo con fisuras, con un intervalo de confianza del 98%.

Solucin
30
Los datos que se tienen son = 70, = 30, 1 = 0.98, = = 70 = 0.43. Por lo tanto el intervalo
de confianza buscado es
(1 )
0.01

Sustituyendo:
0.43(0.57)
0.43 2.33
70
0.43 0.1379

lo que indica que con 98% de confianza la proporcin de soportes con fisuras se encuentra en el
intervalo 0.2921 < < 0.5679.

Intervalo de confianza para la varianza

Cuando se desea determinar un intervalo de confianza con 1 para estimar a la varianza


poblacional 2 , donde la poblacin de la muestra tiene distribucin normal aproximadamente
normal, se calcula utilizando la distribucin ji cuadrada o tambin llamada Chi cuadrada de acuerdo
con la siguiente frmula:
( 1) 2 2
( 1) 2
< <
2 2
, 1 ,
2 2

Con = 1 grados de libertad.

Nota:
El caso de la estimacin de la varianza poblacional 2 solamente tiene validez cuando la poblacin
de la cual se extrae la muestra tiene distribucin normal, como se indic anteriormente. Cuando la
distribucin poblacional es desconocida, no ser abordado en este material ya que no resulta sencillo
y no es comn abordar este caso, por el grado de dificultad que puede representar.

Como un ejemplo, en la siguiente grfica se ilustran los lmites superior e inferior en la distribucin
Ji cuadrada 2 con 5 grados de libertad, cuando el nivel de confianza es de 90%:

Felipe R. Tuz Poot 125


1.145 11.07

Ejemplo
Se ha observado durante 20 das que una lnea de ensamble de una fbrica, tiene una desviacin
estndar de 30 minutos al realizar el proceso. Considerando que el tiempo del proceso de ensamble
tiene una distribucin normal, estime con un nivel de confianza del 90% la desviacin estndar del
proceso durante un ao.

Solucin
Los datos que se tienen son = 20, = 30 minutos y = 1 = 20 1 = 19 grados de libertad.
Tambin se sabe que la poblacin (datos del tiempo de ensamble) tiene una distribucin normal,
entonces, los lmites del intervalo de confianza para la varianza poblacional 2 estn dados por

( 1) 2 ( 1) 2
< 2 <
2 2
,1 1 ,1
2 2

19(30)2 2
19(30)2
2 < < 2
0.005,19 0.95,19

Los valores crticos se obtienen en la tabla 3 y se ilustran en la siguiente figura:

0.05 0.05

10.12 30.14

Sustituyendo
19(30)2 19(30)2
< 2 <
30.14 10.12

Entonces la varianza poblacional est comprendida con 90% de confianza entre los dos siguientes
valores:
567.35 < 2 < 1689.72

Felipe R. Tuz Poot 126


y si lo que se desea estimar es la desviacin estndar, , entonces el intervalo de confianza es

567.35 < < 1689.72


o sea
23.82 < < 41.11

Felipe R. Tuz Poot 127


ESTIMACIN DE INTERVALO DE CONFIANZA A PARTIR DE DOS MUESTRAS

Intervalos de confianza para diferencia de medias poblacionales, cuando las


desviaciones estndar poblacionales y son conocidas.

Supngase que se tienen dos muestras aleatorias: 1 , , y 1 , , . El intervalo de confianza


con nivel 1 , para la estimacin de diferencia de medias est determinado por

2 2
( ) /2 +

Esta estimacin tiene validez si satisface una de las siguientes condiciones:


i) Las poblaciones de donde son extradas las muestras tienen distribucin normal o
aproximadamente normal y entre las dos muestras hay independencia.
ii) Las distribuciones poblacionales de donde son extradas las muestras son desconocidas pero
los tamaos de las muestras son mayores o iguales a 30 y entre las dos muestras hay
independencia.

Ejemplo
Se toman dos muestras aleatorias de 100 varillas de acero que se fabrican en las compaas A y B. De
la muestra de la compaa se obtiene un peso medio de 6.5 kg., asimismo, la muestra de la compaa
indica un peso medio de 6.3 kg. Considerando que las desviaciones estndar poblacionales de las
compaas son = 0.4 kg. y = 0.3 kg. Respectivamente, encontrar el intervalo de confianza del
95.45% para la diferencia de las medias poblacionales.

Solucin
Los datos que se tienen son = = 100, = 6.5, = 0.4, = 6.3, = 0.3 y nivel de
confianza de 1 = 0.9545.

Como el tamao de muestra de cada poblacin es grande, de acuerdo a las condiciones dadas los
lmites del intervalo de confianza para la diferencia de medias son:

2 2
( ) 2 +

(0.4)2 (0.3)2
(6.5 6.3) 2 +
100 100
0.2 0.1

por lo tanto con una confianza del 95.45%, la diferencia de las pesos medios de las varillas de la
compaa y la compaa se encuentra en el intervalo:

0.1 < < 0.3

Felipe R. Tuz Poot 128


Intervalos de confianza para diferencia de medias poblacionales, cuando las
desviaciones estndar poblacionales y son desconocidas

Supngase que se tienen dos muestras aleatorias X1 , , X nX y Y1 , , YnY . Si se cumple alguna de las
siguientes condiciones:

i) Las poblaciones de las cuales se extraen las muestras tienen distribucin normal o aproximadamente
normal y entre las dos muestras hay independencia.
ii) Las distribuciones poblacionales de donde son extradas las muestras son desconocidas pero los
tamaos de las muestras son mayores o iguales a 30 y entre las dos muestras hay independencia.

Entonces, bajo la condicin i), el intervalo de confianza para se determina de acuerdo a


alguno de los casos siguientes:

Caso 1: =
En este caso el intervalo de confianza es definido por:

1 1 1 1
( ) 2, + < < ( ) + 2, +

Donde = + 2 grados de libertad, 2, es un valor de la distribucin , y 2 es calculada


por:
( 1)2 + ( 1)2
2 =
+ 2

Por consiguiente = 2

Caso 2:
En este caso el intervalo de confianza est definido por:

2 2
( ) 2, +

donde los grados de libertad son igual a
2
2 2
( + )

= 2 2
2 2
( ) ( )

+
( 1) ( 1)

Dado que rara vez es un entero, se redondea al entero ms cercano.

Bajo la condicin ii), como se desconocen las desviaciones estndar y , pero los tamaos de las
muestras son mayores o iguales a 30, stas pueden ser estimadas mediante las desviaciones estndar
muestrales por ser estos estimadores consistentes de sus desviaciones estndar
poblacionales respectivas. Por ello pueden ser tratadas como desviaciones estndar poblacionales
conocidas, lo que permite estimar la diferencia de medias utilizando la distribucin normal
como se indica en la siguiente frmula:

Felipe R. Tuz Poot 129


2 2
( ) /2 +

Ejemplo
Se deben eliminar gases cidos de otros gases de refinera en una instalacin de productos qumicos
para reducir al mnimo la corrosin de las plantas. Dos mtodos para eliminar estos gases produjeron
el ritmo de corrosin (mm./ao) que se representan a continuacin:
Mtodo A: 0.3, 0.7, 0.5, 0.8, 0.9, 0.7, 0.8
Mtodo B: 0.7, 0.8, 0.7 0.6, 2.1, 0.6, 1.4, 2.3

Estimar la diferencia entre el ritmo promedio de corrosin para los dos mtodos, con un coeficiente
de confianza de 0.90. Qu hiptesis se deben hacer para que sea vlida la respuesta?

Solucin
La informacin que se tiene es = 7, = 8, = 0.6714, 2 = 0.0424, = 1.15, 2 = 0.4886 y
confianza de 1 = 0.90. Luego

( 1)2 + ( 1)2 (7 1)(0.0424) + (8 1)(0.4886)


2 = = = 0.2827
+ 2 7+82

y = 0.2827 = 0.5317

El intervalo de confianza para la diferencia de medias poblacionales est dado por:

1 1 1 1
( ) 2, + < < ( ) + 2, +

90%

0.05
45%

-1.77 1.77 t

Al consultar la tabla de distribucin de student con = + 2 = 7 + 8 2 = 13 y 2, =


0.05,13 se obtiene que 1.771 es el valor crtico.

Sustituyendo
1 1 1 1
(0.6714 1.15) 1.771(0.5317) + < < (0.6714 1.15) + 1.771(0.5317) +
7 8 7 8

0.4786 0.4874 < < 0.4786 + 0.4874

0.966 < < 0.0088

Felipe R. Tuz Poot 130


Como el lmite inferior tiene signo negativo y el lmite superior tiene signo positivo, el cero est
incluido dentro del intervalo. En estos casos se considera que no existe una diferencia significativa
entre los promedios de los dos mtodos.

Las hiptesis o supuestos que deben hacerse para considerar vlida esta respuesta son:
Las variables aleatorias provienen de distribuciones normales independientes.
Las variables aleatorias tienen varianza comn, o sea 12 = 22 .

Ejemplo
Puede tomarse un curso con crdito ya sea asistiendo a sesiones de clases en horas y das fijos, o
haciendo sesiones en lnea que el estudiante puede hacer a su propio paso y en los tiempos que el
estudiante escoja. El coordinador del curso desea determinar si estas dos formas de tomar el curso
resultaron en una diferencia significativa en rendimiento medido por el examen final para el curso.
La siguiente informacin da las calificaciones en un examen con 45 puntos posibles para un grupo de
= 9 estudiantes que tomaron el curso en lnea y un segundo grupo de = 9 estudiantes que
tomaron el curso de clases convencionales. Estos datos presentan suficiente evidencia para indicar
que existe diferencia significativa entre las calificaciones para estudiantes que tomaron el curso en
lnea y las de quienes asistieron a una clase convencional? Calcular el intervalo con un nivel de
confianza de 95%. Considere que la variable calificaciones tiene distribucin normal y que 2 2 .

Calificaciones
En Saln de
lnea clase
32 35
37 31
35 29
28 25
41 34
44 40
35 27
31 32
34 31

Con los datos muestrales de la tabla anterior se calcularon los siguientes estadsticos:

En lnea Saln de clase


= 35.22 = 31.56

2 = 24.44 2 = 20.03

Como las desviaciones estndar poblacionales son desconocidas y diferentes, asimismo, la variable
calificaciones tiene distribucin aproximadamente normal, entonces se utilizar la distribucin de
Student con las siguientes frmulas:

Los grados de libertad son:

Felipe R. Tuz Poot 131


2
2 2
( + )

= 2 2
2 2
( ) ( )

+
( 1) ( 1)
Sustituyendo se tiene:

2
2 2 24.44 20.03 2
( + ) ( 9 + 9 ) 24.4146

= 2 2 = = = 15.8443
2 2 24.44 2 20.03 2 1.5409
( ) ( ) ( 9 ) ( 9 )

+ +
( 1) ( 1) 8 8

Se redondea al entero ms cercano, o sea, = 16

Con el valor de y con el rea en dos colas de la tabla de Student se obtiene el valor crtico 2, =
0.025,16 = 2.12

El intervalo de confianza se obtiene a travs de la frmula


2 2
( ) 2, +

24.44 20.03
(35.22 31.56) 2.12 +
9 9
3.66 2.12(2.2229)
3.66 4.7064
El intervalo de confianza queda como sigue

1.0464 < < 8.3664

Como el cero est incluido en el intervalo podemos concluir que no existe diferencia significativa
entre el promedio de calificaciones del curso en lnea y el del saln de clase, con un nivel de confianza
de 95%.

Intervalo de confianza para diferencia de proporciones

Intervalo de confianza para diferencia de proporciones poblacionales , con muestras


mayores o iguales a 30.

Considrese el problema en el cual se desea estimar la diferencia entre dos parmetros binomiales
1 2 . Por ejemplo, se podra hacer que 1 representara la proporcin de fumadores con problemas
de cncer en los pulmones y 2 la proporcin de no fumadores con el mismo padecimiento. La

Felipe R. Tuz Poot 132


dificultad, entonces, consiste en estimar la diferencia entre estas dos proporciones. Primero, se
seleccionan muestras aleatorias independientes de tamao 1 y 2 de las dos poblaciones con
parmetros 1 y 2 , respectivamente, entonces se determinan los nmeros 1 y 2 de personas en

cada muestra con cncer en los pulmones y se forman las proporciones muestrales 1 = 1 y 2 =
1
2
2
. Un estimador puntual de la diferencia entre las dos proporciones 1 2 , est dado por el
estadstico 1 2 . Por lo tanto, la diferencia entre las proporciones muestrales 1 2 , se utilizar
como estimacin puntual de 1 2 a la que se sumar y restar un error de estimacin y as
establecer el siguiente intervalo de confianza:

1 1 2 2 1 1 2 2
(1 2 ) 2 + 1 2 (1 2 ) + 2 +
1 2 1 2

donde = 1 .

Nota
Es importante mencionar que el estimador por intervalo anterior solamente es vlido si el tamao
de muestra es grande, es decir, mayor o igual a 30.

Ejemplo
Se est considerando cambiar el procedimiento de manufactura de partes. Se toman muestras tanto
del procedimiento actual como del nuevo para determinar si este ltimo resulta mejor. Si 75 de 1500
artculos del procedimiento actual presentaron defectos y lo mismo sucedi con 80 de 2000 partes
del nuevo procedimiento, determine un intervalo de confianza del 90% para la diferencia real de las
fracciones de partes defectuosas entre los dos procesos.

Solucin
Sean y las proporciones reales de partes defectuosas para los procedimientos actual y nuevo,
75 80
respectivamente. De aqu que = 1500 = 0.05 y = 2000 = 0.04, y la estimacin puntual
= 0.05 0.04 = 0.01.

Al utilizar la tabla de la distribucin normal se encuentra que 2 = 0.05 = 1.645. Por lo tanto, al
sustituir en la frmula, se obtiene el intervalo de confianza de 90%:

0.05(0.95) 0.04(0.96) 0.05(0.95) 0.04(0.96)


(0.05 0.04) 1.645 + < < (0.05 0.04) + 1.645 +
1500 2000 1500 2000

0.01 0.0117 < < 0.01 + 0.0117

el cual se simplifica a

0.0017 < < 0.0217

Dado que el intervalo contiene el valor cero, no hay razn para creer que el nuevo procedimiento
ocasion una disminucin significativa en la proporcin de partes defectuosas con respecto al
mtodo actual.

Felipe R. Tuz Poot 133


Intervalo de ( )% de confianza para un cociente de varianzas poblacionales
de dos distribuciones normales.

Supuestos:
- Las muestras provienen de distribuciones normales
- Las muestras son independientes

Frmula:

12 2 2 1

22 1 2 ,2 1,1 1
12 12 , donde 1, =
2 2 2 2 1,1 1 2 2 1,1 1
, 1,2 1
2 1

Ejemplo:

Considrese un proceso de grabado por bao crtico. Se desean comparar dos catalizadores para
medir su eficacia en la reduccin de los tiempos de inmersin para tarjetas de circuito impreso.
1 = 12 baos se efectuaron con el catalizador 1 y 2 = 15 baos se realizaron con el catalizador 2,
resultando 1 = 0.85 minutos y 2 = 0.98 minutos. Determinar un intervalo de confianza de 90%
respecto al cociente de varianzas 12 22 .

Solucin
La frmula a aplicar es
12 2 2 1

22 1 2 ,2 1,1 1
12 12 , donde 1, =
2 2 2 2 1,1 1 2 2 1,1 1
, 1,2 1
2 1
De la tabla se obtiene:

, = 0.05,14,11 = 2.74
2 2 1,1 1

1 1 1
1, = = = = 0.39
2 2 1,1 1 , 0.05,11,14 2.58
1,2 1
2 1

Sustituyendo en la frmula,

(0.85)2 12 (0.85)2
(0.39) (2.74)
(0.98)2 22 (0.98)2

2
0.29 12 2.06
2

Puesto que este intervalo de confianza contiene la unidad, podramos no requerir que las
desviaciones estndar de los tiempos de inmersin para los dos catalizadores sean diferentes en el
nivel de confianza del 90%.

Felipe R. Tuz Poot 134

También podría gustarte