Nothing Special   »   [go: up one dir, main page]

UNIDAD 3 Estadistica Inferencial.

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 22

TECNÓ LOGICO NACIONAL DE MÉ XICO.

Instituto Tecnoló gico de México.

Estadistica
inferencial Unidad 3

“Pruebas de hipó tesis con una muestra”.

Materia: Estadística Inferencial


Alumna: Gonzá lez Alfonso Mó nica.
Carrera: Ing. Gestió n Empresarial.

Página | 1
Índice

3.1 metodología para la prueba de hipótesis……………………………………3


3.2 Hipótesis nula y alternativo……………………………………………………8
3.3 Error tipo I y error II…………………………………………………………….8
3.4 Pruebas de hipótesis II para la media (desviación estándar
poblacional)…………………………………………………………………………….9
3.5 Pruebas para proporciones……………………………………………………12
3.6 Selección del tamaño de muestra (para estimar la media
poblacional)…………………………………………………………………………….17
3.7 Selección del tamaño de muestra (para estimar la proporción
poblacional)…………………………………………………………………………….19
Bibliografía………………………………………………………………………………22

3.1 METODOLOGIA PARA LA PRUEBA DE HIPOTESIS.

Página | 2
Dentro del estudio de la inferencia estadística, se describe como se puede tomar una muestra
aleatoria y a partir de esta muestra estimar el valor de un parámetro poblacional en la cual se
puede emplear el método de muestreo y el teorema del valor central lo que permite explicar
cómo a partir de una muestra se puede inferir algo acerca de una población, lo cual nos lleva a
definir y elaborar una distribución de muestreo de medias muéstrales que nos permite
explicar el teorema del límite central y utilizar este teorema para encontrar las probabilidades de
obtener las distintas medias maestrales de una población. Pero es necesario tener
conocimiento de ciertos datos de la población como la media, la desviación estándar o la
forma de la población, pero a veces no se dispone de esta información. En este caso es
necesario hacer una estimación puntual que es un valor que se usa para estimar un valor
poblacional.

Pero una estimación puntual es un solo valor y se requiere un intervalo de valores a esto se
denomina intervalo de confianza y se espera que dentro de este intervalo se encuentre el
parámetro poblacional buscado. También se utiliza una estimación mediante un intervalo, el
cual es un rango de valores en el que se espera se encuentre el parámetro poblacional En
nuestro caso se desarrolla un procedimiento para probar la validez de una aseveración
acerca de un parámetro poblacional este método es denominado Prueba de hipótesis para
una muestra. Hipótesis y prueba de hipótesis Tenemos que empezar por definir que es una
hipótesis y que es prueba de hipótesis. Hipótesis es una aseveración de una población
elaborado con el propósito de poner a prueba, para verificar si la afirmación es razonable se
usan datos.

Objetivo de la prueba de hipótesis.

El propósito de la prueba de hipótesis no es cuestionar el valor calculado del


estadístico (muestral), sino hacer
Un juicio con respecto a la diferencia entre estadístico de muestra y un valor
planteado del parámetro.

Procedimiento sistemático para una prueba de hipótesis de una muestra.

Página | 3
Paso 1: Plantear la hipótesis nula Ho y la hipótesis alternativa H1.

Cualquier investigación estadística implica la existencia de hipótesis o


afirmaciones acerca de las poblaciones que se estudian.
La hipótesis nula (Ho) se refiere siempre a un valor especificado del parámetro de
población, no a una estadística de muestra. La letra H significa hipótesis y el
subíndice cero no hay diferencia. Por lo general hay un "no" en la hipótesis nula
que indica que "no hay cambio" Podemos rechazar o aceptar Ho.
La hipótesis nula es una afirmación que no se rechaza a menos que los datos
maestrales proporcionen evidencia convincente de que es falsa. El planteamiento
de la hipótesis nula siempre contiene un signo de igualdad con respecto al valor
especificado del parámetro.
La hipótesis alternativa (H1) es cualquier hipótesis que difiera de la hipótesis nula.
Es una afirmación que se acepta si los datos maestrales proporcionan evidencia
suficiente de que la hipótesis nula es falsa. Se le conoce también como la
hipótesis de investigación. El planteamiento de la hipótesis alternativa nunca
contiene un signo de igualdad con respecto al valor especificado del parámetro.

Paso 2: Seleccionar el nivel de significancia.


Nivel de significancia: Probabilidad de rechazar la hipótesis nula cuando es
verdadera. Se le denota mediante la letra griega α, también es denominada como
nivel de riesgo, este término es más adecuado ya que se corre el riesgo de
rechazar la hipótesis nula, cuando en realidad es verdadera. Este nivel está bajo
el control de la persona que realiza la prueba.
Si suponemos que la hipótesis planteada es verdadera, entonces, el nivel de
significación indicará la probabilidad de no aceptarla, es decir, estén fuera de área
de aceptación. El nivel de confianza (1-α), indica la probabilidad de aceptar la
hipótesis planteada, cuando es verdadera en la población.

La distribución de muestreo de la estadística de


prueba se divide en dos regiones, una región de
rechazo (conocida como región crítica) y una
región de no rechazo (aceptación). Si la
estadística de prueba cae dentro de la región de
aceptación, no se puede rechazar la hipótesis
nula.
La región de rechazo puede considerarse como
el conjunto de valores de la estadística de prueba que no tienen posibilidad de
presentarse si la hipótesis nula es verdadera. Por otro lado, estos valores no son
tan improbables de presentarse si la hipótesis nula es falsa. El valor crítico separa
la región de no rechazo de la de rechazo.

Página | 4
Paso 3: Cálculo del valor estadístico de prueba.
Valor determinado a partir de la información muestral, que se utiliza para
determinar si se rechaza la hipótesis nula., existen muchos estadísticos de prueba
para nuestro caso utilizaremos los estadísticos z y t. La elección de uno de estos
depende de la cantidad de muestras que se toman, si las muestras son de la
prueba son iguales a 30 o más se utiliza el estadístico z, en caso contrario se
utiliza el estadístico t.

Paso 4: Formular la regla de decisión


SE establece las condiciones específicas en la
que se rechaza la hipótesis nula y las
condiciones en que no se rechaza la hipótesis
nula. La región de rechazo define la ubicación de
todos los valores que son tan grandes o tan
pequeños, que la probabilidad de que se presenten bajo la suposición de que la
hipótesis nula es verdadera, es muy remota.
Distribución muestral del valor estadístico z, con prueba de una cola a la derecha.

Valor crítico: Es el punto de división entre la región en la que se rechaza la


hipótesis nula y la región en la que no se rechaza la hipótesis nula.

Paso 5: Tomar una decisión.


En este último paso de la prueba de hipótesis, se calcula el estadístico de prueba,
se compara con el valor crítico y se toma la decisión de rechazar o no la hipótesis
nula. Tenga presente que en una prueba de hipótesis solo se puede tomar una de
dos decisiones: aceptar o rechazar la hipótesis nula. Debe subrayarse que
siempre existe la posibilidad de rechazar la hipótesis nula cuando no debería
haberse rechazado (error tipo I). También existe la posibilidad de que la hipótesis
nula se acepte cuando debería haberse rechazado (error de tipo II).

EJEMPLOS.

1.  Una empresa está interesada en lanzar un nuevo producto al mercado.


Tras realizar una campaña publicitaria, se toma la muestra de 1 000
habitantes, de los cuales, 25 no conocían el producto. A un nivel de
significación del 1% ¿apoya el estudio las siguientes hipótesis?
a. Más del 3% de la población no conoce el nuevo producto.
b. Menos del 2% de la población no conoce el nuevo producto.

Datos:
n = 1000
Página | 5
x = 25

Dónde:
x = ocurrencias
n = observaciones
= proporción de la muestra
= proporción propuesta

Solución:
a)

a = 0,01 

H0 es aceptada, ya que z prueba (-0,93) es menor que z tabla


(2,326), por lo que no es cierto que más del 3% de la población no
conoce el nuevo producto.

b)

a = 0,01 

Página | 6
H0 es rechazada, ya que z prueba (1,13) es menor que z tabla
(2,326), por lo que es cierto que menos del 2% de la población no
conoce el nuevo producto.

2. Cuando las ventas medias, por establecimiento autorizado, de


una marca de relojes caen por debajo de las 170,000 unidades
mensuales, realiza una encuesta a 51 establecimientos autorizados,
seleccionados aleatoriamente, que facilitan la cifra de ventas del último mes
en relojes de esta marca. A partir de estas cifras se obtienen los siguientes
resultados: media = 169.411,8 unidades., desviación estándar = 32.827,5
unidades. Suponiendo que las ventas mensuales por establecimiento se
distribuyen normalmente; con un nivel de significación del 5 % y en vista a
la situación reflejada en los datos. ¿Se considerará oportuno lanzar una
nueva campaña publicitaria?

Datos:

n = 51

Solución:
H0: ( = 170000
H1: ( < 170000
a = 0,05 

Se rechaza Ho, porque z prueba (-0,12) es menor que z tabla (1,645), por lo
tanto se acepta H1: ( < 170000, y se debe considerar oportuno lanzar una
nueva campaña publicitaria.

3.2 HIPOTESIS NULA Y ALTERNATIVA.

Página | 7
1. Las hipótesis nula y alternativa son las siguientes:

H o =P H −PM ≤0 , la proporción de hombres que reportan 9 o más visitas


por mes es la misma o menor que la proporción de mujeres que hacen lo
mismo.

H a =P H −PM >0 , la proporción de hombres que reportan 9 o más visitas


por mes es mayor a la proporción de mujeres que hacen lo mismo.

La información proporcionada es:

n H =45 n M =71

PH =.58 PM =. 42

PH −P M =.58−. 42=. 16

3.3 ERROR TIPO 1 Y ERROR TIPO 2.

Se cometerá un error de tipo I cuando m=50, pero x para la muestra considerada


cae en la región crítica
Y se cometerá un error de tipo II cuando m ¹ 50 pero x para la muestra
considerada cae en la región de aceptación
EJEMPLOS.

ERROR TIPO I (EJEMPLO)


Calcular a para el ejemplo de la rapidez de combustión para una muestra de N=10
datos, suponiendo que la desviación estándar de la rapidez de combustión es
s=2.5 cm/seg.
Solución: en este caso a = P( x caiga en la región crítica | m=50), es decir:
a = P( x < 48.5) + P( x > 51.5)
Recordando que La distribución de x es Normal con media m=50 y desviación
estándar s/ÖN =0.79, por lo tanto, usando Matlab

Página | 8
a = normcdf(48.5,50,0.79) + (1-normcdf(51.5,50,0.79))
= 0.288+ 0.288 = 0.0576
Esto significa que el 5.76% de las muestras de tamaño 10 conducirán al rechazo
de la Hipótesis H0: m=50 cm/seg, cuando ésta es verdadera

ERROR TIPO II (EJEMPLO)


Supongamos que es importante rechazar H 0 si la rapidez promedio de combustión
m es mayor que 52 cm/seg o menor que 48 cm/seg. Dada la simetría sólo se
requiere evaluar la probabilidad de aceptar H 0: m=50 cuando el valor verdadero es
m=52
0.
7
0.
6
0. H0: H1:
5
0.
4
= =
0.
3
0. 50 52
2
0.
10
4 4 4 4 4 5 5 5 5 5 5
5 6 7 8 9 0 1 2 3 4 5
De acuerdo a la figura: b = P(48.5 £ x £ 51.5 | m=52)
Usando Matlab:
b = normcdf(51.5,52,0.79) - normcdf(48.5,52,0.79) = 0.2643

3.4 PRUEBAS DE HIPOTESIS Z PARA LA MEDIA (DESVIACION ESTANDAR


POBLACIONAL CONOCIDA).
La prueba de hipótesis es un procedimiento estadístico que comienza con una
suposición que se hace con respecto a un parámetro de población, luego se
recolectan datos demuestra, se producen estadísticas de muestra y se usa esta
información para decidir qué tan probable es que sean correctas nuestras
suposiciones acerca del parámetro de población en estudio.

Ejemplos de hipótesis pueden ser:


a) Probar si las ventas diaria de un abasto son 1000 o no
b) Probar si la proporción de individuos que compran algún artículo en una tienda
es o no mayor del 0.3.

Página | 9
Objetivo de la prueba de hipótesis

Decidir, basado en una muestra de una población, cuál de dos hipótesis


complementarias es cierta. Las dos hipótesis complementarias se denominan
hipótesis nula e hipótesis alternativa.

EJEMPLOS

1) El Instituto Eléctrico Edison publica cifras del número anual de Kilowatt-


hora que gastan varios aparatos electrodomésticos. Se afirma que una
aspiradora gasta un promedio mínimo de 46 kilowatt-hora al año. Si una
muestra aleatoria de 12 hogares que se incluye en un estudio planeado
indica que las aspiradoras gastan un promedio de 42kilowatt-hora al año
con una desviación estándar de11.9 kilowatt-hora, ¿esto sugiere con un
nivel de significancia de 0.05 que las aspiradoras gastan, en promedio, menos de
46kilowatt-hora anualmente? Suponga que la población de kilowatt-hora
es normal.

Solución:

Datos:
m0 = 46 kilowatt-hora
s= 11.9 kilowatt-hora
x = 42 kilowatt-hora
n = 12,
a= 0.05

Hipótesis:
Ho: m ³ 46
H1: m < 46

Estadístico de Prueba: Como la varianza de la población es desconocida y el tamaño


demuestra es menor de 30 utilizaremos la distribución t de Student en el
cálculo del estadístico.

Percentil:(11) t0.95 1.7965

Justificación y decisión: Como 1.16 > -1.796, no se rechaza Ho y se concluye con
un nivel de significancia del0.05 que no existen suficientes evidencias para
afirmar que el número promedio dekilowatt-hora que gastan al año las
aspiradoras sea menor de 46 KW la hora

Página | 10
2) Los pesos en libras de una muestra aleatoria de bebés de seis meses
son: 14.6, 12.5, 15.3, 16.1, 14.4, 12.9, 13.7 y 14.9. Haga una prueba con
nivel de 5% de significancia para determinar si el peso promedio de
todos los bebés de seis meses es distinto a 14libras, suponga que sus
pesos se distribuyen normalmente y calcule el valor de P.

Solución:
Datos:
= 14 libras
S = 1.21 libras
= 14.3 libras
n=8
a. = 0.052.

Ensayo de hipótesis
Ho:  = 14 libras
H1:   14 libras

3) Regla de Decisión:
Si -2.365  tR  2.365 NO se rechaza Ho

Si tR  -2.365 o Si tR  2.365 Se rechaza Ho

Cálculos:

Página | 11
Justificación y decisión:
Como  – 2.365  0.7012  2.365 por lo tanto, no se rechaza Ho y se
concluye con un nivel de significancia del 0.05 que el peso promedio de
todos los bebés de seis meses es de 14 libras.

3.5 PRUEBAS PARA PROPORCIONES.

El concepto de prueba de hipótesis se puede utilizar para probar hipótesis en


relación con datos cualitativos. Por ejemplo, en el problema anterior el gerente de
la fábrica de llantas quería determinar la proporción de llantas que se reventaban
antes de 10.000 millas. Este es un ejemplo de una variable cualitativa, dado que
se desea llegar a conclusiones en cuanto a la proporción de los valores que tienen
una característica particular. 
El gerente de la fábrica de llantas quiere que la calidad de llantas producidas, sea
lo bastante alta para que muy pocas se revienten antes de las 10.000 millas. Si
más de un 8% de las llantas se revientan antes de las 10.000 millas, se llegaría a
concluir que el proceso no funciona correctamente. La hipótesis nula y alternativa
se pueden expresar como sigue:
H 0 =P≤0 . 08 (Funciona correctamente)
H 1=P>0 .08 (No funciona correctamente)

La prueba estadística se puede expresar en términos de la proporción de éxitos


como sigue:
P s−P X
Z= → Ps =
Pq n
  √ n

siendo X y N el número de éxitos de la muestra y n el tamaño de la muestra, P la


proporción de éxitos de la hipótesis nula. Ahora se determinará si el proceso
funciona correctamente para las llantas producidas para el turno de día. Los
resultados del turno de día indican que cinco llantas en una muestra de 100 se
reventaron antes de 10,000 millas para este problema, si se selecciona un nivel de
significancia α=0 . 05 , las regiones de rechazo y no rechazo se establecerían
como a continuación se muestra. Y la regla de decisión sería: Rechazar Ho si z> +
1.645; de lo contrario no rechazar Ho. Con los datos que se tienen,

Página | 12
P s−P
Ps =0 . 05⇒ Z = =−1. 107
Pq
√ n
una vez reemplazado, recuerde p+q=1
Z=-1.107 +1.645; por tanto no rechazar Ho.

La hipótesis nula no se rechazaría por que la prueba estadística no ha caído en la


región de rechazo. Se llegaría a la conclusión de que no hay pruebas de que más
del 8% de las llantas producidas en el turno de día se revienten antes de 10,000
millas. El gerente no ha encontrado ninguna prueba de que ocurra un número
excesivo de reventones en las llantas producidas en el turno de día.
Una hipótesis estadística es una suposición hecha con respecto a la función de
distribución de una variable aleatoria. Para establecer la verdad o falsedad de una
hipótesis estadística con certeza total, será necesario examinar toda la población.
En la mayoría de las situaciones reales no es posible o practico efectuar este
examen, y el camino más aconsejable es tomar una muestra aleatoria de la
población y en base a ella, decidir si la hipótesis es verdadera o falsa.
En la prueba de una hipótesis estadística, es costumbre declarar la hipótesis como
verdadera si la probabilidad calculada excede el valor tabular llamado el nivel de
significación y se declara falsa si la probabilidad calculada es menor que el valor
tabular. La prueba a realizar dependerá del tamaño de las muestras, de la
homogeneidad de las varianzas y de la dependencia o no de las variables. Si las
muestras a probar involucran a más de 30 observaciones, se aplicará la prueba de
Z, si las muestras a evaluar involucran un número de observaciones menor o igual
que 30 se emplea la prueba de t de student. La fórmula de cálculo depende de si
las varianzas son homogéneas o heterogéneas, si el número de observaciones es
igual o diferente, o si son variables dependientes.
Para determinar la homogeneidad de las varianzas se toma la varianza mayor y se
divide por la menor, este resultado es un estimado de la F de Fisher. Luego se
busca en la tabla de F usando como numerador los grados de libertad (n-1) de la
varianza mayor y como denominador (n-1) de la varianza menor para encontrar la
F de Fisher tabular. Si la F estimada es menor que la F tabular se declara que las
varianzas son homogéneas. Si por el contrario, se declaran las varianzas
heterogéneas. Cuando son variables dependientes (el valor de una depende del
valor de la otra), se emplea la técnica de pruebas pareadas.
Como en general estas pruebas se aplican a dos muestras, se denominarán a y b
para referirse a ellas, así entenderemos por:
- na al número de elementos de la muestra a
- nb al número de elementos de la muestra b
- xb al promedio de la muestra b

Página | 13
- s2a la varianza de la muestra a
- Y así sucesivamente

Entonces se pueden distinguir 6 casos a saber:


- Caso de muestras grandes (n>30)
- Caso de na = nb y s2a = s2b
- Caso de na = nb y s2a ≠s2b
- Caso de na ≠ nb y s2a = s2b
- Caso de na ≠ nb y s2a ≠ s2b
- Caso de variables dependientes

EJEMPLOS

1. Una encuesta realizada por Bancomer a 35 clientes indicó que un poco más
del 74 por ciento tenían un ingreso familiar de más de $200,000 al año. Si
esto es cierto, el banco desarrollará un paquete especial de servicios para
este grupo. La administración quiere determinar si el porcentaje verdadero
es mayor del 60 por ciento antes de desarrollar e introducir este nuevo
paquete de servicios. Los resultados mostraron que 74.29 por ciento de los
clientes encuestados reportaron ingresos de $200,000 o más al año. El
procedimiento para la prueba de hipótesis de proporciones es el siguiente:

Especifica la hipótesis nula y alternativa.


Hipótesis Nula:
H 0 =P≤. 60
Hipótesis Alternativa:
H a =P>. 60 ,

donde P = la proporción de clientes con ingresos familiares anuales de


$200,000 o más.

Específica el nivel de significación, α , permitido. Para una α=. 05 ,


el valor de tabla de Z para una prueba de una sola cola es igual a 1.64.

Calcula el error estándar de la proporción específicada en la hipótesis nula.


p(1−p )
s p=
√ n
donde:

p = proporción especificada en la hipótesis nula.

Página | 14
n = tamaño de la muestra.

2. Por consiguiente:

0. 60(1−0. 60 )
3.
s p=
√ 35
=.0828

Calcula la estadística de prueba:

( proporción observada )−( proporción ¿ )


z=
sp

0 .7429−0 .60
z= =1 . 73
0 . 0828
La hipótesis nula se rechaza porque el valor de la Z calculada es mayor que
el valor crítico Z . El banco puede concluir con un 95 por ciento de
confianza (1−α=. 95 ) que más de un 60 por ciento de sus clientes tienen
ingresos familiares de $200,000 o más. La administración puede introducir
el nuevo paquete de servicios orientado a este grupo.

2. El presidente del PRI en 1988, basado en su experiencia, sostiene que un


95% de los votos para las elecciones presidenciales han sido a favor de su
partido. Los partidos de oposición levantaron una muestra de1,100
electores y encontraron que un 87% de ellos votaría por el PRI. El
presidente del PRI quiere probar la hipótesis, con un nivel de significación
de 0.05, que el 95% de los votos son para su partido.

Hipótesis Nula:
H o : p=0 .95
Hipótesis Alternativa: aH : p≠0 .95
Tamaño de muestra: n=1,100
Nivel de Significación = 0.05.

Página | 15
El primer paso es calcular el error estándar de la proporción utilizando el
valor hipotético del porcentaje que históricamente vota por el PRI:

p(1− p ) 0 . 95∗0 .05


SE p =
√ n
=

1100
=0 .0066

3. Ahora sólo es necesario construir el intervalo de confianza:

po ±1.96∗SE p

0 . 95±( 1 . 96∗0.0066 ) =0 . 937→0 .963


La proporción de .87 de votos por el PRI en la encuesta no cae en la región de
aceptación, por lo tanto el presidente del PRI debe de “preocuparse” por que la
tendencia entre los votantes es a favorecer menos al PRI.

4. Probemos la hipótesis de que el porcentaje de microempresas cuyos


SEXO DEL PATRON

Valid Cumulative
Frequency Percent Percent Percent
Valid Hombre 1634 83.9 83.9 83.9
Mujer 314 16.1 16.1 100.0
Total 1948 100.0 100.0

dueños son hombres captado por la ENAMIN es distinto de 88 por ciento.

Hipótesis Nula:
H 0 =P=0 . 88
Hipótesis Alternativa:
H 0 =P≠0 . 88

0. 88(1−0 .88 )
s p=
√ 1948
=. 0074

Página | 16
0 .839−0 . 88
z= =−5 .54
0. 0074
La hipótesis nula se rechaza porque el valor de la Z calculada es menor que
el valor crítico Z de 1.96. Podemos concluir con un 95 por ciento de
confianza (1−α=. 95 ) que la proporción captada por la ENAMIN es
estadísticamente
3.6 SELECCIÓN DEL TAMAÑO distintaDE
de 0.88.
LA MUESTRA (PARA ESTIMAR UNA MEDIA
POBLACIONAL).

¿Qué tan grande debe ser una muestra si la media muestral se va a usar para
estimar la media poblacional? La respuesta depende del error estándar de la
media, si este fuera cero, entonces se necesitaría una sola media que será igual
necesariamente a la media poblacional desconocida  , porque   = 0. Este caso
extremo no se encuentra en la práctica, pero refuerza el hecho de que mientras
menor sea el error estándar de la media, menor es el tamaño de muestra
necesario para lograr un cierto grado de precisión.

Se estableció antes que una forma de disminuir el error de estimación es


aumentar el tamaño de la muestra, si éste incluye el total de la población,

entonces   sería igual a cero. Con esto en mente, parece razonable que para
un nivel de confianza fijo, sea posible determinar un tamaño de la muestra tal que
el error de estimación sea tan pequeño como queramos, para ser más preciso,
dado un nivel de confianza y un error fijo de estimación  , se puede escoger un

tamaño de muestra n tal que P(( ) = Nivel de confianza. Con el


propósito de determinar n. El error máximo de estimación está dado por:

Si se eleva al cuadrado ambos lados de esta ecuación y se despeja  n de la


ecuación resultante, obtenemos:

Como n debe de ser un número entero, redondeamos hacia arriba todos los


resultados fraccionarios.

En el caso de que se tenga una población finita y un muestreo sin reemplazo, el


error de estimación se convierte en:
Página | 17
De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

EJEMPLOS

1. Un biólogo quiere estimar el peso promedio de los ciervos cazados en el


estado de Maryland. Un estudio anterior de diez ciervos cazados mostró
que la desviación estándar de sus pesos es de 12.2 libras. ¿Qué tan grande
debe ser una muestra para que el biólogo tenga el 95% de confianza de
que el error de estimación es a lo más de 4 libras?

Solución:

En consecuencia, si el tamaño de la muestra es 36, se puede tener un 95%


de confianza en que   difiere en menos de 4 libras de  .

2. Una empresa eléctrica fabrica focos que tienen una duración


aproximadamente normal con una desviación estándar de 40 horas. ¿De
qué tamaño se necesita una muestra si se desea tener 96% de confianza
que la media real esté dentro de 10 horas de la media real?

Se necesita una muestra de 68 focos para estimar la media de la población


y tener un error máximo de 10 horas.

Página | 18
¿Qué pasaría si en lugar de tener un error de estimación de 10 horas sólo
se requiere un error de 5 horas?

Se puede observar como el tamaño de la muestra aumenta, pero esto tiene


como beneficio una estimación más exacta.
3.7 SELECCIÓN DEL TAMAÑO DE LA MUESTRA (PARA ESTIMAR LA
PROPORCION POBLACIONAL).

Se desea saber que tan grande se requiere que sea una muestra para asegurar
que el error al estimar P sea menor que una cantidad específica  .

Elevando al cuadrado la ecuación anterior se despeja n y nos queda:

Esta fórmula está algo engañosa, pues debemos utilizar p para determinar el


tamaño de la muestra, pero p se calcula a partir de la muestra. Existen ocasiones
en las cuales se tiene una idea del comportamiento de la proporción de la
población y ese valor se puede sustituir en la fórmula, pero si no se sabe nada
referente a esa proporción entonces se tienen dos opciones:

 Tomar una muestra preliminar mayor o igual a 30 para proporcionar una


estimación de P. Después con el uso de la fórmula se podría determinar de
forma aproximada cuántas observaciones se necesitan para proporcionar el
grado de precisión que se desea.
 Tomar el valor de p como 0.5 ya que sustituyendo este en la fórmula se
obtiene el tamaño de muestra mayor posible. Observe el siguiente ejemplo:

Se desconoce el valor de P, por lo que se utilizarán diferentes valores y se


sustituirán en la formula para observar los diferentes tamaños de muestras. El
nivel de confianza que se utilizará es del 95% con un error de estimación de 0.30.

Página | 19
p n

0.10 3.84

0.20 6.82

0.30 8.96

0.40 10.24

0.50 10.67

0.60 10.24

0.70 8.96

0.80 6.82

0.90 3.84

Como se puede observar en la tabla anterior cuando P vale 0.5 el tamaño de la


muestra alcanza su máximo valor.

Página | 20
En el caso de que se tenga una población finita y un muestreo sin reemplazo, el
error de estimación se convierte en:

De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:

EJEMPLOS

1. En una muestra aleatoria de 500 familias que tienen televisores en la


ciudad de Hamilton, Canadá, se encuentra que 340 están suscritas a HBO.
¿Qué tan grande se requiere que sea una muestra si se quiere tener 95%
de confianza de que la estimación de P esté dentro de 0.02?

Solución:

Se tratarán a las 500 familias como una muestra preliminar que proporciona
una estimación de p=340/500=0.68.

Por lo tanto si basamos nuestra estimación de P sobre una muestra


aleatoria de tamaño 2090, se puede tener una confianza de 95% de que
nuestra proporción muestral no diferirá de la proporción real por más de
0.02.

2. Una legisladora estatal desea encuestar a los residentes de su distrito para


conocer qué proporción del electorado conoce la opinión de ella, respecto al
uso de fondos estatales para pagar abortos. ¿Qué tamaño de muestra se
necesita si se requiere un confianza del 95% y un error máximo de
estimación de 0.10?

Página | 21
BIBLIOGRAFIA

D.R., A. (2008). estadistica para administracion y la economia. Mexico:


CENGAGE.

https://es.scribd.com/doc/106656471/Unidad-3-PRUEBAS-DE-HIPOTESIS-CON-
UNA-MUESTRA
http://www.geocities.ws/e_gomez_lara/PHIPOTESIS.pdf
file:///C:/Users/paulo/Downloads/Prueba%20de%20Hip%C3%B3tesis.pdf

Página | 22

También podría gustarte