Science">
Nothing Special   »   [go: up one dir, main page]

Hipotesis1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 131

Tamaño de la Muestra

• Hasta ahora, se ha venido considerando el tamaño (n) de la muestra conocido,


pero para determinarlo tenemos que considerar
• La varianza Corresponde al grado de variabilidad que presentan las
unidades de la población.
• Mientras más grande sea 2 mayor será el tamaño de la muestra.
• El valor de supuestamente conocido, de lo contrario se debe estimar a
través de una investigación preliminar.
• En el caso de = PQ, sucede algo similar, pero se tiene la costumbre de tomar
P = 0,50 con lo cual se obtiene el máximo valor posible de n.

Nivel de confianza, Tiene relación directa con el tamaño de la muestra, por lo tanto
se dirá que a mayor nivel de confianza, mas grande debe ser el tamaño de la muestra.
Los valores de Z se obtienen de tabla. El nivel de significación fijado por el
investigador
Precisión de la estimación fijado por el investigador con el conocimiento que tenga
acerca del parámetro que piensa estimar). Se le conoce como error de muestreo (E),
siendo:
Tamaño de la Muestra

Recursos Humanos, Financieros y Tiempo, no entran dentro


de la determinación técnica del tamaño de la muestra, pero es
de suma importancia al establecer el tamaño de las
investigaciones

Cálculo en Poblaciones infinitas


Ejemplo 01 – T de la M

• Un auditor desea tener un nivel de confianza del 95% para que la verdadera
proporción de error no exceda del 2%. Si la población es muy grande, que
tamaño tendrá la muestra que va a tomarse, si el auditor estima que la
proporcion es del 5%?

Para cuando no se conoce el tamaño de la población:


n es el tamaño de la muestra ????
Z es el nivel de confianza = 0.95 95% 1.96
p es la variabilidad positiva = 0.05
q es la variabilidad negativa 0.95
E es la precisión o error = 0.02

n = (1.962) (0.05)(0.95) = 456 cuentas


0.022
Nivel de significación de Z
• Para el nivel de confianza sea igual al 95%, tenemos que
P(Z)=0.95
= ???

∞ = 1 – 0.95 = 0.05
= 0.05 / 2 = 0.025
= 1 – 0.025
= 0.975
Buscar 0.975 en tablas….
Z = 1.96
Z = 0.95 α = 0.05
= 1 – (0.05/2) = 0.975
buscamos en tabla:Z = 1.96
• La muestra es de aproximadamente 384 unidades
Ejemplo 02 – T de la M
• En un lote grande de medicinas, se desea verificar que la
proporción de los ingredientes activos sea el adecuado. Se debe
determinar el tamaño de la muestra para un nivel de
confianza del 95% con un error del 5%. Supongamos que la
variabilidad p=q=0.5.
• n es el tamaño de la muestra = ???
• Z es el nivel de confianza = 95%
• p es la variabilidad positiva = 0.5
• q es la variabilidad negativa =0.5
• E es la precisión o error = 0.05

n = (1.962)(0.5)(0.5) = 384 unidades


(0.05)2
Ejemplo 03 – T de la M…. resolver

El mantenimiento de cuentas puede resultar demasiado costoso, si el promedio de


compra por cuenta, baja de cierto nivel. El gerente de un gran almacén por
departamentos desea estimar el promedio de lo comprado mensualmente por los
clientes que usan la cuenta de crédito, con un error de $2.500, y una probabilidad
aproximada de 0.95. Cuantas cuentas deberá seleccionar, si sabe que la desviación
estándar es de $30.000, la cual fue obtenida de los balances mensuales de las cuentas
de crédito?
n es el tamaño de la muestra = ???
Z es el nivel de confianza = 95%
desviación estándar = 30.000
E es la precisión o error = 2.500

Respuesta :
Ejemplo 04 – T de la M … Resolver

n es el tamaño de la muestra = ???


Z es el nivel de confianza = 0.90
P variable positiva = 0.5
E es la precisión o error = 0.08
Q = 0.5

Respuesta :
n = (1.65)2(0.5)(0.5) = 0.68 = 106
0.08)2 0.0064
AQUÍ SIGUE…..
Tamaño optimo para poblaciones finitas
• En caso de que el tamaño de la población sea conocido y la varianza poblacional se conozca, el
tamaño de muestra se determina de la siguiente forma:

Donde:
• n = tamaño de muestra
• N = tamaño de la población objeto de estudio
• = valor de la normal estándar α/2
• 2 = varianza poblacional
• E = precisión o máximo error de muestreo propuesta por el investigador
Ejemplo 04 – T de la M

Calcular el tamaño de la muestra de una población de 500 elementos con un


nivel de confianza del 95%.
Solucionemos:
N = 500, para el 95% de confianza
Zα =1.64
E = 0.05
σ = 0.5 Si no se tienen los demás valores se usa

n= (500)(1.64)2(0.5)2 = 336.2 = 175.11

(500-1)(0.05)2+(1.64)2(0.5)2 1.9199
Ejemplo 05 – T de la M

Que tamaño deberá tener una muestra para estimar dentro del 3%, la proporción
de mujeres casadas que van periódicamente a consulta ginecológica, en una
población de 5.000 mujeres y una seguridad del 95%.
• E = 3% N = 5.000 Z =1,96 ; Como no se conoce P, se tiene que
• P =0,50

n = 880 mujeres
Ejemplo,
La fuerza de la tensión de adhesión del mortero de cemento portland es una característica importante del
producto. Un ingeniero está interesado en comparar la fuerza de una formulación modificada en la que se han
agregado emulsiones de látex de polímeros durante el mezclado, con la fuerza del mortero sin modificar. El
experimentador ha reunido 10 observaciones de la fuerza de la formulación modificada y otras 10 observaciones
de la formulación sin modfficar. Los datos se muestran en la tabla 2-1. Podría hacerse referencia a las dos
formulaciones diferentes como dos tratamientos o como dos niveles del factor formulaciones.
En la figura 2-1 se grafican los datos de este experimento.

Datos de la fuerza de la tensión de adhesión del experimento de la formulación del


cemento portland

Mortero Mortero
j modificado Mortero sin (Y1 - )2 (Y2 - )2
modificar Y1 modificar
Y1 Y2
1 16.85 17.5 0.007396 0.178084
2 16.4 17.63 0.132496 0.085264
3 17.21 18.25 0.198916 0.107584
4 16.35 18 0.171396 0.006084
5 16.52 17.86 0.059536 0.003844
6 17.04 17.75 0.076176 0.029584
7 16.96 18.22 0.038416 0.088804
8 17.15 17.9 0.148996 0.000484
9 16.59 17.96 0.030276 0.001444
10 16.57 18.15 0.037636 0.051984
167.64 179.22
= 16.764 17.922 0.90124 0.55316

VARIANZA

2
`= 0.090124 0.055316

`= 0.30 0.24
Métodos gráficos simples como ayuda para analizar los datos de un experimento: El
diagrama de puntos, uy útil para representar un cuerpo reducido de datos (hasta unas 20
observaciones).
El diagrama de puntos permite ver de inmediato la localización o tendencia central de
las observaciones y su dispersión.
• Por ejemplo, en el experimento de la fuerza de tensión de adhesión del cemento portland, el
diagrama de puntos revela, que probablemente las dos formulaciones difieran en la fuerza
promedio, pero que ambas producen aproximadamente la misma variación en la fuerza.
Cuando los datos son muy numerosos, es difícil distinguir las observaciones graficadas en un
diagrama de puntos, y sería preferible un histograma
La media aritmética de la suma de dos variables

• La media aritmética de la suma de dos variables, es igual a la suma de las dos medias correspondiente a las
dos variables.
Un modelo de los datos

• Con frecuencia los resultados de un experimento se describen con un modelo. Un


modelo estadístico simple que describe los datos de un experimento

donde
yij es la observación j-ésima del nivel i del factor,
μ es la media de la respuesta para el nivel i-ésimo del factor, y
eij es una variable aleatoria normal asociada con la observación ij-ésima. …
o también componente del error aleatorio del modelo
Prueba de hipótesis e
Intervalos de confianza

• HIPÓTESIS ALTERNATIVA: Correspondiente a la prueba de hipótesis, siendo la


alternativa del parámetro sometida a prueba, la cual se considera verdadera cuando
rechazamos la hipótesis nula

• HIPÓTESIS ESTADÍSTICA: Es un supuesto que se hace acerca de u valor


estadístico de la población, denominado parámetro

• HIPÓTESIS NULA: Es aquella hipótesis que se quiere probar, la cual consideramos


como verdades, distinguiéndola de la hipótesis alternativa.
Hipótesis
• Son suposiciones que relacionan una variable con otra y que serán
probadas a través de la investigación, con el fin de ser aceptadas o
rechazadas por medio de los resultados obtenidos.
• Son ante todo, enunciados que expresan afirmaciones o negaciones
sobre la realidad.

• Es una conjetura o aseveración relacionada con una o más


poblaciones.
• En la mayoría de procesos no es posible trabajar con toda la población
y por tanto se realizan los estudios utilizando muestras.
• Los datos obtenidos se utilizan para establecer la falsedad o
veracidad de la hipótesis.
• Los datos de la población que den inconsistencia con la hipótesis
establecida determinan su rechazo, en tanto que los que la apoyan su
aceptación.
HIPÓTESIS ESTADÍSTICA
• Las pruebas de hipótesis, denominadas también Prueba de significación, tienen
como objeto principal evaluar suposiciones o afirmaciones acerca de los valores
estadísticos de la población, denominados parámetros.
• La palabra docimar significa probar.
• Cuando se hace indispensable tomar una decisión sobre la validez representación en
una población, con base en os resultados obtenidos a través de una muestra se dice
que se toman decisiones estadísticas.
• Para tomar una decisión, es necesario ante todo, plantear posibilidades acerca
de la característica o características a estudiar en una población determinada.
• La suposición puede ser cierta o falsa.
• Estas suposiciones se llaman hipótesis estadísticas.
• Hipótesis estadística: son supuestos acerca de un parámetro o de algún
valor estadístico de una población.
Una hipótesis estadística puede considerare como afirmación
acerca de una característica ideal de una población sobre la cual
hay inseguridad en el momento de formularla y que, a la vez es
expresada de tal forma que pueda ser rechazada
HIPÓTESIS ESTADÍSTICA
CARACTERÍSTICAS:
• Puede ser o no verdaderas.
• Se refiere a una situación real.
• Se refiere a una sola relación entre variables.
• Precisa, concreta, clara y lógica.
• Se refiere a variables y relaciones observables y medibles.
• Consideran técnicas disponibles para su contraste.

CLASIFICACIÓN:
• De investigación (generales o específicas), las cuales pueden
responder en forma amplia a las interrogantes planteadas en el
Marco Teórico respecto al problema en estudio;
• Estadísticas, son las que expresan la relación en términos
matemáticos.
HIPÓTESIS ESTADÍSTICA
• Es un enunciado o afirmación ya sea acerca de los parámetros de una distribución de probabilidad o de los
parámetros de un modelo.
• La hipótesis refleja alguna conjetura acerca de la situación del problema.
• Por ejemplo, en el experimento del cemento portland, puede pensarse que las fuerzas de la tensión de
adhesión promedio de las dos formulaciones del mortero son iguales. Esto puede enunciarse formalmente
como

donde :
• μ 1 es la fuerza de la tensión de adhesión promedio del mortero modificado y
• μ2 es la fuerza de tensión de enlace promedio del mortero sin modificar.
Al enunciado H0 : μ1 = μ 2 se le llama la hipótesis nula y a
H1 : μ1 ≠ μ2 se le llama la hipótesis alternativa.
A la hipótesis alternativa que se especifica aquí se le llama hipótesis alternativa de dos colas porque sería
verdadera si μ 1 < μ2 o si μ 1 > μ2•
Ejemplo,
La fuerza de la tensión de adhesión del mortero de cemento portland es una característica importante del
producto. Un ingeniero está interesado en comparar la fuerza de una formulación modificada en la que se han
agregado emulsiones de látex de polímeros durante el mezclado, con la fuerza del mortero sin modificar. El
experimentador ha reunido 10 observaciones de la fuerza de la formulación modificada y otras 10 observaciones
de la formulación sin modfficar. Los datos se muestran en la tabla 2-1. Podría hacerse referencia a las dos
formulaciones diferentes como dos tratamientos o como dos niveles del factor formulaciones.
En la figura 2-1 se grafican los datos de este experimento.

Datos de la fuerza de la tensión de adhesión del experimento de la formulación del


cemento portland

Mortero Mortero
j modificado Mortero sin (Y1 - )2 (Y2 - )2
modificar Y1 modificar
Y1 Y2
1 16.85 17.5 0.007396 0.178084
2 16.4 17.63 0.132496 0.085264
3 17.21 18.25 0.198916 0.107584
4 16.35 18 0.171396 0.006084
5 16.52 17.86 0.059536 0.003844
6 17.04 17.75 0.076176 0.029584
7 16.96 18.22 0.038416 0.088804
8 17.15 17.9 0.148996 0.000484
9 16.59 17.96 0.030276 0.001444
10 16.57 18.15 0.037636 0.051984
167.64 179.22
= 16.764 17.922 0.90124 0.55316

VARIANZA

2
`= 0.090124 0.055316

`= 0.30 0.24
Establecer H0 y Ha
Hipótesis nula Hipótesis alternativa
𝑯𝟎 𝑯𝟏

Enunciado relativo al valor de un Enunciado que se acepta si la


parámetro poblacional que se muestra reúne suficiente evidencia
quiere probar. para rechazar la hipótesis nula.

Hipótesis nula 𝑯𝟎 : 𝑬𝒙𝒑𝒓𝒆𝒔𝒊ó𝒏

Hipótesis alternativa 𝑯𝟏 : 𝑬𝒙𝒑𝒓𝒆𝒔𝒊ó𝒏


PRUEBA DE HIPÒTESIS

Ho: Es considerada como la hipótesis nula, ya que


hace referencia al valor del parámetro que se
quiere probar como verdadero.

H1, Ha Corresponde a la hipótesis alternativa o


falsa, estableciendo que el parámetro puede ser
mayor, menor o igual, de acuerdo con la
propuesta hecha en la hipótesis nula.

Una hipótesis estadística es una suposición acerca que una característica de la


población, que debe ser probada con base en la información proporcionada por una
muestra aleatoria.
Estimadores en la Prueba de Hipotesis
• Los parámetros mas frecuentes son sus estimadores
puntuales
• û = Ẋ La media muestral Ẋ, de un estimador
poblacional μ
• σ2 = S2 la varianza o La desviación estándar muestral S
es un estimador de desviación estándar poblacional σ
• pˆ = x/n La proporción muestra 𝒑
ෝ es un estimador
de la proporción poblacional p
Ejemplo 01 – Hip.
• Ejemplo. Supongamos que se efectúan 100 lanzamientos de una
moneda y que se obtienen 50 caras. Vamos a probar la legitimidad de
la moneda (que no esté cargada) al lanzar 100 monedas,

La hipótesis puede ser formulada con el fin de rechazarla


de acuerdo
.
• hipótesis nula y se representa por H o.
• hipótesis alternativa por H 1 .

El lanzamiento de 100 monedas, la hipótesis nula corresponde


a la legitimidad de la moneda,
• H 0: µ = 50 (obtención de 50 caras) ya que
p = 1/2 y µ = np = 100 (1/2) =50,
• Ha: µ ≠ 50 la hipótesis alternativa (que el numero de caras sea
mayor o menor de 50)
Tipo de Error
• En la decisión anterior de aceptar o rechazar la moneda (o
monedas) de acuerdo con el resultado obtenido, puede conducir a
error.
• Se consideran dos tipos de error:

Error tipo II. Aceptar la hipótesis nula (Ho) cuando se ha


debido rechazar.
“Aceptar la moneda como correcta, cuando en verdad no
lo es”.
Error tipo I. Rechazar la hipótesis nula (Ho) cuando se ha
debido aceptar.
“Rechazar la moneda como incorrecta, cuando en verdad
está equilibrada”.
Error tipo I y II
• Suponer que se dispone de datos y que se realiza una prueba estadística para
verificar la hipótesis, pueden ocurrir las siguientes situaciones al tomar una decisión:

• Suponer que la hipótesis propuesta Ho es


verdadera, pero la prueba estadística
dice que Ho es falsa, entonces al
rechazar la hipótesis propuesta
cometemos el Error Tipo I
• Suponer que la hipótesis propuesta Ho es
falsa, pero la prueba estadística dice que
Ho es verdadera, entonces al aceptar la
hipótesis propuesta cometemos el Error
Tipo II.

• Ambos errores pueden tener consecuencias importantes al tomar una decisión en


una situación real.
• Por lo tanto es necesario cuantificar la probabilidad de cometer cada tipo de error.
Ejemplo – Hip.
• Ejemplo. Supongamos con base en una muestra aleatoria, que
deseamos probar la hipótesis de que el precio medio de un apartamento
con tres dormitorios y dos baños, en un barrio de la ciudad es de
$180,000.00. Explique ¿en qué condiciones cometeríamos un error y de
qué tipo?
• H 0: µ = $180,000

• Error de tipo II, si aceptamos que el precio del apartamento


descrito es de $180,000.00 dólares, cuando no lo es.
• Error tipo I, si rechazamos el precio de $180,000.00, cuando es
cierto.
• El que un error de tipo I o tipo II se cometa, depende de cómo sea formulada la
hipótesis

Error tipo II. Aceptar la hipótesis nula (Ho) cuando se ha debido rechazar.
Error tipo I. Rechazar la hipótesis nula (Ho) cuando se ha debido aceptar.
Ejemplo. 02 - Hip
Supongamos que el decano de la universidad desea contratar los servicios del
profesor Pérez, para ello es sometido a una entrevista, bajo las siguientes
hipótesis:
a) El profesor Pérez es competente para desarrollar la labor.
b) El profesor Pérez no es competente para esa labor
c) ¿En qué condiciones el decano cometerá errores de tipo I y de tipo II, en
cada caso?

• Ho :
a) Error tipo I: decidir que el señor Pérez no es competente si
realmente lo es.
• Error tipo II: decidir que el señor Pérez es competente si realmente no lo
es.
b) Error tipo I: decidir que el señor Pérez es competente cuando
realmente no lo es.
• Error tipo II: decidir que el señor Pérez no es competente cuando
realmente lo es.
Hipótesis nula y alternativa
• La hipótesis nula es aquella por medio de la cual se hace una afirmación sobre un
parámetro que se va a constatar con el resultado muestral.
• Cuando el fabricante dice que su producto tiene una duración de 5.000 horas, se le
considera como hipótesis nula, pues es lo que se quiere probar.

• La hipótesis alterna, es toda aquella hipótesis que difiere de la hipótesis nula, es


decir, ofrece una alternativa, afirmando que la hipótesis nula es falsa.
• Ejemplo, se puede decir que la hipótesis alternativa podrá ser:
• El fabricante ha exagerado la duración del producto (prueba unilateral a la
izquierda).
• El producto tiene una duración superior al señalado por el fabricante (prueba
unilateral a la derecha).
• La duración del producto no es la señalada por el fabricante (prueba bilateral).
Procedimiento a seguir en las pruebas de
Hipótesis
1. Formular la hipótesis nula y la alternativa.
2. Seleccionar el nivel de significación
3. Conocer o estimar la varianza
4. Determinar la técnica y la prueba estadística
5. Determinar los valores críticos y sus regiones de rechazo
6. Calcular los datos muestrales, utilizando las formulas correspondientes
7. Tomar la decisión estadística, de acepta o rechazar
Procedimiento en las pruebas de Hipótesis
1. Establecer las hipótesis:

a) En el caso de la moneda (normal) y en distribuciones de medias muestrales


se podrían presentar las hipótesis de las siguientes formas

b) En las proporciones se escribirá para cada caso,


Procedimiento en las pruebas de Hipótesis

2. Elegir el riesgo α = %
a) Los niveles de significación más utilizados son:

3. Se establecen ciertos supuestos


a) La muestra es aleatoria.
b) La población es normal.
c) La varianza poblacional es conocida (en la mayoría de
los casos no se conoce, por lo tanto debe ser estimada).
Procedimiento en las pruebas de Hipótesis
4. Se formula la respectiva variante estadística:
a) Distribución normal

b) Distribución de medias muestrales

c) Distribución de proporciones muestrales


Procedimiento en las pruebas de Hipótesis

d) Distribución de diferencias entre dos medias muestrales

(n1 y n2 > 30)

e) Distribuciones de diferencias entre dos proporciones muestrales

(n1 y n2 > 30)


Procedimiento en las pruebas de Hipótesis
5. Formular los puntos críticos: Zi y Zs

a) Al trabajar con un nivel de significación del 5% de dócima bilateral,


se tendrá:
Zs = 1,96 y Zi = −1,96
b) Con el mismo nivel de significación del 5% de docima bilateral se
tiene:
Zs = 1,96 y Zi = -1,96

6. Descripción de la región crítica:


(Bilateral con un = 0,05)

Zs ≥ 1,96
Zi ≤ −1,96
Procedimiento en las pruebas de Hipótesis
6. Descripción de la región crítica:
(Bilateral con un = 0,05)

7. Adoptar una decisión, se acepta o se rechaza la hipótesis nula, de acuerdo al nivel


de significación dado.
Prueba unilateral y bilateral

• La prueba de hipótesis Unilateral es aquella en la cual la zona de rechazo o zona


critica esta completamente comprendida en uno de los extremos de la
distribución,
• La prueba unilateral a la derecha de la curva cuando la hipótesis alternativa de
lo que se quiere es probar, hace mención Ej. Los salarios que paga una empresa son
mayores; que la calidad del producto es superior; que el rendimiento academico es
mejor, etc.
• Si por el contrario, la hipotesis alternativa se refiere a que los salarios son
inferiores, que el prod es de menos calidad, que el rendimiento académico es bajo
etc, corresponde una prueba unilateral a la izquierda.

• En el caso de que la prueba comprenda áreas o zonas de rechazo en ambos


extremos de la distribución, se dice que la prueba es bilateral o que la
hipótesis alternativa es diferente, por lo tanto se omiten los términos … superior,
mayor, mejor, inferior, bajo… etc
Nivel de significación
• Se entiende por nivel de significación, la máxima probabilidad de que se especifique
con el fin de hacer minimo el primer tipo de error. Generalmente, esta probabilidad se
fija antes de escoger la muestra.
• El nivel de significación se simboliza por alfa ( ,,) siendo generalmente el 1%, 5%, 10%
… pero se puede usar cualquier valor, dependiendo del tipo de investigación. Existe la
costumbre de trabajar con el 5%, generalmente cuando el enunciado del problema no
lo da.
• puede usar cualquier nivel, dependiendo del tipo de investigacion que se adelante.
Existe la costumbre
• Cuando se trabaja con el 5%, el resultado es significativo, y mas si es 1%, pero si se
trabaja con el !0% es poco significativo.
• El valor del nivel de significación corresponde a un área bajo la curva de probabilidad
o normal, denominada región critica o zona de rechazo.
• Si esta esta a la derecha se trata de una docima unilateral a la derecha…si es a la
izquierda, de una docima unilateral a la izquierda, si son 2 regiones criticas será una
docima bilateral.
• En las docimas unilaterales se tomara el valor total de alfa; para las docimas
bilaterales alfa se dividirá por dos. La región no sombreada o no cubierta por el nivel
de significación es la zona de aceptación
Regiones Criticas
En tabla
Significancia del 5%
1-0.05= 0.95
Z = 1.64 ò 1.65
Nivel de significación o Intervalo de confianza

El nivel de confianza es equivalente a (1 - el nivel alfa).


si el nivel de significación es 0.05, el nivel de confianza correspondiente
es del 95%.

Un intervalo de confianza de nivel 100 (1 - ∞)%

• Para una muestra grande:


Estimador puntual  Z/2 (Error estándar del estimador)

• Donde Zα/2 es el valor de Z con un área α/2 en


la cola derecha de una distribución estándar.
• Esta formula genera 2 valores: Limite de
confianza inferior y el limite superior
Ejemplos, Distribución de medias muestrales
• Prueba cuando se conoce la varianza poblacional , Cuando no es conocida deberá ser
ustituida por la varianza muestral S2 (ciando la muestra es grande > 30)
Se establecen ciertos supuestos la varianza poblacional
a) La muestra es aleatoria.
b) La población es normal.
c) La varianza poblacional es conocida (en la mayoría de los casos no se conoce, por
lo tanto debe ser estimada).
Ejemplo 03 - Hip
• Un inspector de calidad investiga las acusaciones contra una
embotelladora por su deficiente llenado que debe ser, en
promedio, de 32,5 onzas. Para ello toma una muestra de 60
botellas, encontrando que el contenido medio es de 31,9 onzas de
líquido. Se sabe que la máquina embotelladora debe producir un
llenado con una desviación típica de 3,6 onzas. ¿Puede el inspector
llegar a la conclusión, a un nivel de significación del 5%, que se
están llenando las botellas por debajo de su especificación de
contenido?
μ= 32.5 s = 3.6 n = 60 = 31.9
b) = 0,05

c)  = 3,6

= -0.6/.4648 = -1.291

Como -1,29 se sitúa en la zona de aceptación, es válida la


hipótesis nula,
significa que el inspector no debe llegar a la conclusión, que se
está llenando y vendiendo un producto por debajo de su
especificación, al nivel del 5%.
Ejemplo 04 - Hip
• Un proceso está programado para empacar la cantidad media, de una
libra (16 onzas) de café. Se toma una muestra aleatoria de 36 paquetes;
resulta una media de 14,2 onzas y desviación típica de 5,3 onzas. Al nivel
del 5%, ¿se podrá afirmar que no se está cumpliendo con lo indicado en
el empaque?
• En este caso la prueba es bilateral.
Al nivel del 5%, se podrá afirmar que
no se está cumpliendo con lo indicado
por la fábrica. Se puede ver que -2,04
se ubica en la región crítica, por lo
tanto se estará rechazando la
hipótesis nula y aceptando la hipótesis
alternativa.
(ver 41)
Ejemplo 05 - Hip
• Ejemplo 3 En el correo loca – área de remesas se tienen 500 paquete con
diferentes pesos en kls para ser remitidas a diferentes partes del pais. Para
conocer el peso promedio de los paquetes se selecciono una muestra de 16 de ellas, con
los siguientes resultados:
62 43 60 49 72 56 45 46 37 56
41 43 36 45 56 49
Se sabe que la desviación estándar poblacional es de 10, pero es desconocida la media
poblacional (pero μ = 50, cuando es verdades) Cometiendo el riesgo alfa (nivel de
signficacio) del 5%, docimar o probar la hipótesis de que la media poblacional sea igual :
a)40 b)49 c)50 d)51 e)60
• Como se conoce la media poblacional verdadera, se puede comprobar si la decisión
adoptada es correcta o no. Para cada uno de los 5 casos anteriores establecer si la
decisión es correcta y en caso contrario indicar el tipo de error cometido.
Z = 3,9 cae en la región critica ( Z > 1,96) por lo tanto se rechaza la hipótesis de
que μ = 40 sabiendo que la verdades es μ = 50, rechazamos algo falso por lo tanto
no hay error al nivel del 5%
Z =1,96

Siendo que Z = 30 cae en la zona de aceptación, es decir aceptamos que


μ = 49 (la verdadera μ = 50) aceptamos algo falso error tipo II al 5%.
Distribución de Proporciones Muestrales

• la desviación típica y el error estándar de la proporción, se calcula con


datos obtenidos en la muestra, con más de 30 elementos. La varianza de la
proporción se calculará con valores muestrales
Ejercicios
• Un gerente de una compañía afirma, que el porcentaje de atrasos
en las horas de llegada al trabajo cobija al 25% de sus
empleados. Solicita al jefe de personal la revisión de 40 tarjetas
marcadas con las horas de llegada, en la quincena y encuentra
que 8 han llegado tarde.
• Al nivel del 5%, ¿hay razón para concluir que el gerente de la
compañía está exagerando?
Se ubica Z = -0,79 en la zona de aceptación; por lo tanto
podemos concluir, que al nivel del 5% el gerente no está
exagerando
Ejemplo 06 – Hip prop muest
Por estadísticas que se tienen, se ha podido establecer que por lo menos el
40% de los jóvenes toman regularmente Coca-Cola, cuando tienen sed. Una
muestra aleatoria de 450 jóvenes reveló que 200 de ellos solían tomar dicha
bebida, cuando tenían sed.
¿Cuál podría ser su conclusión al nivel del 1%, acerca de lo que muestran las
estadísticas?
UNIDAD 3
III. PRUEBA DE HIPÓTESIS PARA UNA MUESTRA. REGRESIÓN LINEAL Y
CORRELACIÓN
1. Definición de muestreo y otros conceptos Fundamentales para entender el
muestreo.
2. Tipos de muestreo:
1. Muestreo aleatorio simple.
2. El tamaño de muestra
3. Muestreos proporciones.

3. Conceptos fundamentales de prueba de Hipótesis y su clasificación.


1. Prueba de hipótesis para la media y para Proporciones.
2. Prueba de hipótesis para la diferencia de media y para proporciones.
3. Prueba de hipótesis para la diferencia de media y para proporciones relación.
4. Prueba Chi Cuadrada.
5. Test de correlación Rho-Spearman.
Estimación por intervalo
Una alternativa para reportar un solo valor del parámetro
que se esté estimando es calcular e informar todo un
intervalo de valores posibles, un estimador de intervalo o
intervalo de confianza (IC).

Un intervalo de confianza se calcula siempre seleccionando


primero un nivel de confianza, que es una medida del grado
de fiabilidad en el intervalo.

Un nivel de confianza de 95% implica que ese porcentaje de


todas las muestras daría lugar a un intervalo que incluye μ o
cualquier otro parámetro que se esté estimando, y sólo 5% de
las muestras producirá un intervalo erróneo.

Cuanto mayor sea el nivel de confianza podremos creer que


el valor del parámetro que se estima está dentro del
intervalo.
Intervalo de confianza
Un intervalo deconfianzadenivel100(1-α )%
para unamuestra grande :
Estimador puntual  Z/2 (Error estándar del estimador)
Donde Zα/2 es el valor de Z con un área α/2 en la cola
derecha de una distribución estándar,
Esta formula genera 2 valores.
Limite de confianza inferior (LCL y
el limite superior (UCL)
Intervalo de confianza para la media
poblacional de una muestra grande
Un intervalo de confianzade nivel 100(1-α ) %
para μ es :

n = tamaño de la muestra
 = desviación estándar de la población muestreada
Cuando el valor de  es desconocido, se puede sustituirpor la
desviación estándar muestral, s:
X  s
n
Ejemplo
Se ha tomado una muestra aleatoria de 50 artículos producidos por una industria y se
obtuvo que la media muestral del peso de los artículos fue 165 gr. con una desviación
estándar de 40 gr. Encuentre un intervalo para la media poblacional, con un nivel de
confianza de 98%.

Parámetro: μ (población con distribución desconocida)


Estimador: X
n ≥30: muestra grande
Intervalo de confianza de un lado
El nivel de confianza 100(1- )%con límite inferior de
confianza para  es :

𝑋ҧ + z  X
Un nivel 100(1- )%con límite superiorde conianza
para  es :
𝑋ҧ + z  X
Cuando el valor de es desconocido, se puede sustituir
por la desviación estándar muestral, s :
s
X 
n
Ejercicio 1

Una empresa de material eléctrico fabrica bombillas de luz que


tienen una duración aproximadamente distribuida de forma
normal, con una desviación estándar de 40 horas. Si una muestra
de 30 bombillas tiene una duración promedio de 780 horas,
encuentre un intervalo de confianza de 96% para la media de la
población de todas las bombillas que produce esta empresa.
1. Una empresa de material eléctrico fabrica bombillas especiales para
cuarto dehotel, que tienen una - Brainly.lat

2. Problemas de inferencia estadistica | Superprof


Error en la estimación
Si se utiliza x como una estimación de , podemos tener una
confianza de(1 - )100% deque elerrornoexcederá

z 2
n

Si x se usa como estimación de , podemos tener (1-


)100%
 2
deconfianzaqueelerrorno excederáunacantidadespecíficae
 z 2 
cuandoel tamañode la muestra sea n =  
 e 
Ejercicio 2
De acuerdo al ejemplo anterior, ¿qué tan grande se requiere
una muestra si queremos tener 96% de confianza de que la
estimación de  difiera por menos de 0.5?
C a s o d e  desconocida
¿Cómo determinamos un intervalo de confianza
para la media si desconocemos la varianza muestral?
Utilizando la distribución t.
Si 𝑋ത y S son la media y la desviación estándar de una
muestra aleatoria de una población con varianza  2
desconocida,un intervalo de confianza de (1-  )100%
s s
para  es x −t 2    x + t 2
n n

donde t 2 es el valor t con v = n -1 grados de libertad


que deja un área de  2
Ejercicio 3
Una muestra aleatoria de 10 barras de chocolate energético de
cierta marca tiene, en promedio, 230 calorías con una desviación
estándar de 15 calorías. Construya un intervalo de confianza de
99% para el contenido medio de calorías real de esta marca de
barras de chocolate energético. Suponga que la distribución de
calorías es aproximadamente normal.
Clase 1, muestreo aleatorio, dist muestreo y estimadores by oscar poveda -
issuu

PROBABILIDAD Y ESTADISTICA. 72
Estimación de una proporción
Un estimador puntual de la proporción p en un
experimento binomial está dado por el
estádístico P = X n , donde X representa el
número de éxitos en n pruebas. Por
lo tanto, la proporción de la muestra p̂ = x n
será el estimador puntual del parámetro p.
Tal proporción sigue una distribución normal estándar con el
estadístico.

P̂ - p
Z=
pq n
Donde Pˆ es la proporción de la muestra.

P es la proporción de éxitos poblacional.

q = 1 - p y n es el tamaño de la muestra.
Estimación de una proporción

Media :  p̂ = E (P̂ )= E   =
X np
=p
n n
 2
npq pq
Varianza :  pˆ2 =  X2 n = 2X = 2 =
n n n

Por lo tanto podemos asegurar


que P(- z 2  Z  z 2 )= 1− 

P̂ - p
donde Z=
pq n
Intervalo de confianza de p de una
muestra grande
•Si p̂ eslaproporcióndeéxitosenunamuestra aleatoriade tamañon,
yq̂ =1- p̂,unintervalode confianzaaproximadode(1- )100%para
el parámetrobinomial pestádado

pˆ- z 2 pˆqˆ n  p  pˆ+ z 2 pˆqˆ n


donde z 2 eselvalorzquedejaun áreade /2
a la derecha
Error en la estimación
Si seutiliza pˆcomounaestimaciónde p,podemostener
unaconfianza de (1-  )100% deque el error noexcederá

z 2 p̂q̂ n

Si pˆseusacomoestimacióndep,podemostener
(1-  )100% deconfianzaqueelerrorserámenor
queunacantidadespecífica e cuandoel tamaño
z 2 p̂q̂
delamuestraseaaproximadamenten=
e2
Ejercicio 4.
Un fabricante de reproductores de discos compactos utiliza un
conjunto de pruebas amplias para evaluar la función eléctrica
de su producto. Todos los reproductores de discos compactos
deben pasar todas las pruebas antes de venderse. Una
muestra aleatoria de 500 reproductores tiene como resultado
15 que fallan en una o más de las pruebas. Encuentre un
intervalo de confianza 9 0 % para la proporción de los
reproductores de discos compactos de la población que no
pasan todas las pruebas.
Ejercicio 5.
Calcula un intervalo de confianza de 98% para la proporción
de artículos defectuosos en un proceso cuando se
encuentra que una muestra de tamaño 100 da como
resultado 8 defectuosos.
E s t i m a c i ó n d e la v a r ia n z a

Si s 2 es la varianza de una muestra aleatoria de tamaño


n de una población normal, un intervalo de confianza
de
(1- )100% para  2 es
(n −1)s 2   2  (n −1)s 2
2 2 1−2  2
donde  2 2 y 1−2  2 son valores  2 con v = n -1
grados de libertad, que dejan áreas de  2 y 1- 2
,
respectivamente, a la derecha.
PROBABILIDAD Y 80
ESTADISTICA.
Estimación de la desviación
estándar

Unintervalodeconfianzade(1-  )100% para 


se obtiene al calcular la raíz cuadrada de cada
extremodelintervalopara  2

PROBABILIDAD Y ESTADISTICA.
Ejercicio 6. Una muestra aleatoria de 20 estudiantes obtuvo
una media de 72 y una varianza de 16 en un examen
universitario de colocación en matemáticas. Supón que las
calificaciones se distribuyen normalmente y construya un
intervalo de confianza de 98% para 2.

PROBABILIDAD Y ESTADISTICA.
Dos muestras
Estimación de la diferencia entre dos
medias
Six1 y x 2 son las medias de muestras aleatorias
independientes de tamaños n12y n2 de
convarianzasconocidas 1 y  2 ,
2
poblaciones
unintervalodeconfianzade (1-respectivamente,
 )100%para 1 − 2
estádadopor

 12  22  12  22
(x1 − x2 )− z 2 +  1 − 2  (x1 − x 2 )+ z 2 +
n1 n2 n1 n2

dondez 2 es elvalorzquedejaunáreade  2
aladerecha PROBABILIDAD Y 20
ESTADISTICA.
Ejercicio 7. Se comparan las resistencias de dos clases de
hilo. Cincuenta piezas de cada clase de hilo se prueban bajo
condiciones similares. La marca A tiene una resistencia a
la tensión promedio de 78.3 kilogramos con una desviación
estándar de 5.6 kilogramos; en tanto que la marca B
tiene una resistencia a la tensión promedio de
87.2 kilogramos con una desviación estándar de 6.3
kilogramos. Construye un intervalo de confianza de 95%
para la diferencia de las medias poblacionales.

PROBABILIDAD Y ESTADISTICA.
Estimado de unión de la
varianza

s 2
=
( )
n1 −1s + (n2 −1s
) 2
1
2
2
p
n1 + n2 − 2

PROBABILIDAD Y ESTADISTICA. 85
D o s m u e s t ra s
E s t i m a c i ó n d e la diferencia entre d o s m e d i a s
Va r i a n z a s d e s c o n o c i d a s - i g u a l e s

Si x 1 y x 2 son las medias de muestras aleatorias


independientes de tamaños n 1 y n 2 , de poblaciones
aproximadamente normales con varianzas iguales
pero desconocidas, un intervalo de confianza de
(1- )100% para 1 −  2 está dado por

1 1 1 1
(x1 − x 2 )− t  2sp +  1 − 2  (x1 − x2 )+ t 2sp +
n1 n2 n1 n2

PROBABILIDAD Y ESTADISTICA.
dondesp eslaestimacióndeunióndeladesviación
estándarpoblacionaly t 2 es elvalor t con
v= n1 + n2 - 2 gradosdelibertad,quedejaunárea
de  2aladerecha

PROBABILIDAD Y ESTADISTICA.
Ejercicio 8. En un proceso químico por lotes, se comparan los
efectos de dos catalizadores sobre la potencia de la
reacción del proceso. Se preparó una muestra de 12 lotes
con el uso del catalizador 1 y se obtuvo una muestra de
10 lotes con el catalizador 2. Los 12 lotes para los
que se utilizó el catalizador 1 dieron un rendimiento
promedio de 85 con una desviación estándar muestral de
4; en tanto que para la segunda muestra el promedio fue
de 81 con una desviación estándar muestral de 5.
Encuentra un intervalo de confianza de 90% para la
diferencia entre las medias poblacionales, suponiendo que
las poblaciones se distribuyen aproximadamente normal
con varianzas iguales.

PROBABILIDAD Y ESTADISTICA.
Dos muestras
Estimación de la diferencia entre dos
medias Varianzas desconocidas-diferentes
Six1 y s12 y x 2 y s22 son lasmediasyvarianzas
de muestras aleatorias independientes de tamaños
n1 y n2 de poblacionesaproximadamente normales
convarianzasdesconocidas y diferentes,unintervalo
deconfianzaaproximadode (1-  )100%para 1 − 2
estádado por
s12s
2
s2
s2
(x1 − x 2 )− t 2 + 2   −   (x1 − x2 )+ t 2 1 + 2
1 2
n1 n2 n1 n2

PROBABILIDAD Y ESTADISTICA.
donde t 2 esel valor t con

(s
2
n1 + s n2
2
)2

v=
(s ) (n − 1)+ (s ) (n −1)
1 2
2 2 2 2
1 n1 1 2 n2 2

grados de libertad, que deja un área de 


2
PROBABILIDAD Y 90
aladerecha
ESTADISTICA.
Ejercicio 9. Los siguientes datos representan los tiempos de
duración de las películas que producen dos compañías
cinematográficas. Calcula un intervalo de confianza de 9 0 %
para la diferencia entre los tiempos de duración promedio de
las películas que producen las dos compañías. Supón que las
diferencias de tiempo de duración se distribuyen de forma
aproximadamente normal con varianzas distintas.

Compañía Tiempo ( m i n u t o s )
I 103 94 110 87 98 120
II 97 82 123 92 135 88 118

PROBABILIDAD Y ESTADISTICA.
Datos no agrupados
n

X 1 + X2 ++ Xn
X i
X= = i=1
n n
Datos no agrupados
MUESTRA

(X − X )
n
2
i
sˆ2= i=1
n −1

PROBABILIDAD Y ESTADISTICA.
D o s m u e s t ra s
E s t i m a c i ó n d e la diferencia entre d o s
prSoippˆoyrcipˆonseosnlas proporcionesdeéxitos enmuestras
1 2

aleatoriasdetamaño n1 y n2 ,respectivamente,q̂1= 1− p̂1


y qˆ2= 1− pˆ2,unintervalo deconfianzaaproximadode
(1-  )100%para ladiferenciadedos parámetros
binomiales p1 − p2 estádado por

(p̂1 − p̂2 )− z  2 p̂1q̂1 p̂2q̂2


+  p1 − p2  (p̂1 − p̂2 )+ z 2 1 1 + 2 2
p̂ q̂ p̂ q̂
n1 n2 n1 n2

dondez 2 es elvalorzquedejaunáreade  2
aladerecha PROBABILIDAD Y 30
ESTADISTICA.
ingeniería en Estados Unidos. La muest
contiene 250 ingenieros eléctricos don
80 son mujeres; y 175 ingenieros químico
donde 35 son mujeres. Calcula un interva
de confianza de
90% para la diferencia entre la proporción de
mujeres en estos dos campos de la ingeniería. ¿Hay una
diferencia significativa entre las dos proporciones?

PROBABILIDAD Y 31
ESTADISTICA.
C. Estimación por intervalos
Las propiedades de los estimadores garantizan un cierto
comportamiento de su distribución de probabilidad.
Sin embargo, al resumir la información muestral en un único valor
(la estimación puntual) no hacemos, de forma explícita, ninguna
valoración sobre el error o discrepancia inherente al proceso de
estimación:
Estimador bueno =⇒ estimación buena
por término medio

• La estimación por intervalos permite medir, en términos de


probabilidad o de confianza, la precisión con la que el estimador
permite estimar el parámetro:
• En términos probabilísticos (Antes de observar la muestra ) En
términos de confianza (Con la muestra observada)
C. Estimación por intervalos
• Muchas veces es preferible proporcionar un intervalo dentro del cual
cabría esperar que estaría incluido el valor del parámetro o los
parámetros en cuestión.
• A las declaraciones de estos intervalos se les llama intervalos de
confianza. En muchos experimentos de ingeniería e industriales, el
experimentador sabe de antemano que las medias μ1 y μ2 difieren; por
consiguiente, la prueba de la hipótesis μ1 = μ2 es de escaso interés.
• Por lo general el experimentador estaría más interesado en un
intervalo de confianza para la diferencia en las medias μ1-μ2
• Para definir un intervalo de confianza, suponga que ϑ es un parámetro
desconocido. Para obtener una estimación del intervalo de ϑ, es
necesario encontrar dos estadísticos L y U tales que la declaración
deprobabilidadP(L ≤ 𝜽 ≤ U) = 1 – α sea verdadera
• Al intervalo

L≤ 𝜽 ≤U se le llama intervalo de confianza de


100(1-a) por ciento para el parámetro ϑ.
• A los los estadísticos L y U se les llama los límites de confianza inferior y
superior, respectivamente, y a 1- se le llama el coeficiente de confianza.
• Si a = 0.05, a la ecuación L ≤ 𝜽 ≤ U se le llama intervalo de confianza de 95%
para ϑ
• Observe que los intervalos de confianza tienen una interpretación de
frecuencia; es decir, no se sabe si la declaración es verdadera para esta
muestra específica, pero sí se sabe que el método usado para generar el intervalo
de confianza produce declaraciones correctas en 100(1 - a) % de las veces.
• Suponga que quiere encontrarse un intervalo de confianza de 100(1-α)% para la
verdadera diferencia de las medias μ1 - μ2 en el problema del cemento
portland. El intervalo puede deducirse de la siguiente manera. El estadístico.
Intervalo de confianza para μ con 𝝈𝟐
desconocido

Sea 𝑋𝑖~𝑁(μ, 𝜎) y tomamos una muestra aleatoria 𝑋1, 𝑋2,…, 𝑋𝑛 . Sabemos que el
ҧ 𝑋ҧ𝑛−𝜇
estimador 𝑋 ~𝑁(μ, 𝜎/ 𝑛). Dado que 𝜎 es desconocida, sabemos que ~ 𝑡 𝑛− ,
𝑠/ 𝑛
entonces: 1
𝑋ҧ𝑛− 𝜇
𝑃 −𝑡𝑛−1,𝛼/2< 𝑠 < 𝑡𝑛−1, 𝛼/2 =1−𝛼
𝑛
𝑠 𝑠
𝑃 𝑋ҧ − 𝑡𝑛 −1,𝛼 /2 < 𝜇 < 𝑋ҧ + 𝑡𝑛−1,𝛼/2 . =1−𝛼 n < 30
𝑛 𝑛

𝑪𝑰𝟏−𝑎 𝝁 ,con 𝝈 desconocido:


𝑠
𝑠 𝑋ҧ 𝑛 ± 𝑡𝑛−1,𝛼/2 .
Nota: Si n ≥ 30 t ~ N(0,1) 𝑋ҧ ± 𝑍𝛼 /2.
𝑛
𝑛
Intervalo de confianza para μ con 𝝈𝟐 desconocido

O
• Al comparar ambas ecuaciones:

• es un intervalo de confianza de 100(1 - α) por ciento para μ1 - μ2


Ejemplo
• La estimación real del intervalo de confianza de 95% para la diferencia en la
fuerza de la tensión de adhesión promedio de las formulaciones del mortero de
cemento portland se encuentra haciendo la siguiente sustitución en la
ecuación ultima…
Z=95% Z=0.95
Z1- /2 = Z 1-(0.05/2) = 1-0.025 = 0.975
C.- Estimación por intervalo
• La "estimación por intervalo" consiste en determinar un par de valores a y b,
tales que constituidos en intervalo [a ,b] ; y para una probabilidad 1-α
prefijada (nivel de confianza) se verifique en relación al parámetro ϑ a
estimar se cumpla : La estimación puntual dirá poco sobre el parámetro
cuando la variación entre una estimación y otra es muy grande.
• Una forma de saber qué tan variable es el estimador, consiste en
calcular la desviación estándar o error estándar del estadístico
(σˆẊ ) visto como una variable aleatoria.
con cierto nivel de seguridad o confianza.

P(L ≤ 𝜽 ≤ U) = 1 –
• Operativamente para saber qué tan
α precisa es la estimación, se calcula un
intervalo de confianza que indique un rango “donde puede estar el
parámetro”
• Intervalo al 100(1 – α)% de confianza para un parámetro desconocido 𝜽,
consiste en estimar dos números (estadísticos) L y U, de manera que la
probabilidad de que 𝜽 se encuentre entre ellos sea 1 – α 1
C.- Estimación por intervalo

• Eje: Consideremos la desviación estándar, S y la media Ẋ , de


una muestra de tamaño n; Puesto que X, es una variable
aleatoria, ésta tiene su propia desviación o error estándar,
que se puede estimar mediante σˆẊ = S/ √n.
• La correcta interpretación de un intervalo de confianza es: si se obtuvieran 100
muestras independientes de la misma población o proceso, cada una de tamaño n
y para cada muestra se calculará el intervalo de confianza a 95% para el mismo
parámetro, entonces se espera que 95 de los 100 intervalos contengan el
verdadero valor de dicho parámetro.

• La longitud del intervalo de confianza es una medida de la precisión de la


estimación. De aquí que es deseable que la longitud de los intervalos sea pequeña
y con alto nivel de confianza.

1
i-1) Intervalos de Confianza para la Media con Varianza desconocida

• Es un intervalo de estimación construido con respecto a la media muestral, el


cual especifica la posibilidad de que en el intervalo esté comprendido el valor de la
media poblacional
P(L ≤ 𝜽 ≤ U) = 1 –
• Sea X1, X2, …, Xn
α
una muestra aleatoria de tamaño n de una población, con una
distribución normal con media μ y varianza σ2, ambas desconocidas.
• Para deducir el intervalo, se parte de un estadístico que involucra al parámetro de
interés y que tiene una distribución conocida
Ẋ −μ
𝒕=
S/ √n
• Este estadístico sigue una distribución t de Student con n
– 1 grados de libertad.

≤ Ẋ −μ ≤ Ẋ + 𝒕 𝑎/𝟐
𝑺 𝑺
𝑷 Ẋ − 𝒕𝑎/𝟐 =1-𝑎
𝒏 S/ n 𝒏

1
Ej.1: En un proceso de inyección de plástico una característica de calidad del
producto (disco) es su grosor, el cual debe ser de 1.20 mm con una
tolerancia de ±0.10 mm.
• Especificación inferior del disco , EI=1.10, y la superior, ES=1.30, para considerar
un proceso satisfactorio.
• Para evaluar esta característica, durante una semana se hace un muestreo
sistemático, y se obtienen 25 muestras de tamaño 5 cada una (n = 125), y se
obtiene la media muestral, Ẋ= 1.179 mm y la varianza, S2 = 0.00071
• El error estándar de la media, es σˆẊ = S/ √n = 0, 𝟎𝟐𝟔𝟔/√𝟏𝟐𝟓 = 0,0024
• Cuando n ≥ 45, la distribución t de Student es prácticamente igual a la distribución
normal estándar, por lo tanto, de la tabla de la distribución normal se obtiene que
t𝑎/2 ˜ z 𝑎 /2 = 1.96 para 𝑎 = 0.05.

≤ Ẋ −μ ≤ Ẋ + 𝒕𝑎/𝟐
𝑺 𝑺
𝑷 Ẋ − 𝒕𝑎/𝟐 =1-𝑎
𝒏 S/ n 𝒏

𝑷 1.179 mm ± 𝟏, 𝟗𝟔𝟎 ∗ 𝟎, 𝟎𝟎𝟐𝟒 =1,179 ± 0,00466

• Para un nivel de confianza de 95%, la media μ de grosor de los discos esta en


el intervalo [1.174, 1.184].
• El valor de 0.00466 (es el error de estimación) cantidad en la que puede
diferir el estimador puntual Ẋ del parámetro poblacional μ.
1
i-2) Intervalos de Confianza para la Media con
Varianza conocida
• Este estadístico sigue una distribución normal

Ẋ −μ
𝒁=
σ / √n

• Y su intervalo de confianza es:

σ
𝑷 Ẋ − 𝒁𝑎/𝟐 σ ≤ Ẋ −μ ≤ Ẋ + 𝒁 𝑎/𝟐 =1-𝑎
𝒏 σ / √n 𝒏

1
Tamaño de la Muestra
¿Qué tan grande debe ser una muestra utilizando la media
muestral?
• La respuesta depende del error de muestreo (E); mientras menor sea este
error, mayor será el tamaño de muestra necesaria para lograr un cierto grado de
precisión.
• Dado el tamaño del intervalo de confianza y si se conoce la desviación
estándar de la población σ (o un estimador), el tamaño de muestra (n) será
igual a

Ejercicio 2: en el caso del grosor medio de los elementos experimentados si


quisiera un error máximo de 0.004 = E, entonces n esigual
a
23
Ii) Intervalos para la Varianza
• Es igual que el tratamiento para la media
• Para construir un intervalo de confianza
para la varianza, la distribución de
referencia es una ji-cuadrada con n – 1
grados de libertad, bajo el supuesto de que
la variable de interés tiene una distribución
normal con media y varianza desconocidas,
el estadístico es:
(𝑛 − 1)𝑆 2

σ2
• Y el intervalo de confianza es

(𝒏 − 𝟏)𝑺2 (𝒏 − 𝟏)𝑺2
X 2𝑎 𝟐 𝒏 𝟏 ≤ σ2 ≤ X 2𝟏
/ , − − 𝑎 /𝟐, 𝒏 − 𝟏

• X 2 𝑎 𝟐 𝒏 𝟏 y X 2 𝟏 𝑎 𝟐 𝒏 𝟏 son puntos críticos de la distribución ji-cuadrada con


/ , − − / , −
n – 1 grados de libertad, y se leen en la tabla de esta distribución para el valor
de α dado. Es decir, P(X > X2 )= α/2
α/2,n-1

11
Ej. 3: En la investigación del proceso de fabricación de discos para computadoras,
una de las variables críticas es el rendimiento de formato.
Se toma una muestra aleatoria de n = 10 discos de la producción del turno de la
mañana. Se formatean y se reporta el rendimiento de cada disco. Los datos obtenidos
son: 96.11 - 91.06 - 93.38 - 88.52 - 89.57 - 92.63 - 85.20 - 91.41 - 89.79 - 92.62.
Con base en estos datos interesa estimar puntualmente por intervalo la media y la
desviación estándar para la población de discos de dicho grupo.

Suponiendo distribución normal, el intervalo al 95% de confianza para la media μ,


está dado por

11
El correspondiente intervalo para la desviación estándar σ se obtiene sacando la
raíz cuadrada al intervalo para la varianza σ2 está dado por.

Cuando no se está satisfecho con la amplitud del intervalo, entonces


será necesario incrementar la precisión de la estimación, y esto se hace
aumentando el tamaño de la muestra.

11
iii) Intervalos para la proporción
• Bajo el supuesto de que el número de especímenes
/ mediciones con defecto en una muestra sigue una
distribución binomial, y suponiendo que se
inspecciona una cantidad grande de n
especímenes / mediciones y se encuentra una
proporción pˆ de defectos, se puede construir un
intervalo de confianza para la proporción poblacional
p, apoyándose en la aproximación de la
distribución binomial por la normal.
• En estas condiciones se puede afirmar que la
proporción muestral pˆ sigue una distribución
normal con media p, y varianza: 𝒑(𝟏 − 𝒑)

n
• De esta manera el intervalo de confianza es

𝑝(1−𝑝) 𝑝 (1−𝑝
pˆ −𝑍𝛼 n ≤ p ≤ pˆ +𝑍𝛼 ) n
2 ⋰ 2
/

Zα/2 ►es un percentil de tabla de la distribución normal estándar


13
Ej.4: En un experimento se quiere estimar la proporción p de especímenes
defectuosos en un lote de 2 000 (población). Para ello, se toma una muestra aleatoria
de n = 100 artículos y se encuentra de éstos, x = 5, defectuosos.
Por lo tanto, un estimador puntual de p es pˆ = 5/100 = 0.050.
Si se quiere estimar p por intervalo, entonces de acuerdo con lo explicado antes, un
intervalo al 95% de confianza está dado por

𝑝(1−𝑝)
𝑝 (1−𝑝
pˆ −𝑍𝛼 ) n
≤p≤ pˆ +𝑍𝛼 ⋰ 2 n
⋰ 2

0,05(1−0,05)
0,050 ± 1,96 = 0,005 ± 0,043
100
Iv) Ejemplo de Intervalos para la diferencia dos medias
Ej. 6: La siguiente tabla presenta los resultados de dos muestras aleatorias
para comparar el contenido de nicotina de dos marcas de cigarrillos.

Suponiendo que los conjuntos de datos provienen de muestras tomadas


al azar de poblaciones normales con varianzas desconocidas e iguales,
construya un intervalo de confianza del 95% para la diferencia real de
nicotina de las dos marcas.
V-1) Tamaño de la Muestra - Utilizando la
¿Qué tan grande debe ser una muestra utilizando la media muestral?
• La respuesta depende del error de muestreo (E); mientras menor sea este, mayor
serámedia
el tamaño de muestra necesaria para lograr un cierto grado de precisión.
• En ocasiones es necesario calcular el tamaño de muestra n para lograr que la
estimación de una media poblacional m tenga como error máximo a un número E.
• En este caso, como el error de estimación está dado por E = t(α/2, n – 1)S/√n,
entonces despejando n obteremos

Ej.2: en el caso del grosor medio de los elementos experimentados si quisiera


un error máximo de 0.004 = E, entonces n es igual a

12
Tamaño de la Muestra
Si se quiere estimar el tamaño de la muestra n, que es necesario para
estimar p
con un error máximo de E, entonces dado que:

𝑍2𝛼
/2 *
pˆ(1 − pˆ)
𝑛=
𝐸2

Ejercicio 5: si en el problema anterior se


quisiera un error máximo de E =0.03,conuna
confianza de 95%, entonces se requiere que:

n = (1.96)2 (0.05)(1 – 0.05)/(0.03)2 ≈ 203.

En ocasiones, cuando no se sabe nada de


p en
la fórmula anterior, se supone pˆ = 0.5.
12
V-2) Tamaño de la Muestra
utilizando
Si se quiere estimar el la proporción
tamaño de la muestra n, que es necesario para estimar p
con un error máximo de E, entonces dado que:

𝑍2𝛼
/2 ∗
pˆ(1 − pˆ)
𝑛=
𝐸2

Ej. 5: si en el problema anterior se quisiera un


error máximo de E = 0.03, con una confianza de
95%, entonces se requiere que:

n = (1.96)2 (0.05)(1 – 0.05)/(0.03)2 ≈ 203.

En ocasiones, cuando no se sabe nada de p en la


fórmula anterior, se supone pˆ = 0.5.

12
A.- Introducción
Estimación por intervalo
Una alternativa para reportar un solo valor del parámetro que se esté estimando es
calcular e informar todo un intervalo de valores posibles, un estimador de intervalo o
intervalo de confianza (IC).

Un intervalo de confianza se calcula siempre seleccionando primero un nivel de confianza,


que es una medida del grado de fiabilidad en el intervalo.
Corresponde a un intervalo de valores, dentro de los cuales se espera que el parametro con
cierto grado de confianza o riesgo de error conocido, para ello es necesario determinar
primero la estimación puntual
La probabilidad de que un intervalo de confianza contenga el parametro que se estima se
denomina coeficiente de confianza (pag 277 – ciro martinez)

Un nivel de confianza de 95% implica que ese porcentaje de todas las muestras daría lugar a
un intervalo que incluye μ o cualquier otro parámetro que se esté estimando, y sólo 5% de las
muestras producirá un intervalo erróneo.

Cuanto mayor sea el nivel de confianza podremos creer que el valor del parámetro que se
estima está dentro del intervalo.
Ejemplo 02 – EPM

• μ 2 2
x
• 2
x
Determinación del tamaño de una muestra
A partir del ejemplo de las familias suscritas a HBO… ¿Qué tan
grande debe ser la muestra si queremos tener un 95% de confianza
en que nuestra estimación de “p” está dentro del 0,02 del valor
verdadero?

𝒁𝑎𝟐 / 𝝈𝟐 1,96 2(𝑝^𝑞^) 1,96 2(0,68)(0,32)


𝒏= 𝑛= 2
= 2
= 2090
𝒆𝟐 (0,02) (0,02)

¿Qué ocurre si no se tiene una muestra preliminar para obtener una


estimación de “p”? Se puede obtener de igual manera una muestra,
con al menos un 100(1- 𝑎)% de confianza (95%) y error de
estimación solicitado (0,02)
Caso “proporciones”:
𝒁𝑎𝟐 / 1,96 2 Existe un límite superior para “n” al
𝒏= 𝑛= = 2401 notar que 𝑝^𝑞^=𝑝^(1 − 𝑝^), es decir
4(0,02)2
𝟒𝒆𝟐 el
valor de 𝑝^𝑞^debe ser a lo 1
Estimación por Intervalo para la Media
Definición: Zα
• zα es el valor de la variable Z en la distribución normal estándar tal
que el área a la derecha debajo de f(z) es igual a un valor
especificado α: P(Z ≥ zα) = α
• DISTRIBUCION NORMAL
• Desviacion estándar sigma
• Vvarianza sigma al cuadrado

También podría gustarte