Science">
Hipotesis1
Hipotesis1
Hipotesis1
Nivel de confianza, Tiene relación directa con el tamaño de la muestra, por lo tanto
se dirá que a mayor nivel de confianza, mas grande debe ser el tamaño de la muestra.
Los valores de Z se obtienen de tabla. El nivel de significación fijado por el
investigador
Precisión de la estimación fijado por el investigador con el conocimiento que tenga
acerca del parámetro que piensa estimar). Se le conoce como error de muestreo (E),
siendo:
Tamaño de la Muestra
• Un auditor desea tener un nivel de confianza del 95% para que la verdadera
proporción de error no exceda del 2%. Si la población es muy grande, que
tamaño tendrá la muestra que va a tomarse, si el auditor estima que la
proporcion es del 5%?
∞ = 1 – 0.95 = 0.05
= 0.05 / 2 = 0.025
= 1 – 0.025
= 0.975
Buscar 0.975 en tablas….
Z = 1.96
Z = 0.95 α = 0.05
= 1 – (0.05/2) = 0.975
buscamos en tabla:Z = 1.96
• La muestra es de aproximadamente 384 unidades
Ejemplo 02 – T de la M
• En un lote grande de medicinas, se desea verificar que la
proporción de los ingredientes activos sea el adecuado. Se debe
determinar el tamaño de la muestra para un nivel de
confianza del 95% con un error del 5%. Supongamos que la
variabilidad p=q=0.5.
• n es el tamaño de la muestra = ???
• Z es el nivel de confianza = 95%
• p es la variabilidad positiva = 0.5
• q es la variabilidad negativa =0.5
• E es la precisión o error = 0.05
Respuesta :
Ejemplo 04 – T de la M … Resolver
Respuesta :
n = (1.65)2(0.5)(0.5) = 0.68 = 106
0.08)2 0.0064
AQUÍ SIGUE…..
Tamaño optimo para poblaciones finitas
• En caso de que el tamaño de la población sea conocido y la varianza poblacional se conozca, el
tamaño de muestra se determina de la siguiente forma:
Donde:
• n = tamaño de muestra
• N = tamaño de la población objeto de estudio
• = valor de la normal estándar α/2
• 2 = varianza poblacional
• E = precisión o máximo error de muestreo propuesta por el investigador
Ejemplo 04 – T de la M
(500-1)(0.05)2+(1.64)2(0.5)2 1.9199
Ejemplo 05 – T de la M
Que tamaño deberá tener una muestra para estimar dentro del 3%, la proporción
de mujeres casadas que van periódicamente a consulta ginecológica, en una
población de 5.000 mujeres y una seguridad del 95%.
• E = 3% N = 5.000 Z =1,96 ; Como no se conoce P, se tiene que
• P =0,50
n = 880 mujeres
Ejemplo,
La fuerza de la tensión de adhesión del mortero de cemento portland es una característica importante del
producto. Un ingeniero está interesado en comparar la fuerza de una formulación modificada en la que se han
agregado emulsiones de látex de polímeros durante el mezclado, con la fuerza del mortero sin modificar. El
experimentador ha reunido 10 observaciones de la fuerza de la formulación modificada y otras 10 observaciones
de la formulación sin modfficar. Los datos se muestran en la tabla 2-1. Podría hacerse referencia a las dos
formulaciones diferentes como dos tratamientos o como dos niveles del factor formulaciones.
En la figura 2-1 se grafican los datos de este experimento.
Mortero Mortero
j modificado Mortero sin (Y1 - )2 (Y2 - )2
modificar Y1 modificar
Y1 Y2
1 16.85 17.5 0.007396 0.178084
2 16.4 17.63 0.132496 0.085264
3 17.21 18.25 0.198916 0.107584
4 16.35 18 0.171396 0.006084
5 16.52 17.86 0.059536 0.003844
6 17.04 17.75 0.076176 0.029584
7 16.96 18.22 0.038416 0.088804
8 17.15 17.9 0.148996 0.000484
9 16.59 17.96 0.030276 0.001444
10 16.57 18.15 0.037636 0.051984
167.64 179.22
= 16.764 17.922 0.90124 0.55316
VARIANZA
2
`= 0.090124 0.055316
`= 0.30 0.24
Métodos gráficos simples como ayuda para analizar los datos de un experimento: El
diagrama de puntos, uy útil para representar un cuerpo reducido de datos (hasta unas 20
observaciones).
El diagrama de puntos permite ver de inmediato la localización o tendencia central de
las observaciones y su dispersión.
• Por ejemplo, en el experimento de la fuerza de tensión de adhesión del cemento portland, el
diagrama de puntos revela, que probablemente las dos formulaciones difieran en la fuerza
promedio, pero que ambas producen aproximadamente la misma variación en la fuerza.
Cuando los datos son muy numerosos, es difícil distinguir las observaciones graficadas en un
diagrama de puntos, y sería preferible un histograma
La media aritmética de la suma de dos variables
• La media aritmética de la suma de dos variables, es igual a la suma de las dos medias correspondiente a las
dos variables.
Un modelo de los datos
donde
yij es la observación j-ésima del nivel i del factor,
μ es la media de la respuesta para el nivel i-ésimo del factor, y
eij es una variable aleatoria normal asociada con la observación ij-ésima. …
o también componente del error aleatorio del modelo
Prueba de hipótesis e
Intervalos de confianza
CLASIFICACIÓN:
• De investigación (generales o específicas), las cuales pueden
responder en forma amplia a las interrogantes planteadas en el
Marco Teórico respecto al problema en estudio;
• Estadísticas, son las que expresan la relación en términos
matemáticos.
HIPÓTESIS ESTADÍSTICA
• Es un enunciado o afirmación ya sea acerca de los parámetros de una distribución de probabilidad o de los
parámetros de un modelo.
• La hipótesis refleja alguna conjetura acerca de la situación del problema.
• Por ejemplo, en el experimento del cemento portland, puede pensarse que las fuerzas de la tensión de
adhesión promedio de las dos formulaciones del mortero son iguales. Esto puede enunciarse formalmente
como
donde :
• μ 1 es la fuerza de la tensión de adhesión promedio del mortero modificado y
• μ2 es la fuerza de tensión de enlace promedio del mortero sin modificar.
Al enunciado H0 : μ1 = μ 2 se le llama la hipótesis nula y a
H1 : μ1 ≠ μ2 se le llama la hipótesis alternativa.
A la hipótesis alternativa que se especifica aquí se le llama hipótesis alternativa de dos colas porque sería
verdadera si μ 1 < μ2 o si μ 1 > μ2•
Ejemplo,
La fuerza de la tensión de adhesión del mortero de cemento portland es una característica importante del
producto. Un ingeniero está interesado en comparar la fuerza de una formulación modificada en la que se han
agregado emulsiones de látex de polímeros durante el mezclado, con la fuerza del mortero sin modificar. El
experimentador ha reunido 10 observaciones de la fuerza de la formulación modificada y otras 10 observaciones
de la formulación sin modfficar. Los datos se muestran en la tabla 2-1. Podría hacerse referencia a las dos
formulaciones diferentes como dos tratamientos o como dos niveles del factor formulaciones.
En la figura 2-1 se grafican los datos de este experimento.
Mortero Mortero
j modificado Mortero sin (Y1 - )2 (Y2 - )2
modificar Y1 modificar
Y1 Y2
1 16.85 17.5 0.007396 0.178084
2 16.4 17.63 0.132496 0.085264
3 17.21 18.25 0.198916 0.107584
4 16.35 18 0.171396 0.006084
5 16.52 17.86 0.059536 0.003844
6 17.04 17.75 0.076176 0.029584
7 16.96 18.22 0.038416 0.088804
8 17.15 17.9 0.148996 0.000484
9 16.59 17.96 0.030276 0.001444
10 16.57 18.15 0.037636 0.051984
167.64 179.22
= 16.764 17.922 0.90124 0.55316
VARIANZA
2
`= 0.090124 0.055316
`= 0.30 0.24
Establecer H0 y Ha
Hipótesis nula Hipótesis alternativa
𝑯𝟎 𝑯𝟏
Error tipo II. Aceptar la hipótesis nula (Ho) cuando se ha debido rechazar.
Error tipo I. Rechazar la hipótesis nula (Ho) cuando se ha debido aceptar.
Ejemplo. 02 - Hip
Supongamos que el decano de la universidad desea contratar los servicios del
profesor Pérez, para ello es sometido a una entrevista, bajo las siguientes
hipótesis:
a) El profesor Pérez es competente para desarrollar la labor.
b) El profesor Pérez no es competente para esa labor
c) ¿En qué condiciones el decano cometerá errores de tipo I y de tipo II, en
cada caso?
• Ho :
a) Error tipo I: decidir que el señor Pérez no es competente si
realmente lo es.
• Error tipo II: decidir que el señor Pérez es competente si realmente no lo
es.
b) Error tipo I: decidir que el señor Pérez es competente cuando
realmente no lo es.
• Error tipo II: decidir que el señor Pérez no es competente cuando
realmente lo es.
Hipótesis nula y alternativa
• La hipótesis nula es aquella por medio de la cual se hace una afirmación sobre un
parámetro que se va a constatar con el resultado muestral.
• Cuando el fabricante dice que su producto tiene una duración de 5.000 horas, se le
considera como hipótesis nula, pues es lo que se quiere probar.
2. Elegir el riesgo α = %
a) Los niveles de significación más utilizados son:
Zs ≥ 1,96
Zi ≤ −1,96
Procedimiento en las pruebas de Hipótesis
6. Descripción de la región crítica:
(Bilateral con un = 0,05)
c) = 3,6
= -0.6/.4648 = -1.291
n = tamaño de la muestra
= desviación estándar de la población muestreada
Cuando el valor de es desconocido, se puede sustituirpor la
desviación estándar muestral, s:
X s
n
Ejemplo
Se ha tomado una muestra aleatoria de 50 artículos producidos por una industria y se
obtuvo que la media muestral del peso de los artículos fue 165 gr. con una desviación
estándar de 40 gr. Encuentre un intervalo para la media poblacional, con un nivel de
confianza de 98%.
𝑋ҧ + z X
Un nivel 100(1- )%con límite superiorde conianza
para es :
𝑋ҧ + z X
Cuando el valor de es desconocido, se puede sustituir
por la desviación estándar muestral, s :
s
X
n
Ejercicio 1
PROBABILIDAD Y ESTADISTICA. 72
Estimación de una proporción
Un estimador puntual de la proporción p en un
experimento binomial está dado por el
estádístico P = X n , donde X representa el
número de éxitos en n pruebas. Por
lo tanto, la proporción de la muestra p̂ = x n
será el estimador puntual del parámetro p.
Tal proporción sigue una distribución normal estándar con el
estadístico.
P̂ - p
Z=
pq n
Donde Pˆ es la proporción de la muestra.
q = 1 - p y n es el tamaño de la muestra.
Estimación de una proporción
Media : p̂ = E (P̂ )= E =
X np
=p
n n
2
npq pq
Varianza : pˆ2 = X2 n = 2X = 2 =
n n n
P̂ - p
donde Z=
pq n
Intervalo de confianza de p de una
muestra grande
•Si p̂ eslaproporcióndeéxitosenunamuestra aleatoriade tamañon,
yq̂ =1- p̂,unintervalode confianzaaproximadode(1- )100%para
el parámetrobinomial pestádado
z 2 p̂q̂ n
Si pˆseusacomoestimacióndep,podemostener
(1- )100% deconfianzaqueelerrorserámenor
queunacantidadespecífica e cuandoel tamaño
z 2 p̂q̂
delamuestraseaaproximadamenten=
e2
Ejercicio 4.
Un fabricante de reproductores de discos compactos utiliza un
conjunto de pruebas amplias para evaluar la función eléctrica
de su producto. Todos los reproductores de discos compactos
deben pasar todas las pruebas antes de venderse. Una
muestra aleatoria de 500 reproductores tiene como resultado
15 que fallan en una o más de las pruebas. Encuentre un
intervalo de confianza 9 0 % para la proporción de los
reproductores de discos compactos de la población que no
pasan todas las pruebas.
Ejercicio 5.
Calcula un intervalo de confianza de 98% para la proporción
de artículos defectuosos en un proceso cuando se
encuentra que una muestra de tamaño 100 da como
resultado 8 defectuosos.
E s t i m a c i ó n d e la v a r ia n z a
PROBABILIDAD Y ESTADISTICA.
Ejercicio 6. Una muestra aleatoria de 20 estudiantes obtuvo
una media de 72 y una varianza de 16 en un examen
universitario de colocación en matemáticas. Supón que las
calificaciones se distribuyen normalmente y construya un
intervalo de confianza de 98% para 2.
PROBABILIDAD Y ESTADISTICA.
Dos muestras
Estimación de la diferencia entre dos
medias
Six1 y x 2 son las medias de muestras aleatorias
independientes de tamaños n12y n2 de
convarianzasconocidas 1 y 2 ,
2
poblaciones
unintervalodeconfianzade (1-respectivamente,
)100%para 1 − 2
estádadopor
12 22 12 22
(x1 − x2 )− z 2 + 1 − 2 (x1 − x 2 )+ z 2 +
n1 n2 n1 n2
dondez 2 es elvalorzquedejaunáreade 2
aladerecha PROBABILIDAD Y 20
ESTADISTICA.
Ejercicio 7. Se comparan las resistencias de dos clases de
hilo. Cincuenta piezas de cada clase de hilo se prueban bajo
condiciones similares. La marca A tiene una resistencia a
la tensión promedio de 78.3 kilogramos con una desviación
estándar de 5.6 kilogramos; en tanto que la marca B
tiene una resistencia a la tensión promedio de
87.2 kilogramos con una desviación estándar de 6.3
kilogramos. Construye un intervalo de confianza de 95%
para la diferencia de las medias poblacionales.
PROBABILIDAD Y ESTADISTICA.
Estimado de unión de la
varianza
s 2
=
( )
n1 −1s + (n2 −1s
) 2
1
2
2
p
n1 + n2 − 2
PROBABILIDAD Y ESTADISTICA. 85
D o s m u e s t ra s
E s t i m a c i ó n d e la diferencia entre d o s m e d i a s
Va r i a n z a s d e s c o n o c i d a s - i g u a l e s
1 1 1 1
(x1 − x 2 )− t 2sp + 1 − 2 (x1 − x2 )+ t 2sp +
n1 n2 n1 n2
PROBABILIDAD Y ESTADISTICA.
dondesp eslaestimacióndeunióndeladesviación
estándarpoblacionaly t 2 es elvalor t con
v= n1 + n2 - 2 gradosdelibertad,quedejaunárea
de 2aladerecha
PROBABILIDAD Y ESTADISTICA.
Ejercicio 8. En un proceso químico por lotes, se comparan los
efectos de dos catalizadores sobre la potencia de la
reacción del proceso. Se preparó una muestra de 12 lotes
con el uso del catalizador 1 y se obtuvo una muestra de
10 lotes con el catalizador 2. Los 12 lotes para los
que se utilizó el catalizador 1 dieron un rendimiento
promedio de 85 con una desviación estándar muestral de
4; en tanto que para la segunda muestra el promedio fue
de 81 con una desviación estándar muestral de 5.
Encuentra un intervalo de confianza de 90% para la
diferencia entre las medias poblacionales, suponiendo que
las poblaciones se distribuyen aproximadamente normal
con varianzas iguales.
PROBABILIDAD Y ESTADISTICA.
Dos muestras
Estimación de la diferencia entre dos
medias Varianzas desconocidas-diferentes
Six1 y s12 y x 2 y s22 son lasmediasyvarianzas
de muestras aleatorias independientes de tamaños
n1 y n2 de poblacionesaproximadamente normales
convarianzasdesconocidas y diferentes,unintervalo
deconfianzaaproximadode (1- )100%para 1 − 2
estádado por
s12s
2
s2
s2
(x1 − x 2 )− t 2 + 2 − (x1 − x2 )+ t 2 1 + 2
1 2
n1 n2 n1 n2
PROBABILIDAD Y ESTADISTICA.
donde t 2 esel valor t con
(s
2
n1 + s n2
2
)2
v=
(s ) (n − 1)+ (s ) (n −1)
1 2
2 2 2 2
1 n1 1 2 n2 2
Compañía Tiempo ( m i n u t o s )
I 103 94 110 87 98 120
II 97 82 123 92 135 88 118
PROBABILIDAD Y ESTADISTICA.
Datos no agrupados
n
X 1 + X2 ++ Xn
X i
X= = i=1
n n
Datos no agrupados
MUESTRA
(X − X )
n
2
i
sˆ2= i=1
n −1
PROBABILIDAD Y ESTADISTICA.
D o s m u e s t ra s
E s t i m a c i ó n d e la diferencia entre d o s
prSoippˆoyrcipˆonseosnlas proporcionesdeéxitos enmuestras
1 2
dondez 2 es elvalorzquedejaunáreade 2
aladerecha PROBABILIDAD Y 30
ESTADISTICA.
ingeniería en Estados Unidos. La muest
contiene 250 ingenieros eléctricos don
80 son mujeres; y 175 ingenieros químico
donde 35 son mujeres. Calcula un interva
de confianza de
90% para la diferencia entre la proporción de
mujeres en estos dos campos de la ingeniería. ¿Hay una
diferencia significativa entre las dos proporciones?
PROBABILIDAD Y 31
ESTADISTICA.
C. Estimación por intervalos
Las propiedades de los estimadores garantizan un cierto
comportamiento de su distribución de probabilidad.
Sin embargo, al resumir la información muestral en un único valor
(la estimación puntual) no hacemos, de forma explícita, ninguna
valoración sobre el error o discrepancia inherente al proceso de
estimación:
Estimador bueno =⇒ estimación buena
por término medio
Sea 𝑋𝑖~𝑁(μ, 𝜎) y tomamos una muestra aleatoria 𝑋1, 𝑋2,…, 𝑋𝑛 . Sabemos que el
ҧ 𝑋ҧ𝑛−𝜇
estimador 𝑋 ~𝑁(μ, 𝜎/ 𝑛). Dado que 𝜎 es desconocida, sabemos que ~ 𝑡 𝑛− ,
𝑠/ 𝑛
entonces: 1
𝑋ҧ𝑛− 𝜇
𝑃 −𝑡𝑛−1,𝛼/2< 𝑠 < 𝑡𝑛−1, 𝛼/2 =1−𝛼
𝑛
𝑠 𝑠
𝑃 𝑋ҧ − 𝑡𝑛 −1,𝛼 /2 < 𝜇 < 𝑋ҧ + 𝑡𝑛−1,𝛼/2 . =1−𝛼 n < 30
𝑛 𝑛
O
• Al comparar ambas ecuaciones:
P(L ≤ 𝜽 ≤ U) = 1 –
• Operativamente para saber qué tan
α precisa es la estimación, se calcula un
intervalo de confianza que indique un rango “donde puede estar el
parámetro”
• Intervalo al 100(1 – α)% de confianza para un parámetro desconocido 𝜽,
consiste en estimar dos números (estadísticos) L y U, de manera que la
probabilidad de que 𝜽 se encuentre entre ellos sea 1 – α 1
C.- Estimación por intervalo
1
i-1) Intervalos de Confianza para la Media con Varianza desconocida
≤ Ẋ −μ ≤ Ẋ + 𝒕 𝑎/𝟐
𝑺 𝑺
𝑷 Ẋ − 𝒕𝑎/𝟐 =1-𝑎
𝒏 S/ n 𝒏
1
Ej.1: En un proceso de inyección de plástico una característica de calidad del
producto (disco) es su grosor, el cual debe ser de 1.20 mm con una
tolerancia de ±0.10 mm.
• Especificación inferior del disco , EI=1.10, y la superior, ES=1.30, para considerar
un proceso satisfactorio.
• Para evaluar esta característica, durante una semana se hace un muestreo
sistemático, y se obtienen 25 muestras de tamaño 5 cada una (n = 125), y se
obtiene la media muestral, Ẋ= 1.179 mm y la varianza, S2 = 0.00071
• El error estándar de la media, es σˆẊ = S/ √n = 0, 𝟎𝟐𝟔𝟔/√𝟏𝟐𝟓 = 0,0024
• Cuando n ≥ 45, la distribución t de Student es prácticamente igual a la distribución
normal estándar, por lo tanto, de la tabla de la distribución normal se obtiene que
t𝑎/2 ˜ z 𝑎 /2 = 1.96 para 𝑎 = 0.05.
≤ Ẋ −μ ≤ Ẋ + 𝒕𝑎/𝟐
𝑺 𝑺
𝑷 Ẋ − 𝒕𝑎/𝟐 =1-𝑎
𝒏 S/ n 𝒏
Ẋ −μ
𝒁=
σ / √n
σ
𝑷 Ẋ − 𝒁𝑎/𝟐 σ ≤ Ẋ −μ ≤ Ẋ + 𝒁 𝑎/𝟐 =1-𝑎
𝒏 σ / √n 𝒏
1
Tamaño de la Muestra
¿Qué tan grande debe ser una muestra utilizando la media
muestral?
• La respuesta depende del error de muestreo (E); mientras menor sea este
error, mayor será el tamaño de muestra necesaria para lograr un cierto grado de
precisión.
• Dado el tamaño del intervalo de confianza y si se conoce la desviación
estándar de la población σ (o un estimador), el tamaño de muestra (n) será
igual a
σ2
• Y el intervalo de confianza es
(𝒏 − 𝟏)𝑺2 (𝒏 − 𝟏)𝑺2
X 2𝑎 𝟐 𝒏 𝟏 ≤ σ2 ≤ X 2𝟏
/ , − − 𝑎 /𝟐, 𝒏 − 𝟏
11
Ej. 3: En la investigación del proceso de fabricación de discos para computadoras,
una de las variables críticas es el rendimiento de formato.
Se toma una muestra aleatoria de n = 10 discos de la producción del turno de la
mañana. Se formatean y se reporta el rendimiento de cada disco. Los datos obtenidos
son: 96.11 - 91.06 - 93.38 - 88.52 - 89.57 - 92.63 - 85.20 - 91.41 - 89.79 - 92.62.
Con base en estos datos interesa estimar puntualmente por intervalo la media y la
desviación estándar para la población de discos de dicho grupo.
11
El correspondiente intervalo para la desviación estándar σ se obtiene sacando la
raíz cuadrada al intervalo para la varianza σ2 está dado por.
11
iii) Intervalos para la proporción
• Bajo el supuesto de que el número de especímenes
/ mediciones con defecto en una muestra sigue una
distribución binomial, y suponiendo que se
inspecciona una cantidad grande de n
especímenes / mediciones y se encuentra una
proporción pˆ de defectos, se puede construir un
intervalo de confianza para la proporción poblacional
p, apoyándose en la aproximación de la
distribución binomial por la normal.
• En estas condiciones se puede afirmar que la
proporción muestral pˆ sigue una distribución
normal con media p, y varianza: 𝒑(𝟏 − 𝒑)
n
• De esta manera el intervalo de confianza es
𝑝(1−𝑝) 𝑝 (1−𝑝
pˆ −𝑍𝛼 n ≤ p ≤ pˆ +𝑍𝛼 ) n
2 ⋰ 2
/
𝑝(1−𝑝)
𝑝 (1−𝑝
pˆ −𝑍𝛼 ) n
≤p≤ pˆ +𝑍𝛼 ⋰ 2 n
⋰ 2
0,05(1−0,05)
0,050 ± 1,96 = 0,005 ± 0,043
100
Iv) Ejemplo de Intervalos para la diferencia dos medias
Ej. 6: La siguiente tabla presenta los resultados de dos muestras aleatorias
para comparar el contenido de nicotina de dos marcas de cigarrillos.
12
Tamaño de la Muestra
Si se quiere estimar el tamaño de la muestra n, que es necesario para
estimar p
con un error máximo de E, entonces dado que:
𝑍2𝛼
/2 *
pˆ(1 − pˆ)
𝑛=
𝐸2
𝑍2𝛼
/2 ∗
pˆ(1 − pˆ)
𝑛=
𝐸2
12
A.- Introducción
Estimación por intervalo
Una alternativa para reportar un solo valor del parámetro que se esté estimando es
calcular e informar todo un intervalo de valores posibles, un estimador de intervalo o
intervalo de confianza (IC).
Un nivel de confianza de 95% implica que ese porcentaje de todas las muestras daría lugar a
un intervalo que incluye μ o cualquier otro parámetro que se esté estimando, y sólo 5% de las
muestras producirá un intervalo erróneo.
Cuanto mayor sea el nivel de confianza podremos creer que el valor del parámetro que se
estima está dentro del intervalo.
Ejemplo 02 – EPM
• μ 2 2
x
• 2
x
Determinación del tamaño de una muestra
A partir del ejemplo de las familias suscritas a HBO… ¿Qué tan
grande debe ser la muestra si queremos tener un 95% de confianza
en que nuestra estimación de “p” está dentro del 0,02 del valor
verdadero?