Mathematics">
Nothing Special   »   [go: up one dir, main page]

Doe Parte 2

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 28

Diseño de Experimentos -

DoE -
ING. JUAN ANGEL CHICA URZOLA, PH.D, M.SC.

3166933718

J.ANGELCHICAURZOLA@GMAIL.COM
• Es aquella en la que se pueden medir todos los individuos
P. Finita para tener un conocimiento exacto de sus características.

• Es aquella en la que la población es grande y es imposible e


Una población o universo es P. Infinita incosteable medir a todos los individuos.
una colección o totalidad de
Población
posibles individuos,
especímenes, objetos o
medidas de interés sobre los • Características que, mediante su valor numérico, describen a
que se hace un estudio. Parámetros
un conjunto de elementos o individuos.
Las poblaciones pueden ser
finitas o infinitas
• Es una parte de una población, seleccionada
Muestra adecuadamente, que conserva los aspectos clave de la
Representa población
tiva

• afirmaciones válidas acerca de la población o proceso con


Inferencia base en la información contenida en una muestra.
estadística
Las distribuciones de probabilidad que tienen una variable que
Estimacióncierta característica de una población se definen
representa
completamente cuando se conocen sus parámetros, pero cuando
estos no se conocen, será́ necesario estimarlos con base en los datos
muestrales para hacer inferencias sobre la población.
Por ejemplo, los parámetros de una distribución normal son la media,
µ, y la desviación estándar, s, que en caso de desconocerse será́
necesario estimarlos a partir de los datos en la muestra.
Hay dos tipos de estimación: puntual y por intervalo.
PARÁMETRO ESTIMADOR
La media m del proceso La media muestral µ = x--
(población).
Estimador La varianza 𝞼2 o la La varianza muestral sˆ2 =
Puntual desviación estándar 𝞼 del S2
proceso.
Un estimador puntual de un
parámetro desconocido es La proporción p de La proporción de
un estadístico que genera un artículos defectuosos defectuosos en la
valor numérico simple, que se
utiliza para hacer una muestra, pˆ = x/n, donde
estimación del valor del
parámetro desconocido. x es el número
de artículos defectuosos
Por ejemplo, para estimar el grosor
en una muestra de
promedio de los discos producidos
por un proceso, durante una semana
tamaño n.
se toma una muestra de n = 125
discos, y se obtiene que la media
muestral es X– = 1.179. Este valor
puede usarse como una estimación
puntual de m (la media del proceso).
Una forma de saber qué tan
variable es el estimador, consiste
La Estimador por
estimación puntual de
parámetro se genera a través de un
un
en calcular la desviación
Intervalo
estadístico, y como el valor de éste es estándar o error estándar del
aleatorio porque depende de los estadístico, visto como una
elementos que fueron seleccionados
en la muestra, entonces la estimación variable aleatoria. Por ejemplo,
que se hace sobre el parámetro consideremos la desviación
dependerá y variará de una muestra a
otra.
estándar S y la media X– de una
muestra de tamaño n.
De esta forma, cuando se quiere tener
mayor certidumbre sobre el verdadero Puesto que X– es una variable
valor del parámetro poblacional, será
necesario obtener la información sobre
aleatoria, esta tiene su propia
qué tan precisa es la estimación desviación o error estándar, que
puntual. se puede estimar mediante σˆx =
S /√n .
Una forma operativa de saber qué tan precisa es la estimación consiste en calcular un
intervalo de confianza que indique un rango “donde puede estar el parámetro” con cierto
nivel de seguridad o confianza.
Construir un intervalo al 100(1 – a)% de confianza para un parámetro desconocido 𝜽,
consiste en estimar dos números (estadísticos) L y U, de manera que la probabilidad de que
𝜽 se encuentre entre ellos sea 1 – a, es decir:

P(L ≤ 𝜽 ≤ U) = 1 – a

Donde L y U forman el intervalo de confianza [L,U]. En la practica se dice que el intervalo [L,
U] tiene una confianza de 100(1 – a)%; esto tiene una interpretación constante, en el sentido
de que el parámetro estará́ en el intervalo 100(1 – a)% de las veces que apliquemos el
procedimiento.
Longitud del intervalo de confianza
u Es una medida de la precisión de la
estimación.
u De aquí́ que es deseable que la
longitud de los intervalos sea
pequeña y con alto nivel de
confianza.
u El ancho de los intervalos es mayor
a medida que sea mayor la
varianza de la población y el nivel
de confianza exigido. El ancho del
intervalo es menor si se incrementa
el tamaño de la muestra.
P(L £ m £ U) = 1 – a X−µ
P(L £ m £ U) = 1 – a t=
S/ n
Intervalo de confianza para una
una muestra aleatoria de tamaño n de una población, con una
media
n
Sea Xl, X2, 2…, Xn una el muestra
cual sigue aleatoria
una de tamaño nT de
distribución deuna población,
Student con n con una
– 1 grados de liber
on media m y varianza s , ambas desconocidas. El procedimien-
Sea X1, X2, ...,
distribución Xn una
normal conmuestra
media m aleatoria
y varianza de
s 2, tamaño
ambas n de una población,
desconocidas. El con una
procedimien-
ir el intervalo consistenormal
distribución
en un
en partircon
de lamedia
tabla de
estadístico
µ
esta
y quedistribución
involucra
varianza 𝞼 2, o ambas
en su gráfica se pueden ubicar
desconocidas. El
dos
to general
s y que tiene
para deducirconocida.
una distribución
elt intervalo
y – tTal
consiste
, tales en partir
que:
estadístico es
de un estadístico que involucra
procedimiento general para
a/2 deducir
a/2 el intervalo consiste en partir de un estadístico
al
queparámetro
involucrade al
interés y que tiene
parámetro una distribución
de interés y que tiene conocida. Tal estadístico
una distribución es
conocida. Tal
estadístico es:
X−µ
t= X − µ  X−µ 
S/ n t= P  − tα / 2 ≤ ≤ tα / 2  = 1 − α
S/ n  S/ n 
ibución T de Student con n – 1 grados de libertad. Por lo tanto,
el ocual
tribución en sigue una distribución
su gráfica TDe
se pueden ubicarde aquí,
dos despejando
Student hasta dejar
con n –críticos
valores 1 grados sólo enPor
de libertad. medio de las desiguald
lo tanto,
el la
en cual sigue
tabla unadistribución
de esta distribución Tende
su Student
tro de ointerés, se llegasecon
gráfica quen – 1ubicar
apueden grados dosde libertad.
valores Por lo
críticos
tanto, en la tabla de esta distribución o en su gráfica se pueden ubicar dos valores
a/2 y – ta/2
tcríticos , tales que:
t y – t , tales que:
a/2 a/2
 X−µ   S S 
P  − tα / 2 ≤ ≤ tα / 2  = 1 − α P  X − tα / 2 ≤ µ ≤ X + tα / 2  = 1− α
 S/ n   X−µ  n n
P  − tα / 2 ≤ ≤ tα / 2  = 1 − α
 S/ n 
ndo hasta dejar sólo en medio de las desigualdades al paráme- S S
 S S 
P  X − tα / 2 ≤ µ ≤ X + tα / 2  = 1− α (2.
Así pues,
 n n

En este sentido, L = X − tα / 2 S
y U = X + tα / 2 S
n
son los números buscados q
n
en un Son
intervalo
los númerosal 100(1
buscados– que
a)%definen
paraunlaintervalo
media aldesconocida m. laEnmedia
100(1 – a)% para la tabla de
bucióndesconocida
T de Student 𝞵.
se observa que para una muestra mayor o igual a 30,
valo alEn100(1 – a )% para la media m es aproximadamente X ± 2 S
la tabla de la distribución T de Student se observa que para una muestra mayor o igual
, o sea,
n
a más amenos 2 veces
30, el intervalo su error
al 100(1 estándar.
– a)% para la media 𝞵 es aproximadamente X ± 2 S/√n ,
o sea, la media más menos 2 veces su error estándar.
CAPÍTULO 2 Elementos de inferencia estadística

En un proceso de inyección de plástico una característica de


Ejemplo calidad
2.1 del producto (disco) es su grosor, el cual debe ser de
1.20 mm con una tolerancia de ±0.10 mm.
En un proceso de inyección de plástico una característica de calidad del producto
Así́, el grosor del disco debe estar dentro de la especificación
(disco) esinferior,
su grosor,EI =el1.10,
cual ydebe ser de 1.20
la superior, ES mm conpara
= 1.30, una tolerancia
considerar de que
±0.10elmm.
proceso
Así, el grosor de inyección
del disco fue satisfactorio.
debe estar dentro de la especificación inferior, EI = 1.10, y la
superior, Para evaluar
ES = 1.30, para esta característica
considerar de de
que el proceso calidad,
inyección durante una
fue satisfactorio.
EJEMPLO semana
Para evaluar se hace un
esta característica muestreo
de calidad, sistemático
durante en se
una semana una
hacelínea de
un muestreo
producción, y se obtienen 25 muestras de tamaño 5 cada
sistemático
una.en una línea de producción, y se obtienen 25 muestras de tamaño 5 cada
una. Por lo
Portanto,
lo al final al
tanto, se final
tiene una
se muestra
tiene unade muestra
n = 125 y se
de obtiene
n =la125
media
y mues-
se

tral, X = obtiene
1.179 mmlaymedia muestral,
la varianza, X– = 1.179
S2 = 0.00071, pormm y lalavarianza,
lo que estimación delS2=error
0.00071, por lo que la estimación del error estándar de la
estándar de la media
media es: es

S 0.0266
= = 0.0024
n 11.18

Cuando n ≥ 45, la distribución T de Student es prácticamente igual a la distribución


S 0.0266
Cuando n ≥ 45, la distribución T de=Student
= 0.0024 es prácticamente igual a
n 11.18
la distribución normal estándar, por lo tanto, de la tabla de la

Cuando distribución normal se obtiene


n ≥ 45, la distribución que es
T de Student ta/2 ≃ za/2 = 1.96igual
prácticamente para 𝛂=
a la 0.05.
distribución
normal estándar, por lo tanto, de la tabla de la distribución normal se obtiene que
De aquí́ que el intervalo al 100(1 – a)% de confianza para la media
ta /2 ~
– za /2 = 1.96 para a = 0.05. De aquí que el intervalo al 100(1 – a)% de confianza
para lammedia
del grosor de los de
m del grosor discos está está
los discos dado porpor
dado

EJEMPLO S  0.0266 
X ± tα / 2 = 1.179 ± 1.96   = 1.179 ± 0.00466
n  11.18

Se puede afirmar entonces que con una confianza de 95%, la media m de grosor de
los discos se encuentra
Se puede afirmarenentonces
el intervaloque
[1.174,
con1.184]. En el cálculo
una confianza de anterior
95%, la al valor
media
de 0.00466 se le conoce como error de estimación, porque hasta en 0.00466 puede

diferirmelde grosor de
estimador los discos
puntual se encuentra
X del parámetro en el intervalo
poblacional m. [1.174, 1.184].

En el calculo anterior al valor de 0.00466 se le conoce como error de


Tamaño de la muestra. En ocasiones es necesario calcular el tamaño de muestra n
estimación,
para lograr porque de
que la estimación hasta en 0.00466
una media puede
poblacional diferir
m tenga comoelerror
estimador
máximo
a un número E. En este caso, como el error de estimación está dado por E =
puntual X– del parámetro poblacional m.
÷`n , entonces despejando n obtenemos que
t(a/2, n – 1)S/`
diferir
de 0.00466 el estimador se le conoce puntual X del
como parámetro
error de estimación, poblacional porquem. hasta en 0.00466 puede

de 0.00466 se le conoce como error de estimación, porque hasta en 0.00466 puede
Tamaño
udiferir el estimador de lapuntual muestra.
X del– parámetro poblacional m.
diferir el estimador puntual X del parámetro poblacional m.
Tamaño de la muestra. En ocasiones es necesario calcular el tamaño de muestra n
En ocasiones es necesario calcular el tamaño de muestra n para
Tamaño
para lograrde que la lamuestra.
estimación En de
ocasiones
una media es necesario
poblacional calcular
m tenga el tamaño de muestra
como error máximo n
lograr Tamaño que lade estimación
la muestra. En deocasiones
una media es necesario poblacional
calcular el tamaño µ tenga como
de muestra n
apara lograr
un número que E.laEn estimación
este caso,de una
como mediael errorpoblacional m mtenga
de estimación como
está error
comodado máximo
por E =
error máximo para lograr a laun
que número
estimación de unaE. media
En este poblacional caso, como
tenga el error
error máximo de
t(aa/2,un número
S/ `
÷ ` n
n – 1)a un número , E. En
entonces este caso,
despejando
E. En este como
n el
obtenemos error dequeestimación está dado
dado por E == n
por E
estimación está dado porcaso,
E =comot(a/2, el n-1)
error
S/√n de, estimación
entonces está
despejando
t(a/2, n – 1)t(S/ `
÷ `n , entonces
S/`÷ `n , despejando
entonces despejandon obtenemos
n obtenemos queque
obtenemos a/2, n – 1) que: 2 2
t S
n = t(2α / 2t, 2n2−1) S 2 S 2
n = n(α=/ 2E n −/ 21,) n − 1)
,(α

E2 E2
Como t(a/2, n – 1) depende de n y ésta es la incógnita, entonces para propósitos prácticos
EJEMPLO Como
yComo
con tamaños (ta(a/2,
tComo /2, ndepende
tn-1) – 1) depende
(adepende
de muestra de
n ydeésta
demayores nque
n y ésta
es yesincógnita,
la esta
30, el es
la incógnita,
valor la incógnita,
entonces
entonces
de t(a/2, para entonces
parapropósitos
propósitos para
prácticos
prácticos
n – 1) puede tomarse como
/2, n – 1)
propósitos y con tamaños
prácticos de muestra mayores
ymayores
con queque
tamaños 30, 30, el de el valor dede
t(at/2,
muestra puedetomarse
mayores tomarse como
quecomo
30, el
2.y De
conesta tamaños manera, de muestra valor (a/2, puede
– 1)
n –n1)
valor
2. De de 2. De esta manera,
tmanera,
esta (a/2, n-1) puede tomarse como 2. De esta manera:
4 S 224 S 2
n = n4=S2 2
n = E2E
E
donde Sdonde
2 es un es un estimador
S2 estimador de lade la varianza.
varianza. PorPor ejemplo,
ejemplo, si sienenelelcaso
caso del
del grosor
grosor me-
me-
donde dio
S2 es un estimador
de los discos de la
se quisieravarianza.
un error Por
máximo ejemplo, si en el caso del grosor me-
dio de los discos se quisiera un error máximo de de 0.004
0.004 = =E,E,entonces
entonces sese requiere,
requiere,
Por
dio ejemplo,
de los discossiseen el caso
quisiera del máximo
un error grosor de medio
0.004 = de E, los discos
entonces se quisiera
se requiere,
un error máximo de 0.004,4n(entonces 4(0.00071
0=.00071 ) 2 ) se requiere:
= 177 .5 ≈ 178 .
n = 4(0.00071
( 0. )
004 =
) 177 . 5 ≈ 178 .
n = (0.004)22 = 177.5 ≈ 178 .
(0.004)
Intervalo
Intervalopara para
paralalavarianza
varianza la varianza
Intervalo
Intervalo
Demanera
De para
manerasimilar
similara acomo la
como
sese Varianza
De manera similar a como se obtiene el intervalo para la media, es posible deduci
obtiene
obtiene el el intervalo
intervalo para
para la media,
la media, es posible
es posible deducir
deducir
intervalos de confianza para cualquier parámetro. En particular, para construir un in
intervalosdedeconfianza
intervalos confianza para
para cualquier
cualquier parámetro.
parámetro. En En particular,
particular, parapara construir
construir un in-un in-
De manera similar a tervalo como se deobtiene
confianza para
el intervalola varianza s , la distribución
2
para la media, de referencia
es posible deducir intervalosesde
una ji-cua
tervalodede
tervalo
confianza confianza
confianza
para cualquier parala la
para varianza
varianza s ,sla, distribución
2 2 la distribución de referencia
de referencia es una es una ji-cua-
ji-cua-
dradaparámetro.
con n – 1 grados de libertad, ya que bajo el supuesto de que la variable de
drada
Endrada con
particular, – –1 1grados
conn npara gradosdede
construir libertad,
un libertad,
intervalo yade
yaque bajo
que el supuesto
bajo
confianza el supuesto
para de que
la varianza 𝞼la, variable
de que 2 de de
laladistribución
variable de
referencia es una ji-cuadrada con n – 1 grados de libertad, ya que bajo el supuesto de que lael estadís
interés tiene una distribución normal con media y varianza desconocidas,
interés
interéstiene
variable tiene
de unaunadistribución
interés tiene una normal
distribución normal
distribuciónconconmedia
media
normal ycon
varianza
y varianza
media desconocidas,
ydesconocidas, el estadís-
el estadís-el
varianza desconocidas,
estadístico (n 2–/2s
1)S 2 tico (n
/ 𝞼 sigue
2 sigue 2 – 1)S 2 / s2 sigue
la distribución la distribución
ji-cuadrada con ji-cuadrada
n1–1 con
gradosde n – 1
delibertad. grados
libertad.De esta de libertad. De esta
tico (n – 1)S la distribución ji-cuadrada con n – grados
tico (n – 1)S /s sigue la distribución ji-cuadrada con n – 1 grados de libertad. De esta
2
De esta manera, con manera,
un poco con deun algebra,
poco de álgebra,
se llega se
a llega
que el a que el intervalo
intervalo de confianza
de confianza para la para la va
manera,
manera,
varianza con
con
está un
dado poco
un poco de álgebra, se llega a que el intervalo de confianza
por: de álgebra, se llega a que el intervalo de confianza para la va- para la va-
rianza está dado por
rianza está dado
rianza está dado por por
( n −
(n(−n1−)S1)S 2 2 (n −(n1)−S1)≤S 2σ 2 ≤
2 1 ) S 2
2 ( n − 1 ) S 2

≤ σ ≤ (2.3) (2.3)
χα2χ/ 22, n −1 ≤ σ χ≤χ2α / 22, n −1
2 2
χ1 − α / 2 , n − 1
2
(2.3)
1−χα / 2, n −1
α / 2, n −1 1− α / 2 , n − 1
χα / 2, n −1 y χ1− α / 2, n −1 son puntos críticos de la distribución ji-cuadrada con
2 2
donde χχα /22 , n −1 y yχdonde
2 2
n − 1 son puntos críticos de la distribución ji-cuadrada con
donde α / 2 , n −1 n1χ−–1α−1/ 2α,grados
2
/ 2 , n − 1 son puntos críticos de la distribución ji-cuadrada con
n – 1 grados de libertad y se de libertad
leen en la y sede
tabla leen
esta endistribución
la tabla de esta para distribución
el valor de para
a el valor de a
Donde
n – 1 grados de libertad son y puntos
se leen críticos
en la de la distribución
2 tabla de esta ji-cuadradapara
distribución con el
n –valor
1 grados
de de
a
P ( dado.
> χαEs decir, P( X > χα / 2, paran − 1 ) =elαvalor
/ 2. de a dado. Es decir,
/ 22, n − 1 ) = α / 2.
libertad
dado. Esy se leen en
decir, la tabla
X 2 de esta distribución
dado. Es decir, P ( X > χα / 2 , n −1 ) = α / 2.
ndado. Es decir,
– 1 grados P ( X > χyα /se
de libertad 1) = α
2 , n −leen en/ 2la. tabla de esta distribución para el valor de a
dado. Es decir, P ( X > χ
En el proceso de fabricación
2
α / 2 , n − 1 ) = α / 2. de discos para computadoras, una

deEjemplo
las variables2.2 criticas es el rendimiento de formato. Se toma una
Ejemplo
En el proceso
muestra 2.2de fabricación
aleatoria de n =de 10discos parade
discos computadoras,
la producción una dedel
las variables
turno de críti-
la
Encaselesproceso
mañana. el rendimiento
Se de de formato.
fabricación
formatean de Se
discos
y se toma una
elmuestra
para computadoras,
reporta aleatoria
rendimiento una dedede = 10 discos
lasnvariables
cada críti-de
disco.
Losla datos
cas producción del turno
es el rendimiento
obtenidos de la mañana.
de formato.
son: Se tomaSe
96.11, unaformatean
muestra
91.06, 93.38, y se88.52,
reporta
aleatoria =el10rendimiento
de n 89.57, discos de
92.63,
ladeproducción
85.20, cada disco.89.79,
91.41, Losturno
del datosdeobtenidos
92.62. la Con son:Se96.11,
mañana.
base 91.06,ydatos
formatean
en estos 93.38, 88.52,
se reporta el 89.57,
interesa 92.63,
rendimiento
estimar
de85.20,
cada 91.41,
puntualmente disco. 89.79, 92.62.
Losy datos
por Con baseson:
obtenidos
intervalo en
la estos
96.11,
media datos yinteresa
91.06, la93.38,estimar
88.52,puntualmente
desviación 89.57, 92.63,y
estándar
por intervalo
85.20,
para la91.41, la media
89.79,
población y ladiscos
92.62.
de desviación
Con base estándar
deendicho parainteresa
estos datos
turno. la población
estimardepuntualmente
discos de dicho
y
turno.
por intervalo la media y la desviación estándar para la población de discos de dicho
Los estimadores puntuales para la media y la desviación estándar
turno. Los estimadores puntuales para la media y la desviación estándar resultan ser
EJEMPLO resultan ser
Los estimadores puntuales para la media y la10desviación estándar resultan ser
∑10i =1 Xi ∑10i =1 ( Xi − X )2
10

X= = 91.03 y S = = 2.99
∑ i =101 i
X ∑ i =1 9i
( X − X ) 2

X= = 91.03 y S = = 2.99
10 9
Suponiendo distribución normal, el intervalo al 95% de confianza para la media m
está dado por
Suponiendo
Suponiendo distribución
distribución normal,
normal, el intervalo
el intervalo al 95% de
al 95% de confianza para confianza
la media m
para la media
está dado por µ está dado por (donde el valor del punto crítico
ta/2 X=− tt0.025S =, X2.26 S lee
se  en las tablas .99 
2.99 para la 2distribución T .17
de]
 α /2 + tα /2  =  91 .03 − 2 .26 , 1
91. 03 + 2. 26  = [88.89, 93
Student
 con
S n 9 grados S ndelibertad):2.99 10 10 
2.99
 X − tα / 2 n , X + tα / 2 n  = 91.03 − 2.26 10 , 911.03 + 2.26 10  = [88.89, 93.17]
donde el valor del punto crítico ta/2 = t0.025 = 2.26 se lee en las tablas para la distribu-
de los discos producidos durante ese turno esté entre 88.89 y 93.17.
donde el valor del punto crítico t
a /2 = t0.025 = 2.26 se lee en las tablas para la distribu-
El ción
correspondiente intervalo para la desviación estándar 𝞼 se
T de Student con 9 grados de libertad que se localiza en el apéndice. Con una2
obtiene sacando la raíz cuadrada al intervalo para la varianza 𝞼 .
confianza
Así́ de 95%para
, el intervalo se espera que el
𝞼 está rendimiento
dado por: promedio de los discos producidos
durante ese turno esté entre 88.89 y 93.17. El correspondiente intervalo para la des-
viación estándar s se obtiene sacando la raíz cuadrada al intervalo para la varianza
s2 dado en la relación (2.3). Así, el intervalo para s está dado por
 (n − 1)S 2 (n − 1)S 2   (9)(2.99)2 (9)(2.99)2 
 , = ,  = [2.05, 5.46]
 χα / 2 , n −1 χ1− α / 2 , n −1  
2 2
19.02 2.70 
28 CAPÍTULO 2 Elementos de inferencia estadística
EJEMPLO
donde los valores críticos se
obtienen
donde de la tabla de laχα2 / 2distribución
= χ = ji-cuadrada,
χ oχ también
= se
0.975 , 9 = 270 se
2 2 2
los valores críticos , n −1 19 . 02 y 1− α / 2 , n − 1
pueden consultar usando un software. Así́, con una confianza de
0.025 , 9
obtienen de la tabla de la distribución ji-cuadrada, que está en el apéndice, o también
95%
Gutierrez-02.indd 27 se espera que la desviación estándar del rendimiento de los
discosse producidos
pueden consultar usando unese
durante software.
turnoAsí, estéconentre
una confianza
2.05 y de 95% se espera
5.46.
que la desviación estándar del rendimiento de los discos producidos durante ese tur-
Cuando no se está satisfecho con la amplitud del intervalo,
no estéserá
entonces entre 2.05 y 5.46. incrementar la precisión de la estimación,
necesario
y esto se Cuando no se está satisfecho
hace aumentando elcon la amplitud
tamaño dedel intervalo, entonces será nece-
muestra.
sario incrementar la precisión de la estimación, y esto se hace aumentando el tamaño
de muestra.
de muestra.

Intervalo para la proporción


Intervalo para la Proporción
Bajo el supuesto de que el número de artículos defectuosos en una muestra sigue una
distribución
Bajo el supuestobinomial,
de que y suponiendo
el número de que artículos
se inspecciona una cantidad
defectuosos en una grande de n sigue
muestra
artículos
una y se encuentra
distribución binomial,una
y proporción
suponiendo p̂ de
quedefectuosos, se puede
se inspecciona unaconstruir un in-
cantidad grande
detervalo de confianza
n artículos para la proporción
y se encuentra poblacional
una proporción pˆ de apoyándose enselapuede
p, defectuosos, aproxima-
construir
unción
intervalo de confianza
de la distribución para
binomial porlala proporción poblacional
normal. En estas p,seapoyándose
condiciones puede afirmar en la
aproximación de lamuestral
que la proporción distribución binomial
p̂ sigue por la normal.
una distribución normal con media p y varianza
(1 − p) condiciones se puede afirmar que la proporción muestral pˆ sigue una
En pestas
n
. Con el uso de la misma argumentación que en el intervalo para la media,
distribución normal con media p y varianza p(1 − p)/n.
se deduce que el intervalo de confianza para la proporción es de la forma
Con el uso de la misma argumentación que en el intervalo para la media, n se
deduce que el intervalo de confianza para la proporción es de la forma:
pˆ (1 − pˆ ) pˆ (1 − pˆ )
pˆ − Zα / 2 ≤ p ≤ p + Zα / 2
ˆ
n n

donde Za/2 es un percentil de tabla de la distribución normal estándar que está en el


apéndice.
donde Za/2 es un percentil de tabla de la distribución normal estándar
Se quiere estimar la proporción p de artículos defectuosos
en un lote de 2 000 (población). Conceptos Para ello,
básicos se toma
de prueba una
de hipótesis
muestra aleatoria de n = 100 artículos y se encuentra que de
estos, x = 5, son defectuosos. Por lo tanto, un estimador
Ejemplo
puntual 2.3de p es pˆ = 5/100 = 0.050. Si se quiere estimar p por
Se quiere estimarentonces
intervalo, la proporciónde
p deacuerdo
artículos defectuosos en un lote de 2antes,
con lo explicado 000 (pobla-
un
intervalo
ción). Para ello,al
se 95%
toma de
unaconfianza estáde
muestra aleatoria dado porartículos
n = 100 : y se encuentra
que de éstos, x = 5, son defectuosos. Por lo tanto, un estimador puntual de p es p̂ =
5/100 = 0.050. Si se quiere estimar p por intervalo, entonces de acuerdo con lo expli-
cado antes, un intervalo al 95% de confianza está dado por
EJEMPLO
0.05(1 − 0.05)
0 .050 ± 1 .96
de aquí́ que, con una confianza de= 095%,
.050 ±p0.está
043 entre 0.007 y
100
0.093, en términos porcentuales entre 0.7% y 9.3%.
de aquí
En que, con una confianza
el calculo anterior,deal
95%, p está
valor de entre 0.007sey 0.093,
0.043 en términos
le conoce como por-
centuales entre 0.7% y 9.3%. En el cálculo anterior, al valor de 0.043 se le conoce
error de estimación, porque hasta en ese valor puede diferir
comopˆerror p estimación, porque hasta en ese valor puede diferir p̂ de p.
de de
Tamaño de muestra. Si se quiere estimar el tamaño de la muestra n, que es nece-
sario para estimar p con un error máximo de E, entonces dado que E = Zα / 2 pˆ (1 − pˆ ) /n ;
si despejamos de aquí a n obtenemos que
omo error de estimación, porque hasta en ese valor puede diferir p̂ de p.
e 0.7% y 9.3%. En el cálculo anterior, al valor de 0.043 se le conoce
estimación, porque hasta en ese valor puede diferir p̂ de p.
u Tamaño de muestra.
Si seSiquiere
Tamaño de muestra. se quiere estimar
estimar el tamaño
el tamaño de la muestra
de la muestra es que
n, que n,
muestra. Si se quiere estimar el tamaño de la muestra n, que es nece-
ariop con
mar paraunestimar p con
error máximo deun
necesarioerrorpara
máximo
E, entonces dado quede
E =E,Zαentonces
estimar p con un error
ˆ
p (1 − ˆ
pdado
) /n ; que
máximoE =
de ZE ,
α /2 pˆ (1
entonces dado que /2
; si despejamos de
idedespejamos de aquí
aquí a n obtenemos que
aquía na nobtenemos que
obtenemos que:
Zα2 / 2 pˆ (1 − pˆ )
n= Z pˆ (1 − pˆ )
2

EJEMPLO
E2 n= α /2
2
E
a estimación del valor de p. Por ejemplo, si en el problema anterior se
or máximo de E = 0.03, con una confianza de 95%, entonces se requie-
donde p̂ es una estimación del valor de p. Por ejemplo,
96) (0.05)(1 – 0.05)/(0.03) ª 203. En ocasiones, cuando no se sabe
2 2 si en el problema an
donde pˆ es una estimación del valor de p. Por ejemplo, si
quisiera
a fórmulaun errorsemáximo
anterior, supone de E = 0.03,
= 0.5.
en el p̂problema
con una confianza de 95%, entonces se
anterior se quisiera un error máximo de E =
e que n = (1.96)2 (0.05)(1
0.03, con–una0.05)/(0.03)
confianza de 2 ª
95%,203. En ocasiones,
entonces cuando no
se requiere que
de fórmulas para intervalos de confianza
nada de p en la fórmula anterior, se supone
n = (1.96) p̂ = 0.5.
2(0.05)(1–0.05)/(0.03)2 = 203.

se muestran las fórmulasEnpara calcular los


ocasiones, intervalos
cuando no se desabe
confianza
nadamásde p en la fórmula
más de los intervalos para un parámetro
anterior, ya presentados,
se supone pˆ = 0.5. en la tabla se
Resumen de fórmulas para intervalos de confianza
órmulas correspondientes para intervalos de confianza que involucran
p(1 − p)
n
.
Con el uso de la misma argumentación que en el intervalo para la media,
se deduce que el intervalo de confianza para la proporción es de la forma

pˆ (1 − pˆ ) pˆ (1 − pˆ )
pˆ − Zα / 2 ≤ p ≤ pˆ + Zα / 2
n n

donde Za/2 es un percentil de tabla de la distribución normal estándar que está en el


apéndice.

Tabla 2.1 Resumen de fórmulas para intervalos de confianza.

Parámetro Límite inferior Límite superior


S S
m X − tα /2 X + tα /2
n n

(n − 1)S 2 (n − 1)S 2
s2
χα2 / 2, n − 1 χ12− α / 2, n − 1

Resumen de formulas p pˆ − zα / 2
pˆ (1 − pˆ )
n
pˆ + zα / 2
pˆ (1 − pˆ )
n

para intervalos de ( X1 − X 2 ) − tn1 + n2 − 2 S p


1 1
+

confianza
n1 n2 1 1
m1 – m2 ( X1 − X 2 ) + tn1 + n2 − 2 S p +
(n1 − 1)S + (n2 − 1)S
2 2 n1 n2
donde S p = 1 2
n1 + n2 − 2

σ 12 S 21 S 21
F1 − α / 2, n2 − 1, n1 − 1 Fα / 2, n2 − 1, n1 − 1
σ 22 S 22 S 22

pˆ1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 ) pˆ1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 )


p1 – p2 ( pˆ1 − pˆ 2 ) − zα / 2 + ( pˆ1 − pˆ 2 ) + zα / 2 +
n1 n2 n1 n2

Gutierrez-02.indd 28 12/10/07 10:05:48


Planteamiento de una hipótesis Ho : El nombre de hipótesis nula se deriva del hecho de que
comúnmente se plantea como una igualdad, lo cual facilita el
estadística tener una distribución de probabilidad de referencia especifica

Una hipótesis estadística es una afirmación


sobre los valores de los parámetros de una
H1 : El nombre de hipótesis alternativa se deriva de ser la
población o proceso, que es susceptible de
negación de la hipótesis nula H0
probarse a partir de la información
contenida en una muestra representativa
que es obtenida de la población.
Estadístico de prueba es un número calculado a partir
Probar una hipótesis consiste en investigar si de los datos y la hipótesis nula, cuya magnitud permite
lo afirmado por la hipótesis nula es verdad o discernir si se rechaza o no la hipótesis nula H0.
no. La estrategia de prueba parte del
supuesto de que H0 es verdadera, y si los
resultados de la investigación contradicen Al conjunto de posibles valores del estadístico de prueba
en forma suficiente dicho supuesto, que llevan a rechazar H0, se le llama región o intervalo de
rechazo para la prueba
entonces se rechaza H0 y se acepta la
hipótesis alternativa. En caso de que los
resultados de la investigación no
demuestren claramente la falsedad de H0, los posibles valores donde no se rechaza H0 se les llama región o
esta no se rechaza. intervalo de aceptación

Es decir, la hipótesis nula es verdadera


mientras no se demuestre lo contrario
0

Hipótesis unilateral e hipótesis bilateral -


Región de aceptación / Región de
rechazo H : p = 0.080 H : p = 0.08 0
HA : p < 0.08 HA : p π 0.08

Región 1– a Región 1– a Región


o intervalo o intervalo o intervalo
de rechazo de rechazo de rechazo

–z a –z a/2 z a/2
Región o intervalo Intervalo de
de aceptación aceptación

H0 : µ0 = µ1 H0 : µ0 = µ1
H1 : µ0 < µ1 H1 : µ0 ≠ µ1
Figura 2.3 Hipótesis unilateral y bilateral, regiones de aceptación y rechazo.
𝜶 = P{error tipo I} = probabilidad de rechazar H0 siendo
El riesgo de una decisión verdadera

equivocada:
Errores tipo I y tipo II
𝜷 = P{error tipo II} = probabilidad de aceptar H0 siendo
Probar una hipótesis estadística es falsa
una decisión probabilística, por lo
que existe el riesgo de cometer un
error tipo I o un error tipo II. El primero
ocurre cuando se re- chaza H0
1 – 𝜷 se le llama potencia de la prueba, y es la
cuando esta es verdadera, y el error probabilidad de rechazar H0 cuando es falsa
tipo II es cuando se acepta H0 y esta
es falsa. En toda prueba de hipótesis
cada tipo de error tiene una
probabilidad de ocurrir. Con 𝜶 y 𝜷 A 𝜶 también se le conoce como la significancia dada de la
denotan las probabilidades de los prueba y es la probabilidad de la región o intervalo de
rechazo; su valor se especifica por parte del investigador
errores tipo I y II, respectivamente. desde que planea el estudio
Así́,
Variables que afectan el poder
Tamaño de la muestra

o la potencia estadística
Efecto mínimo de
Potencia de la
El poder estadístico o potencia
interés (MEI, o efecto
de la prueba, representa la
prueba (1-𝜷)
probabilidad de rechazar la mínimo detectable)
hipótesis nula cuando es
realmente falsa. Es decir,
representa la capacidad de un Nivel de significancia
test para detectar como
estadísticamente significativas
(α)
diferencias o asociaciones de
una magnitud determinada.
Nivel de potencia
deseado (tasa de error
implícita de tipo II)
Test unilateral Test bilateral

Comparación de dos
proporciones

Comparación de dos media

Fórmulas para el cálculo


de la potencia
Estimación de un OR en
estudios de casos y

estadística (1-𝜷)
controles

En su defecto, utilice una Estimación de un RR


calculadora online (recomiendo
G*Power)
Estimación de un coeficiente
de correlación lineal

n = Tamaño muestral. En un estudio de casos y controles, n es el número de casos.

= En un estudio transversal o de cohortes, proporción de expuestos que desarrollan la enfermedad. En un


estudio de casos y controles, proporción de casos expuestos.

= En un estudio transversal o de cohortes, proporción de no expuestos que desarrollan la enfermedad. En un


estudio de casos y controles, proporción de controles expuestos.

d = Valor mínimo de la diferencia a detectar entre dos medias


S2 = Varianza en el grupo control o de referencia
c = Número de controles por caso
m = En un estudio de casos y controles, número de controles
OR = Valor aproximado del odds ratio a detectar
RR = Valor aproximado del riesgo relativo a detectar
r = Magnitud del coeficiente de correlación a detectar
Supongamos que se quiere llevar a cabo un ensayo
clínico para comparar la efectividad de un nuevo
fármaco con la de otro estándar en el tratamiento de
una determinada enfermedad.
Al inicio del estudio, se sabe que la eficacia del
tratamiento habitual está en torno al 40%, y se espera
que con el nuevo fármaco la eficacia aumente al
EJEMPLO menos en un 15%. El estudio se diseñó para que tuviese
un poder del 80%, asumiendo una seguridad del 95%.
Esto implica que son necesarios 173 pacientes en cada
uno de los grupos para llevar a cabo la investigación.
Tras finalizar el estudio, solo fue posible tratar con cada
uno de los fármacos a 130 pacientes en cada grupo en
lugar de los 173 pacientes estimados inicialmente. Al
realizar el análisis estadístico, se objetivó que no hay
diferencias significativas en la efectividad de ambos
tratamientos.
efectividad de un nuevoA fármaco
partircon de la de otrofórmulas
las estándar en eldetratamiento de una determinada
la tabla, podemos enfermedad.
calcular Al inicio
cuál del estudio,
ha sido se sabe que la
del tratamiento habitual está en torno al 40%, y se espera que con el nuevo fármaco la eficacia aumente al menos en un 15%. El estudio se dise
finalmente el poder del estudio. Aplicando la fórmula para el cálculo del
que tuviese un poder del 80%, asumiendo una seguridad del 95%. Esto implica que son necesarios 173 pacientes en cada uno de los grupos pa
poder estadístico de comparación de dos proporciones ante un
a cabo la investigación. Tras finalizar el estudio, sólo fue posible tratar con cada uno de los fármacos a 130 pacientes en cada grupo en lugar de
planteamiento
pacientes estimados inicialmente. Al realizarunilateral se obtiene:
el análisis estadístico, se objetivó que no hay diferencias significativas en la efectividad de ambos
tratamientos. A partir de las fórmulas de la Tabla 2, podemos calcular cuál ha sido finalmente el poder del estudio. Aplicando la fórmula para el c
del poder estadístico de comparación de dos proporciones ante un planteamiento unilateral se obtiene:

EJEMPLO

A partir de la Tabla 3, podemos determinar que un valor de corresponde a un poder en torno al 65%-70%. Utilizando las tablas de
distribución normal, se sabe que el poder es del 68%, es decir, el estudio tendría un 68% de posibilidades de detectar una mejora en la eficacia
tratamiento del 15%. Utilizando las tablas de la distribución normal, se sabe que el poder es del
68%, es
Utilizando la fórmula anterior, decir,
podría el estudio
obtenerse tendría
un gráfico como unse68%
en el que deenposibilidades
muestra depara
la Figura 1, en la que, detectar una
este ejemplo, se estima el p
estadístico del estudiomejora
en funciónen del la eficacia
tamaño del tratamiento
de la muestra del 15%.
estudiada y la magnitud del efecto a detectar. Así, puede concluirse que de haber es
130 pacientes por grupo, se obtiene una potencia de sólo el 36.6% para detectar una diferencia mínima del 10%, una potencia del 68% para det
Así́, puede concluirse que de haber estudiado 130 pacientes por grupo,
una diferencia del 15% y de un 90.2% para una diferencia del 20%. Este tipo de gráficos resulta muy útil tanto en la fase de diseño de un estudio
a la hora de valorar ase obtiene
posteriori el poderuna potencia
de una investigación.de solo el 36.6% para detectar una diferencia
mínima del 10%, una potencia del 68% para detectar una diferencia del
Haciendo uso de la
calculadora G*Power, se
observa que el poder o la
potencia de la prueba, esta
en 0,67976 o lo que equivale
al 67,976%

(1-𝜷) = 0,6797690 ≃ 68%

También podría gustarte