Nothing Special   »   [go: up one dir, main page]

Distribuciones Fundamentales para El Muestreo

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 44

Diapositivas Preparadas por

JOHN S. LOUCKS
St. Edward’s University
Adaptadas por
José Luis Martínez Pichardo
Instituto Tecnológico de Celaya

© 2002 South-Western/Thomson Learning Slide


1
Muestreo y Distribuciones de
Muestreo
 Muestreo Aleatorio Simple
 Estimación Puntual (Estimadores)
 Introducción a las Distribuciones de Muestreo
 Distribución Muestral de x
n = 100
 Distribución Muestral de p
 Propiedades de los Estimadores
Puntuales
 Otros Métodos de Muestreo
n = 30

Slide
2
Inferencia Estadística
 El propósito de la inferencia estadística es obtener
información acerca de una población a partir de
información contenida en una muestra.
 Una población es el conjunto de todos los elementos
de interés.
 Una muestra es un subconjunto de la población.
 Los resultados de la muestra proporcionan sólo
estimaciones de los valores de las características de
la población.
 Un parámetro es una característica numérica de una
población.
 Con métodos de muestreo apropiados, los resultados
de la muestra proporcionarán “buenas” estimaciones
de las características de la población.

Slide
3
Muestreo Aleatorio Simple
 Población Finita
• Una muestra aleatoria simple de una población
finita de tamaño N es una muestra seleccionada de
modo tal que cada posible muestra de tamaño n
tiene la misma probabilidad de ser seleccionada.
• El remplazo de cada elemento muestreado antes
de seleccionar elementos subsecuentes se
denomina muestreo con remplazo.
• El muestreo sin remplazo es el procedimiento
usado más frecuentemente.
• En proyectos de muestreo grandes, los números
aleatorios generados por computadora se usan
frecuentemente para automatizar el proceso de
selección de la muestra.

Slide
4
Muestreo Aleatorio Simple
 Población Infinita
• Una muestra aleatoria simple de una población
infinita es una muestra seleccionada de modo tal
que se satisfacen las condiciones siguientes.
• Cada elemento seleccionado proviene de la
misma población.
• Cada elemento se selecciona
independientemente.
• La población generalmente se considera infinita si
implica un proceso continuo que hace que listar o
contar cada elemento sea imposible.
• El procedimiento de selección de números
aleatorios no puede usarse para poblaciones
infinitas.

Slide
5
Estimación Puntual
 En la estimación puntual se usan los datos de la
muestra para calcular un valor de un estadístico de
una muestra estadística que sirve como un estimador
de un parámetro de la población.
 x es el estimador puntual de la media de la población
.
 s es el estimador puntual de la desviación estándar
de la población .
 p es el estimador puntual de la proporción de la
población p.

Slide
6
Error de Muestreo
 La diferencia absoluta entre un punto estimado no
desviado y el correspondiente parámetro de la
población se denomina error de muestreo.
 El error de muestreo es el resultado de usar un
subconjunto de la población (la muestra), y no la
población total para desarrollar estimaciones.
 Los errores de muestreo son:
 | la media muestral
| x  para
| s - s | para la desviación estándar
muestral
| p  para
p | la proporción muestral

Slide
7
Ejemplo: St. Andrew’s

St. Andrew’s University recibe anualmente


900 solicitudes de aspirantes a ingresar. Las
formas de solicitud contienen una variedad
de información incluyendo el resultado de la
prueba de aptitud escolar (SAT) y si el
individuo desea alojamiento en el campus.

Slide
8
Ejemplo: St. Andrew’s
Al director de admisiones le gustaría conocer
la siguiente información:
• El promedio de los resultados del SAT para
los solicitantes, y
• La proporción de solicitantes que quieren
vivir en el campus.
Tres alternativas para obtener la información

deseada serían:
• Realizar un censo de los 900 solicitantes.
• Seleccionar una muestra de 30 solicitantes,
usando una tabla de números aleatorios.
• Seleccionar una muestra de 30 solicitantes,
usando números aleatorios generados porSlide
9
Ejemplo: St. Andrew’s
 Realizar un Censo de los 900 Solicitantes
• Resultados del SAT
• Media de la Población


 x i
 990
900
• Desviación Estándar de las Población


 (x i   )2
 80
900
• Solicitantes que Desean Alojarse en el Campus
• Proporción de la Población
648
p  .72
900
Slide
10
Ejemplo: St. Andrew’s
 Tomar una Muestra de 30 Solicitantes Usando una
Tabla de Números Aleatorios
Puesto que la población finita tiene 900 elementos,
se necesitarán números aleatorios de 3 dígitos para
seleccionar aleatoriamente solicitantes numerados
del 1 al 900.
Se usarán los últimos tres dígitos de los números
aleatorios de 5 dígitos en la tercera columna de una
tabla de números aleatorios. Los números que se
sacarán serán los números de los solicitantes que se
muestrearán a menos que
• el número aleatorio sea mayor que 900 o
• el número aleatorio ya haya sido utilizado.
Se continuará extrayendo números aleatorios hasta
tener 30 solicitantes para la muestra.
Slide
11
Ejemplo: St. Andrew’s
 Uso de Números Aleatorios para Muestrear
Número Aleatorio Solicitante
de 3 Dígitos Incluido en la Muestra
744 No. 744
436 No. 436
865 No. 865
790 No. 790
835 No. 835
902 Número mayor de 900
190 No. 190
436 Número ya usado
etc. etc.

Slide
12
Ejemplo: St. Andrew’s
 Datos Muestrales
Número Resultado Alojamiento
No. Aleatorio Solicitante SAT en el Campus
1 744 Connie Reyman 1025 Si
2 436 William Fox 950 Si
3 865 Fabian Avante 1090 No
4 790 Eric Paxton 1120 Si
5 835 Winona Wheeler 1015 No
. . . . .
30 685 Kevin Cossack 965 No

Slide
13
Ejemplo: St. Andrew’s
 Tomar una Muestra de 30 Solicitantes Usando
Números Aleatorios Generados por Computadora
• Excel proporciona una función para generar
números aleatorios en su hoja de cálculo.
• Se generan 900 números aleatorios, uno por cada
solicitante en la población.
• Luego se eligen los 30 solicitantes
correspondientes a los 30 números aleatorios más
pequeños como la muestra.
• Cada uno de los 900 solicitantes tiene la misma
probabilidad de ser incluida.

Slide
14
Uso de Excel para Seleccionar
una Muestra Aleatoria Simple
 Fórmula de la Hoja de Cálculo
A B C D
Número de Resultad En el Número
1 Solicitante SAT Campus Aleatorio
2 1 1008 Si =RAND()
3 2 1025 No =RAND()
4 3 952 Si =RAND()
5 4 1090 Si =RAND()
6 5 1127 Si =RAND()
7 6 1015 No =RAND()
8 7 965 Si =RAND()
9 8 1161 No =RAND()

Nota: No se muestran los renglones 10-901.

Slide
15
Uso de Excel para Seleccionar
una Muestra Aleatoria Simple
 Valor de la Hoja de Cálculo
A B C D
Número de Resultad En el Número
1 Solicitante SAT Campus Aleatorio
2 1 1008 Si 0.26660
3 2 1025 No 0.98392
4 3 952 Si 0.90355
5 4 1090 Si 0.66486
6 5 1127 Si 0.54644
7 6 1015 No 0.57485
8 7 965 Si 0.06149
9 8 1161 No 0.97387

Nota: No se muestran los Renglones 10-901.

Slide
16
Uso de Excel para Seleccionar
una Muestra Aleatoria Simple
 Valor de Hoja de Cálculo (Ordenado)
A B C D
Número de Resultad En el Número
1 Solicitante SAT Campus Aleatorio
2 12 1107 No 0.00027
3 773 1043 Si 0.00192
4 408 991 Si 0.00303
5 58 1008 No 0.00481
6 116 1127 Si 0.00538
7 185 982 Si 0.00583
8 510 1163 Si 0.00649
9 394 1008 No 0.00667
Nota: No se muestran los renglones 10-901.

Slide
17
Ejemplo: St. Andrew’s

 Puntos Estimados o Estimadores


• x como Punto Estimador de 
x
 x

29,910
i
 997
30 30
• s como Punto Estimador de 
s
 (x  x )
i

2
163,996
 75.2
29 29
• p como Punto Estimador de p
p  20 30  .68
 Nota: Números aleatorios diferentes habrían
identificado una muestra diferente la cual habría
resultado en puntos estimados diferentes.

Slide
18
Distribución Muestral de x

 Proceso de Estadística Inferencial

Población Se selecciona una muestra


con media aleatoria simple de n
elementos de la
m=? población

x
El valor de se usa Los datos muestrales
para hacer inferencias dan un valor de la
media muestralx
acerca del valor de m.

Slide
19
Distribución Muestral de x

 La distribución muestral de x es la distribución de


probabilidad de todos los posibles valores de la
media muestral x .
 Valor esperado de x
E( ) =  x
donde:
 = la media de la población

Slide
20
Distribución Muestral de x

 Desviación Estándar de x
Población Finita Población Infinita

 N n 
x  ( ) x 
n N 1 n
• Una población finita se trata como si fuera infinita
si n/N < 0.05.
• ( N  n) / ( N  1) es el factor de corrección finito.
•  x es referido como el error estándar de la media.

Slide
21
Distribución Muestral de x

 Si se usa una muestra aleatoria simple grande


(n > 30) , el Teorema del Límite Central permite
concluir que la distribución muestral de x puede
aproximarse por la distribución de probabilidad
normal.
 Cuando la muestra aleatoria simple es pequeña
(n < 30), la distribución muestral de x puede
considerarse normal sólo si se asume que la
población tiene una distribución de probabilidad
normal.

Slide
22
Ejemplo: St. Andrew’s

 Distribución muestral de x para los Resultados del


SAT

 80
x    14.6
n 30

x
E ( x )    990

Slide
23
Ejemplo: St. Andrew’s

 Distribución Muestral de x para los Resultados del


SAT
¿Cuál es la probabilidad de que una muestra
aleatoria simple de 30 solicitantes proporcione una
estimación de la media poblacional de los resultados
del SAT que esté dentro de más o menos 10 de la
media de la población real  ?
En otras palabras, ¿cuál es la probabilidad de que
x
se encuentre entre 980 y 1000?

Slide
24
Ejemplo: St. Andrew’s

 Distribución Muestral de x para los Resultados del


SAT
Distribución
muestral
de x

Area = .2518 Area = .2518

x
980 990 1000
Usando la tabla de probabilidad normal estándar con
z = 10/14.6= .68, se tiene un área = (.2518)(2) = .5036

Slide
25
Distribución Muestral de p

 La distribución muestral de p es la distribución de


probabilidad de todos los posibles valores de la
muestra de la proporción p

 Valor Esperado
de p E ( p)  p

donde:
p = la proporción de la población

Slide
26
Distribución Muestral de p

 Desviación Standar de p
Población Finita Población Infinita

p (1  p ) N  n p(1  p)
p  p 
n N 1 n

•  p es referido como el error estándar de la


proporción.

Slide
27
Ejemplo: St. Andrew’s
 Distribución Muestral de p para los Residentes En el
Estado

.72(1  .72)
p   .082
30

E( p )  .72

La distribución de probabilidad normal es una


aproximación aceptable puesto que np = 30(.72) =
21.6 > 5 y n(1 - p) = 30(.28) = 8.4 > 5.

Slide
28
Ejemplo: St. Andrew’s

 Distribución Muestral de p para los Residentes En el


Estado
¿Cual es la probabilidad de que una muestra
aleatoria simple de 30 solicitantes proporcione una
estimación de la proporción de la población de
solicitantes que desean alojarse en el campus que esté
dentro de más o menos 0.5 de la proporción p de la
población real?
En otras palabras, ¿cuál es la probabilidad de que
esté entre 0.67 y 0.77?

Slide
29
Ejemplo: St. Andrew’s

 Distribución Muestral de p para Residentes En el


Estado
Distribución
muestral
de p

Area = .2291 Area = .2291

p
0.67 0.72 0.77
Para z = .05/.082 = .61, el área = (.2291)(2) = .4582.
La probabilidad es .4582 de que la muestra de la
proporción estará dentro de +/-.05 de la proporción
de la población real.
Slide
30
Propiedades de los Estimadores

 Antes de usar una muestra estadística como un punto


estimador, los analistas verifican si tiene las
siguientes propiedades asociadas con los buenos
estimadores.
• No desviación (sesgo)
• Eficiencia
• Consistencia

Slide
31
Propiedades de los Estimadores

 No desviación (sesgo)

Si el valor esperado del estadístico muestral es


igual al parámetro de la población que se está
estimando, se dice que el estadístico muestral es un
estimador insesgado del parámetro poblacional.

Slide
32
Propiedades de los Estimadores

 Eficiencia

Dada la elección entre dos estimadores insesgados


del mismo parámetro poblacional, se preferiría usar
el punto estimado con la menor desviación estándar,
puesto que tiende a proporcionar estimaciones más
cercanas al parámetro de la poblacion.
El estimador con la menor desviación estándar se
dice que tiene mayor eficiencia relativa que el otro.

Slide
33
Propiedades de los Estimadores

 Consistencia

Un punto estimado es consistente si sus valores


tienden a estar más cerca del parámetro poblacional a
medida que el tamaño de la muestra es mayor.

Slide
34
Otros Métodos de Muestreo

 Muestreo Aleatoriamente Estratificado


 Muestreo por Conglomerados
 Muestreo Sistemático
 Muestreo por Conveniencia
 Muestreo por Juicio

Slide
35
Muestreo Aleatoriamente Estratificado

 Primero se divide la población en grupos de


elementos llamados estratos.
 Cada elemento de la población pertenece a uno y
solamente a un estrato.
 Se obtienen los mejores resultados cuando los
elementos dentro de cada estrato son tan similares
como sea posible (ej. grupos homogéneos).
 Se toma una muestra aleatoria de cada estrato.
 Hay fórmulas disponibles para combinar los
resultados de las muestras de los estratos en un
estimador del parámetro poblacional.

Slide
36
Muestreo Aleatorio Estratificado

 Ventaja: Si los estratos son homogéneos, este método


es tan “preciso” como el muestreo aleatorio simple,
pero con un menor tamaño de muestra.
 Ejemplo: La base para formar el estrato puede ser un
departamento, una ubicación, la edad, el tipo de
industria, etc.

Slide
37
Muestreo por Conglomerados

 Primero se divide la población en grupos separados


de elementos llamados conglomerados.
 Idealmente, cada conglomerado es una versión
representativa a pequeña escala de la población (ej.
grupos heterogéneos).
 Se toma una muestra aleatoria simple de los
conglomerados.
 Todos los elementos dentro de cada conglomerado
muestreado (elegido) forman la muestra.

… continúa

Slide
38
Muestreo por Conglomerados

 Ventaja: La proximidad de los elementos puede ser


benéfica para el costo (por ej. muchas observaciones
de la muestra se pueden obtener en un corto tiempo).
 Desventaja: Este método generalmente requiere un
mayor tamaño de muestra que el muestreo aleatorio
simple o que el estratificado.
 Ejemplo: Una aplicación primaria es el muestreo de
un área, donde los conglomerados son cuadras de la
ciudad u otras áreas bien definidas.

Slide
39
Muestreo Aleatorio Sistemático

 Si se desea un muestra de tamaño n de una población


que contiene N elementos, se podría muestrear un
elemento cada n/N elementos en la población.
 Se selecciona aleatoriamente el primero de los n/N
elementos de la lista de la población.
 Luego se selecciona cada n/N avo elemento que
sigue en la lista de la población.
 Este método tiene las propiedades de una muestra
aleatoria simple, especialmente si la lista de los
elementos de la población está ordenada al azar.

… continúa

Slide
40
Muestreo Aleatorio Sistemático

 Ventaja: La muestra usualmente será más fácil de


identificar que si se empleará muestreo aleatorio
simple.
 Ejemplo: Seleccionar cada 100ésimo número telefónico
listado en un directorio después de la primera
elección realizada al azar.

Slide
41
Muestreo por Conveniencia

 Es una técnica de muestreo no probabilística. Los


elementos se incluyen en la muestra sin conocer las
probabilidades de ser seleccionados.
 La muestra se identifica primariamente por
conveniencia.
 Ventaja: La selección de la muestra y la recolección
de datos son relativamente fáciles.
 Desventaja: Es imposible determinar qué tan
representativa de la población es la muestra.
 Ejemplo: Un profesor que conduce una
unvestigación podría emplear estudiantes
voluntarios para constituir una muestra.

Slide
42
Muestreo por Juicio

 La persona con mayor conocimiento en la materia del


estudio selecciona los elementos de la población que
siente que son más representativos de ella.
 Es una técnica de muestreo no probabilística.
 Ventaja: Es una forma relativamente fácil de
seleccionar una muestra.
 Desventaja: La calidad de los resultados de la
muestra dependen del juicio de la persona que la
selecciona.
 Ejemplo: Un reportero podría muestrear tres o
cuatro senadores y juzgarlos como reflejo de la
opinión general del senado.

Slide
43
Fin del Tema

Slide
44

También podría gustarte