Mathematics">
Nothing Special   »   [go: up one dir, main page]

Distribuciones de Muestreo

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 44

 INTRODUCCION A LAS DISTRIBUCIONES DE

MUESTREO.

PARAMETROS POBLACIONALES Y ESTADISTICOS


MUESTRALES.

Los parámetros poblacionales son las


características numéricas de la población. En
concreto, un parámetro es una caracterización
numérica de la distribución de la población-
Un estadístico es cualquier función real de las variables
aleatorias que integran la muestra, es decir, es una
función de las observaciones muestrales, la cual no
contiene ningún valor o parámetro desconocido.
un parámetro y un estadístico son conceptos muy
diferentes, pues el parámetro es una constante y
cuando se conoce determina completamente el
modelo probabilístico, sin embargo, el estadístico
es una variable aleatoria cuyo valor dependerá de
las observaciones muestrales.

Así pues, si la medida numérica se calcula para el


conjunto de datos poblacionales le llamaremos
valor del parámetro poblacional y si se calcula
para el conjunto de datos muestrales, le
llamaremos valor del estadístico muestral.
Donde:

μ = Media poblacional

σ 2 = Varianza poblacional

p= Proporción poblacional
DISTRIBUCION MUESTRAL DE
ESTADISTICOS
Ejemplo:

Sea una empresa dedicada al transporte y distribución


de mercancías, la cual tiene una plantilla de 50
trabajadores. Durante el último año se ha observado
que 25 trabajadores han faltado un solo día al trabajo,
20 trabajadores han faltado dos días y 5 trabajadores
han faltado tres días. Si se toma una muestra
aleatoria, con reemplazamiento de tamaño dos (X1, X2 )
del total de la plantilla, obtener:
1. La distribución de probabilidad del número de días que ha
faltado al trabajo un empleado, su media y su varianza.
2. Distribución de probabilidad del estadístico media muestral X
3. La distribución de probabilidad del estadístico varianza muestral,
S2
4. La media y varianza del estadístico media muestral
5. La probabilidad de que el estadístico media muestral X, sea menor
que 2
6. La media y varianza del estadístico varianza muestral
7. La probabilidad de que el estadístico varianza muestral S2, sea menor o
igual que 0.5
Solución:

1. Empezaremos obteniendo la distribución de probabilidad de la


variable aleatoria

X: número de días que ha faltado al trabajo un empleado


elegido aleatoriamente de la plantilla total.

La variable aleatoria X, puede tomar los valores 1, 2 o 3, y como la


selección se hace de manera aleatoria, todos los trabajadores
tendrán la misma probabilidad de ser seleccionados, luego la
distribución de probabilidad de la variable aleatoria X viene dada en
la tabla 1.2, y será la distribución de probabilidad de la población.
A partir de esta distribución de probabilidad tenemos
que la media será:

Y la varianza:
Observamos que si sumamos el número total de faltas al
trabajo que se han producido en la población de los 50
empleados y dividimos por los 50 empleados tenemos la
media:

25 . 1 + 20 . 2 + 5 . 3 = 80 = 1.6

50 50

Análogamente sucede con la varianza.


Por esto en lo sucesivo μ y σ2 serán consideradas como la media y la
varianza poblacional, respectivamente.

1. Seleccionamos una muestra aleatoria, con reemplazamiento, de


tamaño dos (X1 , X2), siendo:

X1 : Variable aleatoria correspondiente al número de días que falta el


primer trabajador seleccionado

X2: Variable aleatoria correspondiente al número de días que falta el


segundo trabajador seleccionado

Ambas variables aleatorias X1 y X2 tienen la misma distribución de


probabilidad que de la variable aleatoria X, correspondiente a la
población.
Pero como nos interesa obtener la distribución de
probabilidad del estadístico media muestral:
Errores en el Muestreo.

Cuando se utilizan valores muestrales, o estadísticos


para estimar valores poblacionales, o parámetros,
pueden ocurrir dos tipos generales de errores: el
error muestral y el error no muestral.
El error muestral se refiere a la variación natural
existente entre muestras tomadas de la misma
población.

Cuando una muestra no es una copia exacta de la


población, aun si se ha tenido gran cuidado para
asegurar que dos muestras del mismo tamaño sean
representativas de una cierta población, no
esperaríamos que las dos sean idénticas en todos sus
detalles.
Los errores que surgen al tomar las muestras
no pueden clasificarse como errores
muestrales y se denominan errores no
muestrales.

El sesgo de las muestras es un tipo de error no


muestral.

El sesgo muestral se refiere a una tendencia


sistemática inherente a un método de muestreo que
da estimaciones de un parámetro que son, en
promedio, menores (sesgo negativo), o mayores
(sesgo positivo) que el parámetro real.
El sesgo muestral puede suprimirse, o
minimizarse, usando la aleatorización.

La aleatorización se refiere a cualquier proceso de


selección de una muestra de la población en el
que la selección es imparcial o no está sesgada;
una muestra elegida con procedimientos
aleatorios se llama muestra aleatoria.

Los tipos más comunes de técnicas de muestreo


aleatorios son el muestreo aleatorio simple, el
muestreo estratificado, el muestreo por
conglomerados y el muestreo sistemático.
Si una muestra aleatoria se elige de tal forma que
todos los elementos de la población tengan la
misma probabilidad de ser seleccionados, la
llamamos muestra aleatoria simple.
Ejemplo:

Suponga que nos interesa elegir una muestra aleatoria de 5


estudiantes en un grupo de estadística de 20 alumnos.

20C5 da el número total de formas de elegir una muestra no


ordenada y este resultado es 15,504 maneras diferentes de
tomar la muestra.

Si listamos las 15,504 en trozos separados de papel, una tarea


tremenda, luego los colocamos en un recipiente y después los
revolvemos, entonces podremos tener una muestra aleatoria
de 5 si seleccionamos un trozo de papel con cinco nombres.
Un procedimiento más simple para elegir una muestra aleatoria
sería escribir cada uno de los 20 nombres en pedazos separados
de papel, colocarlos en un recipiente, revolverlos y después
extraer cinco papeles al mismo tiempo.

Otro método para obtener una muestra aleatoria de 5


estudiantes en un grupo de 20 utiliza una tabla de números
aleatorios.

Se puede construir la tabla usando una calculadora o una


computadora. También se puede prescindir de estas y 4 hacer la
tabla escribiendo diez dígitos del 0 al 9 en tiras de papel, las
colocamos en un recipiente y los revolvemos, de ahí, la primera
tira seleccionada determina el primer número de la tabla, se
regresa al recipiente y después de revolver otra vez se selecciona
la seguida tira que determina el segundo número de la tabla; el
proceso continúa hasta obtener una tabla de dígitos aleatorios
con tantos números como se desee.
Hay muchas situaciones en las cuales el muestreo
aleatorio simple es poco práctico, imposible o no
deseado; aunque sería deseable usar muestras
aleatorias simples para las encuestas nacionales de
opinión sobre productos o sobre elecciones
presidenciales, sería muy costoso o tardado.

El muestreo estratificado requiere de separar a la


población según grupos que no se traslapen llamados
estratos, y de elegir después una muestra aleatoria
simple en cada estrato. La información de las s
muestras aleatorias simples de cada estrato
constituiría entonces una muestra global.
Error Muestral

Cualquier medida conlleva algún error.

Si se usa la media para medir, estimar, la media poblacional


m, entonces la media muestral, como medida, conlleva
algún error.

Por ejemplo, supongamos que se ha obtenido una muestra


aleatoria de tamaño 25 de una población con media m=15
si la media de la muestra es x=12, entonces a la diferencia
observada x-m = -3 se le denomina el error muestral.

Una media muestral x puede pensarse como la suma de


dos cantidades, la media poblacional m y el error muestral;
si e denota el error muestral, entonces: X = m + e
ERROR ESTANDAR:

En lugar de decir “la desviación estándar de la


distribución de medias de la muestra” para describir
una distribución de medias de la muestra, los
estadísticos se refieren al error estándar de la media.
De manera similar, la “desviación estándar de la
distribución de las proporciones de la muestra” se
abrevia como error estándar de las proporciones.

El término error estándar se utiliza porque da a


entender un significado específico.
La desviación estándar de la distribución de las
medias de las muestras mide el grado hasta el
que esperamos que varíen las medias de las
diferentes muestras debido a este error fortuito
cometido en el proceso de muestreo. Por tanto,
la desviación estándar de la distribución de una
estadística de muestra se conoce como error
estándar de la estadística.
El error estándar indica no solo el tamaño del
error de azar que se ha cometido, sino también la
probable precisión que obtendremos si
utilizamos una estadística de muestra para
estimar un parámetro de población.

Una distribución de medias de muestra que está


menos extendida ( y que tiene un error estándar
pequeño) es un mejor estimador de la media de
la población que una distribución de medias de
muestra que está ampliamente dispersa y que
tiene un error estándar más grande.
σ = σ / n
x

Donde:

σ = Error estándar de la media

σ = Desviación estándar de la población

n= Tamaño de la muestra
 Teorema del Límite Central.
El teorema central del límite (TCL) es una teoría estadística que
establece que, dada una muestra suficientemente grande de la
población, la distribución de las medias muestrales seguirá una
distribución normal
Además, el TCL afirma que a medida que el tamaño de la
muestra se incrementa, la media muestral se acercará a la media
de la población.

Por tanto, mediante el TCL podemos definir la distribución de la


media muestral de una determinada población con
una varianza conocida.

De manera que la distribución seguirá una distribución normal si


el tamaño de la muestra es lo suficientemente grande.
La media de la distribución de muestreo de la media
será igual a la media de la población, sin importar el
tamaño de la muestra, incluso si la población no es
normal.

Al incrementarse el tamaño de la muestra, la


distribución de muestreo de la media se acercará a la
normalidad, sin importar la forma de la distribución
de la población.

Esta relación entre la forma de la distribución de la


población y la forma de la distribución del muestreo
se denomina TEOREMA DEL LIMITE CENTRAL.
El teorema del límite central es tal vez el más
importante de toda la inferencia estadística. Nos
asegura que la distribución de muestreo de la media
se aproxima a la normal al incrementarse el tamaño
de la muestra.

La importancia del teorema del Límite Central es que


nos permite usar estadísticas de muestra para hacer
inferencias con respecto a los parámetros de población
sin saber nada sobre la forma de la distribución de
frecuencia de esa población más que lo que podamos
obtener de la muestra.
Ejemplo:

Sea X el número de imperfecciones en una pulgada


de un alambre de cobre. La función de masa de
probabilidad de X se muestra en la tabla siguiente:
X P (X= x)

0 0.48

1 0.39

2 0.12

3 0.01
Se toma una muestra de 100 alambres de esta
población. ¿Cuál es la probabilidad de que el número
promedio de imperfecciones por alambre en esta
muestra sea menor a 0.5?

Solución:

Media y varianza para variables aleatorias


discretas:

μ=  x P ( X = x)

σ2=  ( x – μ )2 P (X= x)
Obteniendo la media del número de imperfecciones en
la población es:

μ= (0 x 0.48) + (1 x 0.39) + (2 x 0.12) + (3 x 0.01) = 0.66

y la varianza poblacional es

σ2= ( 0 – 0.66)2 (0.48) + (1 – 0.66)2 (0.39) + (2-0.66)2


(0.12) + (3- 0.66)2 (0.01)

σ2 = 0.5244 por lo que

σ = 0.724154
n= 100

σi = 0.724154 / 100 = = 0.724154 / 10 = 0.0724154


 
z = 0.5 – 0.66 = - 2.2094  -2.21
0.0724154
De la tabla de distribución normal:
z 0.01

2.2 0.0136

P( X < 0.5 ) = 0.0136

También podría gustarte