Mathematics">
T4 Muestreo
T4 Muestreo
T4 Muestreo
en el muestreo
Introducción
Tipos de muestreo
1
Características de las distribuciones en el muestreo (para
cualquier población)
Pues bien, en esta parte del curso de Estadística Teórica nos centraremos en la
Inferencia Estadística. Esto es, si hasta ahora estudiábamos y
modelizábamos un fenómeno aleatorio que se daba en la realidad, ahora
tratamos de INFERIR a partir de unos datos obtenidos de la realidad, las
características de este fenómeno.
Al conjunto de técnicas que tienen como objetivo extraer conclusiones para una
T1
población a partir de la información que proporciona una muestra se le
denomina INFERENCIA ESTADÍSTICA.
3
Conceptos de Población y Muestra
Espacio muestral: conjunto de todas las posibles muestras de tamaño n de la
población y que está formado por tantos elementos como muestras distintas de este
tamaño se puedan obtener Xn.
T1
Del tamaño de la muestra.
Para que la muestra sea representativa debe ser aleatoria. Esto nos permitirá
conocer en términos de probabilidad cuál es el error que se comete al usar una
muestra como reflejo de una población.
Tipos de Muestreo
• Selección no probabilística: Muestreo opinático: el investigador elige, con
criterios no aleatorios, los elementos que va a estudiar.
F ( x1 ) F ( x2 ) F ( xn ) ~ i.i.d .
Donde las xi son las extracciones muestrales (muestra genérica) y los números
6
concretos constituyen la muestra específica o realización muestral.
Parámetros Poblacionales y Estadísticos Muestrales
Parámetros poblacionales: son las características numéricas de la población.
En concreto, un parámetro es una característica numérica de la distribución de la
población que permite conocer total o parcialmente su distribución de
probabilidad.
T1
Los estadísticos más comunes son:
x x
n
2
n i
Media muestral: x i Varianza muestral: m2 i 1
S
a1 i 1
x n
n
x x
n
2
i
Cuasivarianza muestral: S 2 i 1
7
n 1
1
Características de las distribuciones en el muestreo
Dado que los estadísticos son variables aleatorias, podremos estudiar sus
características, como son sus momentos (los cuales nos resumen la información de la
variable aleatoria estudiada). Supondremos que proceden de poblaciones con media
µ y varianza σ2.
Esperanza (media): En una muestra aleatoria simple de tamaño “n” (x1, x2, …., xn)
de una variable aleatoria X se define la media muestral o valor medio de los valores
u observaciones muestrales:
1 n
E ( x) xi donde i 1, 2, , n
n i 1
T1 x , x , , x son las extracciones muestrales
1 2 n
Por ser una variable aleatoria podemos calcular la esperanza matemática de la
media muestral
1 n 1 n 1 n 1 n n
E ( x) E xi E xi E ( xi )
n i 1 n i 1 n i 1 n i 1 n
Por tanto, el valor esperado de la media muestral coincide con el valor de la media
poblacional (independientemente de la distribución de probabilidad que siga la 8
población).
Características de las distribuciones en el muestreo
Distribución de la media muestral
Varianza:
1 n 1 n 1 n 1 n 2 n 2 2
V ( x) V xi 2 V xi 2 V ( xi ) 2 2
n i 1 n i 1 n i 1 n i 1 n n
Por tanto, ahora observamos que la varianza muestral no coincide con la varianza
poblacional, sino que es necesario dividirla por el tamaño muestral.
Por tanto, lo que estamos diciendo es que, según aumenta el tamaño de la muestra,
aumenta la precisión de la media muestral para estimar la media poblacional. 9
Características de las distribuciones en el muestreo
Distribución de la Varianza muestral
S
2
n
x x
i
2
n
x x
i
2
1 n
( xi ) 2 n( x ) 2
x
i 1 n i 1 n n i 1
Su esperanza será: 2
x
1
2 2
1 n
n i 1
E ( S ) E ( xi ) n( x ) E ( xi ) 2 nE ( x ) 2
n
n 1 2
se puede demostrar
T1
n
n21 2
S
2
x
11
n
Muestreo en poblaciones Normales
Distribución de la Media Muestral con σ2 conocida
n
Sabemos que: x i
1 1 1
x i 1
x1 x2 xn
n n n n
12
Muestreo en poblaciones Normales
Distribución de la Diferencia de medias muestrales con σ2 conocida
x
m
i
x ~ N ( x ,
x y j y
x i 1 )
y
j 1 y ~ N ( y , )
n n m m
Se considera de interés estudiar el estadístico de diferencia de medias
T1 ഥ − 𝑦) , éste será una combinación lineal de n+m variables
muestrales (𝑥
aleatorias normales e independientes, por lo que su distribución será
normal:
x2 y
2
E x y E x E y x y V x y V x V y
n m
2 13
2
x y ~ N x y ;
y
x
n m
Muestreo en poblaciones Normales
Distribución de la Diferencia de medias muestrales con σ2 conocida
x
m
i
x ~ N ( x ,
x y j y
x i 1 )
y
j 1 y ~ N ( y , )
n n m m
Se considera de interés estudiar el estadístico de diferencia de medias
T1 ഥ − 𝑦) , éste será una combinación lineal de n+m variables
muestrales (𝑥
aleatorias normales e independientes, por lo que su distribución será
normal:
x2 y
2
E x y E x E y x y V x y V x V y
n m
2 14
2
x y ~ N x y ;
y
x
n m
Muestreo en poblaciones Normales
Distribución de la Media Muestral con σ2 desconocida
𝜎
Dado que 𝑥~𝑁
ҧ 𝜇, depende de la varianza poblacional y la
𝑛
desconocemos, recurrimos a una distribución no dependiente de la varianza
poblacional, que es la T-Student. Ésta se define como:
𝑁(0,1)
𝑡𝑛 = 2 𝝌𝑛
𝑛
nS x2
Además sabemos que 𝑥~𝑁
ҧ 𝜇,
𝜎
; 𝑥ҧ = 𝜇 +
𝜎
𝑍; y que n21
𝑛 𝑛 2
T1
Con estos datos nosotros tenemos una N(0,1) y una n21 por lo que debemos
transformar los datos para que podamos obtener la t de student.
Operando llegamos a:
Dadas dos V.A. X~N(x, x) e Y~N(y, y), de cada una de las cuales se
extrae una mas (x1, x2, …., xn) y la segunda (y1, y2, …., yn),
independientemente de la primera, para las que no se conoce el valor de x,
y, siendo n y m el tamaño de las respectivas muestras de cada población,
se obtiene que la distribución de la diferencia de medias cuando las
varianzas poblacionales sean desconocidas resulta ser (la demostración
para llegar a ella es un tanto ardua, y puede consultarse en cualquier
manual, por lo que aquí presentamos únicamente el resultado):
T1
t
x y y n m n m 2
x
~ tn m2
n S x2 m S y2 nm
16
Muestreo en poblaciones Normales
Distribución de la Proporción Muestral
𝑿
ෝ=
𝒑 → Proporción muestral donde 𝑋~𝐵(𝑛, 𝑝)
𝒏 17
Muestreo en poblaciones Normales
Distribución de la Proporción Muestral (continuación)
𝒑𝒒
ෝ~𝑵(𝒑,
𝒑 )
𝒏
T1 pˆ
x p y ~ N px p y ;
px qx p y q y
ˆ
nx ny
19