Statistics">
Nothing Special   »   [go: up one dir, main page]

Teorica 9 Inferencias

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 23

Bioestadística

2018
Área Bioestadística, Escuela de Veterinaria – USAL

Inferencias
Inferencias estadísticas

Población: es el conjunto de todos los individuos de interés


• Normalmente es demasiado grande para poder abarcarla toda = censo
Muestra: es un subconjunto representativo de la población y es sobre el
que realmente hacemos las observaciones

La inferencia estadística consiste en generalizar las conclusiones


extraídas de una muestra sobra una población

n
Parámetro y estimador

Parámetro: es una cantidad numérica calculada sobre la población

Estimador: es una cantidad numérica calculada sobre la muestra

Parámetro Estimador
µ x
σ s

Pero….. Como generalizamos? Podemos equivocarnos?


Necesitamos manejar probabilidades
INSESGADO
Se dice que un estimador es insesgado si la Media de la distribución del
estimador es igual al parámetro.

CONSISTENTE
Un estimador es consistente si aproxima el valor del parámetro cuanto
mayor es n (tamaño de la muestra).

EFICIENTE
Un estimador es más eficiente que otro si la Varianza de la distribución
muestral del estimador es menor a la del otro estimador.
menor eficiencia menor confianza

SUFICIENTE
Un buen estimador es suficiente cuando resume toda la información
relevante contenida en la muestra.
ej: la media muestral sería un estimador suficiente de la media
poblacional, mientras que la moda no lo sería.
Supongamos

Población 100 individuos N=100


Media de la población es 50 µ = 50
La variabilidad es 10 σ = 10
Si sacamos una muestra de mi población

El promedio de la muestra no coincide con el de


la población.

La diferencia entre el valor muestral y el


poblacional es el error muestral.
EM=43,6-50 =-6,4

Es el costo que se paga por no haber hecho un


censo.
Y si sacamos otra muestra de la población???

Los parámetros se calculan sobre los N valores


de la población, por lo tanto no cambian a menos
que cambie la población, son constantes

Los estimadores se calculan sobra n valores


muestrales, por lo tanto varían de muestra en
muestra y por lo tanto son variables aleatorias.
Si repitiéramos este proceso muchas veces, que
comportamiento esperaríamos para todos los
promedios posibles???
Distribución muestral de X
Distribuciones muestrales

La distribución muestral de un estimador es la distribución de


probabilidades de todos los posibles valores de un estimador que se
pueden obtener extrayendo infinitas muestras aleatorias de tamaño n
de la población.

La distribución de un estimador, como de cualquier variable


aleatoria, se puede caracterizar por:
• Tendencia central
• Variabilidad
• Función de probabilidad

Las distribuciones muestrales de los estimadores pueden ser:


• Aproximaciones mediante técnicas de simulación
• Derivadas matemáticamente
Distribución muestral de X

Y si promediamos todas las medias muestrales?

Cual será la variabilidad de las medias muestrales?

El desvío estándar de un estimador se conoce como error estándar y


da idea de la precisión en la estimación
Distribución muestral de X
Y si los datos originales no siguen una distribución
normal?
Teorema central del límite

Si de una población con distribución no normal o desconocida


con media µ y desvío estándar σ se extraen infinitas muestras
aleatorias de tamaño n y a cada una se ellas se le calcula el
promedio X se demuestra que éste se comporta según una
distribución normal si n es lo suficientemente grande.
A que llamamos un n “lo suficientemente grande”?

• Si la variable original es normal, entonces X será normal, para


cualquier n

• Si la variable original es aproximadamente simétrica y unimodal,


entonces X tenderá a una distribución aproximadamente normal
para n relativamente bajos

• Si la variable original es marcadamente asimétrica, entonces n


deberá ser mayor para que la distribución de X sea normal
Distribución muestral de X cuando σ es conocido
Es útil conocer la distribución de un estimador?

Nos permite calcular probabilidades Es la clave para hacer


inferencias!!!

Ejemplo:

• Se sabe que el peso de una placenta de vacas preñadas pastoreo


libre a término sigue una distribución normal con promedio de
500g y un desvío de 50g

• Se determinó el peso de la placenta de 50 partos a término de


vacas de feedlot elegidas al azar y se obtuvo un promedio de
480g

• Cual es la probabilidad de que la media muestral sea de 480g o


menor?
-2,86
Conclusión?
0,00214

-2,86
Que necesitamos para hacer inferencias??
• Una muestra aleatoria

• Observaciones independientes

• Un tamaño de muestra lo suficientemente grande

• Es necesario sacar muchas (infinitas) muestras para poder aplicar


el TCL?

• A mayor n mas cerca del parámetro estará mi estimador?

• A mayor n menor variabilidad de los datos?


Cierta marca de jugos comercializa jugo de ananá con una acidez
media (medida como g de ácido cítrico/100 ml de jugo) de 0.41 g /100
ml, con un desvío estándar de 0.21 g/100 ml, pero se desconoce su
ley de distribución. Un control rutinario sobre el proceso productivo
arroja, sobre un total de 30 determinaciones realizadas, un promedio
de 0,5 g de ácido cítrico/100 ml de jugo.

Calcule la probabilidad de obtener como mínimo dicho valor.


¿Aconsejaría detener el proceso productivo?

También podría gustarte