Science">
Bioestadística Básica
Bioestadística Básica
Bioestadística Básica
Trabaja con datos estadísticos (dato estadístico: tiene que cumplir con 3 condiciones: tienen
que poder ser comparados, analizados e interpretados).
Etapas históricas:
Fenómenos:
Población/ universo: conjunto de elementos a los que se refiere un estudio estadístico. Puede
ser finita o infinita.
Aleatoria
Dirigida
Elemento o unidad estadística: es cada uno de los individuos que compone la población
Aleatorio simple: los elementos de la población tienen que estar identificados para
poder realizar un sorteo.
Aleatorio sistemático: se sortea solo el primer elemento de la muestra y luego se
eligen los otros siguiendo un cierto sistema.
Estratificado: cuando las poblaciones son grandes y no son homogéneas entonces se
divide la población en estratos (categorías) y se eligen elementos de cada estrato.
Por conglomerado: muy grandes y geográficamente muy distribuidas.
Variables: es una característica del elemento susceptible de cambios. (ej: peso, altura, etc). Se
divide en:
Censos:
Instrumento legal
Normas técnicas
Parámetros: medidas de población
Estimadores: medidas de la muestra.
Para que el estudio sea bueno tiene que ser el valor del parámetro y del estimador lo más
parecidos posible.
Clasificación de la estadística:
Primero hay que establecer el objetivo, identificación la población, elegir o definir la muestra y
diseñar el muestreo.
n: tamaño de la muestra
Fi (frecuencia absoluta): cantidad de veces que se repite cada uno de los valores posibles de la
variable.
eje x: Xi
eje y: Fi
eje x: Xi
eje y: Fa
Estadística descriptiva
Son valores numéricos que nos dan una unidad sencilla respecto a la distribución de datos.
Ventajas:
Desventaja
2) mediana: valor que divide al conjunto en dos partes iguales o que deja igual
cantidad de valores hacia la derecha y hacia la izquierda.
Simetría y asimetría:
La varianza y el desvío son medidas de variabilidad absoluta por lo tanto están afectadas
por las unidades de la variable.
Probabilidad
Experimento aleatorio: se dice que un experimento es aleatorio si pueden asumirse válidas las
siguientes hipótesis:
Se dice que la probabilidad del evento A es el cociente entre el numero de casos favorables a A
sobre el numero de casos posibles.
Propiedades de la probabilidad:
1- 0 ≤ p(A) ≤1
2- P(Ω)= 1
3- La probabilidad de un evento imposible es cero
4- La probabilidad de un evento A es igual a uno menos la probabilidad de su
complemento.
P(A)= 1- p(Ac)
Distribuciones probabilísticas
Distribución binomial:
Tanto p como q son constantes en cada ensayo y cada ensayo debe ser independiente.
Conociendo que:
Por lo tanto la probabilidad de encontrar r elementos que complen con el evento A luego de n
repeticiones del experimento, se define como P(r):
𝑛
Siendo ( ) las posibles combinaciones de ocurrencia de r en n experimentos y eso se resulve
𝑟
de la siguiente manera:
Distribución de Poisson:
Hay ciertos fenómenos que por sus características pueden considerarse como procesos de
poisson, generalmente se trata de observaciones independientes en un intervalo de tiempo,
en un determinado volumen por superficie o en una unidad de longitud.
La representación gráfica para la distribución normal es una curva simétrica que tiene forma
de campana. La localización del centro de la campana está dado por el parámetro media
poblacional (μ) y la mayor o menor amplitud de la campana viene dada por el desvío
poblacional (σ).
Cuanta más chata es la curva, mas desvío poblacional tiene. La curva o toca el eje, a de -∞ a ∞
pero en algún momento el valor se vuelve despreciable.
2. El punto más alto de una curva normal se encuentra sobre la media, la cual coincide con la
mediana y la moda.
4. La desviación estándar determina la forma de la curva. Cuanto mayor sea el valor de σ , más
se dispersarán los datos en torno a la media y la curva será más baja. Un valor pequeño de
este parámetro indica una gran probabilidad de obtener datos cercanos al valor medio de la
distribución y la curva será más alta.
Estandarización (z)
Inferencia Estadística
Introducción:
En aquellos casos en los que no se cuente con los valores de los parámetros poblacionales se
deben recurrir a técnicas o métodos que nos permitan estimar tales parámetros. El primero de
estos métodos es mediante la estimación de parámetros mediante un intervalo de confianza, y
el segundo de estos métodos es el contraste de hipótesis.
La estimación de parámetros puede ser puntual y esto significa que el valor del parámetro
poblacional es igual al valor del estimador, esto consiste en asignar un valor concreto al
parámetro. En cambio, un intervalo de confianza está conformado por un conjunto de valores
numéricos con una prefijada probabilidad de que éste contenga al verdadero valor del
parámetro poblacional.
Intervalos de Confianza
Por ejemplo, para el caso del promedio, diremos que el promedio muestral 𝑥̅ es igual al valor
del promedio poblacional µ, (𝑥̅ estima puntualmente a 𝜇).
Aunque el estimador cumpla con todas las propiedades de un buen estimador va a existir un
error de estimación que es la diferencia entre el valor muestral y el verdadero valor del
parámetro [1].
Debido a que el valor del estimador depende de los valores 𝑥i de la muestra estamos
cometiendo un error cuyo valor es aleatorio, es decir, siempre es desconocido tanto en
módulo como en su signo.
Una manera de evitar incurrir en este error aleatorio es construir un intervalo de valores
confianza. Este intervalo consiste en un par de valores dentro de los que se tiene una cierta
probabilidad de que valga el verdadero valor del parámetro poblacional.
Esta probabilidad se denomina nivel de confianza, su valor puede ser tan grande como se
desee y constituirá una medida del grado de precisión con el que se estima el parámetro.
Prueba de hipótesis:
El método de estimación puntual y por intervalos lo usamos para proponer una estimación de
un parámetro poblacional. Otra metodología inferencial sirve para probar la validez de una
afirmación acerca del valor de un parámetro. Una afirmación cuantitativa respecto a un
parámetro poblacional se llama hipótesis estadística y los métodos usados para probar su
validez se llaman pruebas de hipótesis.
El método más seguro para probar una hipótesis es un examen de la población completa, lo
cual es imposible por tiempo y costo.
Sea θ un parámetro poblacional y la hipótesis que se somete a prueba es H0: θ= θ0 y H1: θ> θ0
Diseño experimental
Es una secuencia de pasos para asegurar que los datos se obtienen adecuadamente.
Factores a analizarse:
En experimentos agropecuarios ese valor es más alto por la heterogeneidad del material
experimental:
CV= S/ 𝑥̅ x 100
Tipos de diseños:
La base del diseño experimental se llama ANOVA, ANVA o ADEVA que es una prueba de
hipótesis en la cual en vez de comparar 2 μ, se comparan más
H0= μ1= μ2= μ3= μ4 H1= por lo menos en uno hay diferencia
Sirve para comprar la media de 2 o más poblaciones y es la base del diseño experimental.
Por medio de la prueba e hipótesis para diferencias de μ se pueden comparar las medias de 2
poblaciones pero si se desean comprar más de dos medias no es conveniente hacerlo tomando
de a pares porque aumentaría el error de significación (α). Lo que se hace es comparar
simultáneamente todas las diferencias de μ mediante el análisis de la varianza.
Xij= μi + εij
Donde: