Presentacion E. Inferencial PDF
Presentacion E. Inferencial PDF
Presentacion E. Inferencial PDF
Estadística Inferencial
•Se encarga de Inducción o generalización de
nuevos conocimientos a partir del estudio de
muestras derivadas de poblaciones
Principales Métodos que se Utilizan en la
Estadística Descriptiva
Métodos tabulares
•Tabla de frecuencias
•Tabla de frecuencias por clases
Método gráficos
•Histograma de frecuencias
•Polígono de frecuencias
•Diagrama de pastel, etc.
Estimación de parámetros
Pruebas de hipótesis y
análisis de varianza
Análisis de regresión
Principales Tipos de Razonamiento
Existen dos tipos fundamentales de
razonamiento lógico:
I. Razonamiento Deductivo
Utiliza conceptos generalizados para
tratar de llegar a otros más
específicos.
( )
Tres maneras de interpretar el símbolo p
1. Una interpretación distributiva que describe el resultado
en relación con la distribución de puntuaciones en una
población o muestra
.
Área Bajo la Curva Normal
Identificar parte de la curva y calcular la proporción (p) de
la curva total que dicha parte representa.
Cálculo del Área por debajo de z
Cálculo del Área por arriba de z
Cálculo del Área entre dos Valores
Cálculo del Área entre dos puntuaciones z
Uso de la Teoría de la Probabilidad para
producir Distribuciones Muestrales
Error de Muestreo
Encuentre:
1. , Media Poblacional.
2. , la desviación estándar Poblacional.
3. , la media de la distribución muestral de medias.
4. , la desviación estándar de la distribución muestral de
medias.
5. , Error Estándar
Además, grafique las frecuencias para la población y para la
distribución muestral de medias.
SOLUCIÓN
1. La media poblacional es:
2. La desviación estándar de la población es:
, luego
𝑝̂ = Probabilidad de Éxito
𝑞 =Probabilidad de Fracaso
n= Numero de valores muestrales
E= Margen de error
𝑍 / =Valor Critico
INTERVALO DE CONFIANZA
Con
𝑝̂ = Probabilidad de Éxito
n= Numero de valores muestrales
E= Margen de error
𝑍 / =Valor Critico
EJEMPLO 3
En una encuesta realizada por Pew Research
Center, que incluyó a 1501 adultos
estadounidenses elegidos al azar, reveló que el
70% creía en el calentamiento global. Los
resultados muestrales son n =1501 y = 0.70
, luego
, , y
Ahora;
b). Calculando intervalo de confianza
c). Con base en el intervalo de confianza obtenido en el
inciso anterior (b), parece que la proporción de adultos
que creen en el calentamiento global es mayor que 0.5 (o
50%), por lo que podemos concluir con certeza que la
mayoría de los adultos creen en el calentamiento global.
Como es probable que los límites de 0.677 y 0.723
contengan la proporción poblacional verdadera, parece
que la proporción de la población es un valor mayor que
0.5.
d). La siguiente afirmación resume los resultados: el 70%
de los adultos estadounidenses creen que la Tierra se está
calentando. El porcentaje se basa en una encuesta
realizada por el Pew Research Center con 1501 adultos
estadounidenses elegidos al azar. En teoría, en el 95% de
este tipo de encuestas, el porcentaje difiere en no más de
2.3 puntos porcentuales (0,023183), en cualquier
dirección, del porcentaje que se obtendría al entrevistar a
todos los adultos estadounidenses.
DETERMINACIÓN DE LA MUESTRA
, , , E=0,03 y
n=?
Luego;
841,3104 842
b).
, , , E=0,03 y n=?
Luego;
,1111
Para tener una confianza del 95% de que nuestro
porcentaje muestral está dentro de tres puntos
porcentuales del porcentaje verdadero de todos los
adultos, debemos obtener una muestra aleatoria
simple de 1068 adultos. Comparando este
resultado con el tamaño de la muestra de 842
calculado en el inciso a), podemos ver que si no
tenemos conocimiento de un estudio previo, se
requiere una muestra más grande para obtener los
mismos resultados que cuando se puede estimar el
valor de .
CÁLCULO DE LA ESTIMACIÓN PUNTUAL
Y DE E A PARTIR DE UN INTERVALO DE
CONFIANZA
Estimación puntual :
, con
EJEMPLO 5
Han muerto personas en accidentes de embarcaciones y
aviones debido al uso de una estimación obsoleta del peso
medio de los hombres. En décadas recientes, el peso medio
de los hombres ha aumentado de manera considerable, por
lo que es necesario actualizar la estimación de esa media
con la finalidad de que las embarcaciones, los aviones, los
elevadores y otros vehículos de transporte no se
sobrecarguen peligrosamente. Si utilizamos los pesos de
hombres de un conjunto de datos, obtenemos los
estadísticos muestrales de la muestra aleatoria simple:
y libras.
Investigaciones realizadas por otras fuentes sugieren que la
población de los pesos de hombres tienen una desviación
estándar dada por libras.
180,61
c) Con base en el intervalo de confianza, es posible que el
peso medio de 166.3 libras que se usaba en 1960 sea el
peso medio de los hombres en la actualidad. Sin embargo,
la mejor estimación puntual de 172.55 libras sugiere que el
peso medio de los hombres ahora es mucho mayor que
166.3 libras. Considerando que la subestimación del peso
medio de los hombres podría provocar la pérdida de vidas
debido a la sobrecarga de embarcaciones y aeronaves, esos
resultados sugieren con firmeza que deben reunirse datos
adicionales. (Se reunieron datos adicionales, y se
incrementó el peso medio supuesto de los hombres).
El intervalo de confianza del inciso b) también podría
expresarse como 172.55 8.06 o como (164.49, 180.61).
Con base en la muestra con n = 40, y
suponiendo que , el intervalo de confianza para la
media de la población es 180,61
libras, y este intervalo tiene un nivel de confianza de 0.95.
Esto significa que si seleccionamos muchas muestras
aleatorias simples diferentes de 40 hombres y construimos
los intervalos de confianza como lo hicimos aquí, el 95%
de ellos incluirían realmente el valor de la media
poblacional .
DETERMINACIÓN DEL TAMAÑO DE
LA MUESTRA REQUERIDO PARA
ESTIMAR
EJEMPLO 6
Suponga que queremos estimar la puntuación media
del CI de la población de estudiantes de estadística.
¿Cuántos estudiantes de estadística deben
seleccionarse al azar para aplicarles pruebas de CI,
si queremos tener una confianza del 95% de que la
media muestral estará dentro de 3 puntos de CI de
la media poblacional?
SOLUCIÒN
Para un intervalo de confianza del 95%, tenemos
, de modo que . Puesto que
queremos que la media muestral esté dentro de tres
puntos de CI de , el margen de error es E=3.
Asimismo, .
ESTIMACIÓN DE LA MEDIA
POBLACIONAL:
DESCONOCIDA
𝜇= Media Poblacional
𝑋 =Media Muestral
𝑠 =Desviación Estándar Muestral
n= Numero de valores muestrales
E= Margen de error
𝑡 / =Es una distribución t de Student para todas las muestras de tamaño n. La distribución t de Student a menudo
se conoce simplemente como distribución t.
es una distribución t de Student para todas las muestras de
tamaño n. La distribución t de Student a menudo se
conoce simplemente como distribución t.
GRADOS DE LIBERTAD PARA UN
CONJUNTO DE DATOS MUESTRALES
RECOLECTADOS
𝜇= Media Poblacional
𝑋= Media Muestral
n= Numero de valores muestrales
E= Margen de error
s= Desviación estándar muestral
𝑡 / =Valor Critico t
EJEMPLO 8
Existe la creencia popular de que el ajo reduce los niveles de
colesterol. En una prueba de la eficacia del ajo, 49 sujetos fueron
tratados con dosis de ajo crudo, y sus niveles de colesterol se
midieron antes y después del tratamiento. Los cambios en sus niveles
de colesterol de baja densidad (en mg/dL) tienen una media de 0.4 y
una desviación estándar de 21.0 (según datos de “Effect of Raw
Garlic vs Commercial Garlic Supplements on Plasma Lipid
Concentrations in Adults With Moderate Hypercholesterolemia”, de
Gardner et al., Archives of Internal Medicine,vol. 167). Utilice los
estadísticos muestrales de n = 49, y s = 21.0 para construir
un intervalo de confianza del 95% para el cambio medio neto en el
colesterol de baja densidad después del tratamiento con ajo. ¿Qué
sugiere el intervalo de confianza acerca de la eficacia del ajo para
reducir el colesterol de baja densidad?
SOLUCIÒN
El nivel de confianza del 95% implica que . Con n
= 49, el número de grados de libertad es . Si
utilizamos la tabla A-3, buscamos en el renglón con 48
grados de libertad, y en la columna correspondiente a
en dos colas. La tabla no incluye 48 grados de
libertad, y el número más cercano de grados de libertad es
50, de manera que podemos utilizar . Si
utilizamos , y , calculamos
el margen de error E como sigue:
Con y , construimos el intervalo de
confianza de la siguiente manera:
Este resultado también podría expresarse en la forma de
o . Con base en los resultados muestrales
dados, tenemos una confianza del 95% de que los límites de -
5.6 y 6.4 realmente contienen el valor de , la media de los
cambios en el colesterol de baja densidad para la población.
Como los límites del intervalo de confianza contienen el valor
de 0, es muy posible que la media de los cambios en el
colesterol de baja densidad sea igual a 0, lo que sugiere que el
tratamiento con ajo no modificó los niveles de este tipo de
colesterol.
No parece que el tratamiento con ajo sea eficaz para reducir el
colesterol de baja densidad.
PROPIEDADES IMPORTANTES DE LA
DISTRIBUCIÓN t DE STUDENT
d) y La población tiene
una distribución muy sesgada. (En la realidad, pocas veces
se conoce ).