U1
U1
U1
Temario – Unidad 2
2.2. Errores Tipo I y Tipo II.
2.3. Metodología para la prueba de hipótesis.
2.4. Pruebas de significancia de una y dos colas.
Temario – Unidad 2 (continuación)
2.5. Pruebas de hipótesis para la media.
2.6. El valor de P en las pruebas de hipótesis.
2.7. Pruebas de hipótesis para las proporciones.
Temario – Unidad 3
3.2. Pruebas de hipótesis de las muestras de poblaciones
independientes.
3.3. Pruebas de hipótesis para la diferencia entre las
proporciones muestrales de dos poblaciones.
3.4. Comparación de las medias de la población con
muestras pequeñas.
3.5. Pruebas de hipótesis de dos muestras dependientes.
3.6. Comparación de muestras dependientes e
independientes
Temario – Unidad 4
4.1. Introducción ANOVA.
4.2. Distribución F.
4.3. Comparación de dos varianzas de población.
4.4. Suposiciones de ANOVA.
4.5. La prueba de ANOVA.
4.6. Inferencias sobre pares de medias de tratamiento.
4.7. Análisis de la varianza en dos direcciones.
Temario – Unidad 5
5.1. Introducción Regresión lineal y correlación.
5.2. El coeficiente de correlación y de determinación.
5.3. Pruebas de significancia del coeficiente.
5.4. Análisis de regresión. Mínimos cuadrados.
5.5. Error estándar de estimación.
5.6. Intervalos de confianza e intervalos de predicción.
Temario – Unidad 6
6.1. Introducción rgegresión lineal múltiple
6.2. Análisis de regresión múltiple.
6.3. Error estándar de estimación múltiple.
6.4. Tabla ANOVA.
6.5. Análisis de varianzas residuales.
Temario – Unidad 7
7.1. Introducción serie de tiempo y proyección.
7.2. Componentes de una serie de tiempo.
7.3. Método de promedio móvil.
7.4. Método de promedio móvil ponderado.
7.5. Tendencia lineal.
7.6. Método de los mínimos cuadrados.
7.7. Variación estacional.
7.8. Distribución Weibull.
Criterios de evaluación
Asistencia mínima obligatoria: 80% (Derecho a calificación ordinaria)
Si tres vidas útiles de baterías medidas en días hubieran sido x1 = 5.6, x2 = 4.5 y x3
= 6.1, el uso del estimador (promedio) habría dado por resultado la estimación:
x = (5.6 + 4.5 + 6.1)/3 = 5.40.
Ejemplo:
Método de momentos
Ejemplo:
Método de momentos
Ejemplo:
Método de momentos
Método de momentos
Ejemplo:
Método de momentos
Ejemplo:
Método de momentos
Ejemplo:
Método de momentos
Ejemplo: Si tuviésemos los siguientes valores, ¿cuál sería el resultado de
los estimadores anteriores?
Que X1, X2, …, Xn tengan una función masa de probabilidad o una función de densidad
de probabilidad:
donde los parámetros θ1, …, θm tienen valores desconocidos. Cuando x1, …, xn son los
valores muestrales observados y la función anterior se considera como una función de
θ1, …, θm, se llama función de verosimilitud. Las estimaciones de máxima
verosimilitud (EMV) son aquellos valores de las θi que incrementan al
máximo la función de probabilidad, de modo que:
Cuando se sustituyen las Xi en lugar de las xi, se obtienen los estimadores de máxima
verosimilitud.
Método de máxima verosimilitud
Idealmente, se busca obtener el logaritmo natural de la función de distribución o
de la función de masa, se deriva esta última función con respecto al parámetro
deseado y se iguala a cero, encontrando entonces el estimador o un conjunto de
ecuaciones que permiten obtener los estimadores correspondientes.
Ejemplo: Se obtuvo una muestra de diez cascos de ciclista nuevos fabricados por una
compañía. Al probarlos, se encontró que el primero, el tercero y el décimo estaban
agrietados, en tanto que los demás no. Sea p = P(casco agrietado) y defina X1, …, X10
como Xi = 1 si el i-ésimo casco está agrietado y cero de lo contrario. En ese caso las xi
son 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, así que la función masa de probabilidad conjunta de la
muestra es
^
Método de máxima verosimilitud
Suponga que X1, X2, . . . , Xn es una muestra aleatoria de una distribución exponencial
con parámetro λ. Debido a la independencia, la función de verosimilitud es un
producto de las funciones de densidad de probabilidad individuales:
Método de máxima verosimilitud
Suponga que X1, X2, . . . , Xn es una muestra aleatoria de una distribución exponencial
con parámetro λ. Debido a la independencia, la función de verosimilitud es un
producto de las funciones de densidad de probabilidad individuales:
El ln(verosimilitud) es
Método de máxima verosimilitud
Suponga que X1, X2, . . . , Xn es una muestra aleatoria de una distribución exponencial
con parámetro λ. Debido a la independencia, la función de verosimilitud es un
producto de las funciones de densidad de probabilidad individuales:
El ln(verosimilitud) es
^
Método de máxima verosimilitud
Ejercicio: Sean X1, X2, . . . , Xn una muestra aleatoria de una distribución normal. La
función de probabilidad es:
Resultado:
Estimación de funciones de parámetros
Ejemplo:
Intervalos de confianza
Una estimación puntual, por el hecho de ser un solo número no proporciona
información sobre la precisión y confiabilidad de la estimación.
_
Debido a la variabilidad del muestreo, virtualmente nunca es el caso de que x
= µ. La estimación puntual no dice nada sobre qué tan cerca pudiera estar a
µ. Una alternativa para reportar un solo valor sensible del parámetro que se
está estimando es calcular y reportar un intervalo completo de valores
factibles: una estimación de intervalo o un intervalo de confianza (IC).
Un intervalo de confianza siempre se calcula seleccionando primero un nivel
de confianza, el cual mide el grado de confiabilidad del intervalo. Un nivel de
confianza de 95% implica que 95% de todas las muestras daría un intervalo
que incluye µ, o cualquier otro parámetro que se esté estimando y sólo 5% de
las muestras darían un intervalo erróneo. Los niveles de confianza más
frecuentemente utilizados son 95%, 99% y 90%.
Mientras más alto es el nivel de confianza, más fuerte es la creencia de que
el valor del parámetro que se está estimando queda dentro del intervalo.
Intervalos de confianza
El ancho del intervalo da información sobre la precisión de una estimación de
intervalo. Si el nivel de confianza es alto y el intervalo resultante es bastante
angosto, el conocimiento del valor del parámetro es razonablemente preciso.
Un muy amplio intervalo de confianza, sin embargo, transmite el mensaje de
que existe gran cantidad de incertidumbre sobre el valor de lo que se está
estimando.
Intervalos de confianza
Importancia de los intervalos de confianza
Desempeño de Desempeño de
proveedor 3σ proveedor 6σ
donde:
es el símbolo del error estándar de la media.
σ es la desviación estándar poblacional.
n es el numero de observaciones en la muestra.
Valores “Z”
Modo de empleo de un valor “z”
Valores “Z”
Ejemplo:
Valores “Z”
Ejemplo:
Valores “Z”
Ejemplo:
Valores “Z”
Cómo determinar intervalos para distintos valores de confianza “z”.
Valores “Z”
Uso de tablas “z”:
Valores “Z”
¿Por qué decidirse por un nivel de confianza de 95% cuando un nivel de 99% es
alcanzable? Porque el precio pagado por el nivel de confianza más alto es un intervalo
más ancho. Como el intervalo de 95% se extiende 1.96 errores muestrales a cada lado
de x, el ancho del intervalo es 2(1.96) = 3.92 errores muestrales. Asimismo, el ancho
del intervalo de 99% es 2(2.58) = 5.16 errores muestrales. Es decir, se tiene más
confianza en el intervalo de 99% precisamente porque es más ancho.
Una estrategia atractiva es especificar tanto del nivel de confianza deseado como el
ancho del intervalo y luego determinar el tamaño de muestra necesario.
Valores “Z”
La fórmula general para el tamaño de muestra n necesario para garantizar un ancho
de intervalo w se obtiene a partir de:
Ejemplo:
Ejemplo:
Estandariza los datos para permitir entender de mejor modo diferentes casos
Es utilizado para encontrar las probabilidades de las distribuciones normales
Es utilizado para generar métricos de capacidad de los datos de procesos
Valores “Z”
Utilizando el valor de Z podemos hacer comparaciones entre diferentes procesos
Ejemplo:
Retrabajos de A Retrabajos de B
μ = 7 minutos μ = 3 minutos
σ = 1 minuto σ = 0.5 minuto
(m m) (0 0)
Z(x m) 0
s s
(m s m) ( s )
Z ( x s) 1
s s
σ 1
μ 0
Ventajas:
“Todos nosotros estamos hablando el mismo lenguaje”, esto significa,
que cualquiera de nosotros entiende el significado del valor de Z. No es
importante en este ámbito el contexto original de los datos, porque
estamos hablando y trabajando con datos estandarizados.
Valores “Z”
Cómo determinar intervalos de confianza cuando se desconoce la desviación
estandar
Valores “Z”
Ejemplo:
Valores “Z”
Ejemplo:
Intervalos de confianza con varianza desconocida
Intervalo de confianza para la media con desviación estándar
desconocida
Ejemplo
La expectativa del cliente en la refinería es que la cantidad
promedio de aceite por barril es igual a 55,0 galones. Usted
decide tomar una muestra aleatoria de 20 barriles para
determinar cuál es el promedio real. En su muestra de 20
barriles, encontrará que la media de la muestra, x, es igual a
54,860 galones y que la desviación estándar, s, es igual a 1,008
galones.
Los datos reales eran éstos:
54.1, 53.3, 56.1, 55.7, 54.0, 54.1, 54.5, 57.1, 55.2, 53.8,
54.1, 54.1, 56.1, 55.0, 55.9, 56.0 ,54.9, 54.3, 53.9, 55.0
Estadística descriptiva: C1
Variable máxima
C1 57,100
3
Intervalos de confianza con varianza desconocida
Summary for C1
Anderson-Darling Normality Test
A-Squared 0.60
P-Value 0.105
Mean 54.860
StDev 1.008
Variance 1.016
Skewness 0.560026
Kurtosis -0.509797
N 20
Minimum 53.300
1st Quartile 54.100
Median 54.700
3rd Quartile 55.850
54 55 56 57 Maximum 57.100
95% Confidence Interval for Mean
54.388 55.332
95% Confidence Interval for Median
54.100 55.582
Median
5 4 .0 5 4 .4 5 4 .8 5 5 .2 5 5 .6
Tenemos un intervalo de confianza del 95% de que la media real está comprendida entre
54,3882 y 55,3318.
También estamos corriendo un riesgo del 5% de equivocarnos.
Intervalo de confianza para la proporción de
una población
Sea p la proporción de “éxitos” en una población, donde éxito identifica a un
individuo u objeto que tiene una propiedad específica (p. ej., individuos que
se graduaron en una universidad, computadoras que no requieren servicio de
garantía, etc.). Una variable aleatoria de n individuos que tiene que ser
seleccionada y X es el número de éxitos en la muestra.
Ejemplo:
El artículo “Repeatability and Reproducibility for Pass/Fail Data” (J. of
Testing and Eval., 1997: 151-153) reportó que en n=48 ensayos en un
laboratorio particular, 16 dieron por resultado la ignición de un tipo
particular de sustrato por un cigarrillo encendido. Sea p la proporción a largo
plazo de tales ensayos que producirían ignición. Una estimación puntual de p
es p=16/48=0.333.
Intervalo de confianza para la proporción de
una población
Un intervalo de confianza para p con un nivel de confianza de
aproximadamente 95% es:
Intervalo de confianza para la proporción de
una población
Si se iguala al ancho del intervalo de confianza para p al ancho
preespecificado w se obtiene una ecuación cuadrática para el tamaño de
muestra n necesario para dar un intervalo con un grado de precisión deseado.
Si se suprime el subíndice en z/2 , la solución es:
Cuidado!!!
NO SON los mismos valores
Intervalos de confianza para la varianza y la
desviación estándar
Ejemplo:
Valores de temperatura en el manejo de metales fundidos en colado-1:
Valores de ji cuadrada:
Intervalos de confianza para la varianza y la
desviación estándar
Ejemplo:
Valores de temperatura en el manejo de metales fundidos en colado-1:
Valores de ji cuadrada:
Ejercicios:
Ejercicios:
Una legisladora estatal desea encuestar a los residentes de su distrito para ver
qué proporción del electorado está consciente de su posición sobre la
utilización de fondos estatales para solventar abortos.
418 421 421 422 425 427 431 434 437 439 446 447 448 453 454 463 465