Mathematics">
Nothing Special   »   [go: up one dir, main page]

01 Prueba de Bondad de Ajuste (Introduccion)

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 39

TECNOLÓGICO NACIONAL DE

MÉXICO CAMPUS ALVARADO

INGENIERIA INDUSTRIAL
VARIABLES ALEATORIAS Y
PRUEBAS DE BONDAD DE
AJUSTE
CURSO: SOLUCION DE TOPICOS DE INGENIERIA INDUSTRIAL MEDIANTE
ANALISIS ESTADISTICO Y SIMULACION
VARIABLE ALEATORIA DISCRETA
• Variables aleatorias discretas. Este tipo de variables deben cumplir
con estos parámetros:
DISTRIBUCIONES DISCRETAS DE
PROBABILIDAD
Algunas distribuciones discretas de probabilidad son la uniforme
discreta, la de Bernoulli, la hipergeométrica, la de Poisson y la binomial
(vea la figura 3.1). Podemos asociar a estas u otras distribuciones de
probabilidad el comportamiento de una variable aleatoria.
VARIABLE ALEATORIA DISCRETA
(EJEMPLOS)
• Si nuestro propósito al analizar un muestreo de calidad consiste en
decidir si la pieza bajo inspección es buena o no, estamos realizando
un experimento con 2 posibles resultados: la pieza es buena o la pieza
es m ala. Este tipo de comportamiento está asociado a una
distribución de Bernoulli.

• Por otro lado, si lo que queremos es modelar el número de usuarios


que llamarán a un teléfono de atención a clientes, el tipo de
comportamiento puede llegar a parecerse a una distribución de
Poisson.
VARIABLE ALEATORIA CONTINUA
• Este tipo de variables se representan mediante una ecuación que se
conoce como función de densidad de probabilidad. Dada esta
condición, cambiamos el uso de la sumatoria por la de una integral
para conocer la función acumulada de la variable aleatoria. Por lo
tanto, las variables aleatorias continuas deben cumplir los siguientes
parámetros.
VARIABLE ALEATORIA CONTINUA
• Entre las distribuciones de probabilidad tenemos la uniforme
continua, la exponencial, la normal, la de Weibull, la Chi-cuadrada y la
de Erlang (vea la figura 3.2). De la misma forma que en las
distribuciones discretas, algunos procesos pueden ser asociados a
ciertas distribuciones.
VARIABLE ALEATORIA CONTINUA
• Por ejemplo, es posible que el tiempo entre llegadas de los clientes a un sistema
tenga una distribución de probabilidad muy semejante a una exponencial o que el
tiempo que le toma a un operario realizar una serie de tareas se comporte de manera
muy similar a la dispersión que presenta una distribución normal.

• Sin embargo, debemos hacer notar que este tipo de distribuciones tienen sus
desventajas, ya que el rango de valores posibles implica que existe la posibilidad de
tener tiempos entre llegada de clientes infinitos o tiempos de ensamble infinitos
situaciones lejanas a la realidad.

• Por fortuna, es muy poco probable de se presenten este tipo de eventos, aunque el
analista de la simulación debe estar consciente de cómo pueden impactar valores
como los descritos en los resultados del modelo.
DETERMINACIÓN DEL TIPO DE
DISTRIBUCIÓN
• La distribución de probabilidad de los datos históricos puede
determinarse mediante las pruebas Chi-cuadrada, de Kolmogorov-
Smirnov y de Anderson-Darling.

• En esta sección se revisarán los procedimientos de cada una de estas


pruebas denominadas de BONDAD DE AJUSTE.
PRUEBAS DE BONDAD DE AJUSTE
• Las pruebas de bondad de ajuste son pruebas de hipótesis
para verificar si los datos observados en una muestra
aleatoria se ajustan con algún nivel de significancia a
determinada distribución de probabilidad (uniforme,
exponencial, normal, poisson, u otra cualquiera).
HIPOTESIS
• Hipótesis nula Ho indica la distribución propuesta, mientras que la
hipótesis alternativa H1 , nos indica que la variable en estudio tiene
una distribución que no se ajusta a la distribución propuesta.
PRUEBAS MAS COMUNES
• Para calcular si una distribución dada se ajusta a un conjunto de datos,
se pueden utilizar las siguientes pruebas:

• Prueba de Kolmogórov-Smirnov
• Criterio de Cramér-von Mises
• Prueba de Anderson-Darling
• Test de Shapiro–Wilk
• Prueba de ji cuadrada
• Criterio de Información de Akaike
Procedimiento
• Para realizar la prueba, se clasifican los datos observados en k clases o
categorías, y se contabiliza el número de observaciones en cada clase,
para posteriormente comparar la frecuencia observada en cada clase
con la frecuencia que se esperaría obtener en esa clase si la hipótesis
nula es correcta.
PRUEBA DE CHI - CUADRADA
CURSO: SOLUCION DE TOPICOS DE INGENIERIA INDUSTRIAL MEDIANTE ANALISIS
ESTADISTICO Y SIMULACION
Prueba Chi - Cuadrada
• Se trata de una prueba de hipótesis a partir de datos, basada en el
cálculo de un valor llamado estadístico de prueba, al cual suele
comparársele con un valor conocido como valor crítico, mismo que se
obtiene, generalmente, de tablas estadísticas. El procedimiento
general de la prueba es:
PROCEDIMIENTO
1. Obtener al menos 30 datos de la variable aleatoria a analizar.

2. Calcular la media y varianza de los datos.

3. Crear un histograma de k = \ fn intervalos, y obtener la frecuencia observada en cada


intervalo O..

4. Establecer explícitamente la hipótesis nula, mediante una distribución de


probabilidad que se ajuste a la forma del histograma.

5. Calcular la frecuencia esperada, E¡, a partir de la función de probabilidad propuesta.


PROCEDIMIENTO
6. Calcular el estadístico de prueba.

7. Definir el nivel de significancia de la prueba, a, y determinar el valor


crítico de la prueba, , {k es el número de intervalos y r el
numero de parámetros estimados en la distribución propuesta).

8. Comparar el estadístico de prueba con el valor crítico. Si el estadístico de


prueba es menor que el valor crítico no se puede rechazar la hipótesis nula.
Recomendaciones P/Prueba Chi - Cuadrada
• Si las diferencias (oi – ei) son pequeñas, el valor del estadístico es pequeño, por el
contrario si esas diferencias son grandes (lo observado no se ajusta a lo
propuesto), el valor del estadístico es grande, por lo tanto, la región de rechazo
de la hipótesis nula se ubica en la cola superior de la distribución Ji-cuadrada al
nivel de significancia a.

• El tamaño de la muestra deberá ser moderadamente grande, pues si la muestra


es muy pequeña no se podrá formar un número suficiente de clases y si la
muestra es muy grande la prueba conducirá al rechazo casi con seguridad.

• Se sugiere que n sea aproximadamente igual a 5 veces el número de clases.


Recomendaciones P/Prueba Chi - Cuadrada
• Se recomienda clasificar la muestra en mínimo cinco clases y máximo diez.

• Hacer que toda frecuencia observada o esperada no sea menor que cinco, esto
puede lograrse combinando clases vecinas, pero para cada par de clases que se
combinan, el número de grados de libertad debe reducirse en uno (k es el
número de clases efectivas en la tabla de frecuencias).

Si fo(x) es continua: u
• Para la primera clase, calcular p1 considerando el intervalo desde -• hasta el
límite superior de la clase. u Para la última clase, calcular pk considerando el
intervalo desde el límite inferior de la clase hasta +•.
VALOR P
Ejemplo
Ejemplo
Ejemplo
Ejemplo
PRUEBA DE KOLMOGOROV -
SMIRNOV
CURSO: SOLUCION DE TOPICOS DE INGENIERIA INDUSTRIAL MEDIANTE ANALISIS
ESTADISTICO Y SIMULACION
DEFINICION
• ES UNA PRUEBA DE BONDAD DE AJUSTE, Desarrollada en la década
de los treinta del siglo XX, esta prueba permite — al igual que la
prueba Chi-cuadrada determinar la distribución de probabilidad de
una serie de datos.
OBJETIVO
• EL OBJETIVO DE ESTA PRUEBA ES SEÑALAR Y DETERMINAR SI LOS
DATOS ESTUDIADOS O MEDICIONES MUESTRALES PROVIENEN DE
UNA POBLACIÓN QUE TIENE UNA DISTRIBUCIÓN TEÓRICA
DETERMINADA.

• Una limitante de la prueba de Kolmogorov-Smirnov estriba en que


solamente se puede aplicar al análisis de variables continuas. El
procedimiento general de la prueba es:
PASOS DE LA PRUEBA
1. Obtener al menos 30 datos de la variable aleatoria a analizar.
2. Calcular la media y la varianza de los datos.
3. Crear un histograma de m = v n intervalos, y obtener la frecuencia
observada en cada intervalo 0 ¡ .
4. Calcular la probabilidad observada en cada intervalo PO¡ = 0 ¡ / n , esto
es, dividir la frecuencia observada O. entre el número total de datos, n.
5. Acumular las probabilidades PO. para obtener la probabilidad observada
hasta el i-ésimo intervalo, POAr
6. Establecer de manera explícita la hipótesis nula, para esto se propone una
distribución de probabilidad que se ajuste a la forma del histograma.
PASOS DE LA PRUEBA
7. Calcular la probabilidad esperada acumulada para cada intervalo,
PEA¡, a partir de la función de probabilidad propuesta.
8. Calcular el estadístico de prueba

9. Definir el nivel de significancia de la prueba a, y determinar el valor crítico de la prueba,


D a/n (consulte la tabla de valores críticos de la prueba de Kolmogorov - Smirnov en la
sección de apéndices).

10. Comparar el estadístico de prueba con el valor crítico. Si el estadístico de prueba es


menor que el valor crítico no se puede rechazar la hipótesis nula.
VALORES CRITICOS KOMOLGOROV
VALORES CRITICOS KOMOLGOROV
VALORES CRITICOS KOMOLGOROV
PRUEBA DE ANDERSON –
DARLING
CURSO: SOLUCION DE TOPICOS DE INGENIERIA INDUSTRIAL MEDIANTE ANALISIS
ESTADISTICO Y SIMULACION
Definición
• Se dio a conocer en 1954. Esta prueba tiene como propósito
corroborar si una muestra de variables aleatorias proviene de una
población con una distribución de probabilidad específica. En realidad
se trata de una modificación de la prueba de Kolmogorov-Smirnov,
aunque tiene la virtud de detectar las discrepancias en los extrem os
de las distribuciones.
Definición
• La principal desventaja de la prueba de Anderson-Darling estriba en
que es necesario calcular los valores críticos para cada distribución. La
prueba es m uy sensible en los extremos de la distribución, por lo que
debe usarse con mucho cuidado en distribuciones con límite inferior
acotado, y no es confiable para distribuciones de tipo discreto.
Procedimiento
1. Obtener n datos de la variable aleatoria a analizar.
2. Calcular la media y la varianza de los datos.
3. Organizar los datos en forma ascendente: Y¡, i = 1,2,...,n
4. Ordenar los datos en forma descendente. Yn+1-i, i = 1,2,...,n
5. Establecer de manera explícita la hipótesis nula, al proponer una
distribución de probabilidad.
6. Calcular la probabilidad esperada acumulada para cada número Y,
PEA{Y), y la probabilidad esperada acumulada para cada número Yn+1-i,
PEA(Yn+1-i) ,a partir de la función de probabilidad propuesta.
Procedimiento

8. Ajustar el estadístico de prueba de acuerdo con la distribución de


probabilidad propuesta.
9. Definir el nivel de significancia de la prueba a, y determinar su valor
crítico, a/n (vea la tabla 3.3).
10. Comparar el estadístico de prueba con el valor crítico. Si el estadístico de
prueba es menor que el valor crítico no se puede rechazar la hipótesis nula.
Valores Críticos de Anderson - Darling

También podría gustarte