Science">
Nothing Special   »   [go: up one dir, main page]

Tabla de Contingencia.

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 10

UNIVERSIDAD NACIONAL DE MISIONES

FACULTAD DE INGENIERÍA

PROBABILIDAD Y ESTADÍSTICA 2
Departamento de Ingeniería Industrial

ACTIVIDAD DE AULA N° 2: Estadística no paramétrica.


Prueba CHI – CUADRADO de una variable.

AUTOR:

ARENHARDT, Roberto Guillermo

SEGUNDO SEMESTRE 2018


UNIVERSIDAD NACIONAL DE MISIONES

Probabilidad y Estadística 2 Trabajo Practico N°2


Temas: Estadística no Paramétrica. Prueba CHI-CUADRADO de una variable.

Ejercicio 1: En la encuesta telefónica realizada el pasado curso por los alumnos los resultados
fueron muy dispares, mientras algunos realizaron las cuatro entrevistas programadas otros no
consiguieron cumplimentar ninguna de ellas. La distribución del número de entrevistas
conseguidas por los 57 alumnos que participaron en el proyecto fue la siguiente: A un nivel de
confianza del 90% ¿Puede afirmarse que estas diferencias han sido debidas al azar? O por el
contrario están motivadas por alguna otra causa.

Ejercicio 2: En cierta máquina Expendedora de gaseosas ofrece 4 tipo de bebidas. Estamos


interesados en averiguar si la elección de cualquiera de estos canales se hace de forma aleatoria o
existe algún tipo de preferencia por parte de los consumidores. La siguiente tabla muestra el
número de bebidas vendidas en cada uno de los 4 canales durante una semana. Contrastar la
hipótesis de que los canales son seleccionados al azar a un nivel de significación del 5%.

Ejercicio 3: Se pretende comprobar la perfección de un dado de 6 caras. Para esto realizamos


100 lanzamientos del dado anotando los puntos obtenidos en cada lanzamiento. A la vista de los
resultados obtenidos, ¿podemos concluir que el dado no es perfecto? Nivel de significación (5%).

Puntuación en el dado Número de veces que se obtuvo la


puntuación
1 14
2 22
3 18
4 17
5 20
6 9
UNIVERSIDAD NACIONAL DE MISIONES

Probabilidad y Estadística 2 Trabajo Practico N°2


Temas: Estadística no Paramétrica. Prueba CHI-CUADRADO de una variable.

Ejercicio 4: En una carpintería se han registrado el número de sillas terminadas durante 1036
días. El jefe de producción afirma que la función de producción sigue una distribución de Poisson.
¿Es razonables esta suposición? Suponer α=0.05. Los resultados se muestran en la tabla siguiente

N° Sillas x Día (xi) 0 1 2 3 4 5 6 7


Frecuencias Observadas 360 359 180 53 40 16 14 14
(θi)

H0:X ~ P0 ( λ)

H1:X ~ P0 ( λ)
Ejercicio 5: Suponer que los siguientes datos corresponden a una distribución exponencial.

a) Comprobar que los datos se ajustan a una distribución exponencial.

Ejercicio 6: Se han registrado durante 200 días el número de accidentes de tránsito diario. Se
cree que los datos se distribuyen por medio de una distribución de Poisson de media 2 (hipótesis
nula).

N° de accidentes 0 1 2 3 4 5 6 7
N° de días 22 53 58 39 20 5 2 1
Desarrollo
Ejercicio N°1: El pasado curso, un conjunto de 57 estudiantes realizó entrevistas con un nivel
de confianza del 90% (α=0,10) y un valor total posible de N=228, ya que cada uno podría hacer
como máximo 4 de ellas. Se busca verificar si los resultados obtenidos son fruto del azar o, por el
contrario, tienen otro motivo; para ello se plantea el siguiente test de hipótesis:

Hipótesis nula:

𝑯𝟎 : 𝒙 ~ 𝑩(𝒙, 𝒏, 𝒑)
Hipótesis alternativa:

𝑯𝟏 : 𝒙 ≁ 𝑩(𝒙, 𝒏, 𝒑)
Número total de entrevistas a realizar:

𝑵 = 𝟓𝟕 ∗ 𝟒 = 𝟐𝟐𝟖
Número de entrevistas realizadas:

𝑵′ = 𝟏𝟔 ∗ 𝟏 + 𝟐𝟒 ∗ 𝟐 + 𝟗 ∗ 𝟑 + 𝟐 ∗ 𝟒 = 𝟗𝟗
Probabilidad de ocurrencia:
𝟗𝟗
𝒑= = 𝟎. 𝟒𝟑
𝟐𝟐𝟖
Fracaso:

𝒒 = 𝟏 − 𝒑 = 𝟎. 𝟓𝟕
Distribución binomial:
𝒏!
(𝒏𝒙) ∗ 𝒑𝒙 ∗ 𝒒𝒏−𝟏 (𝒏𝒌) = 𝒙!∗(𝒏−𝒙)!

Región de Rechazo:

𝑹𝒅𝒆𝑹 𝑼 > 𝑿𝟐

𝑿𝟐 𝜶 (𝒌−𝒓−𝟏) = 𝑿𝟐 𝟎.𝟏𝟎 (𝟐) = 𝟒. 𝟔𝟎 𝑼 = 𝟎. 𝟗𝟖𝟏

Rta: Como 𝑼 < 𝑿𝟐 no se rechaza la hipótesis nula. Podemos afirmar que mediante una
distribución Binomial 𝑿 ~𝒃(𝒙, 𝒏, 𝒑), la diferencia que hay se da de manera aleatoria.
N° de entrevistas Frecuencia Frecuencia
xi observada Ꝋi esperada ei
0 6 5.985
1 16 18.24
2 24 20.52
3 9 10.26
4 2 1.93
Total 57 ≈ 57

N° de entrevistas Frecuencia Frecuencia


xi observada Ꝋi esperada

0 6 5.985 0.00004
1 16 18.24 0.275
2 24 20.52 0.590
3y4 11 12.19 0.116
Total 57 ≈ 57 0.981

(𝟔−𝟓.𝟗𝟖𝟓)𝟐
𝑷(𝑿 = 𝟎) → (𝟒𝟎) ∗ 𝟎. 𝟒𝟑𝟎 ∗ 𝟎. 𝟓𝟕𝟒 = 𝟎. 𝟏𝟎𝟓 𝒆𝟎 = 𝟓𝟕 ∗ 𝟎. 𝟏𝟎𝟓 = 𝟓. 𝟗𝟖𝟓 𝒖𝟎 = 𝟓.𝟗𝟖𝟓

(𝟏𝟔−𝟏𝟖.𝟐𝟒)𝟐
𝑷(𝑿 = 𝟏) → (𝟒𝟏) ∗ 𝟎. 𝟒𝟑𝟏 ∗ 𝟎. 𝟓𝟕𝟑 = 𝟎. 𝟑𝟐 𝒆𝟏 = 𝟓𝟕 ∗ 𝟎. 𝟑𝟐 = 𝟏𝟖. 𝟐𝟒 𝒖𝟏 = 𝟏𝟖.𝟐𝟒

(𝟐𝟒−𝟐𝟎.𝟓𝟐)𝟐
𝑷(𝑿 = 𝟐) → (𝟒𝟐) ∗ 𝟎. 𝟒𝟑𝟐 ∗ 𝟎. 𝟓𝟕𝟐 = 𝟎. 𝟑𝟔 𝒆𝟐 = 𝟓𝟕 ∗ 𝟎. 𝟑𝟔 = 𝟐𝟎. 𝟓𝟐 𝒖𝟐 = 𝟐𝟎.𝟓𝟐

(𝟏𝟏−𝟏𝟐.𝟏𝟗)𝟐
𝑷(𝑿 = 𝟑) → (𝟒𝟑) ∗ 𝟎. 𝟒𝟑𝟑 ∗ 𝟎. 𝟓𝟕𝟏 = 𝟎. 𝟏𝟖 𝒆𝟑 = 𝟓𝟕 ∗ 𝟎. 𝟏𝟖 = 𝟏𝟎. 𝟐𝟔 𝒖𝟑 =
𝟏𝟐.𝟏𝟗

𝑷(𝑿 = 𝟒) → (𝟒𝟒) ∗ 𝟎. 𝟒𝟑𝟒 ∗ 𝟎. 𝟓𝟕𝟎 = 𝟎. 𝟎𝟑𝟒 𝒆𝟒 = 𝟓𝟕 ∗ 𝟎. 𝟎𝟑𝟒 = 𝟏. 𝟗𝟑

Ejercicio N°2: Se busca averiguar si los canales son seleccionados al azar con un nivel de significación
α= 0,05 sobre un total de elecciones con valor N=70. Como se trata de un potencial caso de elección
al azar se seleccionará para el análisis una distribución uniforme, donde cada una de las 4 opciones
tenga la misma posibilidad de ocurrencia, por lo que se tendrá:

Hipótesis nula:

𝑯𝟎 : 𝒙 ~ 𝑼( 𝛌)
Hipótesis alternativa:

𝑯𝟏 : 𝒙 ≁ 𝑼( 𝛌 )
( − )
Xi θi ei
1 13 17,5 1,15714286
2 22 17,5 1,15714286
3 18 17,5 0,01428571
4 17 17,5 0,01428571
U= 2,34285714

Donde se determina que, por tratarse de una distribución uniforme, la frecuencia esperada para
cada uno de los 4 canales será equitativa. Entonces, a través de los datos determinados en la tabla
anterior, se realiza la comparación entre el valor de “U” obtenido con el valor crítico de la
distribución Chi Cuadrado para α= 0,05, k=4 y r=0, obteniendo:

X21-α (K-r-1) = X20,95 (3) = 7,8147

R. de R. U > X2

NO RECHAZO

Rta: De esta manera podemos afirmar que, con una distribución uniforme, la selección de los
canales se desarrolla de forma aleatoria.

Ejercicio N°3: Se pretende comprobar la perfección de un dado con un nivel de significación α= 0,05
sobre un total de lanzamientos de N=100. Al igual que en el ejercicio N° 2, se está ante una potencial
distribución uniforme, ya que lo que se pretende comprobar es que todas las caras del dado tienen
las mismas posibilidades de ser seleccionadas por lo que se tendrá:

Hipótesis nula:

𝑯𝟎 : 𝒙 ~ 𝑼( 𝛌)
Hipótesis alternativa:

𝑯𝟏 : 𝒙 ≁ 𝑼( 𝛌 )

( − )
Xi θi ei
1 14 16,66 0,42470588
2 22 16,66 1,71162065
3 18 16,66 0,10777911
4 17 16,66 0,00693878
5 20 16,66 0,66960384
6 9 16,66 3,52194478
U= 6,44259304
Sabiendo que la frecuencia esperada será la misma para todas las posibilidades se determina el valor
de “U” y se lo compara con el arrojado por la distribución Chi Cuadrado de acuerdo a las condiciones
planteadas (α= 0,05, k=6 y r=0):

X21-α (K-r-1) = X20,95 (5) = 11,07

R. de R. U > X2

NO RECHAZO

Rta: De acuerdo a la comparación del valor de “U” obtenido con el correspondiente valor de Chi
Cuadrado determinado se puede afirmar que el dado sobre el cual se realizó la experiencia es
perfecto.

Ejercicio N°4: En una carpintería se han registrado el número de sillas terminadas durante N=1036
días. El jefe de producción afirma que la función de producción sigue una distribución de Poisson
con α=0.05. Los resultados se muestran en la tabla siguiente:

( − )
Xi θi ei
0 360 295,26 14,1951758 Datos menores a 5 agrupados en una sola
1 359 370,89 0,38116989 frecuencia 5 ó +
2 180 233,1 12,096139
3 53 97,39 20,232797
( − )
4 40 30,04 3,30231691 θi ei
5 16 7,66
6 14 1,55 - 44 9,5 125,289474
7 14 0,29
U= 175,497072

Se desea comprobar si la función de producción corresponde a una del tipo Poisson, por lo que se
plantea lo siguiente:

Hipótesis nula:

𝑯𝟎 : 𝒙 ~ 𝑷𝒐( 𝛌)
Hipótesis alternativa:

𝑯𝟏 : 𝒙 ≁ 𝑷𝒐( 𝛌 )
Se supone un nivel de significación del 95% (α= 0,05) y se emplea el método del estimador de
máxima verosimilitud para calcular 𝛌 :

̅
EMV 𝛌 = 𝑿
𝑛
̅ = ∑𝑖=1 𝑋𝑖 ∗𝑓(𝜃𝑖 ) = 1300 = 1.255
Media Aritmética → 𝛌 = 𝑿 𝑁 1036

Luego se procede al cálculo de las frecuencias esperadas:

𝒆𝒊 = 𝑵 ∗ 𝑷(𝑿 = 𝒙𝒊 )
𝒆−𝛌 ∗𝛌𝒙
Donde: N=1036 y 𝑷(𝑿 = 𝒙𝒊 ) = ̅ = 𝟏. 𝟐𝟓𝟓
→ con 𝛌 = 𝑿
𝒙!

𝒆−𝟏.𝟐𝟓𝟓 ∗𝟐𝟎
𝒆𝟎 = 𝟏𝟎𝟑𝟔 ∗ = 𝟏𝟎𝟑𝟔 ∗ 𝟎, 𝟐𝟖𝟓 = 𝟐𝟗𝟓, 𝟐𝟔
𝟎!

𝒆−𝟏.𝟐𝟓𝟓 ∗ 𝟐𝟏
𝒆𝟏 = 𝟏𝟎𝟑𝟔 ∗ = 𝟏𝟎𝟑𝟔 ∗ 𝟎, 𝟑𝟓𝟖 = 𝟑𝟕𝟎, 𝟖𝟗
𝟏!


𝒆−𝟏.𝟐𝟓𝟓 ∗𝟐𝟕
𝒆𝟕 = 𝟏𝟎𝟑𝟔 ∗ = 𝟏𝟎𝟑𝟔 ∗ 𝟎, 𝟎𝟎𝟎𝟐𝟖 = 𝟎, 𝟐𝟗
𝟕!

Entonces → U=175,50 y se tiene que (α= 0,05, k=6 y r=1), se tendrá:


X21-α (K-r-1) = X20,95 (4) = 9,49
R. de R. U > X2

Como U > X2

Rta: RECHAZO la Hipótesis de que la producción sigue una distribución de Poisson.


Ejercicio N°5: Se debe determinar si un conjunto de datos dado corresponde a una distribución del
tipo exponencial, con un nivel de significancia de α= 0,05:
( − )
Intervalo MC θi ei Datos menores a 5 agrupados en un
[0-8) 4 20 18,38 0,14278564 solo intervalo [24-70)
[8-16) 12 8 9,93 0,37511581
( − )
[16-24) 20 7 5,37 0,49476723 θi ei
[24-32) 28 1 2,88 1,22722222
[32-40) 36 2 1,56 0,12410256
[40-48) 44 1 0,848 0,02724528
- 5 6,1 0,19836066
[48-56) 52 0 0,456 0,456
[56-64) 60 1 0,248 2,28025806
[64-70) 68 0 0,108 0,108
U= 1,21102933

Se sabe de antemano que N=40, y debemos determinar los valores de Frecuencia Esperada (ya
incluida en tabla anterior) a través de la previa determinación de la Media Aritmética y, por
consiguiente, del parámetro estimador de máxima verosimilitud λ; en símbolos:
∑𝑛
𝑖=1 𝑀𝐶𝑖 ∗𝜃𝑖
̅=
Media Aritmética → 𝑿 = 𝟏𝟑
∑𝑛
𝑖=1 𝜃𝑖

𝟏
Parámetro λ → 𝛌 = ̅
= 𝟎, 𝟎𝟕𝟕
𝑿
𝒕𝟐
Frecuencia Esperada → 𝒆𝒊 = (∫𝒕𝟏 𝛌𝒆−𝛌∗𝐓 𝒅𝑻) ∗ 𝑵

Siendo t1: límite inferior del intervalo, t2= límite superior del intervalo, T= Variable Independiente
𝟖
𝟏 − 𝟏 ∗𝐓
𝒆𝟏 = (∫ 𝒆 𝟏𝟑 𝒅𝑻) ∗ 𝟒𝟎 = 𝟏𝟖, 𝟑𝟖
𝟎 𝟏𝟑
𝟏𝟔
𝟏 − 𝟏 ∗𝐓
𝒆𝟐 = (∫ 𝒆 𝟏𝟑 𝒅𝑻) ∗ 𝟒𝟎 = 𝟗, 𝟗𝟑
𝟖 𝟏𝟑


𝟕𝟎
𝟏 − 𝟏 ∗𝐓
𝒆𝟗 = (∫ 𝒆 𝟏𝟑 𝒅𝑻) ∗ 𝟒𝟎 = 𝟎, 𝟏𝟎𝟖
𝟔𝟒 𝟏𝟑

Entonces → Si U=1,211 y se tiene que (α= 0,05, k=4 y r=1) se tendrá:


X21-α (K-r-1) = X20,95 (2) = 5,91
R. de R. U > X2

Rta: NO RECHAZO la Hipótesis de que el conjunto dado de datos corresponde a una distribución
del tipo exponencial.
Ejercicio N°6: Se desea determinar si una distribución dada, cuyo N=200 (correspondientes a la
sumatoria -distribuida en frecuencias- de accidentes de tránsito diarios), corresponde a una del tipo
Poisson. También se conoce que la media de la misma es 𝑿 ̅ = 𝟐.

𝑯𝟎 : 𝒙 ~ 𝑷𝒐( 𝛌)
𝑯𝟏 : 𝒙 ≁ 𝑷𝒐( 𝛌 )
En primer lugar, se supone un nivel de significación del 95%, por lo que α= 0,05; luego, se
confecciona la correspondiente tabla de frecuencias:
( − )
Xi θi ei
0 22 27 0,92592593 Datos menores a 5 agrupados en una
1 53 54,2 0,02656827 sola frecuencia 5 ó +
2 58 54,2 0,26642066
3 39 36 0,25
( − )
4 20 18 0,22222222 θi ei
5 5 7,2 0,67222222
6 2 2,4 -
0,06666667 8 10,29 0,50963071
7 1 0,69 0,13927536
U= 2,20076779

En este caso, las Frecuencias Esperadas ei se calculan como:


𝒆𝒊 = 𝑵 ∗ 𝑷(𝑿 = 𝒙𝒊 )
𝒆−𝛌 ∗𝛌𝒙
𝑫𝒐𝒏𝒅𝒆 → 𝑷(𝑿 = 𝒙𝒊 ) = ̅=𝟐
→ sabiendo que 𝛌 = 𝑿
𝒙!

𝒆−𝟐 ∗𝟐𝟎
𝒆𝟎 = 𝟐𝟎𝟎 ∗ = 𝟐𝟕
𝟎!

𝒆−𝟐 ∗ 𝟐𝟏
𝒆𝟏 = 𝟐𝟎𝟎 ∗ = 𝟓𝟒, 𝟐
𝟏!


𝒆−𝟐 ∗ 𝟐𝟕
𝒆𝟕 = 𝟐𝟎𝟎 ∗ = 𝟎, 𝟔𝟗
𝟕!

Entonces → Si U=2,2 y se tiene que (α= 0,05, k=6 y r=1) se tendrá:


X21-α (K-r-1) = X20,95 (4) = 9,49
R. de R. U > X2

Rta: NO RECHAZO, por lo que se podría decir que la distribución potencialmente corresponde a
una del tipo Poisson.

También podría gustarte