Science">
Trabajo Final
Trabajo Final
Trabajo Final
TRABAJO FINAL
Ing. Rigoberto Américo Garza López
•Estadística
Ciencia encargada de estudiar los datos que incluye recolectar, analizar y describir los datos para llegar a conclusiones
sobre un fenómeno en particular.
•Estadística Descriptiva
La estadística descriptiva es una disciplina que se encarga de recoger, almacenar, ordenar, realizar tablas o gráficos y
calcular parámetros básicos sobre el conjunto de datos.
•Estadística inferencial
Es la rama de la Estadística encargada de hacer deducciones, es decir, inferir propiedades, conclusiones y tendencias, a
partir de una muestra del conjunto.
•Pruebas paramétricas
Las pruebas paramétricas son un tipo de pruebas de significación estadística que cuantifican la asociación o
independencia entre una variable cuantitativa y una categórica.
•Pruebas no paramétricas
GLOSARIO
Las pruebas no paramétricas son aquellas que se basan en determinadas hipótesis, pero los datos observados no tienen una
organización normal. Estas pruebas no hacen supuestos acerca de la ley de probabilidad que sigue la población de la que ha sido
extraída la muestra.
•Prueba de hipótesis
Una prueba de hipótesis siempre tiene una hipótesis nula y una hipótesis alternativa, que se definen de la siguiente manera:
Hipótesis nula (H0): es la hipótesis que sostiene que la suposición inicial que se tiene respecto a un parámetro poblacional es
falsa. Por lo tanto, la hipótesis nula es aquella hipótesis que se pretende rechazar.
Hipótesis alternativa (H1): es la hipótesis de la investigación que se pretende probar que es cierta.
•Desviación estándar
La desviación estándar es una medida que indica cuánto se alejan los datos de la media, es útil para conocer la variación o
dispersión de los datos en una muestra o población.
•Varianza
La varianza es una medida de dispersión que indica la variabilidad de una variable aleatoria.
PRUEBAS PARAMÉTRICAS
Prueba de hipótesis para una media muestra grande.
n=45
=0.05 𝓏=
41.25−40
= 3.12
H0: =40 𝑥ҧ − µ
2
𝑥=41.25
ҧ
H1: ≠40
45
𝑍=
=$400 𝜎/ 𝑛
=2 H1= 4.19
𝑥ҧ − 𝜇 𝑛Σ𝑥12 − (Σ𝑥2 )2
𝑡= 𝑠 𝑠=
𝑛(𝑛 − 1)
𝑛
𝑛=6 𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛
𝑥3 =0.52 H0: = 0.5 𝜈 =𝑛−1 𝑥ҧ =
𝛼=0.05 H1: > 0.5
𝑛
𝑥4 =0.48 Σ𝑥12 = 𝑥12 + 𝑥22 + ⋯ 𝑥𝑛2
𝜇=$179
𝑥5 =0.57 (Σ𝑥1 )2 = 𝑥1 + 𝑥2 + ⋯ 𝑥𝑛 2
𝑥1 =0.46
𝑥6 =0.54
𝑥2 =0.61
Microcircuito 2 20 mA 45 mA 23 mA 50 mA 10 mA
𝑛1 =5 𝑛2 = 5
𝑥ҧ1 =38
𝑥ҧ 2 =29.6
𝛼=0.05 𝐻0 : 𝜇1 = 𝜇2
𝑠12 = 174.5 𝐻1 : 𝜇1 ≠ 𝜇2
𝑠22 = 293.3
𝑠𝑝2 =-27787.32
𝛾 = 7.51 ≈ 8
Valores críticos de la
distribución t
Se acepta 𝐻0 . Se concluye que no
existe alguna diferencia significativa
en el flujo de corriente promedio
V 𝜶 entre los dos diseños.
0.005
8
2.306
Cálculos del problema
5(5554)− 21904
𝑠22 = = 293.3
5 5−1
30+40+27+60+33 4(174.5) 2 +4(293.3)2
𝑥1ҧ = = 38 𝑠𝑝2 = =-27787.32
5 5+5−2
20+45+23+50+10 (38−29.6) −(0)
𝑥ҧ2 = =29.6 𝑡= =0.86
5 174.5 293.3
5(7918)−36100 +
2 5 5
𝑠1 = = 174.5 174.5 293.3
5 5−1 5
+
5
𝛾= 174.5 2 293.3 2
= 7.51 ≈ 8
5
+ 5
4 4
Prueba de hipótesis para dos medias muestras pequeñas. (Considerando varianzas
diferentes por el método de la W)
Un fabricante de monitores prueba dos diseños de microcircuitos para determinar si
producen un flujo de corriente equivalente. El departamento de ingeniería ha obtenido
los datos siguientes:
Microcircuito 1 30 mA 40 mA 27 mA 60 mA 33 mA
Microcircuito 2 20 mA 45 mA 23 mA 50 mA 10 mA
𝑛1 =5 𝑛2 = 5
𝑥ҧ1 =38
𝑥ҧ 2 =29.6
𝛼=0.05 𝐻0 : 𝜇1 = 𝜇2
𝑠12 = 174.5 𝐻1 : 𝜇1 ≠ 𝜇2
𝑠22 = 293.3
𝑠𝑝2 =-27787.32
𝛾 = 7.51 ≈ 8
Valores críticos de la
distribución t
Se acepta 𝐻0 . Se concluye que no
V 𝜶 = 𝟎. 𝟎𝟐𝟓 existe alguna diferencia significativa
en el flujo de corriente promedio
4 2.776 entre los dos diseños.
V 𝜶 = 𝟎. 𝟎𝟐𝟓
4 2.776
Cálculos del problema
30+40+27+60+33
𝑥ҧ1 = = 38 𝑤1 =
174.5
= 34.9 𝑤2 =
293.3
= 58.66
5 5 5
20+45+23+50+10
𝑥ҧ2 = =29.6 𝑡=
(38−29.6) −(0)
=0.86
5
174.5 293.3
2
5(7918)−36100 5
+
5
𝑠1 = = 174.5
5 5−1 34.9 2.776 + (58.66)(2.776)
5(5554)− 21904 𝑇= = 2.77
2
𝑠2 = = 293.3 34.9 + 56.88
5 5−1
Prueba de hipótesis para una proporción
A cualquier edad, alrededor de 20% de estadounidenses adultos participan en
actividades de acondicionamiento físico al menos dos veces a la semana. No obstante,
estas actividades cambian a medida que las personas envejecen y, ocasionalmente, los
participantes se convierten en no participantes. En una encuesta local de n 100
adultos de más de 40 años, un total de 15 personas indicaron que participaron en estas
actividades al menos dos veces a la semana. ¿Estos datos indican que el porcentaje de
participación para adultos de más de 40 años de edad es considerablemente menor a la
cifra de 20%? Calcula el valor P y úselo para sacar las conclusiones adecuadas.
Datos Planteamientos Formula Procedimiento
𝑋 15
𝑧= 𝑛 − 𝑝0 𝑧= 100 − 0.20 = −1.25
𝑝0 = 0.7 𝑝0 (1 − 𝑝0 ) 0.20(1 − 0.20)
𝐻0 : 𝑝0 = 0.2
𝑛 = 100 𝑛 100
𝐻1 : 𝑝0 <0.2
𝛼 = 0.01
𝑋 = 15
ɤ α: 0.05
9 16.91 Se acepta H0.
ɤ α: 0.95
Concluimos que la
9 3.325
desviación estándar no
es mayor a 9 años.
Prueba de hipótesis para la razón de la
varianza.
Un experimentador está preocupado porque la variabilidad de respuestas que usan dos procedimientos
experimentales diferentes puede no ser igual. Antes de realizar su investigación, realiza un estudio previo con
muestras aleatorias de 10 y 8 respuestas y obtiene S 12 = 7.14 y S22 = 3.21, respectivamente. ¿Las varianzas
muestrales presentan suficiente evidencia para indicar que las varianzas poblacionales son desiguales
Datos Planteamientos Formula Procedimientos
𝑆12 7.14
𝑓= 2 𝑓= = 2.22
𝑆12 = 7.14 𝑆2 3.21
1
𝑆22 = 3.21 𝑓1−α (ɤ1 , ɤ2 )=
H0: 𝜎12 = 𝜎22 𝑓α (ɤ2 , ɤ1 )
n1 = 10 1 1
H1: 𝜎12 ≠ 𝜎22 𝑓1−0.05 (9, 7)= = 3.29 = 0.30
n2 = 8 𝑓0.05 (7, 9)
α = 0.05
ɤ1 = 𝑛1 − 1 = 10 − 1 = 9
ɤ2 = 𝑛2 − 1 = 8 − 1 = 7
ɤ1 ɤ1
ɤ2 ɤ2 Se acepta H0.
9 7
Hay insuficiente evidencia
7 4.82 9 3.29
para indicar una diferencia en
las varianzas poblacionales.
Prueba de bondad y ajuste.
El gerente de una planta industrial pretende determinar si el número de empleados que asisten al
consultorio médico de la planta se encuentra distribuido, en forma equitativa, durante los cinco días de
trabajo de la semana. Con base en una muestra aleatoria de cuatro semanas completas de trabajo, se
observo el siguiente número de consultas:
𝑖 = 1,2,3,4,5;
H0: 𝐷𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑒𝑞𝑢𝑖𝑡𝑎𝑡𝑖𝑣𝑎 𝑘
49 − 40 2 35 − 40 2
n=200 𝑋2 + +
α = 0.05 H1∶ 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜 𝑒𝑞𝑢𝑖𝑡𝑎𝑡𝑖𝑣𝑎 𝑘 𝑋2 = 40 40
0𝑖 − 𝑒𝑖 2 32 − 40 2 39 − 40 2 45 − 40 2
= 𝑖=1 + +
𝑒𝑖 40 40 40
𝑖=1
𝑋 2 =4.9 𝐻1 = 4.9
ɤ α: 0.05
Se acepta H0.
9 5.991
Con base en esta evidencia, no existe
ɤ α: 0.95 ninguna razón para creer
2 0.103 que el número de empleados que acuden al
1−
α
=1−
0.1
= 0.95
consultorio no se encuentre distribuido en
2 2
forma uniforme a lo largo de la semana de
α 0.1
2
=
2
= 0.05 trabajo.
Prueba de signo para una media.
Los siguientes datos representan el número de horas que un
compensador opera antes de requerir una recarga: 1.5, 2.2,
0.9, 1.3, 2.0, 1.6, 1.8, 1.5, 2.0, 1.2 y 1.7. Utilice la prueba de
rango con signo para probar la hipótesis en el nivel de
significancia de 0.05 que este compensador particular opera
con una media de 1.8 horas antes de requerir una recarga.
− + − − + − − + − −
Datos Planteamientos Formula Procedimiento
n=10 3 − 0.5(10)
𝛼=0.05 H0: = 1.8 𝑥 − 0.5𝑛 𝑧= = −1.26
𝑧= 0.5 10
X=3 0.5 𝑛
p=1/2 H1: ≠1.8
q=1/2 𝜈 =𝑛−1
Valores críticos de la
distribución t Se acepta H0.
Se concluye que el
V 𝜶
tiempo mediano de
0.06 operación no es
-1.9 0.025
significativamente
diferente de 1.8 horas.
Prueba de signo para dos medias.
Una compañía de taxis trata de decidir si el uso de llantas radiales en lugar de llantas regulares
con cinturón mejora la economía de combustible. Se equipan 16 automóviles con llantas
radiales y se manejan por un recorrido de prueba establecido. Sin cambiar de conductores, se
equipan los mismos autos con llantas regulares con cinturón y se manejan una vez más por el
recorrido de prueba. Se registra el consumo de gasolina, en kilómetros por litro, de la siguiente
manera:
Automóvil
Llantas
radiales
Llantas con cinturón ¿Se puede concluir en el nivel de significancia de 0.05
1 4.2 4.1
que los autos equipados con llantas radiales obtienen
2 4.7 4.9 mejores economías de combustible que los equipados
3 6.6 6.2 con llantas regulares con cinturón?
4 7.0 6.9 + − + + − + + + + + + + − +
5 6.7 6.8
6 4.5 4.4 Datos Fórmula Sustitución
7 5.7 5.7
8 6.0 5.8 α = 0.05
9 7.4 6.9 r=11 𝑟 + − 0.5𝑛 11 − 0.5(14)
10 4.9 4.9 n=14 𝑧= 𝑧= = 2.14
0.5 𝑛 0.5 14
11 6.1 6.0
12 5.2 4.9
13 5.7 5.3 Planteamiento
14 6.9 6.5
15 6.8 7.1
𝐻𝑜 : 𝜇1 − 𝜇2 = 0
16 4.9 4.8 𝐻1 : 𝜇1 − 𝜇2 > 0
Gráfica
Conclusión
Se rechaza H0.
Se concluye que
las llantas
radiales mejoran
la economía de
combustible.
PRUEBAS NO PARAMÉTRICAS
Prueba de rango con signo para una media.
Se realizó un experimento para comparar las densidades de pasteles elaborados de dos clases
diferentes de mezclas de pastel, A y B. Seis charolas de pastel recibieron la masa A y seis
recibieron la masa B. Esperando una variación en la temperatura del horno, el experimentador
colocó un pastel A y uno B juntos en seis lugares diferentes del horno. Prueba la hipótesis de que
no hay diferencia en las distribuciones poblacionales de densidades de pastel para dos masas
para pastel diferentes.
Planteamiento Valores críticos para la prueba de rangos con signo Se rechaza la Se rechaza H0, los
hipótesis nula si el materiales influyen
𝐻0 : 𝜇1 = 𝜇2 𝑢𝑛𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 𝛼 = 0.05
𝑛 valor calculado w+, en la ansiedad de los
𝐻1 : 𝜇1 > 𝜇2
𝑏𝑖𝑙𝑎𝑡𝑒𝑟𝑎𝑙 𝛼 = 0.10 w– o w es menor o estudiantes.
𝛼 = 0.05
igual que el valor
n=12 10 11 tabulado apropiado.
Prueba de suma de rangos.
En el desarrollo de un nuevo método para la determinación de niveles de alcohol en la sangre, se
analizó cinco veces una muestra de sangre, con los resultados siguientes: 64.5, 66.0, 63.9, 65.1 y
64.0 mg/100 ml. El método de análisis estándar aplicado a la misma muestra proporciona los
resultados 66.2, 65.8, 66.3, 65.6 mg/100ml. Utilizando las pruebas de U-Mann Whitney y la de
suma de rangos de Wilcoxon, probar si los métodos difieren significativamente.
Nuevo Método Rango Método estándar Rango Condición
65.5 4 66.2 8 La Hipótesis nula se rechaza
66.0 7 65.8 6 si el valor calculado
es menor o igual
63.9 1 66.3 9 al valor de las tablas
65.1 3 65.6 5 tabulado.
64.0 2
Datos Formula Sustitución Conclusión
𝑛1 = 5 𝑛1 (𝑛1 + 1) 𝑊1 =8+6+9+5=28 Se rechaza 𝐻0 , se concluye
𝑈1 = 𝑊1 − 4 4+1
𝑛2 = 5 2 que no existe evidencia
𝛼=0.1 𝑛2 𝑛2 + 1 𝑈1 = 28 − = 18 significativa al 5% como para
𝑈2 = 𝑊2 − 2
2 (4 + 5)(4 + 5 − 1) rechazar que los dos
(𝑛1 + 𝑛2 )(𝑛1 + 𝑛2 − 1) 𝑊2 = − 28 = 17
𝑊2 = − 𝑊1 2 métodos producen
2 4 4+1 resultados equivalentes.
Planteamiento 𝑈2 = 17 − =2
2
𝐻0 : 𝜇1 = 𝜇2
𝐻1 : 𝜇1 ≠ 𝜇2
Nomenclatura Referencias
X̅= Media =Desviación Libro –Introducción a la probabilidad y estadística.
muestra. estándar. 13va edición. Mendenhall y Beaver.
=Media de n= 30 = Media
población. grande.
N= 30 = Media
=Nivel de pequeña
significación.