Regression Analysis">
Taller No. 1 - Estadistica y Confiabilidad
Taller No. 1 - Estadistica y Confiabilidad
Taller No. 1 - Estadistica y Confiabilidad
Taller No.1
Ejercicio No. 1
Análisis: Podemos afirmar que existe una simetría y una curtosis positiva ya que
los resultados son mayores de cero, además se evidencia que una vivienda
presenta un valor atípico de 18.9 litros por minuto el cual puede ser generado por
un error en los datos, problema en el proceso, factor faltante o probabilidad
aleatoria.
Ejercicio No. 2
Se usan dos máquinas para llenar botellas de plástico con un volumen de 16 onzas.
Uno de los miembros del personal de ingeniería de calidad sospecha que ambas
máquinas hacen el llenado con el mismo volumen neto medio. Se toma una muestra
aleatoria de 10 botellas de la producción de cada máquina y se verifica su volumen:
Máquina 1 16,03 16,04 16,05 16,05 16,02 16,01 15,96 15,98 16,02 15,99
Máquina 2 16,1 15,97 15,8 16,11 15,89 16,13 16,14 16,12 16,11 16,1
Apoyándose en las medidas: media aritmética, desviación estándar, coeficiente de
variación y un diagrama de caja y bigotes responda la sospecha del miembro del
personal de ingeniería.
Fuente: Registros
b) Complemente este análisis haciendo la descripción con la figura de sectores
(Diagrama circular) para la variable.
Grafica 6: No conformidades presentadas durante el primer semestre del año en
una fábrica de podadoras de pasto de asiento
Fuente: Registros
c) Construya una gráfica de barras por conglomerados que le permita comparar los
tipos de no conformidades observados durante los seis meses. Elabore un análisis
al respecto.
Grafica 7: No conformidades presentadas durante el primer semestre del año en
una fábrica de podadoras de pasto de asiento
Fuente: Registros
Análisis: La mayor inconformidad registrada con mayor número de incidencia es la
de poca pintura y las menos recurrentes en todos los meses es la de mucha pintura
y otros.
Ejercicio No. 4
Un panadero cree que existe una gran variabilidad en el peso (gr) de sus
productos. Hay dos operarios A y B que usan las máquinas 1 y 2 no en forma
simultánea. Durante 28 días se tomaron en forma aleatoria muestras de 4 piezas
del mismo tipo de pan producido por cada máquina y operario. La base de datos en
el Excel (Ejercicio 4) muestra los resultados.
a) Con los datos obtenidos, para la variable peso (gr) construya la tabla de
frecuencias para el tipo de pan observado sin diferenciar operario ni máquina
Respuesta: Puesto que la media de las muestras analizadas arroja que la mayor
población de peso en gramos esta entre 200 y 220, con una media poblacional de
209 gramos cumpliendo así con las especificaciones de producción. Sin embargo,
existe una pequeña parte de muestras que se extiende entre 220 y 230 gramos.
f) Apoyándose en las medidas: media aritmética, desviación estándar y coeficiente
de variación, responda la sospecha del panadero.
Respuesta: La cantidad de muestras obtenidas arrojan que los pesos en gramo del
producto están muy cerca al peso ideal lo que hace desviación estándar sea muy
baja e ideal para el panadero ya que su producto en aspecto y tamaño están dentro
de la media necesaria, dato demostrado con el valor de coeficiente de variación
baja.
g) Apoyándose en diagramas de caja y bigotes, primero general y segundo
diferenciado por operario responda la sospecha y el cumplimiento del criterio del
panadero.
Grafica 10: Base de datos de pan producido por cada máquina y operario
Grafica 13: Base de datos de pan producido por cada máquina y operario
Ejercicio No. 5
Generación de corriente directa de un generador eólico. El viento es una masa de
aire que se mueve principalmente en dirección horizontal desde un área de alta
presión hasta una con baja presión. La Energía Eólica es la energía que se produce
a partir del viento. Como la energía solar, es una fuente alterna de energía para
lugares remotos. Sus aplicaciones más comunes son en sistemas de
telecomunicación y en sistemas aislados para viviendas. La capacidad generatriz
de un generador eólico excede la de un sistema solar y su costo es solo una fracción
de este. Por esta razón la energía eólica se ha convertido en una atractiva fuente
de generación de que produce grandes ahorros y cuya inversión es pagadera en el
corto o mediano plazo. La energía producida por el generador eólico y los paneles
solares se almacena en el banco de baterías. El generador eólico transforma la
energía del viento en corriente directa. Se requiere con esta información (Hoja del
libro Excel: Ejercicio 5).
a) Construya el diagrama de dispersión para las variables velocidad del viento (mph)
y Salida de corriente directa. Genere un análisis sobre lo que observa.
Fuente: Registros
Análisis: Se evidencia que la velocidad del viento y la salida de corriente directa es
directamente proporcional, además se observa que es un gráfico de dispersión
dependientes ya que posee causa y efecto, las variables son positivas y son
crecientes
Grafica 15: Diagrama de dispersión entre salida corriente directa (CD) y velocidad
del viento (MPH)
Fuente: Registros
Método
Tipo de Spearman
correlación
Número de filas 25
utilizadas:
Fuente:
Tabla.
Correlaciones
Salida de
CD
Velocidad del 0,982
viento (MPH)
Fuente: Registros
c) genere el siguiente proceso: Haga clic sobre el botón estadísticas y en lo que se
despliega, seleccione la opción regresión. Entre las múltiples opciones que se
abren, tome la opción “gráfica de línea ajustada”.
Complete los campos para la variable respuesta Y y la variable predictora X. A
continuación, en tipo de modelo de regresión, seleccione la opción “Cuadrático” y
finalmente de aceptar. Lo que resulta es el modelo de línea ajustada para los datos
que se le han facilitado. Ha dado un paso más en el análisis de regresión y
correlación: generar el modelo que los datos generan. Con este modelo ya es
posible hacer interpolaciones.
La ecuación de regresión es
Velocidad del viento (MPH) = 2,986 - 1,549 Salida de CD + 1,880 Salida de CD^2
Tabla.
Análisis de Varianza
Fuente GL SC MC F P
Regresión 2 147,822 73,9112 283,67 0,000
Error 22 5,732 0,2605
Total 24 153,554
Fuente:
Fuente: Registros
Grafica 16: Salida corriente directa (CD) y velocidad del viento (MPH)
Fuente: Registros
Ejercicio No. 6
Un ingeniero de una planta de fundiciones de aluminio evalúa la relación entre el
contenido de hidrógeno y la porosidad de las fundiciones de aleación de aluminio.
El ingeniero recoge una muestra aleatoria de 14 piezas fundidas y mide las
siguientes propiedades de cada una de las piezas: contenido de hidrógeno,
porosidad y resistencia. La información la encuentra en el libro de Excel, en la hoja
Ejercicio 6. Construya una gráfica de matriz simple, con opción de matriz para su
presentación superior derecho. Elabore un sistema de conclusiones a partir de la
gráfica elaborada por pares de variables.
Fuente: Registros
Análisis: Se puede observar que a medida que el nivel de concentración del
hidrogeno es mayor, el nivel de resistencia es menor, pero el nivel de porosidad es
mayor y a su vez que entre mayor sea el nivel de porosidad el nivel de resistencia
es menor.
Ejercicio No. 7
La rugosidad en los bordes de los productos de papel cortado aumenta con el
desgaste de las cuchillas. Sólo 1% de los productos cortados con cuchillas nuevas
tiene bordes rugosos, 3% de los productos cortados con cuchillas con filo promedio
presentan rugosidad y 5% de los productos cortados con cuchillas desgastadas
presentan rugosidad. Si 25% de las cuchillas utilizadas son nuevas, 60% tienen filo
promedio y 15% están desgastadas.
a) Construya una tabla de contingencia con la información que se tiene. Cuáles son
las probabilidades que al seleccionar uno de estos productos…
RUGOSO 1% 3% 5% 9%
NO
24% 57% 10% 91%
RUGOSO
c) ¿El producto tenga borde rugoso y haya sido cortado con una cuchilla de filo
promedio?
Respuesta: La probabilidad es del 3%
d) ¿El producto haya sido cortado con cuchilla desgastada si no presenta borde
rugoso?
Respuesta: La probabilidad es del 10%
e) ¿El borde del producto de papel cortado sea no rugoso o haya sido cortado con
cuchilla nueva?
Respuesta: La probabilidad es del 25%
f) ¿El borde del producto haya sido cortado con cuchilla promedio o desgastada?
Respuesta: La probabilidad es del 75%
Ejercicio No. 8
Una cadena de tiendas de video vende tres marcas diferentes de reproductores de
DVD. De sus ventas de reproductores de DVD, 50% son de la marca 1 (la menos
cara), 30% son de la marca 2 y 20% son de la marca 3. Cada fabricante ofrece 1
año de garantía en las partes y mano de obra. Se sabe que 25% de los
reproductores de DVD de la marca 1 requieren trabajo de reparación dentro del
periodo de garantía, mientras que los porcentajes correspondientes de las marcas
2 y 3 son 20% y 10%, respectivamente.
a) Construya una tabla de contingencia con la información que se tiene ¿Cuáles son
las probabilidades que para uno de estos reproductores…
10
𝑃(𝑍/𝑁) = = 0,22222 = 22,2%
45
Análisis: Hay un 22,2% de probabilidad de que uno de los reproductores sea de la
marca 3 si no requirió trabajo de reparación dentro del periodo de garantía.
e) ¿No requiera trabajo de reparación dentro del periodo de garantía o sea de la
marca 1?
𝑃(𝑁 𝑜 𝑋) = 𝑃(𝑁) + 𝑃(𝑋) − 𝑃(𝑁𝑦𝑋)
45 50 25
𝑃(𝑁 𝑜 𝑋) = + − = 0,7 = 70%
100 100 100
Análisis: Hay un 70% de probabilidad de que uno de los reproductores no requiera
trabajo de reparación o sea de la marca 1.
Ejercicio No. 9
El desgaste generalmente es definido como el daño superficial sufrido por los
materiales después de determinadas condiciones de trabajo a los que son
sometidos. Este fenómeno se manifiesta por lo general en las superficies de los
materiales, llegando a afectar la sub-superficie. El resultado del desgaste es la
pérdida de material y la subsiguiente disminución de las dimensiones y por tanto la
pérdida de tolerancias.
a) Elaborar el diagrama de dispersión con grupos que describe la relación entre las
variables, tomando como variable de agrupación tipo de acero.
Grafica 18: Diagrama de dispersión entre las variables de Desgaste vs. Velocidad
D 4 20 16 40
A∩D
# 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑡𝑎𝑛𝑡𝑜 𝑎𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 𝐴 𝑐𝑜𝑚𝑜 𝑎 𝐷 𝑒𝑛 𝑒𝑙 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜
𝑃𝑟 (𝐴⋂𝐷) =
# 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜𝑠 𝑒𝑛 𝑒𝑙 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜
4
𝑃𝑟 (𝐴⋂𝐷) = = 0,008 = 8%
500
Respuesta: La probabilidad de que el evento 𝐴⋂𝐷 ocurra es del 8%.
AUB
𝑃𝑟 (𝐴⋃𝐵) = 𝑃𝑟 (𝐴) + 𝑃𝑟 (𝐵)
100 240
𝑃𝑟 (𝐴⋃𝐵) = + = 0,68 = 68%
500 500
Respuesta: La probabilidad de que el evento 𝐴⋃𝐵 ocurra es del 68%.
𝑃𝑟 (𝐵 𝐶 ) = 1 − 𝑃𝑟 (𝐵)
240
𝑃𝑟 (𝐵 𝐶 ) = 1 − = 0,52 = 52%
500
Respuesta: La probabilidad de que el evento 𝐵 𝐶 ocurra es del 52%
𝑃𝑟 (𝐵 𝐶 ⋂𝐶)
# 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑡𝑎𝑛𝑡𝑜 𝑎𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 𝐵 𝐶 𝑐𝑜𝑚𝑜 𝑎 𝐶 𝑒𝑛 𝑒𝑙 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜
=
# 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜𝑠 𝑒𝑛 𝑒𝑙 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜
160
𝑃𝑟 (𝐵 𝐶 ⋂𝐶) = = 0,32 = 32%
500
Respuesta: La probabilidad de que el evento 𝐵 𝐶 ⋂𝐶 ocurra es del 32%.