Mathematics">
Nothing Special   »   [go: up one dir, main page]

Trabajo Final

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 23

Ingeniería Industrial

Estadística

Inferencial 3ro D

Profesora:Elia Marlene Sauceda Hernandez

Proyecto final

Derick Ismael Avila Ramos 20212275

Tijuana B.C.

05/JUNIO/2022
Índice:
Introducción:
Planteamiento del Problema:
Objetivo General:

Regresión y correlación (definiciones, y cual es la función):


1.1 Diagrama de Dispersión
Regresión lineal simple
Correlación lineal simple:

Ecuación de regresión lineal simple

Modelos de ecuaciones de regresión lineal simple


Modelo de línea recta:
Modelo de ecuación cuadrática (exponencial y polinomial)
Modelo desviación estándar

Coeficiente de Correlación
4.1 Cálculo por el método de Pearson:
4.2 Cálculo por el método de Spearman

Pruebas de Regresión y Correlación:


pruebas de hipótesis para correlación de Rangos de Spearman

6. Regresión lineal múltiple


6.1 Desviación estándar de regresión lineal múltiple

Materiales que se utilizaron:

¿Cómo se llevó a cabo? ( Método )

Conclusión:

Bibliografías:
Introducción:
en este trabajo final se verán los temas ya mencionados en el índice,
con el fin de poder recabar toda la información necesaria para que
dichos temas queden bastantes claros y en un futuro si se llega a
presentar algún tipo de problema con dichos temas, saber el como
están planteados, cuál es su función y el cómo poder llevarlos a cabo y
obviamente poder resolverlos.
note al momento de hacer dicha investigación de estos temas, que estoy
familiarizado con ciertos aspectos que se vieron en la preparatoria,
gracias a esto se pudo hacer la investigación mucho mas rapida y con la
mejor información posible, al igual otro punto importante de esto, el
hacer la presentación con una investigación previa y después hacerlo a
tu manera ( con tus propias palabras) es algo interesante ya que esto te
ayuda a poder tener una buena comprensión lectora y así poder explicar
de la mejor manera estos temas, ya que hoy en día el estudiante está
muy acostumbrado a solo leer un poco y hacer copy/paste de toda la
información que se encuentra en google, entonces puedo decir con
certeza que este trabajo será 100% libre de copy paste, a excepción de
las imágenes que se lleguen a agregar claro.
sin más preámbulos iniciemos con este trabajo y veamos de qué es lo
que tratan estos temas de estadística inferencial, el como funcionan,
que son, ejemplos, etc.
Planteamiento del Problema:
En este documento se deberá dar investigación a los temas propuestos por la
profesora, los parámetros a cubrir serán los siguientes: definición, tipos de
ecuaciones, modelos, cálculo, ejemplos, etc

Objetivo General:
El objetivo de esta investigación es poder adquirir los conocimientos suficientes para
poder entender estos temas y así en un futuro si es necesario poder aplicarlos en
nuestra profesión.
1. Regresión y correlación (definiciones, y cual es la
función):
Estas son dos técnicas estrechamente relacionadas que comprenden una forma de
estimación.
una forma más específica de explicar esto es, la correlación y la regresión
comprenden un análisis para datos muestrales, para poder saber qué es y el cómo
se pueden llegar a relacionar entre dos o más variables en una misma población. El
análisis de correlación nos proporciona un número que nos dice el grado de
correlación entre dos variables ( ojo que el número que nos da es un número
reducido), mientras que el análisis de regresión nos da una ecuación matemática
que nos describe dicha relación.
para que nos sirve el análisis de correlación? bueno, este resulta muy útil para algún
tipo de trabajo de exploración, cuando algún investigador o analista trata de
determinar cuales variables son potenciales e importantes.

1.1 Diagrama de Dispersión


el diagrama de dispersión nos permite estudiar cuáles son las relaciones entre dos
conjuntos que van muy de la mano, un claro ejemplo de este es ( X, Y), el diagrama
nos mostrará esto con demasiados puntos en la gráfica ( como si fuera una gran
nube de puntos )
¿para que se usan estos diagramas? uno de sus usos es descubrir y también
mostrar las relaciones que hay entre dos conjuntos asociados de datos y el
confirmar que tipo de relaciones anticipadas hay entre estos conjuntos.
El diagrama de dispersión también puede llegar a estudiar:
- dos causas o factores que tengan algún tipo de relación con la calidad
- dos problemas de calidad
- algún problema de calidad junto a su posible causa
a continuación veremos unos ejemplos de los tipos de correlación y podrán notar el
como parecen una nube de puntos como lo dije anteriormente.

(por favor no tome como plagio estas 3 imágenes)

1.2 Regresión lineal simple


Esta es una técnica de un modelo estadístico que se usa para poder describir una
variable de tipo respuesta, continua como una función de solo una o también varias
variables predictoras. también nos puede ayudar a poder comprender y predecir un
comportamiento de algún sistema complejo o también analizar datos
experimentales, etc. La técnica de regresión lineal nos permite crear algún modelo
lineal.

un ejemplo lo veremos más adelante ya que se explicará el cómo se hace esto


mediante el metodo de minimos cuadrados y decir de una vez que este nos sirve
para adecuar la mejor recta posible al problema que se nos está planteando.

1.3 Correlación lineal simple:

Como se mencionó anteriormente la correlación lineal y la regresión lineal simples,


son dos métodos estadísticos que van muy de la mano, ya que estos se encargan
de estudiar la relación lineal que existe entre dos variables.
ojo, que estas sean estrechamente relacionadas no significa que sean iguales, ya
que la correlación se encarga de cuantificar el cómo se relacionan dos variables, por
el otro lado la regresión lineal se encarga de generar la ecuación ( modelo ) que,
basándose en la relación existe entre ambas variables.

2. Ecuación de regresión lineal simple


- regresión lineal simple: este tipo de modelo solo utiliza un solo predictor, la
ecuación general de este tipo es:

un ejemplo de este podría ser, tenemos una gráfica, la regresión lineal simple nos ayudará a
predecir el número de muertes por armas en un estado en específico, ( nuestra variable de
respuesta es Y) en comparación con la población de dicho estado ( nuestra variable
predictora X)
β0 y β1 estas dos son los parámetros del modelo, mientras que la “e” es una
variable aleatoria, también se le conoce como “error”, este explica la variabilidad que
se encuentra en Y, que no puede ser explicada en la relación lineal en la X y Y

3. Modelos de ecuaciones de regresión lineal simple


dependiendo de las variables que nos de el problema elegiremos el modelo que
mejor se adecue a este, que en realidad ahí está el verdadero reto, ya que existen
varios tipos de modelos los cuales podemos utilizar, pero siempre debemos escoger
el que mejor se ajuste a los datos otorgados para así poder minimizar el error en el
que la estima que se haga a partir del modelo.

3.1 Modelo de línea recta:


La línea recta es la que mejor se puede llegar a ajustar a una aproximación de
algún conjunto de datos.

Este modelo estudia la naturaleza de la relación que existe entre dos variables.

una recta que que mejor se adecua puede llegar a ser una recta determinada,
usando el método visual al dibujar una línea recta en alguna gráfica de dispersión,
esto con el fin de que cada número de puntos en la parte de arriba de dicha recta y
de abajo de esta misma sean casi los mismos.
una manera o método más preciso de encontrar la recta que mejor se puede llegar a
adecuar, es el método de mínimos cuadrados.
para encontrar la recta que mejor se ajusta emplearemos los siguientes pasos:
- calcular media de los valores en X y hacer lo mismo en Y
- Sumar los cuadrados de los valores de X
- sumar cada valor de X y multiplicar su valor que le corresponde en Y
- calcular la pendiente de dicha recta usando la sig. Fórmula

- calcular intercepción en Y de la recta con la siguiente fórmula:

- usar la pendiente al igual que la intercepción en Y y asi formar la ecuación


de la recta.
para poder entender mejor este método veamos un ejemplo:
- encontrar la mejor recta para los siguientes datos:

- graficamos los datos y veremos el comportamiento de los puntos.


Buscaremos una recta en y = mx + b, pero para eso deberemos aplicar el
método de los mínimos cuadrados. como ya se mencionó, primero
buscaremos el valor ( x*y )

- después , por las expresiones m y b buscaremos encontrar X^2

- Después usaremos la fórmula que se mencionó anteriormente y


nos arrojaran los siguientes resultados:
- la recta que se obtuvo con este método es la siguiente:

A continuación la gráfica:

- Se puede ver que la recta corta el eje Y en 11.48 y por el otro lado en el eje X
en 13.57.
3.2 Modelo de ecuación cuadrática (exponencial y
polinomial)
este modelo es una gran opción o alternativa cuando el modelo anterior
mencionado ( línea recta) no logra obtener un coeficiente de determinación
apropiado, o cuando el problema que se está estudiando, tiene cierto
comportamiento que se puede llegar a considerar un tanto parabolico, ( tema que se
trato muy a fondo en otras materias ). La forma más sencilla de lograr establecer la
tendencia, es realizando un diagrama de dispersión o como se mencionó
anteriormente una nube de puntos.

Ecuación:
la ecuación que define dicho modelo es la siguiente:

Yi=A+Bxi+Cx 2+E
donde:
- Yi= es la variable dependiente
- A,B Y C= son los parámetros de la ecuación ( generalmente
son desconocidos )
- E= es el error de dicho problema
- Xi= variable independiente
cuando sustituimos los parámetros por los estimadores, la ecuación toma la
siguiente forma:

yi=a+bxi+cxi2
3.3 Modelo desviación estándar

la desviación típica o también conocida como desviación estándar ( se muestran con


los siguientes símbolos σ o s ) esta es una medida del grado de dispersión de los
datos con respecto al valor promedio . En otras palabras la desviación estándar es el
promedio o variación esperada respecto a la media aritmética.

unos ejemplos muy sencillos como los siguientes para que quede un poco
más claro:
- tenemos 3 muestras para calcular: ( 0,0,14,14)(0,6,8,14)(6,6,8,8) nos indica que
cada una tiene una media de 7, su desviación estándar son 7, 5, 1
respectivamente, nos podemos percatar que la última muestra tiene una
desviación mucho menor a las otras, esto sucede porque sus valores están
más cerca de él 7.

4. Coeficiente de Correlación
Esta es la medida específica que ayuda a cuantificar la intensidad de la relación
lineal entre las dos variables en algún análisis de correlación, en los problemas o
ejemplos que se lleguen a presentar de correlación, este coeficiente se verá
representado con la letra “r”

¿Cómo se utiliza el coeficiente de correlación?


Para las dos variables, lo que hace la fórmula es comparar la distancia de cada de
cada dato, con respecto a la media de dicha variable y se usa esta comparación
para poder informarnos hasta qué punto la relación entre dichas variables se ajustan
a una línea que se traza entre los datos.
4.1 Cálculo por el método de Pearson:
Este cálculo es un método de la estadística paramétrica, que se usa para poder
conocer la relación que hay entre dos variables cuantitativas y que también ayuda
para la predicción de alguna variable.
este coeficiente de correlación de Pearson estará entre los valores -1 y +1
- si el valor es menor a 0 nos indica que existe una correlación negativa.
- en su caso contrario al anterior si el valor es mayor a 0 este nos indica
que existe una correlación positiva.
- pero si nos da un valor a 0 o su valor se aproxima demasiado al 0 este
nos indica que no existe una relación lineal entre las variables

El poder tener los datos reflejados en una gráfica siempre será muy útil ya que nos
podrá ayudar a visualizar la relación que pueda existir entre las variables y siempre
debemos tener en cuenta que no siempre habrá relaciones entre variables que sean
lineales.
Características:
- El valor de dicho coeficiente siempre será independiente de cualquier tipo
de unidad para medir dichas variables.
- Mientras más grande sea la muestra que se presenta, más exacto será
el coeficiente de correlación.
- Cuando existe algún valor extremo en alguna variable, el valor del
coeficiente de dicha correlación puede resultar alterado de una forma un
tanto importante.

4.2 Cálculo por el método de Spearman

Este coeficiente de correlación es una medida no paramétrica, esta es utilizada


principalmente para el análisis de datos.
nos ayuda a medir la fuerza y dirección de dicha asociación entre dos variables, en
otras palabras, es una medida estadística de la fuerza de alguna relación lineal entre
variables.
¿Cómo se calcula?

donde:
n= al número de puntos de datos de las variables
di= diferencia de rango
este coeficiente puede tomar valores entre -1 y +1:
- si el valor es -1 en p este significa que hay una perfecta asociación
pero negativa entre los rangos
- si el valor es +1 en p entonces aquí sucede lo opuesto al caso anterior ya
que hay una perfecta asociación de rangos
- Pero si el valor es 0 en p nos dice que no existe una asociación de rangos.

5. Pruebas de Regresión y Correlación:

5.1 pruebas de hipótesis para correlación de


Rangos de Spearman
El coeficiente de correlación de rangos de Spearman como se dijo
anteriormente es una prueba no paramétrica, cuando se quiere medir la
relación que existe entre dos variables y no se cumple el supuesto de
normalidad en la distribución de los valores.
¿Cómo llevar a cabo la prueba de coeficiente de
Spearman? PASO 1: formular la hipótesis
PASO 2: Plantear el nivel de significancia
PASO 3: fórmula de estadística de Prueba
PASO 4: establecer los criterios de decisión
PASO 5: sustituir y hacer cálculos
PASO 6: decisión se acepta Ho o se rechaza
otro dato muy interesante sobre este punto es que los valores de los
rangos deben ser colocados según el orden numérico de las variables,
un ejemplo seria como la siguiente tabla de datos

Talla Peso
1.68 68
1.89 70
1.75 80
1.56 45
1.48 48
al convertir esta tabla en una escala ordinal, se obtienen los siguientes
resultados

Talla Peso
3 3
5 4
4 5
2 1
pero cómo fue que ocurrió esto? bueno, el primer valor del lado
izquierdo ( que en este caso sería 1.68 ) se convierte en 3, esto sucede
porque el 1.68 es el 3er valor más pequeño de la columna de la talla.
por el otro lado, el 45 se convierte en 1 porque es el valor más pequeño
de la columna del peso y así es como se sacaron los valores de la tabla
de arriba.

Y por último se deben calcular la diferencia de los rangos:

di di^2
3-3 0
5-4 1
4-5 1
2-1 1
1-2 1
se usará la siguiente fórmula y sustituiremos los valores
La interpretación de esto es la siguiente: en la muestra que se observó los
valores de la talla y peso tienen una correlación muy fuerte, lo que nos quiere
decir es que mientras aumentan los valores de la talla también aumentaron
los del peso y viceversa.
6. Regresión lineal múltiple

6.1 Desviación estándar de regresión lineal múltiple

Esta permite generar un modelo lineal en el que el valor de la variable


dependiente o sea Y es determinada por conjuntos de variables
independientes que sería ( X1, X2, X3…). También se le conoce por ser una
extensión de la regresión lineal simple y por esta razón debió quedar claro
este tema para poder realizar este otro. Este método puede ser utilizado para
predecir el valor de la variable dependiente o también para evaluar la
influencia que tienen estos valores sobre esta misma.

los modelos lineales múltiples siguen esta ecuación:


Yi=(β0+β1X1i+β2X2i+⋯+βnXni)+ei
β0= es la ordenada en el origen, también el valor de la dependiente Y

βi: es el efecto promedio que tiene el incremento de la variable


independiente X.
ei: es básicamente el error
Materiales que se utilizaron:
- internet
- tiempo
- computadora
- paginas webs

¿Cómo se llevó a cabo? ( Método )

para poder llevar a cabo este proyecto fue necesario tener las
habilidades mínimas de comprensión lectora ya que el copy paste
estaba prohibido, se necesitaba leer toda la información y rescatar lo
más importante de cada una de ellas, al igual buscar ejemplos con el
que se pudieran complementar dichos temas, la verdad no fue muy
laborioso solo que estuvo algo extenso este trabajo, también lo que se
necesito y que fue algo indispensable fue internet para así poder
encontrar toda la información necesaria para este proyecto final.
Conclusión:
la verdad que fue un proyecto bastante extenso pero gracias a esto se nos
despegamos un poco de la rutina de solo hacer click en la primera pagina que
encontrábamos, hacer copy y pegarlo en el documento, esto en realidad para
un futuro como ingenieros está mal ya que ni siquiera miramos si la
información es verídica o no entonces que este proyecto sea de hacerlo con
tu propia comprensión me pareció bastante bien, espero que todos los temas
hayan quedado bastantes claros y sea un documento merecedor de 100, ya
que los temas vistos no fueron para nada sencillos pero tampoco fueron muy
complicados de entender, solo debes dedicarle el tiempo y la paciencia
necesaria y los temas se comprende con rapidez.
Bibliografías:
- Correlación lineal y Regresión lineal simple by Joaquín Amat
Rodrigo, available under a Attribution 4.0 International (CC BY 4.0)
at
https://www.cienciadedatos.net/documentos/24_correlacion_y_reg
r esion_lineal

- Ing. Agr. Luis Manfredo Reyes Chávez Profesor Titular


Departamento de Estadística:
http://reyesestadistica.blogspot.com/2011/07/analisis-de-regresion
- cuadratica.html
-
- EL COEFICIENTE DE CORRELACION DE LOS RANGOS DE
SPEARMAN CARACTERIZACION Revista Habanera de Ciencias
Médicas, vol. 8, núm. 2, abril-junio, 2009 Universidad de Ciencias
Médicas de La Habana Ciudad de La Habana, Cuba
https://www.redalyc.org/pdf/1804/180414044017.pdf
- Betancourt, D. F. (26 de julio de 2016). Cómo hacer un diagrama
de dispersión: Ejemplo en calidad. Recuperado el 10 de
diciembre de 2021, de Ingenio Empresa:
www.ingenioempresa.com/diagrama-de-dispersion.
- https://www.cimec.es/coeficiente-correlacion-pearson/
- http://eio.usc.es/eipc1/BASE/BASEMASTER/FORMULARIOS-PHP
-DPTO/MATERIALES/Mat_50140116_Regr_%20simple_2011_12.
pdf
- https://miprofe.com/minimos-cuadrados/
- https://www.jmp.com/es_mx/statistics-knowledge-portal/what-is-co
r relation/correlation-coefficient.html
- https://www.scientific-european-federation-osteopaths.org/wp-con
t
ent/uploads/2019/01/Coeficiente-de-correlaci%C3%B3n-de-Spear
man-.pdf
-

También podría gustarte