Mathematics">
Trabajo Final
Trabajo Final
Trabajo Final
Estadística
Inferencial 3ro D
Proyecto final
Tijuana B.C.
05/JUNIO/2022
Índice:
Introducción:
Planteamiento del Problema:
Objetivo General:
Coeficiente de Correlación
4.1 Cálculo por el método de Pearson:
4.2 Cálculo por el método de Spearman
Conclusión:
Bibliografías:
Introducción:
en este trabajo final se verán los temas ya mencionados en el índice,
con el fin de poder recabar toda la información necesaria para que
dichos temas queden bastantes claros y en un futuro si se llega a
presentar algún tipo de problema con dichos temas, saber el como
están planteados, cuál es su función y el cómo poder llevarlos a cabo y
obviamente poder resolverlos.
note al momento de hacer dicha investigación de estos temas, que estoy
familiarizado con ciertos aspectos que se vieron en la preparatoria,
gracias a esto se pudo hacer la investigación mucho mas rapida y con la
mejor información posible, al igual otro punto importante de esto, el
hacer la presentación con una investigación previa y después hacerlo a
tu manera ( con tus propias palabras) es algo interesante ya que esto te
ayuda a poder tener una buena comprensión lectora y así poder explicar
de la mejor manera estos temas, ya que hoy en día el estudiante está
muy acostumbrado a solo leer un poco y hacer copy/paste de toda la
información que se encuentra en google, entonces puedo decir con
certeza que este trabajo será 100% libre de copy paste, a excepción de
las imágenes que se lleguen a agregar claro.
sin más preámbulos iniciemos con este trabajo y veamos de qué es lo
que tratan estos temas de estadística inferencial, el como funcionan,
que son, ejemplos, etc.
Planteamiento del Problema:
En este documento se deberá dar investigación a los temas propuestos por la
profesora, los parámetros a cubrir serán los siguientes: definición, tipos de
ecuaciones, modelos, cálculo, ejemplos, etc
Objetivo General:
El objetivo de esta investigación es poder adquirir los conocimientos suficientes para
poder entender estos temas y así en un futuro si es necesario poder aplicarlos en
nuestra profesión.
1. Regresión y correlación (definiciones, y cual es la
función):
Estas son dos técnicas estrechamente relacionadas que comprenden una forma de
estimación.
una forma más específica de explicar esto es, la correlación y la regresión
comprenden un análisis para datos muestrales, para poder saber qué es y el cómo
se pueden llegar a relacionar entre dos o más variables en una misma población. El
análisis de correlación nos proporciona un número que nos dice el grado de
correlación entre dos variables ( ojo que el número que nos da es un número
reducido), mientras que el análisis de regresión nos da una ecuación matemática
que nos describe dicha relación.
para que nos sirve el análisis de correlación? bueno, este resulta muy útil para algún
tipo de trabajo de exploración, cuando algún investigador o analista trata de
determinar cuales variables son potenciales e importantes.
un ejemplo de este podría ser, tenemos una gráfica, la regresión lineal simple nos ayudará a
predecir el número de muertes por armas en un estado en específico, ( nuestra variable de
respuesta es Y) en comparación con la población de dicho estado ( nuestra variable
predictora X)
β0 y β1 estas dos son los parámetros del modelo, mientras que la “e” es una
variable aleatoria, también se le conoce como “error”, este explica la variabilidad que
se encuentra en Y, que no puede ser explicada en la relación lineal en la X y Y
Este modelo estudia la naturaleza de la relación que existe entre dos variables.
una recta que que mejor se adecua puede llegar a ser una recta determinada,
usando el método visual al dibujar una línea recta en alguna gráfica de dispersión,
esto con el fin de que cada número de puntos en la parte de arriba de dicha recta y
de abajo de esta misma sean casi los mismos.
una manera o método más preciso de encontrar la recta que mejor se puede llegar a
adecuar, es el método de mínimos cuadrados.
para encontrar la recta que mejor se ajusta emplearemos los siguientes pasos:
- calcular media de los valores en X y hacer lo mismo en Y
- Sumar los cuadrados de los valores de X
- sumar cada valor de X y multiplicar su valor que le corresponde en Y
- calcular la pendiente de dicha recta usando la sig. Fórmula
A continuación la gráfica:
- Se puede ver que la recta corta el eje Y en 11.48 y por el otro lado en el eje X
en 13.57.
3.2 Modelo de ecuación cuadrática (exponencial y
polinomial)
este modelo es una gran opción o alternativa cuando el modelo anterior
mencionado ( línea recta) no logra obtener un coeficiente de determinación
apropiado, o cuando el problema que se está estudiando, tiene cierto
comportamiento que se puede llegar a considerar un tanto parabolico, ( tema que se
trato muy a fondo en otras materias ). La forma más sencilla de lograr establecer la
tendencia, es realizando un diagrama de dispersión o como se mencionó
anteriormente una nube de puntos.
Ecuación:
la ecuación que define dicho modelo es la siguiente:
Yi=A+Bxi+Cx 2+E
donde:
- Yi= es la variable dependiente
- A,B Y C= son los parámetros de la ecuación ( generalmente
son desconocidos )
- E= es el error de dicho problema
- Xi= variable independiente
cuando sustituimos los parámetros por los estimadores, la ecuación toma la
siguiente forma:
yi=a+bxi+cxi2
3.3 Modelo desviación estándar
unos ejemplos muy sencillos como los siguientes para que quede un poco
más claro:
- tenemos 3 muestras para calcular: ( 0,0,14,14)(0,6,8,14)(6,6,8,8) nos indica que
cada una tiene una media de 7, su desviación estándar son 7, 5, 1
respectivamente, nos podemos percatar que la última muestra tiene una
desviación mucho menor a las otras, esto sucede porque sus valores están
más cerca de él 7.
4. Coeficiente de Correlación
Esta es la medida específica que ayuda a cuantificar la intensidad de la relación
lineal entre las dos variables en algún análisis de correlación, en los problemas o
ejemplos que se lleguen a presentar de correlación, este coeficiente se verá
representado con la letra “r”
El poder tener los datos reflejados en una gráfica siempre será muy útil ya que nos
podrá ayudar a visualizar la relación que pueda existir entre las variables y siempre
debemos tener en cuenta que no siempre habrá relaciones entre variables que sean
lineales.
Características:
- El valor de dicho coeficiente siempre será independiente de cualquier tipo
de unidad para medir dichas variables.
- Mientras más grande sea la muestra que se presenta, más exacto será
el coeficiente de correlación.
- Cuando existe algún valor extremo en alguna variable, el valor del
coeficiente de dicha correlación puede resultar alterado de una forma un
tanto importante.
donde:
n= al número de puntos de datos de las variables
di= diferencia de rango
este coeficiente puede tomar valores entre -1 y +1:
- si el valor es -1 en p este significa que hay una perfecta asociación
pero negativa entre los rangos
- si el valor es +1 en p entonces aquí sucede lo opuesto al caso anterior ya
que hay una perfecta asociación de rangos
- Pero si el valor es 0 en p nos dice que no existe una asociación de rangos.
Talla Peso
1.68 68
1.89 70
1.75 80
1.56 45
1.48 48
al convertir esta tabla en una escala ordinal, se obtienen los siguientes
resultados
Talla Peso
3 3
5 4
4 5
2 1
pero cómo fue que ocurrió esto? bueno, el primer valor del lado
izquierdo ( que en este caso sería 1.68 ) se convierte en 3, esto sucede
porque el 1.68 es el 3er valor más pequeño de la columna de la talla.
por el otro lado, el 45 se convierte en 1 porque es el valor más pequeño
de la columna del peso y así es como se sacaron los valores de la tabla
de arriba.
di di^2
3-3 0
5-4 1
4-5 1
2-1 1
1-2 1
se usará la siguiente fórmula y sustituiremos los valores
La interpretación de esto es la siguiente: en la muestra que se observó los
valores de la talla y peso tienen una correlación muy fuerte, lo que nos quiere
decir es que mientras aumentan los valores de la talla también aumentaron
los del peso y viceversa.
6. Regresión lineal múltiple
para poder llevar a cabo este proyecto fue necesario tener las
habilidades mínimas de comprensión lectora ya que el copy paste
estaba prohibido, se necesitaba leer toda la información y rescatar lo
más importante de cada una de ellas, al igual buscar ejemplos con el
que se pudieran complementar dichos temas, la verdad no fue muy
laborioso solo que estuvo algo extenso este trabajo, también lo que se
necesito y que fue algo indispensable fue internet para así poder
encontrar toda la información necesaria para este proyecto final.
Conclusión:
la verdad que fue un proyecto bastante extenso pero gracias a esto se nos
despegamos un poco de la rutina de solo hacer click en la primera pagina que
encontrábamos, hacer copy y pegarlo en el documento, esto en realidad para
un futuro como ingenieros está mal ya que ni siquiera miramos si la
información es verídica o no entonces que este proyecto sea de hacerlo con
tu propia comprensión me pareció bastante bien, espero que todos los temas
hayan quedado bastantes claros y sea un documento merecedor de 100, ya
que los temas vistos no fueron para nada sencillos pero tampoco fueron muy
complicados de entender, solo debes dedicarle el tiempo y la paciencia
necesaria y los temas se comprende con rapidez.
Bibliografías:
- Correlación lineal y Regresión lineal simple by Joaquín Amat
Rodrigo, available under a Attribution 4.0 International (CC BY 4.0)
at
https://www.cienciadedatos.net/documentos/24_correlacion_y_reg
r esion_lineal