Mathematics">
Regresion Lineal
Regresion Lineal
Regresion Lineal
pEn la práctica a menudo se requiere resolver problemas que implican conjuntos de variables de
las cuales se sabe que tienen alguna relación inherente entre sí. Por ejemplo, en una situación
industrial quizá se sepa que el contenido de alquitrán en el flujo de salida de un proceso químico
está relacionado con la temperatura en la entrada.
𝑌 = 𝛽₀ + 𝛽₁𝑥,
en la que, por supuesto, 𝛽₀ es la intersección y 𝛽₁ es la pendiente.y
sabias qué ...
Desempeño
sperado
Y
Alumno es de
capaz l
Identificar
s
si es deterministe
Si la relación es exacta y no contiene ningún componente aleatorio o probabilístico, entonces
-
se trata de una relación determinista entre dos variables (como se ve en cálculo). Sin embargo, la
--
mayoría de los fenómenos científicos y de ingeniería, la relación no es determinista, es decir, una 𝑥
dada no siempre produce el mismo valor de 𝑌. Como resultado, los problemas importantes en este
caso son de naturaleza probabilística, toda vez que la relación anterior no puede considerarse
exacta.
Con frecuencia un estadístico utiliza un modelo como representación de un ideal que, en esencia,
define cómo percibimos que el sistema en cuestión generó los datos. La respuesta 𝑌 se relaciona
con la variable independiente 𝑥 a través de la ecuación
𝑌 = 𝛽₀ + 𝛽₁𝑥 + 𝜀,
,
Un diagrama de dispersión consta los puntos ubicados en el plano de tal forma que cada punto
representa un valor de la variable independiente (medido a lo largo del eje horizontal), y un valor
asociado de la variable dependiente (medido a lo largo del eje vertical).
El diagrama de dispersión, también llamado nube de puntos, brinda dos tipos de información,
visualmente se pueden determinar los patrones que indican como las variables están relacionadas
(lineal o mediante una curva) y por otro lado si existe una relación entre ellas visualizando la clase
de línea o ecuación de estimación que describe a dicha relación.
El coeficiente de correlación lineal entre X e Y medir la dependencia lineal que existe entre las dos
variables y viene dado por:
𝑆𝑋𝑌
𝑟=
𝑆𝑋 𝑆𝑌
Donde
b) Si las variables son independientes, entonces 𝑟 = 0, pero el inverso no tiene por qué ser cierto.
c) Si existe una relación lineal exacta entre 𝑋 e 𝑌, entonces 𝑟 valdría 1 (relación directa) ó -1
(relación inversa).
d) Si 𝑟 > 0, esto indica una relación directa entre las variables (es decir, que si aumentamos 𝑋,
también aumenta 𝑌).
e) Si 𝑟 < 0, la correlación entre las variables es inversa (si aumentamos una, la otra disminuye).
Para hacer una estimación del modelo de regresión lineal simple, trataremos de buscar una
recta de la forma:
𝑌 = 𝛽 0 + 𝛽1 𝑥 + 𝜀,
de modo que se ajuste a la nube de puntos, es decir, que la distancia entre cada punto y la recta
estimada sea la menor posible como se muestra en la siguiente figura.
El método de mínimos cuadrados consiste en minimizar la suma de los cuadrados de los errores:
𝑛
Es decir, la suma de los cuadrados de las diferencias entre los valores reales observados 𝑦𝑖 y los
valores estimados 𝑦𝑖 sea mínima.
Dada la muestra {(𝑥𝑖 , 𝑦𝑖 )}; 𝑖 = 1,2, . . . , 𝑛}, los estimados 𝑏₀ y 𝑏₁ de los mínimos cuadrados
𝑏₀ = 𝑦̅ − 𝑏₁𝑥̅
Por lo tanto, la recta que aproxima mejor a la recta de regresión lineal está dada por
𝑌 = 𝑏₀ + 𝑏₁𝑥.
Ejemplo:
Temperatura 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0
Azúcar 8.1 7.8 8.5 9.8 9.5 8.9 8.6 10.2 9.3 9.2 10.5
𝑥̅ = 1.5,
𝑦̅ = 9.13,
𝑆𝑋2 = 0.11,
𝑆𝑌2 = 0.72,
𝑆𝑋 = 0.33,
𝑆𝑌 = 0.84.
De esta manera, vemos que si existe una correlación positiva entre la cantidad de azúcar
convertida y la temperatura en este proceso químico, por lo cuál vamos ahora a buscar la línea recta
que mejor se ajuste a estos datos y así poder usarla para hacer predicciones sobre la variable
dependiente.
𝑌 = 𝑏₀ + 𝑏₁𝑥
𝑌 = 6. 4164 + 1.8091𝑥
Con esta función es posible hacer predicciones o estimaciones sobre la cantidad convertida para
una temperatura determinada que no aparezca en los datos proporcionados, por ejemplo podemos
estimar cuanta será la cantidad de azúcar convertida a una temperatura de 2.3
𝑌 = 6. 4164 + 1.8091𝑥
𝑌 = 6. 4164 + 1.8091(2.3)
𝑌 = 6. 4164 + 4.1609
𝑌 = 10.5773