Mathematics">
S14 Regresión Lineal Simple ASU
S14 Regresión Lineal Simple ASU
S14 Regresión Lineal Simple ASU
Estudios Generales
Estadística Básica
1. Gráfico de dispersión
2. Modelo de regresión lineal simple
3. Bondad de ajuste del modelo
4. Predicción de valores de la variable dependiente
LOGRO DE LA SESIÓN
X Y
Variable independiente Variable dependiente
Explica a Y Depende X
Xi Yi
x1 y1
x2 y2 c d
: :
xn yn
EJEMPLO 1
En un Centro de Salud se hizo el seguimiento del peso a un grupo de pacientes
adultos de 30 a 40 años, se quiere determinar un modelo lineal para predecir el
peso en función de la talla con los siguientes datos y se pide responder las
siguientes preguntas:
Talla en Peso en
cm Kg
a. Elabore el gráfico de dispersión y explique la
162 61 tendencia de los datos.
154 60 b. Estime el mejor modelo de regresión e interprete el
180 78 coeficiente de regresión.
158 62
c. Evalúe el modelo: coeficiente de correlación y
171 66
169 60
coeficiente de determinación.
166 54 d. Estime el peso de las personas que tengan una talla
176 84 de 165 cm.
163 68
160 58
EJEMPLO 1
En un Centro de Salud se hizo el seguimiento del peso a un grupo de pacientes adultos de 30 a 40 años, se quiere
determinar un modelo lineal para predecir el peso en función de la talla con los siguientes datos y se pide
responder las siguientes preguntas:
Peso en Kg
169 60 70 de regresión
166
176
54
84
65
a partir de
163 68
60
55
los datos?
160 58
50
150 155 160 165 170 175 180 185
Variable independiente: Talla Talla en cm
Variable dependiente: Peso En el gráfico se observa que la tendencia de los datos describen una relación lineal positiva,
significa que ante un aumento en la talla en la misma proporción aumenta el peso.
MODELO DE REGRESIÓN LINEAL SIMPLE
El modelo de regresión lineal simple se define:
Yi = 0 + 1xi + eij
Donde:
Yi: valor de la variable dependiente para la i-ésima observación
Xi: valor de la variable independiente para la i-ésima observación
eij: error aleatorio para la i-ésima observación que se asume normal
βo : intercepto con el eje Y
β1 : mide el cambio de Y cuando varía X en 1 unidad, llamado pendiente
Los parámetros βo y β1 deben ser estimados:
MÉTODO DE ESTIMACIÓN
xy = x + x
0 1
2
n XY − X Y
0 = y − 1 x 1 =
n X 2 − ( X ) 2
ˆ0 +
ŷ = ˆ 1x
Interpretación de los coeficientes de regresión lineal
La ecuación estimada:
Ŷ= 0 + 1 X o también Ŷ= a + bX
Ŷ= β0 + β1 X
β1
Calcularemos los
coeficientes β0, β1.
β0
β1 es la pendiente de la recta
EJEMPLO 1
75
70
65
60
55
yˆ = ˆ0 + ˆ1 x
50
150 155 160 165 170 175 180 185
Talla en cm
EJEMPLO 1
90
Peso en Kg
Yˆ = −72.047 + 0.827 X
70
65
60
55
50
150 155 160 165 170 175 180 185
Talla en cm
Interpretación de los coeficientes de regresión
n XY − X Y
R=
n X 2 − ( X ) 2 n Y 2 − ( Y ) 2
Donde:
-1 R 1
n = Tamaño muestral
x = Valores de las x’s
y = Valores de las y’s
Interpretación del coeficiente de correlación R de Pearson
El Coeficiente de Correlación R de Pearson mide la fuerza y dirección de relación entre dos variables
cuantitativas en una escala que varía entre -1 a +1. Cuanto mas se aleja del 0 el valor del coeficiente
muestra una relación mas fuerte. El signo de R nos indica si la relación es positiva o negativa.
Correlación Correlación Correlación Correlación Correlación Correlación Correlación Correlación Correlación Correlación
negativa negativa negativa negativa negativa positiva positiva positiva positiva positiva
Muy alta Alta Moderada Baja Muy baja Muy baja Baja Moderada Alta Muy alta
NEGATIVA POSITIVA
R2 =
[ n XY − X Y ] 2
0 R2 1
(n X 2 − ( X ) 2 )(n Y 2 − ( Y ) 2 )
Ventas en Millones
120
2010 5 80 400 25 6400 100
2011 6 120 720 36 14400 80
2012 6 90 540 36 8100 60
2013 7 125 875 49 15625
40
2014 4 35 140 16 1225
20
2015 8 135 1080 64 18225
0
Total 44 645 4015 260 65975 0 2 4 6 8 10
∑X ∑Y ∑XY ∑ X2 ∑ Y2 Gastos en Publicidad (Millones)
ŷ =
o =
1 =
3) Bondad de ajuste del modelo de regresión
1. Coeficiente de correlación: r =
2. Coeficiente de determinación: r2 =
En el diagrama de dispersión
se observa una existe una
relación lineal directa.
b) Hallando los coeficientes de regresión
Experienci Ventas(miles)
N° XY X2 Y2
a (X) (Y)
1 13 26 338 169 676
𝒏=𝟕
2 16 33 528 256 1089
3 30 36 1080 900 1296 σ 𝒙 𝟏𝟎𝟔
𝒙= = = 𝟏𝟓. 𝟏𝟒
4 2 16 32 4 256 𝒏
n =7 ; x =
𝟕x 106
= = 15.14 ; y=
194
= 27.71
5 8 26 208 64 676
σ 𝒚 𝟏𝟗𝟒n 7 7
6 6 19 114 36 361
𝒚= = = 𝟐𝟕. 𝟕𝟏
7 31 38 1178 961 1444 n 𝒏 𝟕
x = 106 = 15.14 ; y2 = 194 = 27.712 xi yi − nxy
= 7 106;
n∑X= =
x ∑Y=194 ∑XY=3478 ∑ X =2390 ∑ Y =5798 i =1 3478 − 7(15.14)(27.71)
n 7 7 b = = = 0.688
2390 − 7(15.14)
1 n 2
n
xi2 − nx 2
i =1
xi yi − nxy
i =1 3478 − 7(15.14)(27.71)
b= = = 0.688
b0 = y − b1 x = 27.71 − ( 0.688 )15.14 = 17.29
2390 − 7(15.14) 2
1 n
x 2
i
− nx 2
i =1
ˆ = 17.29 + 0.668x
y
1 = 0.668 El promedio de ventas aumenta en 668 soles por cada año de experiencia
que adquiera un vendedor (es el incremento en 0.668 de las ventas cuando x
aumenta en una unidad).
c) Bondad de ajuste del modelo de regresión
1. Coeficiente de correlación: r = 0.939
Con un coeficiente de correlación de Pearson r = 0.939 nos indica que existe alta
correlación directa entre los años de experiencia y las ventas
2. Coeficiente de determinación: r2 = (0.93.9)2 = 0.883
El 88.3% de las variaciones de las ventas son explicadas por los años de experiencia.
Existe además un (100-88.3)% = 11.7% lo explican otras variables
Agente-Ventas X Y
1 20 30 X: Nº de llamadas
2 40 60 Y: Nº de fotocopiadoras vendidas
3 20 40
4 30 60
5 10 30
6 10 40
7 20 40
8 20 50
9 20 30
10 30 70
Ejemplo 1 aplicativo de ASU
Ingresos Años de Ingresos Años de
El estudio tiene como objetivo estimar una función lineal que anuales educación anuales educación
relacione el número de años de educación y el ingreso anual. N° N°
1 36577 11 11 64543 12
Los datos corresponden a una encuesta realizada a 20
2 54365 12 12 43433 14
trabajadores que se encuentra en el archivo:
3 33542 10 13 34644 12
S14 ASU 02-4Data_examples_additional_correlations.xlsx. 4 65654 12 14 33213 10
Predecir el ingreso anual de un trabajador con 20 años de 5 45765 11 15 55654 15
educación. 6 24354 7 16 76545 14
7 43233 12 17 21324 11
8 44321 13 18 17645 12
9 23216 9 19 23432 11
10 43454 12 20 44543 15
Tomado de: Arizona State University (Enero, 2023). HCD300: Bioestatistics. Estadística para los negocios.
https://canvas.asu.edu/courses/49003/modules 5.
Regresión con SPSS
Análisis de Regresión:
b0
b1
yˆ = 18,947 + 1,184 x Interpretación de b1 : 1,18 es el cambio promedio en el
número de fotocopiadoras vendidas por cambio unitario
en el número de llamadas.
TRABAJO EN SALA
Resolver en equipos
colaborativos problema 1 y 3
de la semana 14.
CONCLUSIONES
3. http://www.fisterra.com/mbe/investiga/var_cuantitativas/var_cuantitativas2.pdf
Correlation en Wikipedia (inglés).