Mathematics">
Nothing Special   »   [go: up one dir, main page]

Regresión y Correlación

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 7

ESTADÍSTICA DESCRIPTIVA

UNIDAD 4
REGRESIÓN Y CORRELACIÓN
1. Introducción.- En situaciones cotidianas de las organizaciones muchas veces es necesario analizar dos o
más variables como un conjunto, para establecer cuál es la relación que existe entre cada una de ellas. La
estadística en el estudio de la relación entre dos variables considera en general los siguientes aspectos:

a) Análisis de Regresión: Trata de establecer la forma de la relación que existe entre variables; es decir
que trata de encontrar una relación funcional y = f(x) de manera que se pueda calcular el valor de una
variable de acuerdo al valor que tome la otra.

b) Análisis de Correlación: Trata de establecer el grado de relación que se tiene entre dos variables; es
decir que se trata de medir cuán relacionados entre sí están las variables.

Ejemplo: Si se trata de establecer una relación entre la edad y la estatura de un grupo de niños. El análisis
de regresión tratará de hallar una ecuación matemática que relacione un concepto con el otro;
mientras que el análisis de correlación tratará de hallar un coeficiente que indique cuán
relacionados están entre sí ambos conceptos.

2. Diagrama de dispersión.- Es la representación de un conjunto de datos a través de un sistema de


coordenadas rectangulares (x , y)
y
x y
x1 y1
x2 y2

xn yn
x

3. Tipos de regresión.- En el análisis de regresión se procura conocer una ecuación funcional que exprese de
mejor manera la relación entre dos variables; es en este sentido que se presentan los siguientes tipos de
regresiones:

a) Regresión lineal simple: Este modelo se basa en representar a todos los datos mediante la ecuación de
una recta; es decir:
y
y = a0 + a1 x
Donde:

y = variables dependiente
x = variable independiente
a0 = intersección con el “eje y”
a1 = pendiente o inclinación de la recta

1
ESTADÍSTICA DESCRIPTIVA
b) Regresión lineal múltiple: Este tipo de regresión se utiliza cuando se relaciona tres o mas variables,
las cuales se pueden representar mediante una ecuación lineal en tres variables; es decir:
y
y = a0 + a1 x1 + a 2 x 2

c) Regresión no lineal: Este tipo de regresión se utiliza cuando el diagrama de dispersión se ajusta mas a
una curva que una recta; es decir:
y

y = a0 + a1 x + a2 x 2

4. Curvas de tendencia.- Las ecuaciones generales con las cuales se puede realizar el ajuste de curvas a un
diagrama de dispersión pueden ser las siguientes:

i) Lineal : y = a0 + a1 x
ii) Lineal múltiple : y = a0 + a1 x1 + a 2 x 2
iii) Cuadrática (Parabólica) : y = a0 + a1 x + a2 x 2
iv) Cúbica : y = a0 + a1 x + a2 x 2 + a3 x 3
v) Potencial : y =a xb
vi) Exponencial : y = a e bx
1
vii) Hiperbólica : y=
a0 + a1 x

2
ESTADÍSTICA DESCRIPTIVA
5. Método de los Mínimos Cuadrados.- Este consiste en establecer la ecuación funcional de manera que la
suma de los cuadrados de las diferencias entre los puntos observados ( xi , yi ) y los puntos que se
encuentran sobre la ecuación funcional (por ejemplo la recta) sea mínima; de manera que las desviaciones
sean las menores posibles.

6. Regresión lineal simple.- El método de mínimos cuadrados nos permite en el caso de la regresión lineal
simple calcular los valores de a0 y a1 para establecer la recta de regresión, utilizando el siguiente sistema
normal de ecuaciones:

 y = n  a + ( x ) a
0 1

 xy = ( x ) a + ( x ) a
0
2
1

Aplicando los conceptos del cálculo diferencial y minimizando las desviaciones, se obtiene las siguientes
ecuaciones:

(y ) (x 2 ) − (x )(xy) n (xy) − (x )(y )


a0 = a1 =
n (x 2 ) − (x ) ( )
n x 2 − (x )
2 ; 2

Donde: n = número de datos (puntos)

7. Coeficiente de correlación (r ) .- Es un indicador del grado de asociación existente entre dos variables,
para un determinado modelo. En el caso del modelo de regresión lineal se utiliza la siguiente expresión:

n (xy ) − (x )(y )


r=
( ) ( )
 n x 2 − (x )2    n y 2 − (y )2 
   

❖ Este coeficiente de correlación lineal puede tomar valores en el intervalo de -1 a +1;


es decir: − 1  r  + 1.
❖ Dependiendo del signo que tenga el coeficiente (r ) se interpreta lo siguiente:

3
ESTADÍSTICA DESCRIPTIVA

i) Si es positivo, entonces significa que la recta es creciente

ii) Si es negativo, entonces significa que la recta es decreciente

❖ De acuerdo al valor que puede tomar (r ) , se obtiene las siguientes conclusiones:

|r| INTERPRETACIÓN
0 No existe correlación entre las variables
0.1 La correlación entre las variables es “muy débil”
0.5 La correlación entre las variables es “moderada”
0.8 La correlación entre las variables es “fuerte”
1 La correlación entre las variables es “perfecta”

( )
2
8. Coeficiente de determinación r .- Es un número positivo que varía entre 0 y 1; éste coeficiente nos
permite indicar el grado de certeza con que una variable depende de la otra.

Si multiplicamos por 100 el coeficiente de determinación, entonces éste nos muestra el porcentaje de
validez con que se afirma que una variable depende de la otra y se denota por (r ) .
2

Para analizar el coeficiente de determinación se considera lo siguiente:

0 50 100 (%)

BAJA ALTA

Ejemplo 1: El cuadro adjunto muestra las horas dedicadas al estudio y las notas obtenidas en el examen por
un estudiante; con esta información determine usted la función de regresión lineal, construya el diagrama de
dispersión, en el mismo grafico la función ajustada y el coeficiente de determinación.
Horas de Nota del
estudio examen
10 40
20 65
30 78
40 90

4
ESTADÍSTICA DESCRIPTIVA
Solución: Función de regresión: 𝒚 = 𝒂𝟎 + 𝒂𝟏 𝒙

(∑ 𝑦)(∑ 𝑥 2 ) − (∑ 𝑥)(∑ 𝑥 𝑦) 𝑛 (∑ 𝑥 𝑦) − (∑ 𝑥)(∑ 𝑦 )


Calculamos 𝑎0 : 𝑎0 = (∑ 𝑥 2 ) − (∑ 𝑥 ) 2
; 𝑎1 =
𝑛 𝑛 (∑ 𝑥 2 ) − (∑ 𝑥) 2
( )( ) − ( )( ) 𝑛 ( ) − ( )( )
𝑎0 = 𝑛 ( )−( )2
; 𝑎1 = 𝑛( )−( )2
𝑎0 = ; 𝑎1 =

Entonces la función de regresión lineal es:

𝑛 (∑ 𝑥 𝑦) − (∑ 𝑥)(∑ 𝑦)
Calculamos el coeficiente de correlación: 𝑟 =
(√𝑛 (∑ 𝑥 2 ) − (∑ 𝑥 ) 2 ) ∗ (√𝑛 (∑ 𝑦 2 ) − (∑ 𝑦) 2 )

𝑛 ( ) − ( )( )
𝑟= 𝑟=
(√𝑛 ( ) − ( ) 2 ) ∗ (√𝑛 ( ) − ( ) 2 )

Calculamos el coeficiente de determinación: 𝑟 2 = (𝑟)2 ∗ 100

Respuesta:

Ejemplo 2: Los datos que se muestran en el cuadro corresponden a la estatura y pesos de un grupo de 10
personas
Altura
(cm.)
175 180 162 157 180 173 171 168 165 165
Peso
(Kg.)
80 82 57 63 78 65 66 67 62 58

Con esta información determine la función de regresión lineal, el grado de relación que tienen las variables y
¿qué peso corporal le correspondería a una persona de 178 cm. de estatura?

Solución: Ordenamos nuestros datos de manera vertical:


Altura Peso
(cm.) (Kg.)

∑= ∑=

5
ESTADÍSTICA DESCRIPTIVA
Función de regresión: 𝒚 = 𝒂𝟎 + 𝒂𝟏 𝒙

(∑ 𝑦)(∑ 𝑥 2 ) − (∑ 𝑥)(∑ 𝑥 𝑦) 𝑛 (∑ 𝑥 𝑦) − (∑ 𝑥)(∑ 𝑦 )


Calculamos 𝑎0 : 𝑎0 = (∑ 𝑥 2 ) − (∑ 𝑥 ) 2
; 𝑎1 =
𝑛 𝑛 (∑ 𝑥 2 ) − (∑ 𝑥) 2
( )( ) − ( )( ) 𝑛 ( ) − ( )( )
𝑎0 = 𝑛 ( )−( )2
; 𝑎1 = 𝑛( )−( )2
𝑎0 = ; 𝑎1 =

Entonces la función de regresión lineal es:


𝑛 (∑ 𝑥 𝑦) − (∑ 𝑥)(∑ 𝑦)
Calculamos el coeficiente de correlación: 𝑟 =
(√𝑛 (∑ 𝑥 2 ) − (∑ 𝑥 ) 2 ) ∗ (√𝑛 (∑ 𝑦 2 ) − (∑ 𝑦) 2 )

𝑛 ( ) − ( )( )
𝑟= 𝑟=
(√𝑛 ( ) − ( ) 2 ) ∗ (√𝑛 ( ) − ( ) 2 )

Calculamos el coeficiente de determinación: 𝑟 2 = (𝑟)2 ∗ 100

Calculamos el peso que correspondería a una persona que tiene 178 cm. de estatura:

Ejemplo 3: Un estudio técnico – económico dispone de la siguiente información histórica de ventas de baterías
de fabricación nacional en miles de unidades por año.
Año 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019
Ventas (1000
unidades)
10 12 13 11 14 15 18 17 20 22

a) Determine la función de regresión lineal


b) Calcule el coeficiente de determinación e interprete el resultado
c) Estime las ventas anuales para el año 2020.
Solución: Organizamos de manera vertical nuestros datos:
Año Ventas
x y

∑= ∑=

6
ESTADÍSTICA DESCRIPTIVA

a) Función de regresión: 𝒚 = 𝒂𝟎 + 𝒂𝟏 𝒙

(∑ 𝑦)(∑ 𝑥 2 ) − (∑ 𝑥)(∑ 𝑥 𝑦) 𝑛 (∑ 𝑥 𝑦) − (∑ 𝑥)(∑ 𝑦 )


Calculamos 𝑎0 : 𝑎0 = (∑ 𝑥 2 ) − (∑ 𝑥 ) 2
; 𝑎1 =
𝑛 𝑛 (∑ 𝑥 2 ) − (∑ 𝑥) 2
( )( ) − ( )( ) 𝑛 ( ) − ( )( )
𝑎0 = ; 𝑎1 =
𝑛 ( )−( )2 𝑛( )−( )2
𝑎0 = ; 𝑎1 =

Entonces la función de regresión lineal es:


𝑛 (∑ 𝑥 𝑦) − (∑ 𝑥)(∑ 𝑦)
b) Calculamos el coeficiente de correlación: 𝑟 =
(√𝑛 (∑ 𝑥 2 ) − (∑ 𝑥) 2 ) ∗ (√𝑛 (∑ 𝑦 2 ) − (∑ 𝑦) 2 )

𝑛 ( ) − ( )( )
𝑟= 𝑟=
(√𝑛 ( ) − ( ) 2 ) ∗ (√𝑛 ( ) − ( ) 2 )

Calculamos el coeficiente de determinación: 𝑟 2 = (𝑟)2 ∗ 100

c) Calculamos las ventas para el año 2020:

También podría gustarte