School Work > Homework, Fundación Universitaria Konrad Lorenz, y metodos numericos">
Aplicación de La Regresion Lineal Por Minimos Cuadrados
Aplicación de La Regresion Lineal Por Minimos Cuadrados
Aplicación de La Regresion Lineal Por Minimos Cuadrados
cesara.acostaq@fukl.edu
Resumen- Este documento está encaminado a la resolución de un problema de la vida real, abordándolo por medio del uso de los
métodos numéricos vistos, siendo la regresión lineal por mínimos cuadrados la herramienta que permitirá obtener los resultados
deseados. Por otra parte es una forma de aplicar parte de los conocimientos adquiridos en pro del mejoramiento de la calidad en el
servicio del departamento de audiovisuales de la Fundación Universitaria Konrad Lorenz, analizando en un mediano plazo el
crecimiento de las solicitudes por parte de la comunidad académica. cca
Nombre Institución
I. FORMULACIÓN DEL PROBLEMA
En los últimos años se ha visto una tendencia de crecimiento en el uso de ayudas audiovisuales, como el
videobean, que complementa la labor pedagógica de los docentes de la Universidad Konrad Lorenz, por tal
razón la institución ha venido adquiriendo equipos y nuevas tecnologías que permitan satisfacer esta
necesidad lo que conlleva a grandes inversiones de dinero que no habían sido presupuestadas algunos años
atrás. Por tal razón mi propuesta de problema es contribuir proporcionando un pronóstico de utilización de los
próximos dos a tres años, de estas ayudas audiovisuales, procurando el desarrollo de nuevos procesos
internos que mejoren aspectos logísticos en cuanto a los prestamos que se efectúan diariamente. Desde mi
punto de vista y ya que laboro actualmente en el área de audiovisuales de la institución, se ha observando
que la universidad está en continua expansión y seria de gran utilidad conocer y planificar cuales van a ser las
exigencias, al menos de tipo tecnológico y de apoyo pedagógico que tendremos en un mediano plazo.
Después de un análisis grafico, que se puede observar en la figura 1, en el cual se tomaron datos estadísticos
del uso de ayudas audiovisuales de 8 semestres correspondientes a los últimos cuatro años, se observa que
los datos en la grafica de dispersión están contenidos en una región estrecha y por lo tanto sugiere una
relación directamente proporcional.[1]
Fundación Universitaria Konrad Lorenz. Acosta, César. Aplicación practica de los métodos numéricos.
3000
2500
2000
1500
1000
500
0
0 2 4 6 8 10
PERIODOS
Fig.1
Gran parte de las matemáticas se dedica a estudiar variables que están deterministicamente relacionadas.
Decir que X y Y están relacionadas de esta manera, significa que una vez conocido el valor de X, el valor de
Y queda completamente especificada. [2]
Donde se asocian errores sustanciales con los datos, la interpolación polinomial es inapropiada y puede dar
resultados insatisfactorios cuando se usa para predecir valores, por ejemplo en la figura 2a, se muestran siete
datos derivados experimentales que exhiben variabilidad significativa, pero sugiere una posible relación entre
Y y X. Es decir, la tendencia general indica que los valores más altos de Y son asociados a los valores más
altos de X. ahora si una interpolación de sexto orden se ajusta a estos datos, como se aprecia en la figura 2b,
pasara justo a través de todos los puntos. Sin embargo, a causa de la variabilidad de los datos la curva oscila
en forma amplia en el intervalo entre los puntos.
Una estrategia más apropiada para tales casos es derivar una función aproximada que ajuste la forma de la
tendencia general de los datos sin ajustar necesariamente con los puntos individuales. La figura 2c ilustra
cómo se puede usar por lo general una línea recta para caracterizar la tendencia de los datos sin pasar a
través de un punto en particular. Para determinar esta línea recta hay que inspeccionar de forma visual los
datos graficados y después trazar una “mejor” línea a través de los puntos. Pero para hacer esto es
necesario concebir algunos criterios con el fin de establecer una base para el ajuste. Una forma de hacerlo es
derivar una curva que minimice la discrepancia entre los puntos y la curva, para lograr esto se utiliza la
técnica de regresión por mínimos cuadrados.
Fundación Universitaria Konrad Lorenz. Acosta, César. Aplicación practica de los métodos numéricos.
Fig. 2a Fig. 2b
Fig.2c
La relación matemática deterministica más simple entre dos variables X y Y es una relación lineal:
(1)
Una estrategia para ajustara a la “mejor” línea a través de los datos podría ser minimizar la suma de los
errores residuales para todos los datos disponibles, como en:
(2)
Donde n es el número total de puntos. Sin embargo, éste es un criterio inadecuado, como se puede ver en la
figura (3a), la cual muestra el ajuste de una línea recta de dos puntos. Obviamente, el mejor ajuste es la línea
que conecta los puntos. Sin embargo, cualquier línea recta que pasa a través del punto medio que conecta la
línea (excepto una línea perfecta vertical) resulta en un valor mínimo de la ecuación (2) igual a cero debido a
los errores que se cancelan.
Fig. 3a Fig. 3b
Fig. 3c
Fundación Universitaria Konrad Lorenz. Acosta, César. Aplicación practica de los métodos numéricos.
Por tanto otro criterio lógico podría ser minimizar la suma de los valores absolutos de las discrepancias, como
en
(3)
La figura (3b) demuestra que por este criterio es también inadecuado. Para los cuatro puntos expuestos,
cualquier línea recta que este dentro de las líneas punteadas minimizará el valor absoluto de la suma. Así,
este criterio tampoco da un único mejor ajuste.
Una tercera estrategia para ajustar a la mejor línea es el criterio minimax. En esta técnica la línea se elige de
manera que minimice la máxima distancia que tenga un punto individual desde la línea. Como se ilustra en la
figura (3c), tal estrategia no es adecuada para regresión, ya que tiene una excesiva influencia en puntos fuera
del conjunto; es decir, un solo punto con un gran error.
Una estrategia que supera los defectos de los procedimientos anteriores es minimizar la suma de los
cuadrados de los residuos entre la y medida y la y calculada con el modelo lineal.
(4)
Este criterio tiene varias ventajas, entre ellas el hecho de que se obtiene una línea única para un cierto criterio
conjunto de datos. A continuación se presenta una técnica para determinar los valores de
y que minimizan la ecuación 4.
Para determinar los valores de y de la ecuación (17.3) es diferenciada con respecto a cada
coeficiente:
(5)
Fundación Universitaria Konrad Lorenz. Acosta, César. Aplicación practica de los métodos numéricos.
Obsérvese que se han simplificado los símbolos de la sumatoria; todas las sumatorias son de i= 1 hasta n. Al
fijar estas derivadas igual a cero, resultara un mínimo . Si se hace esto, las ecuaciones se pueden expresar
como:
(6)
Ahora si hacemos que = podemos expresar las ecuaciones como un conjunto de dos ecuaciones
(7)
(8)
Estas son las llamadas ecuaciones normales, y pueden ser resueltas en forma simultánea.
(9)
Este resultado, entonces, se puede usar un conjunto con la ecuación 7 y resolver para
(10)
Como se dijo anteriormente, el problema que queremos solucionar tiene que ver con el pronóstico de uso de
ayudas audiovisuales en la Fundación Universitaria Konrad Lorenz. Para esto contamos con la tabla 1[3],
donde vemos la distribución según el año y el semestre, de los prestamos efectuados de las ayudas
audiovisuales. La figura 4 ilustra la grafica de dispersión de estos datos hasta el segundo semestre de 2008.
Con esta grafica podemos determinar que la nube de datos tiene una tendencia ascendente y hay poca
dispersión entre los mismos.
1ER SEMESTRE
AÑO PERIODO USUARIOS ATENDIDOS
2DO SEMESTRE
1 690
2004 2 730
3 739
2005 4 1077
5 2690
2006 6 2442
7 2786
2007 8 2856
9 2936
2008 10 3469
N(total de
muestras) 10
Tabla 1
Fundación Universitaria Konrad Lorenz. Acosta, César. Aplicación practica de los métodos numéricos.
2500
2000
1500
1000
500
0
0 2 4 6 8 10
PERIODOS
FIG. 4
Habiendo verificado esto podemos comenzar a hacer los cálculos matemáticos necesarios que determinaran la recta de
regresión. En la tabla 2 se ilustra cada una de las sumatorias que se incluirán en las ecuaciones 9 y 10.
Σ(Xi*Yi)
ΣXi ΣYi Σxi/n ΣYi/n ΣXi ΣYi Σxi^2 Σyi^2
1 690 1 690 1 690 1 690
2 730 2 730 2 730 2 730
3 739 3 739 3 739 3 739
4 1077 4 1077 4 1077 4 1077
5 2690 5 2690 5 2690 5 2690
6 2442 6 2442 6 2442 6 2442
7 2786 7 2786 7 2786 7 2786
8 2856 8 2856 8 2856 8 2856
9 2936 9 2936 9 2936 9 2936
10 3469 10 3469 10 3469 10 3469
55 20415 5.5 2041.5 140241 385 52487103
Tabla 2
Fundación Universitaria Konrad Lorenz. Acosta, César. Aplicación practica de los métodos numéricos.
Con esta información ya tenemos la posibilidad de ir a las ecuaciones 9 y 10, reemplazar y obtener una recta
de la forma y=mx+b, que es determinada por nuestros valores . Seguido de esto, y con base en esta
función obtener la recta de regresión, creamos la tabla 3 en la que damos valores de x y los evaluamos en
nuestra función que nos dará el punto y.
a1 338,8909091
a0 177,6
X Y
0 177
1 516
2 855
3 1194
4 1533
5 1872
6 2210
7 2549
8 2888
9 3227
10 3566
11 3905
12 4244
Tabla 3.
Lo siguiente, y como podemos ver en la figura 5, es graficar los valores de la tabla 3 e incluirlos sobre la figura 4 de
dispersión para verificar el comportamiento sobre esta, también es necesario obtener el coeficiente de correlación r,
este valor puede ir de +1.00 a -1.00 que multiplicado por 100 (para mostrarlo en porcentaje) nos indica la fuerza o
grado de la relación; cuanto mayor sea, mayor será la correspondencia entre los dos conjuntos de datos. Así, cuando
rXY= 1.00 o 100%, los resultados en y serán completamente predecibles, si se conoce x. [4]
En nuestro caso el cálculo de r se hace mediante la ecuación:
Fundación Universitaria Konrad Lorenz. Acosta, César. Aplicación practica de los métodos numéricos.
Esto nos da como resultado un valor que indica que la correlación es explicada en un 95.46%
3500
3000
2500
2000 Linea de Regresion
1500 Puntos de dispersion
1000
estimado
500
0
0 2 4 6 8 10 12 14
PERIODOS
Fig. 5
Vemos que para el primer semestre del año 2010, el número de usuarios del departamento de audiovisuales
puede ascender a los 4244 usuarios de las diferentes facultades.
Fundación Universitaria Konrad Lorenz. Acosta, César. Aplicación practica de los métodos numéricos.
REFERENCIAS
[3] Dirección de Biblioteca Fundación Universitaria Konrad Lorenz. Dra. Beatriz Flórez