"Desarrollo de Una Herramienta Informática BI (Business Intelligence), para La Toma de Decisiones en El Área de Cartera Crediticia, de La Cooperativa de Ahorro y Crédito Mushuc Ru
"Desarrollo de Una Herramienta Informática BI (Business Intelligence), para La Toma de Decisiones en El Área de Cartera Crediticia, de La Cooperativa de Ahorro y Crédito Mushuc Ru
"Desarrollo de Una Herramienta Informática BI (Business Intelligence), para La Toma de Decisiones en El Área de Cartera Crediticia, de La Cooperativa de Ahorro y Crédito Mushuc Ru
Tema:
Ambato Ecuador.
Enero 2015.
APROBACIN DEL TUTOR
EL TUTOR
-----------------------------------------------
ii
AUTORA
-----------------------------------------------
iii
APROBACIN DEL TRIBUNAL DE GRADO
La Comisin Calificadora del presente trabajo de graduacin conformada por los seores
docentes Ing. M.Sc. Oswaldo Paredes e Ing. Gabriela Prez, Ph.D., han revisado y
aprobado el Informe Final del Trabajo de Graduacin titulado DESARROLLO DE UNA
HERRAMIENTA INFORMTICA BI (BUSINESS INTELLIGENCE), PARA LA
TOMA DE DECISIONES EN EL REA DE CARTERA CREDITICIA, DE LA
COOPERATIVA DE AHORRO Y CRDITO MUSHUC RUNA., presentada por el
Seor Curi Inti Masaquiza Chango, de acuerdo al Art. 18 del Reglamento de Graduacin
para obtener el ttulo Terminal del tercer nivel de la Universidad Tcnica de Ambato.
---------------------------------------------
Ing. M.Sc. Vicente Morales
PRESIDENTE DEL TRIBUNAL
-------------------------------------------- ---------------------------------------------
DOCENTE CALIFICADOR
Ing. M.Sc. Oswaldo Paredes Ing. Gabriela Prez, Ph.D.
iv
DEDICATORIA:
v
AGRADECIMIENTO:
vi
NDICE DE CONTENIDOS
CAPTULO 1 .......................................................................................................................... 1
1.1 Tema de investigacin................................................................................................... 1
1.2 Planteamiento del Problema .......................................................................................... 1
1.3 Delimitacin del objeto de investigacin. ..................................................................... 2
1.4 Justificacin................................................................................................................... 3
1.5 Objetivos ....................................................................................................................... 4
1.5.1 Objetivo general .................................................................................................... 4
1.5.2 Objetivos especficos .............................................................................................. 4
CAPTULO 2 .......................................................................................................................... 6
2.1 Antecedentes investigativos .......................................................................................... 6
2.2 Fundamentacin terica ................................................................................................ 8
2.3 Propuesta de Solucin ................................................................................................. 25
CAPTULO 3 ........................................................................................................................ 26
3.1. Modalidad de la investigacin .................................................................................. 26
3.2. Recopilacin de la informacin ................................................................................ 26
3.3. Desarrollo del proyecto ............................................................................................. 27
CAPTULO 4 ........................................................................................................................ 29
4.1. Observacin de los procesos actuales que intervienen en la toma de decisiones en el
rea de cartera crediticia de la Cooperativa de Ahorro y Crdito Mushuc Runa. . 29
4.2. Revisin de los datos que forman parte de la informacin para la toma de decisiones
el rea de cartera crediticia de la Cooperativa de Ahorro y Crdito Mushuc Runa. .
................................................................................................................................ 31
4.3. Anlisis de las herramientas informticas Pentaho BI y Spago BI. .......................... 34
4.4. Estudio y seleccin de las herramientas informticas ms adecuadas que se adapten
tanto a la infraestructura, recurso econmico; as como la satisfaccin de las
necesidades en cuanto a la toma de decisiones en el rea de cartera crediticia de la
Cooperativa de Ahorro y Crdito Mushuc Runa. .................................................. 36
4.4.1. Seleccin del SGBD para el DW ......................................................................... 36
4.4.2. Herramienta BI a utilizar ..................................................................................... 37
4.5. Diseo del Data Warehouse ...................................................................................... 38
4.5.1. PASO 1: ANLISIS DE REQUERIMIENTOS ............................................ 39
4.5.2. PASO 2: ANLISIS DE LOS OLTP ............................................................. 41
4.5.3. PASO 3: MODELO LGICO DEL DATA WAREHOUSE ......................... 51
vii
4.5.4. PASO 4: INTEGRACIN DE DATOS. ........................................................ 60
4.6. Creacin de Cubos Multidimensionales..................................................................... 78
4.7. Ejecucin de las pruebas de funcionamiento del esquema multidimensional. ......... 85
4.8. OBTENCIN DE RESULTADOS DE LA HERRAMIENTA INFORMTICA BI. .
................................................................................................................................ 88
CAPTULO 5 ...................................................................................................................... 101
5.1. Conclusiones. .......................................................................................................... 101
5.2. Recomendaciones.................................................................................................... 102
Referencias: ..................................................................................................................... 104
ANEXOS ............................................................................................................................ 107
Anexo 1: Entrevista mediante un cuestionario al director de asesores y analistas de
crdito...................................................................................................................... 107
Anexo 2: Entrevista realizada mediante un cuestionario al director del departamento de
sistemas. .................................................................................................................. 109
Anexo 3: Identificacin de indicadores y perspectivas de anlisis. ............................... 111
viii
NDICE DE FIGURAS
ix
Fig. 38: Carga Inicial DW.................................................................................................... 63
Fig. 39: Carga dimensin SECTOR_GEOGRAFICO. ........................................................ 65
Fig. 40: SECTOR_GEOGRAFICO Obtener datos OLTP................................................ 66
Fig. 41: Carga dimensin ESTADO_CIVIL ....................................................................... 67
Fig. 42: ESTADO_CIVIL Obtener datos OLTP. ............................................................ 67
Fig. 43: Carga dimensin RANGO_EDAD. ....................................................................... 68
Fig. 44: RANGO_EDAD Obtener datos OLTP. .............................................................. 69
Fig. 45: Carga dimensin LINEA_CREDITO. ................................................................... 70
Fig. 46: DIM_LINEA_CREDITO Obtener datos OLTP.................................................. 70
Fig. 47: Carga dimensin GARANTIA_CREDITO............................................................ 71
Fig. 48: GARANTIA_CREDITO Obtener datos OLTP. ................................................. 71
Fig. 49: Carga Hecho H_CREDITO. .................................................................................. 72
Fig. 50: Hecho H_CREDITO - Obtener datos OLTP. ......................................................... 72
Fig. 51: Carga Hecho H_SOCIO_TIPO_A. ........................................................................ 73
Fig. 52: Hecho H_SOCIO_TIPO_A - Obtener datos OLTP. .............................................. 73
Fig. 53: Carga Hecho H_SOCIO_TIPO_B. ......................................................................... 74
Fig. 54: Hecho H_SOCIO_TIPO_B - Obtener datos OLTP. .............................................. 74
Fig. 55: Carga Hecho H_SOCIO_TIPO_C. ......................................................................... 75
Fig. 56: Hecho H_SOCIO_TIPO_C Obtener datos OLTP. .............................................. 75
Fig. 57: Cargar Hecho CARTERA_CREDITO. .................................................................. 76
Fig. 58: Hecho CARTERA_CREDITO - Obtener datos OLTP. ......................................... 76
Fig. 59: Procedimiento almacenado Carga dimensin FECHA. ......................................... 77
Fig. 60: Conexin DW desde Schema Workbench. ............................................................ 78
Fig. 61 Creacin del esquema multidimensional. ................................................................ 78
Fig. 62: Aadir dimensin. .................................................................................................. 79
Fig. 63: Asignar tabla que se relaciona con la Dimensin................................................... 79
Fig. 64: Configuracin de la jerarqua que pertenece a la dimensin. ................................. 80
Fig. 65: Configuracin de los campos a utilizar en la dimensin. ....................................... 80
Fig. 66: Agregacin de cubo multidimensional. .................................................................. 81
Fig. 67: Definicin de la tabla de hechos que se relaciona con el cubo. ............................. 81
Fig. 68: Definicin de la dimensin a usar en el cubo. ........................................................ 82
Fig. 69: Configuracin del indicador de la tabla de hechos que se relaciona con el cubo. . 83
Fig. 70: Esquema final de los Cubo Multidimensional. ...................................................... 83
Fig. 71: Publicacin del Esquema de Cubos Multidimensionales en Pentaho BI Server. ... 84
Fig. 72: Publicacin exitosa del Esquema de Cubos Multidimensional. ............................. 85
Fig. 73: Iniciacin de la herramienta Pentaho BI Server. .................................................... 86
Fig. 74: Acceso a Pentaho BI Server mediante navegador. ................................................. 86
Fig. 75: Inicio sesin en BI Server. ..................................................................................... 87
Fig. 76: Seleccin de esquema y cubo multidimensional a analizar. .................................. 87
x
Fig. 77: Datos multidimensionales generados por Jpivot. ................................................... 88
Fig. 78: Saiku Analytics - Anlisis de datos dimensionales Monto de mora por Sector
Geogrfico. ........................................................................................................................... 89
Fig. 79: Saiku Analytics - Anlisis datos de dimensionales - Monto de mora por Rango de
Edad. ..................................................................................................................................... 89
Fig. 80: Jpivot - Anlisis de datos dimensionales - Monto de mora por Estado Civil. ....... 90
Fig. 81: Saiku Analytics - Anlisis de datos dimensionales - Total de socios tipo A entre el
2010 al 2013.......................................................................................................................... 90
Fig. 82: Saiku Analytics - Anlisis de datos dimensionales - Total de socios tipo B entre el
2010 al 2013.......................................................................................................................... 91
Fig. 83: Saiku Analytics - Anlisis de datos dimensionales - Total de socios tipo C entre el
2010 al 2013.......................................................................................................................... 91
Fig. 84: Saiku Analytics - Anlisis de datos dimensionales - Promedio de monto ms
solicitado entre el 2010 al 2013. ........................................................................................... 92
Fig. 85: Saiku Analytics - Anlisis de datos dimensionales - Promedio de plazo ms
solicitado entre el 2010 al 2013. ........................................................................................... 92
Fig. 86: Saiku Analytics - Anlisis de datos dimensionales - Cartera por lnea de crdito.
.............................................................................................................................................. 93
Fig. 87: Saiku Analytics - Anlisis de datos dimensionales - Cartera por garanta de
crdito. .................................................................................................................................. 93
Fig. 88: Ventana de bienvenida de PRD. ............................................................................. 94
Fig. 89: Seleccin de la plantilla para el reporte.................................................................. 95
Fig. 90: Seleccin del mtodo de acceso al DW.................................................................. 95
Fig. 91: Conexin al DW desde PRD. ................................................................................. 96
Fig. 92: Cdigo SQL para obtener los datos para el reporte. ............................................... 96
Fig. 93: Sentencia SQL para filtrar el reporte por ao......................................................... 97
Fig. 94: Seleccin del SQL que contiene los datos a mostrar en el reporte. ........................ 97
Fig. 95: Definicin de campos a mostrar en el reporte. ....................................................... 98
Fig. 96: Finalizacin del asistente con el formateo de los campos del reporte.................... 98
Fig. 97: rea de trabajo para el diseo del reporte personalizado. ...................................... 99
Fig. 98: Final del diseo personalizado del reporte. ............................................................ 99
Fig. 99: Publicacin del reporte en el Servidor Pentaho BI. .............................................. 100
xi
RESUMEN
ASHALLA
xii
ABSTRACT
Making decision is the fundamental pillar that involving the permanency or decay of
organization; the companies must keep pace with technological advances not be
competitive if not for achieve the objectives effectively, maintaining a sustainable economic
development. In the present time most organizations require decision support systems with
business intelligence for evaluating stability through a variety of financial indicators. For
these reason in the Cooperativa de Ahorro y Crdito Mushuc Runa Ltda., have seen the
importance of acquire a BI tool that helping decision making in the area of credit portfolio,
allowing take opportune and veridical analysis.
xiii
GLOSARIO DE TRMINOS
BI (Business Intelligence): es un trmino que abarca los procesos, las herramientas, y las
tecnologas utilizadas para convertir los datos en informacin y la informacin en
conocimiento. [8].
xiv
JDBC: Java DataBase Connectivity. Es una interfaz escrita en Java que permite la
conexin a diferentes SGBDs como PostgreSQL, MySQL, entre otros.
JDK (Java Delopment Kit): El Kit de desarrollo de Java (JDK) contiene las herramientas y
libreras necesarias para crear y ejecutar aplicaciones desarrolladas en Java.
MR: Modelo Relacional, es un diagrama que representa la estructura lgica de una base de
datos, es decir representa las conexiones entre tablas y operadores de tablas para representar
un conjunto de datos. [2].
OCI: Oracle Call Interface. Es una interfaz que permite la conexin al SGBD de Oracle.
ODBC: Open DataBase Connectivity. Es una interfaz abierta de Microsoft, que permite la
conexin a diferentes SGBDs.
xv
ROLAP: Procesamiento Relacional Analtico en Lnea (On-Line Analytical Processing
Relational). ROLAP incluye ampliaciones a un DBMS relacional para soportar datos
multidimensionales. Los motores ROLAP soportan una gran variedad de tcnicas de
almacenamiento y organizacin para la extraccin de datos en forma de resumen. [2].
SGBD: Sistema Gestor de Base de datos, en ingls DBMS (Data Base Management
System), consiste en una coleccin de datos interrelacionados y un conjunto de programas
para acceder a dichos datos. El objetivo principal de un SGBD es proporcionar una forma
de almacenar y recuperar la informacin de manera que sea tanto prctica como eciente.
Se disean para gestionar grandes cantidades de informacin. La gestin de los datos
implica tanto la denicin de estructuras para almacenar la informacin como la provisin
de mecanismos para la manipulacin de la informacin. [1].
xvi
INTRODUCCIN
Esta tesis est organizada, en captulos que se van detallando de manera sucesiva para
alcanzar los objetivos planteados en este trabajo.
xvii
En el Captulo 5, se presentan las conclusiones y recomendaciones de este trabajo.
Finalmente, se presentan las referencias bibliogrficas utilizadas durante el desarrollo de la
tesis y los anexos.
xviii
CAPTULO 1
EL PROBLEMA
Las empresas buscan el xito a travs de una eficaz toma de decisiones. En este
contexto es comn utilizar herramientas informticas basadas en BI para transformar los
datos generados en la organizacin en informacin y la informacin en conocimiento,
algo que no se puede realizar manualmente debido al constante crecimiento de los
datos; es por ello que hoy por hoy estas herramientas se vuelven una tendencia vital
para el futuro de las instituciones a nivel mundial.
En el ltimo censo del MIES, se manifiesta que solo en Tungurahua existen ms de 117
cooperativas de ahorro y crdito, por lo que se cataloga la tercera provincia con mayor
1
movimiento econmico y comercial del Ecuador, sin embargo existen instituciones
financieras que van decreciendo al no mantener un nivel econmico estable [3].
2
1.4 Justificacin
Con el desarrollo del presente trabajo investigativo el impacto competitivo que tendr la
institucin financiera ser altamente beneficiosa frente a las diferentes organizaciones
de la misma lnea.
La aplicacin de las metodologas BI, hoy por hoy son una de las tendencias que tiene
mayor auge dentro de las empresas, ya que se considera un sinnimo de xito, por lo
que la presente investigacin ser de novedosa aplicacin en esta institucin.
3
De la misma manera, la informacin facilitada por la empresa, as como de los libros,
revistas, artculos cientficos e internet servirn de mucha ayuda para profundizar los
conocimientos en la presente rea de investigacin. A dems, la presente investigacin
aportar a uno de los temas ms mencionados en la constitucin del Ecuador que es el
Sumak Kausay o buen vivir, ya que permitir a los clientes de la institucin financiera
acceder de manera eficaz y oportuna a los prstamos para cubrir sus necesidades,
mejorando la calidad de vida.
1.5 Objetivos
4
Generar reportes dinmicos por medio de la herramienta BI, a los
usuarios del rea de cartera crediticia de la Cooperativa de Ahorro y
Crdito Mushuc Runa.
5
CAPTULO 2
En este captulo se presenta el marco terico, en donde se exponen los antecedentes, los
diferentes conceptos relacionados al tema de investigacin, que servirn de soporte en el
desarrollo del TEMI, definiendo de esta manera la propuesta de solucin al problema
planteado en el captulo anterior.
MARCO TERICO
6
Vivimos en una poca en la que la informacin es de vital importancia al momento de
tomar decisiones dentro de las instituciones, motivo por el cual las personas
responsables de tomar decisiones deben apoyarse en herramientas tecnolgicas que
contribuyan con esta actividad; el presente trabajo tiene como objetivo principal crear
un modelo que sirva como gua para implementar Inteligencia de Negocios que apoye a
la toma de decisiones, permitiendo ahorrar costos, tiempo, logstica entre otros, todo
esto se comprueba con la implementacin del Sistema BI desarrollado para la Red de
Proteccin Solidaria. [5].
Hoy en da todas las empresas sin importar su tamao necesitan buscar alternativas
adecuadas que les permitan sobresalir frente a su competencia manteniendo calidad en
el producto o servicio ofrecido.
Anteriormente todas las empresas u organizaciones se enfocaban en mantener su
negocio activo, sin importarles la satisfaccin de sus clientes quienes simplemente
adquiran lo que les ofreca el mercado solventando parcialmente sus necesidades. Por
lo tanto es imprescindible para las organizaciones dar una respuesta rpida a los
requerimientos de informacin e incluso proyectar oportunidades de negocio basadas en
datos histricos. De hecho, muchas empresas estn tratando de realizar un cambio
progresivo para convertir esa informacin en conocimiento; para ello se presenta como
solucin la implementacin de la Inteligencia de Negocios como alternativa de
crecimiento empresarial. [6].
7
comporta como un sistema de alerta que provee una informacin adecuada permitiendo
tomar decisiones de forma gil y oportuna. [7].
BUSINESS INTELLIGENCE
Business Intelligence (BI) es un trmino que abarca los procesos, las herramientas y las
tecnologas para convertir datos en informacin, informacin en conocimiento y planes
para conducir de forma eficaz las actividades de los negocios. BI abarca las tecnologas
de data warehousing de los procesos en el Back End, consultas, informes, anlisis y
las herramientas para mostrar informacin y los procesos en el Front End. [8].
As mismo se puede describir BI, como un concepto que integra por un lado el
almacenamiento y por el otro el procesamiento de grandes cantidades de datos, con el
principal objetivo de transformarlos en conocimiento facilitando la toma de decisin en
tiempo real. Es decir Datos + Anlisis = Conocimiento.
8
Fig. 1: Fases del proceso de BI. [10].
FASE 1: Dirigir y Planear. En esta fase inicial es donde se debern recolectar los
requerimientos de informacin especcos de los diferentes usuarios, as como entender
sus diversas necesidades, para que luego en conjunto con ellos se generen las preguntas
que les ayudarn a alcanzar sus objetivos.
FASE 3: Procesamiento de Datos. En esta fase es donde se integran y cargan los datos
en crudo en un formato utilizable para el anlisis. Esta actividad puede realizarse
mediante la creacin de una nueva base de datos, agregando datos a una base de datos
ya existente o bien consolidando la informacin.
FASE 5: Difusin. Finalmente, se les entregar a los usuarios que lo requieran las
herramientas necesarias, que les permitirn explorar los datos de manera sencilla e
intuitiva. [10].
9
DATA WAREHOUSING & DATA WAREHOUSE
Estas dos palabras, claves en el desarrollo de una herramienta BI, son muy parecidas,
pero tienen diferentes significados, razn por la cual existe la importancia de revisar el
concepto de cada una de ellas:
As mismo otras fuentes sealan: Un Data Warehouse es una base de datos corporativa
que se caracteriza por integrar y depurar informacin de distintas fuentes, para luego
procesarla permitiendo su anlisis desde infinidad de perspectivas y con grandes
velocidades de respuesta. La creacin de un datawarehouse representa en la mayora de
las ocasiones el primer paso, desde el punto de vista tcnico, para implantar una
solucin completa y fiable de Business Intelligence. [11].
En este punto se describirn mediante grficos todos los componentes que intervienen
en la arquitectura del data warehousing tal como se muestra en la Fig. 2:
10
Fig. 2: Arquitectura Data Warehousing. [10].
Como se puede observar, el ambiente del Data Warehousing est formado por diversos
elementos que interactan entre s y que cumplen una funcin especca dentro del
sistema. Bsicamente, la forma de operar del esquema superior se resume de la
siguiente manera:
Los datos son extrados desde aplicaciones, bases de datos, archivos, etc. Esta
informacin generalmente reside en diferentes tipos de sistemas, orgenes y
arquitecturas y tienen formatos muy variados.
Los datos son integrados, transformados y limpiados, para luego ser cargados en el DW.
Principalmente, la informacin del DW se estructura en cubos multidimensionales, ya
que estos preparan esta informacin para responder a consultas dinmicas con un buen
tiempo de respuesta.
11
Proveen una estructura que permite tener acceso rpido a los datos, a travs de la
ejecucin de consultas al cubo, por medio de herramientas multidimensionales, para su
exploracin y anlisis de resultados.
Esta flexibilidad de las bases de datos multidimensionales es gracias a los tres variantes
de modelamiento, que permiten realizar consultas de soporte de decisin como son:
Estos esquemas requieren que toda la estructura de datos este desnormalizada o semi
desnormalizada, para evitar desarrollar uniones (Join) complejas permitiendo acceder a
la informacin de forma gil.
Tabla de dimensiones
Las tablas de dimensiones definen el medio para analizar el contexto del negocio, es
decir representan los aspectos de inters, mediante los cuales los usuarios podrn ltrar
y manipular la informacin almacenada en la tabla de hechos. Estos contienen datos
cualitativos. Ver Fig. 3
Como se puede observar, cada tabla posee un identicador nico y al menos un campo
o dato de referencia que describe los criterios de anlisis relevantes para la
organizacin, estos son por lo general de tipo texto.
12
Tabla de Dimensin Tiempo
Tabla de hechos
Las tablas de hechos contienen los indicadores de negocio que permiten apoyar a la
tomas de decisiones. Contiene datos cuantitativos.
Los hechos son datos que residen en las tablas de hechos y son el resultado de aplicar
sumarizacin esta ltima no solo se refiera a las sumas sino tambin a promedios,
mnimos, mximos, totales por sector, porcentajes, frmulas predenidas, entre otras
operaciones matemticas, dependiendo de los requerimientos de anlisis de la
informacin de negocio. Ver Fig. 4
Como se puede observar en la Fig. 4, los campos que forman parte de la tabla de hechos
son la o las claves primarias de las tablas de dimensiones relacionadas a este y sus
respectivos hechos o indicadores de anlisis de negocio. [10].
13
TIPOS DE MODELAMIENTO DE UN DW
Esquema en estrella
Caractersticas:
Este esquema representa una extensin del modelo en estrella, cuando las tablas de
dimensiones se organizan en jerarquas de dimensiones. Ver Fig. 6
14
Fig. 6: Esquema Copo de Nieve. [10].
Caractersticas:
Esquema constelacin
Este modelo est compuesto por una serie de esquemas en estrella, y tal como se puede
apreciar en la Fig. 7, est formado por una tabla de hechos principal (HECHOS_A) y
por una o ms tablas de hechos auxiliares (HECHOS_B), las cuales pueden ser
sumarizaciones de la principal. Dichas tablas yacen en el centro del modelo y estn
relacionadas con sus respectivas tablas de dimensiones.
No es necesario que las diferentes tablas de hechos compartan las mismas tablas de
dimensiones, ya que, las tablas de hechos auxiliares pueden vincularse con solo algunas
de las tablas de dimensiones asignadas a la tabla de hechos principal, y tambin pueden
hacerlo con nuevas tablas de dimensiones.
15
Fig. 7: Esquema Constelacin. [10].
Su diseo y cualidades son muy similares a las del esquema en estrella, pero posee una
serie de diferencias con el mismo, que son precisamente las que lo destacan y
caracterizan. Entre ellas se pueden mencionar:
CUBO MULTIDIMENSIONAL
16
Atributos: campos o criterios de anlisis, pertenecientes a tablas de dimensiones, los
mismo que permiten filtrar los datos de anlisis de negocio (Dimensiones).
Se puede observar, que el resultado del anlisis est dado por los cruces matriciales de
acuerdo a los valores de las dimensiones seleccionadas.
Ms especficamente, para acceder a los datos del DW, se pueden ejecutar consultas
sobre algn cubo multidimensional previamente definido. Dicho cubo debe incluir entre
otros objetos: indicadores, atributos, jerarquas, etc., basados en los campos de las tablas
17
de dimensiones y de hechos, que se deseen analizar. De esta manera, las consultas son
respondidas con gran performance, minimizando al mximo el tiempo que se hubiese
incurrido en realizar dicha consulta sobre una base de datos transaccional. [10].
De la misma forma otras fuentes afirman: Los cubos son elementos claves en OLAP,
una tecnologa que provee rpido acceso a datos en un almacn de datos (data
warehouse). Los cubos proveen un mecanismo para buscar datos con rapidez y tiempo
de respuesta uniforme independientemente de la cantidad de datos en el cubo o la
complejidad del procedimiento de bsqueda.
DATOS
Los datos son nmeros, letras o smbolos que describen objetos, condiciones o
situaciones. Son el conjunto bsico de hechos referentes a una persona, cosa o
transaccin de inters para distintos objetivos, entre los cuales se encuentra la toma de
decisiones. [14].
INFORMACIN
18
proporciona orientacin a las acciones por el hecho de reducir el margen de
incertidumbre con respecto a nuestras decisiones. [16].
CONOCIMIENTO
En una conversacin informal, los tres trminos suelen utilizarse indistintamente y esto
puede llevar a una interpretacin libre del concepto de conocimiento. Quizs la forma
ms sencilla de diferenciar los trminos sea pensar que los datos estn localizados en el
mundo y el conocimiento est localizado en agentes de cualquier tipo (personas,
empresas, mquinas...), mientras que la informacin adopta un papel mediador entre
ambos.
19
Fig. 9: Esquema de conceptos Dato - Informacin y Conocimiento. [20].
Datos
Los datos son la mnima unidad semntica, y se corresponden con elementos primarios
de informacin que por s solos son irrelevantes como apoyo a la toma de decisiones.
Tambin se pueden ver como un conjunto discreto de valores, que no dicen nada sobre
el porqu de las cosas y no son orientativos para la accin.
Un nmero telefnico o un nombre de una persona, por ejemplo, son datos que, sin un
propsito, una utilidad o un contexto no sirven como base para apoyar la toma de una
decisin. Los datos pueden ser una coleccin de hechos almacenados en algn lugar
fsico como un papel, un dispositivo electrnico (CD, DVD, disco duro...), o la mente
de una persona. En este sentido las tecnologas de la informacin han aportado mucho a
recopilacin de datos.
Como cabe suponer, los datos pueden provenir de fuentes externas o internas a la
organizacin, pudiendo ser de carcter objetivo o subjetivo, o de tipo cualitativo o
cuantitativo, etc.
Informacin
20
Contextualizando: se sabe en qu contexto y para qu propsito se generaron.
Categorizando: se conocen las unidades de medida que ayudan a interpretarlos.
Calculando: los datos pueden haber sido procesados matemtica o
estadsticamente.
Corrigiendo: se han eliminado errores e inconsistencias de los datos.
Condensando: los datos se han podido resumir de forma ms concisa
(agregacin).
Conocimiento
21
As mismo, otras definiciones son las siguientes:
El termino sistema de soporte de decisiones (SSD) se define a una clase de sistemas que
soportan el proceso de toma de decisiones. El nfasis est en el soporte y no en la
automatizacin de las decisiones. Los sistemas de soporte a la decisin permiten al
decisor recuperar los datos y probar las soluciones alternativas durante el proceso de
solucin de problemas. [22].
CARTERA CREDITICIA
Comprende los saldos del principal y productos devengados por cobrar a favor de la
entidad por las operaciones de crdito directo concedidas a sus clientes. Se incluyen
todos los financiamientos otorgados por la entidad, cualquiera sea la modalidad como
los mismos se pacten o documenten, con excepcin de las operaciones que corresponde
registrar en los grupos de Inversiones temporales e Inversiones permanentes de acuerdo
con la definicin de cada uno de stos. [23].
Cartera vigente.- En esta cuenta se registran los crditos que tienen sus amortizaciones
de capital e intereses al da, conforme al plan de pagos establecido en el contrato de
crdito y aquellos que se encuentran con un atraso en sus pagos de hasta 30 das, a partir
de la fecha de incumplimiento del cronograma original de pagos.
Cartera vencida.- En esta cuenta se registran los crditos cuyo capital, cuotas de
amortizacin o intereses no hayan sido cancelados ntegramente a la entidad hasta los
30 das contados desde la fecha de vencimiento. Para este efecto, la fecha efectiva de
contabilizacin en esta cuenta es el da 31 de incumplimiento en cronograma de pagos.
Todo crdito cuyo vencimiento para las amortizaciones de capital, una cuota del mismo
o intereses devengados, haya sido prorrogada por periodos adicionales a 30 das se
contabiliza en esta cuenta.
22
Cartera no devengada o en ejecucin.- En esta cuenta se registran los crditos por los
cuales la entidad ha iniciado las acciones judiciales para el cobro. [25].
CLASIFICACIN DE LA CARTERA
Crdito Productivo.- Aquellos otorgados a sujetos que registren ventas anuales iguales
o mayores a 100.000 USD. As mismo a persona naturales que ejercen su trabajo como
profesionales en libre ejercicio, obligados a llevar contabilidad segn el SRI.
Crdito Microcrdito.- Todo crdito que no supere los USD 20.000, concedido a un
prestatario, sea una empresa constituida como persona natural o jurdica con un nivel de
ventas inferior a 100.000 USD; un trabajador por cuenta propia, grupo de prestatarios,
destinado a financiar actividades en pequea escala, cuya fuente de pagos es el producto
de las ventas o ingresos generados por dicha actividad. Si es mayor a 100.000 USD pasa
a Crdito Productivo.
23
Crdito Comercial.- Son aquellos crditos directos o indirectos otorgados a personas
naturales o jurdicas destinados al financiamiento de la produccin y comercializacin
de bienes y servicios en sus diferentes fases.
Tambin se consideran dentro de esta definicin los crditos otorgados a las personas a
travs de tarjetas de crdito, operaciones de arrendamiento financiero u otras formas de
financiamiento.
GARANTAS
Es decir las garantas son los medios que respaldan o aseguran el pago o reembolso de
los crditos concedidos.
Las personas que pueden prestar la garanta en los crditos son las que tienen mnimo
18 y mximo 65 aos.
TIPOS DE GARANTAS
24
aportacin, en cuyo caso se entregar hasta el 95% del valor, nominal, la pliza de plazo
fijo no podr se pre cancelado sin que antes no haya cancelado la totalidad de la deuda.
[26].
Ttulos valores.- Son documentos necesarios para legitimar el ejercicio del derecho
literal y autnomo que en ellos se incorpora, pueden ser de contenido crediticio,
corporativo o de participacin y de tradicin o representativo de mercancas.
25
CAPTULO 3
METODOLOGA
26
3.3. Desarrollo del proyecto
A continuacin se detallan las actividades que se realizarn, para cumplir los
objetivos establecidos para la presente investigacin.
Anlisis de requerimientos:
a) Identificacin de las preguntas claves.
b) Identificacin de indicadores y perspectivas.
c) Modelo conceptual.
Anlisis de los OLTP:
a) Conformar indicadores.
a) Establecer correspondencias.
b) Nivel de granularidad.
c) Modelo conceptual ampliado.
27
a) Tipo de modelo lgico del DW.
b) Tablas de dimensiones.
c) Tablas de hechos.
d) Uniones.
Integracin de datos:
a) Carga Inicial.
b) Actualizacin. [10].
28
CAPTULO 4
DESARROLLO DE LA PROPUESTA
29
plazos, estos anlisis se realiza a travs del reporte (Ver Fig. 11) emitido por el
sistemas de la Central de Riesgos o Bur de crditos EQUIFAX.
7. Entrega de las carpetas con todos los datos a los asesores de crdito quienes
analizan la documentacin, se contactan con los socios para realizar la
inspeccin correspondiente en el domicilio del socio y en el lugar de trabajo,
donde se verifica que la informacin de la solicitud sea verdadera; luego de lo
cual los asesores emiten un informe donde establecen si es recomendable o no
otorgar el crdito en base a la verificacin de documentos como: cdula de
identidad, planillas de pagos de servicios para verificar el lugar de vivienda y
trabajo, Rol de Pago Mecanizado del IESS, escrituras para verificar y analizar la
Capacidad de Pago del Socio, estados de cuentas bancarias etc.
8. Las carpetas son enviadas al Comit de Crditos, los que se renen diariamente
para aprobar o negar los crditos solicitados.
30
10. Una vez que todo ha sido verificado se procede a acreditar el total del dinero
solicitado a la cuenta de ahorro del socio solicitante, utilizando el software de
crditos.
11. Las carpetas con los crditos negados son devueltos a los analistas para que los
documentos sean devueltos a los socios, con la respectiva explicacin del porque
ha sido negado el Crdito y luego se procede a enviar las carpetas al archivo: lo
mismo realizan los liquidadores de crdito una vez otorgado los crditos de los
socios.
4.2. Revisin de los datos que forman parte de la informacin para la toma de
decisiones el rea de cartera crediticia de la Cooperativa de Ahorro y Crdito
Mushuc Runa.
En este punto se revis los documentos facilitados a la hora de efectuar la entrevista
detallada en el tem anterior:
31
Fig. 10: Requisitos para obtener prstamos.
32
Fig. 11: Anlisis del estado de prstamos del socio.
33
Fig. 12: Tabla de anlisis de la cultura de pago del socio.
34
dos herramientas informticas son catalogadas como las ms recomendadas
actualmente. El anlisis se realizar por los servicios que ofrecen (Ver Tabla 1), sin
tener en cuenta las ventajas y desventajas ya que esto no tiene sentido porque estas
herramientas estn orientas hacia el mismo destino.
HERRAMIENTAS/SE
RVICIOS
Reportes S S
Anlisis
S S
multidimensional(OLAP)
Grficos S S
Indicadores clave de
S S
desempeo (KPI)
Integracin datos (ETL) S S
Anlisis varios elementos
No S
en la misma vista.
Minera de datos S S
Diseador de reportes S S
Autenticacin S S
Ubicacin geogrfica
No S
inteligente
Documentacin, foros,
soporte, formacin y S No
consultora.
Mvil No S
Mtodos de acceso al Nativo JDBC, ODBC,
Nativo JDBC, ODBC.
SGBD OCI para Oracle.
Base de datos
S S
Oracle/PostgreSQL
35
4.4. Estudio y seleccin de las herramientas informticas ms adecuadas que se
adapten tanto a la infraestructura, recurso econmico; as como la satisfaccin
de las necesidades en cuanto a la toma de decisiones en el rea de cartera
crediticia de la Cooperativa de Ahorro y Crdito Mushuc Runa.
Con cul motor de base de datos open source deseara que se ejecute el
proyecto investigativo?, la respuesta fue PostgreSQL por sus caractersticas
principales como las siguientes:
36
4.4.2. Herramienta BI a utilizar
En base a la comparativa realizada en el punto 4.4. la herramienta BI a utilizar
en el desarrollo de la presente solucin informtica BI es Pentaho Community
que actualmente est en la versin 5.0, se selecciona esta opcin por la
accesibilidad a la documentacin, lo cual sin duda facilitar la investigacin
permitiendo culminar de forma eficaz el proyecto; as mismo por los servicios
que brinda como la integracin de datos, anlisis OLAP, diseo de reporte,
diferentes mtodo de conexin al SGBD, soporte de la base de datos Oracle y
PostgreSQL, ya que estos son las bases de datos con las que se trabajara en el
trascurso del desarrollo de proyecto; en fin los servicios que ofrece esta
herramienta BI permiten cubrir la ejecucin y alcance del presente trabajo
investigativo.
37
4.5. Diseo del Data Warehouse
Para la creacin del Data Warehouse se utilizar la metodologa Hefesto v2.0, la
cual consta de 4 pasos que se detallan en la Fig. 13.
38
4.5.1. PASO 1: ANLISIS DE REQUERIMIENTOS
Tareas a realizar:
a) Identificar preguntas
El primer paso comienza con la recoleccin de informacin de la empresa,
en este punto se utiliz la tcnica de la entrevista mediante un cuestionario
(Ver Anexo 2) con el fin de obtener las preguntas claves que la herramienta
informtica BI podr responder, la entrevista fue realizada al director del
departamento de sistemas, Ing. Jairo Snchez obteniendo como resultado las
siguientes preguntas claves:
39
b) Identificar indicadores y perspectivas de anlisis
En este tem se encontrarn los indicadores y las perspectivas de anlisis
que intervendrn en el desarrollo de modelo conceptual, para ello se
utilizarn las preguntas claves obtenidas en el paso anterior [Ver Anexo 4].
Debido a que el tiempo es comnmente una perspectiva indispensable en
cuanto al desarrollo de un DW se lo tomar muy en cuenta en el modelo
conceptual.
c) Modelo Conceptual
En esta etapa, se construir un modelo conceptual a partir de los indicadores
y perspectivas obtenidas en el paso anterior.
Este modelo se podr ver claramente el alcance del presente proyecto
investigativo.
A continuacin se puede ver en la Fig. 14 y Fig. 15 el Modelo conceptual #1
y Modelo conceptual #2 respectivamente.
40
Fig. 14: Modelo conceptual #1.
En este paso se analizan las fuentes de datos OLTP con el fin de determinar
cmo sern calculados los indicadores, las respectivas correspondencias que
existen entre el modelo conceptual y las fuentes de datos, seguidamente se
definir la perspectiva con los respectivos campos de anlisis establecidos
41
en el paso anterior. Finalmente, se realizar el modelo conceptual ampliado
con la informacin obtenida en este paso.
a) Conformar indicadores
Modelo conceptual # 1:
42
Aclaracin: el indicador Total socios tipoB representa el nmero
total de socios que tienen la calificacin B = Riesgo potencial digno
de mencin cuando se realiza un prstamo.
Total socios tipo C
Hechos: Socios tipoC.
Funcin de sumarizacin: COUNT.
Monto ms solicitado
Hechos: capital prstamo.
Funcin de sumarizacin: AVG.
Plazo ms solicitado
Hechos: plazo prstamo.
Funcin de sumarizacin: AVG.
Modelo conceptual # 2:
43
Aclaracin: el indicador Total cartera vigente representa el saldo o
monto total pendiente que el socio tiene que pagar por el prstamo
realizado, este no incluye el inters.
Total cartera vencida
Hechos: Capital vencido.
Funcin de sumarizacin: SUM.
Aclaracin: el indicador Total cartera vencida representa el monto
total del capital que no es pagado en el plazo o fecha establecida.
Total cartera no devengada
Hechos: Capital no devengado.
Funcin de sumarizacin: SUM.
Aclaracin: el indicador Total cartera no devengada representa el
monto total del capital que ya no genera inters por estar en trmites
judiciales.
b) Establecer correspondencias
La idea es, que todos los elementos del modelo conceptual estn
correspondidos en los OLTP.
44
Fig. 16: Mapeo modelo conceptual #1 con el modelo relacional del OLTP.
45
Fig. 17: Mapeo modelo conceptual #2 con el modelo relacional del OLTP.
46
c) Nivel de granularidad
MODELO CONCEPTUAL #1
Con respecto a la perspectiva Sector geogrfico, los campos
revisados son:
CPROVINCIA: Es una clave fornea de la tabla
TPERSONADIRECCIONES, la misma que representa a una de
las claves primarias en la tabla TPROVINCIAS.
CCUIDAD: Es una clave fornea de la tabla
TPERSONADIRECCIONES, la misma que representa a una de
las claves primarias en la tabla TCIUDADES.
CBARRIO: Es una clave fornea de la tabla
TPERSONADIRECCIONES, la misma que representa a una de
las claves primarias en la tabla TBARRIOS.
En la perspectiva Rango de edad, los campos analizados son:
FNACIMIENTO: Representa la fecha de nacimientos de una
persona natural la misma que est en la tabla
TNATURALINFORMACIONBASICA.
De tal forma en la perspectiva Estado civil, los campos revisados
son:
CESTADOCIVIL: Es una clave fornea de la tabla
TNATURALINFORMACIONBASICA, la misma que
47
representa a una de la claves primarias de la tabla
TESTADOSCIVILES.
Con respecto a la perspectiva Rango de Fechas, la cual determina
la granularidad de los datos del DW; segn una consulta realizada de
forma directa al Ing. Javier Garca, Director de asesores y analistas de
crdito los campos que requieren para filtrar los datos son:
MES.
TRIMESTRE.
AO.
MODELO CONCEPTUAL #2
De la perspectiva lnea, el campo revisado es:
DESCRIPCION: Es un campo que representa la descripcin del
producto o lnea de crdito, el mismo que pertenece a la tabla
TPRODUCTO.
De tal forma en la perspectiva Garanta, el campo revisado es:
48
DESCRIPCION: Este representa la descripcin del tipo de
garanta al momento de realizar un prstamo, el mismo que
pertenece a la tabla TTIPOSGARANTIA.
Con respecto a la perspectiva Rango de Fechas, la cual determina
la granularidad de los datos del DW; segn una consulta realizada de
forma directa al Ing. Javier Garca, Director de asesores y analistas de
crdito los campos que requieren para filtrar los datos son:
MES.
TRIMESTRE.
AO.
Perspectiva Lnea:
DESCRIPCION.
Perspectiva Garanta:
DESCRIPCION.
Perspectiva Rango de Fechas:
MES.
TRIMESTRE.
AO.
49
Fig. 18: Modelo conceptual ampliado #1.
50
4.5.3. PASO 3: MODELO LGICO DEL DATA WAREHOUSE
En este punto de proceder con la creacin de la estructura del DW,
teniendo como base el modelo conceptual que ya se cre en el paso anterior.
Para ello, primero se definir el tipo de modelo o esquema que se utilizar y
luego se llevarn a cabo las acciones propias al caso, para disear las tablas
de dimensiones y de hechos. Finalmente, se realizarn las uniones
pertinentes entre estas tablas.
b) Tablas de dimensiones
A continuacin, se disearan las tablas de dimensiones de los dos
modelos conceptuales obtenidos.
51
TABLA DE DIMENSIONES DEL MODELO
CONCEPTUAL # 1
52
Tabla de dimensin ESTADO_CIVIL a partir de la perspectiva
Estado civil:
La tabla de dimensin tendr el nombre de ESTADO_CIVIL.
Se agregar una clave primaria con el nombre idEstadoCivil, el campo
de la perspectiva correspondiente cambiado de nombre y un campo
Fecha_carga, tal como muestra la Fig. 22.
53
TABLA DE DIMENSIONES DEL MODELO
CONCEPTUAL # 2
54
Tabla de dimensin FECHA a partir de la perspectiva Rango de
fechas:
La tabla de dimensin tendr el nombre de FECHA.
Se agregar una clave primaria con el nombre idFecha, los tres campos
de la perspectiva correspondiente, como se muestra en la Fig. 26.
c) Tablas de hechos
A continuacin, se confeccionar las tablas de hechos:
TABLA DE HECHOS DEL MODELO
CONCEPTUAL #1
Se crearn 4 tablas de hechos con sus respectivos indicadores esto
aprovechando la ventaja del esquema constelacin, el cual permite
crear varias tablas de hechos, que comparten las dimensiones
necesarias para el anlisis, esta son las siguientes:
La primera tabla de hechos tendr el nombre de H_CREDITO, su
clave principal ser la combinacin de las claves principales de
las tablas de dimensiones antes determinadas: idSector,
idEdad, idEstadoCivil e idFecha.
55
Fig. 27: Tabla de hechos "H_CREDITO".
56
El indicador ser total_soc_tipo_B; en la Fig. 29 se puede
apreciar con ms detalle lo manifestado:
57
Se crearn tres hechos, los mismos que corresponden a los tres
indicadores y tendrn los siguientes nombres: total_cart_vigente,
total_cart_vencida y total_cart_devengada.
En la Fig. 31 se puede apreciar mejor este paso:
58
a) Uniones
Aqu se tiene las tablas de hechos, enlazados con las diferentes tablas de
dimensiones obtenidas en el transcurso de la realizacin del proyecto. (Ver Fig.
32)
59
4.5.4. PASO 4: INTEGRACIN DE DATOS.
60
Para ello se ubica en:
Inicio-> Mi PC -> click derecho -> Propiedades -> Opciones avanzadas ->
Variables de entorno, en la Fig. 34 se puede de manera detallada estos
pasos.
61
Paso 2:
Nombre de la variable: PATH
Valor de la variable: despus de dar click en modificar, se aade al ltimo
;%JAVA_HOME%. En la Fig. 36 se puede apreciar con ms detalle lo
manifestado:
62
a) Carga Inicial
63
Carga dimensin GARANTIA_CREDITO: ejecuta los pasos
necesarios para la carga de datos en la dimensin
DIM_GARANTIA_CREDITO.
Carga tabla de hechos CREDITO: ejecuta el contenedor de pasos
que cargar la tabla de hechos H_CREDITO.
Carga tabla de hechos SOCIO_TIPO_A: ejecuta el contenedor de
pasos que cargar de datos a la tabla de hechos H_SOCIO_TIPO_A.
Carga tabla de hechos SOCIO_TIPO_B: ejecuta el contenedor de
pasos que cargar de datos la tabla de hechos H_SOCIO_TIPO_B.
Carga tabla de hechos SOCIO_TIPO_C: ejecuta el contenedor de
pasos que poblar de datos la tabla de hechos H_SOCIO_TIPO_C.
Carga tabla de hechos CARTERA_CREDITO: ejecuta el
contenedor de pasos necesarios que cargar de datos la tabla de
hechos H_CARTERA_CREDITO.
Success: indica la finalizacin con xito de la ejecucin de los pasos
necesarios para la carga de datos tanto en las dimensiones como en las
tablas de hechos.
64
Fig. 39: Carga dimensin SECTOR_GEOGRAFICO.
65
Fig. 40: SECTOR_GEOGRAFICO Obtener datos OLTP.
66
Carga dimensin ESTADO_CIVIL: Este paso incluye las tareas
mostradas en la Fig. 41:
67
Cargar ESTADO_CIVL: almacena en la tabla de dimensin
DIM_ESTADO_CIVL los datos obtenidos mediante el SQL
presentado anteriormente.
68
Fig. 44: RANGO_EDAD Obtener datos OLTP.
69
Carga dimensin LINEA_CREDITO: este tem incluye las tareas
que se muestran en la Fig. 45:
70
Carga dimensin GARANTIA_CREDITO: este tem incluye
tareas que se muestran en la Fig. 47:
71
Carga tabla de hechos CREDITO: Este paso incluye las tareas
mostradas en la Fig. 49:
72
Cargar Hecho CREDITO: almacena en la tabla de hechos
CREDITO los datos obtenidos mediante el cdigo SQL presentado
anteriormente.
A continuacin, se tiene la Fig. 52 con el cdigo SQL que cubre este tem:
73
Cargar Hecho SOCIO TIPO_A: almacena en la tabla de hechos
H_SOCIO_TIPO_A los datos obtenidos mediante el cdigo SQL
presentado anteriormente.
74
Cargar Hecho SOCIO_TIPO_B: almacena en la tabla de hechos
H_SOCIO_TIPO_B los datos obtenidos mediante el cdigo SQL
presentado anteriormente.
Seguidamente, se tiene la Fig. 56 con el cdigo SQL que cubre este tem:
75
Cargar Hecho SOCIO_TIPO_C: almacena en la tabla de hechos
H_SOCIO_TIPO_C los datos obtenidos mediante el cdigo SQL
presentado anteriormente.
76
Para la carga de la dimensin FECHA se cre un procedimiento
almacenado en la base de datos PostgreSQL en el cual est el DW, a
continuacin en la Fig. 59 se tiene el cdigo establecido para cubrir esta
tarea:
b) Actualizacin
El DW se actualizar cada fin de mes, para ello todas las tablas sern
recargadas, previo a este proceso, se realizar un respaldo de los datos
anteriores; para el proceso de actualizacin se utilizar la estructura de
carga inicial, en donde se editar el rango de fechas en los respectivos
cdigos SQL, esta edicin permitir obtener los datos de anlisis
requeridos por parte de los usuarios del rea de cartera crediticia de la
Cooperativa de Ahorro y Crdito Mushuc Runa.
77
4.6. Creacin de Cubos Multidimensionales.
Para cubrir este propsito se utilizar la herramienta Schema Workbench de Pentaho,
la misma que dejo descontinuada al Cube Designer, debido a que esta es ms flexible
y completa.
A continuacin los pasos para cumplir con este objetivo:
Lo primero que se realiz es establecer la respectiva conexin al DW, tal como se
muestra la Fig. 60.
78
Luego se hace click derecho en Schema y se selecciona la opcin de Add
Dimension, se aadir la dimensin el cual tiene sus atributos que quedan
configurados tal como se muestra en la Fig. 62:
79
Seguidamente se configura la jerarqua, esta tiene dos atributos importantes que son:
name en la cual se debe asignar un nombre que represente a la dimensin, en este
caso se coloc dim_sector_geografico, el primary key que se refiere a la clave
primaria de la dim_sector_geografico, en la Fig. 64 se puede apreciar de forma
detallada lo manifestado:
80
Con estos pasos se ir aadiendo las dimensiones necesarias para cubrir el desarrollo
del archivo .XML.
El esquema y el cubo quedar marcado con rojo, esto es porque falta definir algunos
componentes, como la tabla de hechos con la que se relaciona el cubo, las
dimensiones, los indicadores que usa el cubo y entre otros atributos que se
configuran a continuacin:
Hacer click derecho en el cubo creado y se selecciona Add Table, se configura sus
respectivos atributos, tal como se muestra en la Fig. 67:
81
Seguidamente hacer click derecho en el cubo para aadir las dimensiones que usa el
cubo seleccionando la opcin Add Dimension Usage, luego se configura sus
atributos como el name que se refiere a un nombre que identifique la dimensin en
cuestin, el foreing key que es la clave fornea de la dimensin que esta en la tabla
de hechos aadida en el paso anterior llamada h_credito y el source que se refiere a
la dimensin a usar que en este caso el Dim_Sector_Geografico configurada
anteriormente este tem queda configurado tal como se muestra en la Fig. 68:
El ltimo paso es configurar los measures, medidas o indicadores del cubo que estn
en la tabla de hechos respectivamente, para ello hacer click en el cubo Credito y se
escoge la opcin de Add Measure y se configuran sus atributos como el name en el
cual va el nombre que mejor represente al indicador, aggregator que se refiere a las
funcin de sumarizacin de grupos (SUM, COUNT, MIN, MAX, AVG,
DISTINCTCOUNT) en este caso se selecciona SUM porque el indicador que se
quiere analizar represente el monto total de mora; column aqu se selecciona el
campo que representa al indicador en la tabla de hechos en este caso
monto_total_mora y en data type el tipo de dato correspondiente al campo en este
caso Numeric, en la Fig. 69 se puede apreciar de forma detallada lo manifestado:
82
Fig. 69: Configuracin del indicador de la tabla de hechos que se relaciona con el cubo.
Con estos pasos se procedi a obtener el esquema final que se muestra en la Fig. 70:
83
El ltimo paso es publicar el schema de los cubos multidimensionales en el servidor
PBA de la siguiente forma:
En la pantalla de SW hacer click en File Publish lo cual abre la ventana llamada
Publish Schema en esta hay que configurar los parmetros de publicacin, estos
parmetros son los siguientes:
Server URL: en esta opcin se tiene que configurar la direccin electrnica donde
est alojado nuestro servidor BI, en te caso digitamos http://localhost:8080/pentaho/.
User y Password, se configura el nombre de usuario y la contrasea del servidor BI
que tiene permisos para publicar; finalmente en Pentaho or JNDI Data Source: se
coloca el nombre que tiene la conexin con el DW en nuestro Pentaho BI-Server, tal
como se muestra en la Fig. 71.
Una vez llenos estos datos, hacer click en el botn Publish el cual permitir publicar
el esquema multidimensional, para su posterior utilizacin en el Pentaho BI Server,
si todos los datos son correctos aparecer el siguiente mensaje Publish Successful o
Publicacin exitosa, como se muestra en la Fig. 72.
84
Fig. 72: Publicacin exitosa del Esquema de Cubos Multidimensional.
85
Fig. 73: Iniciacin de la herramienta Pentaho BI Server.
86
A continuacin, digitar las credenciales de usuario y hacer click en el botn ingresar
como se muestra la Fig. 75:
87
cubos multidimensionales publicado en pasos anteriores, ya que si existiere algn
error no aparecera la ventana de la Fig. 77:
88
Fig. 78: Saiku Analytics - Anlisis de datos dimensionales Monto de mora por Sector Geogrfico.
Fig. 79: Saiku Analytics - Anlisis datos de dimensionales - Monto de mora por Rango de Edad.
89
c) Cunto es el monto de mora por estado civil?, con la Fig. 80 se responde a
esta pregunta.
Fig. 80: Jpivot - Anlisis de datos dimensionales - Monto de mora por Estado Civil.
Fig. 81: Saiku Analytics - Anlisis de datos dimensionales - Total de socios tipo A entre el 2010 al 2013.
90
Fig. 82: Saiku Analytics - Anlisis de datos dimensionales - Total de socios tipo B entre el 2010
al 2013.
Fig. 83: Saiku Analytics - Anlisis de datos dimensionales - Total de socios tipo C entre el 2010 al
2013.
91
e) En promedio, cunto es el monto ms solicitado por los socios en un
determinado tiempo?, con la Fig. 84 se responde a esta pregunta.
Fig. 84: Saiku Analytics - Anlisis de datos dimensionales - Promedio de monto ms solicitado entre
el 2010 al 2013.
Fuente: Elaborado por investigador.
Fig. 85: Saiku Analytics - Anlisis de datos dimensionales - Promedio de plazo ms solicitado
entre el 2010 al 2013.
Fuente: Elaborado por investigador.
92
g) En qu tipo de lnea (comercial, consumo y microcrdito) y garanta
(Quirografario, prendario, hipotecario, y ttulo a valores) se concentra la
cartera vigente, vencida y no devengada?, con las figuras Fig. 86 y Fig. 87
respectivamente, se puede dar respuesta a esta pregunta clave de negocio.
Fig. 86: Saiku Analytics - Anlisis de datos dimensionales - Cartera por lnea de crdito.
Fig. 87: Saiku Analytics - Anlisis de datos dimensionales - Cartera por garanta de crdito.
93
As mismo se utilizar la herramienta de Pentaho Report Designer (PRD), con el
propsito de crear reportes personalizados, tal como se muestra a continuacin:
94
Fig. 89: Seleccin de la plantilla para el reporte.
Fuente: Elaborado por investigador.
Luego aparece una ventana la cual permite seleccionar el mtodo de acceso al DW,
para esto hacer click en el botn y seleccionar JDBC, como muestra la Fig. 90:
conexin al DW, para esto se debe hacer click en el botn en el rea de Data
Source Connections ubicada en la parte superior izquierda, se mostrar la siguiente
ventana, en donde se debe configurar los parmetros de conexin al DW, tal como se
muestra en la Fig. 91:
95
Fig. 91: Conexin al DW desde PRD.
Fig. 92: Cdigo SQL para obtener los datos para el reporte.
Fuente: Elaborado por investigador.
96
Como se puede apreciar en el cdigo SQL se pretende realizar un reporte del total de
cartera no devengada por las diferentes lneas de crdito, filtrando por ao, para lo cual
se hace la sentencia SQL mostrada en la Fig. 93.
Fig. 94: Seleccin del SQL que contiene los datos a mostrar en el reporte.
Fuente: Elaborado por investigador.
97
Posteriormente en la siguiente ventana se debe elegir los campos a mostrar en el
reporte, como se muestra en la Fig. 95:
Fig. 96: Finalizacin del asistente con el formateo de los campos del reporte.
Fuente: Elaborado por investigador.
98
Al finalizar el asistente se mostrar la ventana que se muestra en la Fig. 97, la cual
permite disear y personalizar el reporte.
99
PRD se debe presionar la siguiente combinacin de teclas: Ctrl + Mays + P, esto
permitir visualizar una ventana en donde se configuran los parmetros de
publicacin al Servidor Pentaho BI, esto queda configurado tal como se muestra en
la Fig. 99:
100
CAPTULO 5
CONCLUSIONES Y RECOMENDACIONES
5.1. Conclusiones.
101
con diferentes herramientas de anlisis multidimensional, permiten convertir los
datos en informacin valiosa a travs del esquema de cubos multidimensionales y
Pentaho Report Designer, que permite generar reportes personalizados que
requieran los usuarios del rea de cartera crediticia de la Cooperativa de Ahorro y
Crdito Mushuc Runa.
5.2. Recomendaciones.
102
La actualizacin de las herramientas de anlisis de datos multidimensionales
como Jpivot y Saiku, es de mucha importancia ya que las nuevas versiones
siempre tendr alguna mejora, o algn modulo del cual pueda beneficiarse la
empresa.
103
Referencias:
104
[10] R. Bernabeu, HEFESTO DATA WAREHOUSING: Investigacin y
Sistematizacin de Conceptos, HEFESTO: Metodologa para la Construccin de un
Data Warehouse. [online]. Argentina: Crdoba 2010, Disponible en:
http://www.businessintelligence.info/docs/hefesto-v2.pdf
[11] Annimo, Datawarehouse [online]. 2012, Disponible en:
http://www.sinnexus.com/business_intelligence/datawarehouse.aspx
[12] R. Bernabeu, DATA WAREHOUSING & DATA WAREHOUSE in DATA
WAREHOUSING: Investigacin y Sistematizacin de Conceptos, Ed. Argentina:
Crdoba, 2010, pp. 9.
[13] P. Dip, OLAP y el diseo de cubos [online]. 2007, Disponible en:
http://www.gestiopolis.com/canales8/ger/olap-online-analytic-processing.htm
[14] P. Dip, Datos [online]. 2009, Disponible en:
http://latecnologiavirtual.blogspot.com/2009/08/datos.html
[15] J. Gil Flores, Anlisis de Datos Cualitativos. Aplicaciones a la Investigacin
Educativa, Barcelona, Edit. PPU, 1994, Cap. 1.
[16] Chiavenato, Introduccin a la Teora General de la Administracin, Sptima
Edicin, McGraw-Hill Interamericana, 2006, Pg. 110.
[17] Definicin de informacin [online]. Disponible en:
http://definicion.de/informacion/
[18] Annimo, Conocimiento [online]. 2014, Disponible en:
http://es.wikipedia.org/wiki/Conocimiento
[19] Annimo, Definicin de conocimiento [online]. 2009, Disponible en:
http://sobreconceptos.com/conocimiento
[20] Sinnexus, Business Intelligence Informtica Estratgica Datos, Informacin,
Conocimiento [online]. 2012, Disponible en:
http://www.sinnexus.com/business_intelligence/piramide_negocio.aspx
[21] Sinnexus, Definicin de sistema de soporte de decisin [online]. 2012,
Disponible en:
http://www.sinnexus.com/business_intelligence/sistemas_soporte_decisiones.aspx
[22] D. Gordon, M. Olson, Sistema de informacin gerencial, Segunda Edicin -
Primera en espaol, McGraw-Hill Latinoamericana, 1987, Pg. 380.
105
[23] Annimo, Definicin de cartera crediticia [online]. Disponible en:
http://www.sugef.fi.cr/servicios/documentos/normativa/plan/GRU-130.html
[24] Google Docs para Empresas [online]. Disponible en:
http://www.definicion.org/diccionario/5
[25] Annimo, Manual de cuentas para entidades financieras [online]. Disponible en:
http://servdmzw.asfi.gob.bo/circular/Manual/T03/130.pdf
[26] Manual de polticas de crdito, Mushuc Runa Cooperativa de Ahorro y Crdito,
Ambato Tungurahua, 2011.
[27] S. Ayala, Los crditos financieros [online]. 2005, Disponible en:
http://www.gestiopolis.com/canales5/fin/loscrefinan.htm
[28] L. Gomez, Ttulos valores [online]. 2012, Disponible en:
http://www.gerencie.com/titulos-valores.html
[29] M. Butler, 5+ Free Open Source BI Suites [online]. 2013, Disponible en:
http://butleranalytics.com
[30] PostgreSQL Una Alternativa de DBMS Open Source, Open World Consultores
Informticos Integrales. Soluciones Tecnolgicas al Servicio de la Nacin [online].
2005, Disponible en: http://www.lgs.com.ve/pres/PresentacionES_PSQL.pdf
106
ANEXOS
107
108
Anexo 2: Entrevista realizada mediante un cuestionario al director del departamento de
sistemas.
109
110
Anexo 3: Identificacin de indicadores y perspectivas de anlisis.
xxxxxxxx Indicadores.
xxxxxxxx Perspectivas.
Pregunta clave 1:
Cunto es el monto de mora por sector geogrfico?
Pregunta clave 2:
Cunto es el monto de mora por rango de edad?
Pregunta clave 3:
Cunto es el monto de mora por estado civil?
Pregunta clave 4:
Cuntos son los socios tipo A, B y C en un determinado tiempo?
Pregunta clave 5:
Cunto es el monto ms solicitado por los socios en un determinado tiempo?
Pregunta clave 6:
Cul es el plazo de pago ms solicitado por los socios a la hora de realizar prstamos?
Pregunta clave 7:
En qu tipo de lnea (comercial, consumo y microcrdito) y garanta (Quirografario,
prendario, hipotecario, y ttulo a valores) se concentra la cartera vigente, vencida y no
devengada?
111