Construção de Um Data Warehouse - TCC
Construção de Um Data Warehouse - TCC
Construção de Um Data Warehouse - TCC
COORDENAÇÃO DE INFORMÁTICA
CURSO DE TECNOLOGIA EM ANÁLISE E DESENVOLVIMENTO DE SISTEMAS
PONTA GROSSA
2011
EMANOÉLY FERNANDA GURA
LARISSA LOURENÇO NUNES BENCK
PONTA GROSSA
2011
TERMO DE APROVAÇÃO
por
_____________________________ __________________________________
Prof. Marcos Vinicius Fidelis
Prof. Msc. Simone de Almeida
Membro titular
Prof. Orientador
__________________________________
Prof. Dr. Saulo Jorge Beltrão de Queiroz
Membro titular
_____________________________
___________________________________
Prof. Msc. Helyane Bronoski Borges
Prof. Dr .André Koscianski
Responsável pelos Trabalhos
Coordenador do Curso
de Conclusão de Curso
UTFPR - Campus Ponta Grossa
AGRADECIMENTOS
Este Trabalho de Conclusão de Curso não seria possível sem a oportunidade nos
dada por Deus de ingressar na UTFPR, uma universidade de tamanho prestígio e conceito.
Agradecemos acima de tudo Àquele que tanto nos proporcionou durante esses três anos de
curso.
Um agradecimento especial à professora e amiga Simone de Almeida que tanto nos
auxiliou como alunas, quanto como orientandas, que, confiando em nós, instigou o tema do
trabalho, dando-nos força para que ele pudesse ser concluído. Também agradecemos sua
disponibilidade, compreensão e paciência durante o desenvolvimento do trabalho.
Agradecemos também, a todos os professores que nos incentivaram, apoiaram e
inspiraram no decorrer do curso.
Aos nossos amigos e colegas de universidade, em especial à Jessyca, que nos
incentivou a acordar cedo todos os dias para não perder sua carona.
Os agradecimentos específicos de Emanoély
Sinto-me grata a todos que me apoiaram e incentivaram, seja através de palavras
motivadoras ou com auxílios e companheirismo para a realização desse projeto. Agradeço, de
forma singular, aos meus pais Eutêmia e Estanislau, que não só me consolaram em momentos
de dificuldade, como foram meus maiores pilares de sustentação durante todo o curso e em
especial, durante a realização do Trabalho de Diplomação. Ao meu irmão Evandro, que devo
agradecimentos não só pelos conselhos e apoio a mim dispensado, mas por toda a ajuda
dedicada nos meus projetos do curso.
Agradeço a minha companheira de trabalho e de curso, Larissa, que se mostrou mais
que uma colega, se tornando uma amiga e irmã, que me aturou durante esses três anos, mas
principalmente nos últimos três meses. Agradeço pela sua dedicação e esforço e por me dar a
oportunidade de realizar o trabalho em conjunto.
Em especial, agradeço a todos os professores da coordenação de informática, que
além de aulas, lecionaram lições e conselhos. Em particular, ao meu chefe e professor,
Marcos Vinícius Fidelis, que me permitiu algumas fugidas do trabalho para poder finalizar o
trabalho de diplomação.
Também, de nada valeria tanta dedicação, se não pudesse comemorar todo o esforço
com os meus amigos que tanto me apoiaram e entenderam minha falta de tempo e paciência.
Agradeço especialmente a Ariane, que apesar das broncas, se tornou minha irmã para todo o
sempre; àquelas que não perdiam a “janta das meninas” lá em casa; àqueles que me puxavam
pro boliche pra descontar a raiva; àquele que aturou minha falta de paciência nos últimos dias;
aos meus amigos de Irati, que talvez ainda não entendam o motivo do meu sumiço e àqueles
que eu levarei pra sempre em minha história.
Os agradecimentos específicos de Larissa
Agradeço em especial todas as pessoas envolvidas com minha formação, desde apoio
motivacional, incentivador, esperançoso e financeiro dos meus pais e avós para realizar um
curso fora de minha cidade; principalmente nas minhas primeiras semanas do curso, na fase
de adaptação eles sempre estavam lá para me ajudar, não se esquecendo da minha grande
amiga Amanda que desde o terceiro ano consolidou-se nossa amizade e veio lapidando-se
nesses 3 anos de convivência; morando junto, estudando na mesma faculdade, respeitando os
limites de cada uma e por fim nos ajudando a morar longe dos pais. Não se esquecendo das
minhas irmãs Letícia e Luiza que sempre estavam contando-me piadinhas e dando risadas,
nos momentos mais ansiosos e difíceis do trabalho, fazendo-me relaxar, restaurar forças para
continuar.
Dentro da faculdade, não posso esquecer-me de dois grandes amigos que sempre me
apoiaram e estavam comigo para vários momentos, o Leonardo e a Emanoély, que acabou se
tornando uma nova grande amiga para conversas, risadas, boliches e estudos principalmente;
madrugadas estudando para provas e desenvolvendo projetos, e o mais engraçado era quando
estávamos com sono e confundíamos as palavras como escalabilidade com
“escanolabilidade”, agradeço muito por ter concedido essa oportunidade de ser sua amiga e
desenvolvermos nosso trabalho de diplomação juntas.
Agradeço todos os professores da Coordenação de Informática, em especial a
professora Simone Nasser que me incentivou no curso, e concedeu uma vaga ao grupo de
iniciação científica em que obtive muitas experiências.
"Nunca deixe que alguém te diga
que não pode fazer algo. Nem
mesmo eu. Se você tem um sonho,
tem que protegê-lo. As pessoas
que não podem fazer por si
mesmas, dirão que você não
consegue. Se quer alguma coisa,
vá e lute por ela. Ponto final."
(Chris Gardner)
RESUMO
In most business organizations, it is a fact the problem of lack of the correct interpretation of
information and difficulties of grouping them, for getting a new knowledge. To this solution
presents the literature data warehouse technology. This technology is a solution that looks for
a flexible and efficient options to treat a huge volume of data and obtain information that help
in the decision-making process. Thus, this work presents process of constructing
an application that discovery the Data Warehouse technology. The data has been collected in
a the pharmacy located in the Ponta Grossa region, and standardized to facilitate the consult
and extraction of knowledge. For implementing the case study, it was used the Pentaho tool,
that supports the entire process of Data Warehouse and proved adequate in the case study. It
was showed the iReport tool, responsible for generating reports and the end of the study had
full integration with Pentaho, generating reports, according to requested. In addition, also the
difficulty and benefic discovered are listed with the development of the work.
BD Banco de Dados
BI Business Intelligence (Inteligência Empresarial)
DM Data Mart (Dados Departamentais)
DW Data Warehouse (Armazém de Dados)
ER Entidade e Relacionamento
ETL Extract, transformation e load (Extração, transformação e carga)
OLTP Processamento de Transações Online
OLAP Processamento Analítico Online
SQL Structure Query Language (Linguagem de Estruturação de Dados)
SUMÁRIO
1 INTRODUÇÃO ............................................................................................................. 15
1.1 OBJETIVOS ................................................................................................................. 15
1.1.1 Objetivo Geral ............................................................................................................ 16
1.1.2 Objetivos Específicos.................................................................................................. 16
1.2 PROBLEMA................................................................................................................. 16
1.3 ORGANIZAÇÃO DO TRABALHO ............................................................................. 17
2 DATA WAREHOUSE .................................................................................................... 18
2.1 DADOS, INFORMAÇÃO E CONHECIMENTO ......................................................... 18
2.2 DIFERENÇAS ENTRE GESTÃO DO CONHECIMENTO E da INFORMAÇÃO ....... 19
2.3 TOMADA DE DECISÃO NO SISTEMA DE INFORMAÇÃO .................................... 20
2.4 DEFINIÇÃO DE DATA WAREHOUSE ........................................................................ 21
2.5 CARACTERÍSTICAS DO DATA WAREHOUSE.......................................................... 23
2.5.1 Orientado a Assunto.................................................................................................... 23
2.5.2 Variação de Tempo ..................................................................................................... 23
2.5.3 Não Volátil ................................................................................................................. 24
2.5.4 Integração ................................................................................................................... 24
2.6 Modelagem dos dados ................................................................................................... 25
2.6.1 Modelagem Entidade-Relacionamento (ER)................................................................ 25
2.6.2 Modelagem Multidimensional..................................................................................... 27
2.7 METADADOS ............................................................................................................. 29
2.8 DATA MART ................................................................................................................. 30
2.9 GRANULARIDADE .................................................................................................... 30
2.10PROCESSO DE DATA WAREHOUSING ..................................................................... 31
2.11TIPOS DE IMPLEMENTAÇÕES ................................................................................. 32
3 FERRAMENTAS DE DATA WAREHOUSE ............................................................... 33
3.1 APRESENTAÇÃO ....................................................................................................... 33
3.2 MICROSOFT® SQL SERVER 2008 EXPRESS.............................................................. 34
3.2.1 Componentes .............................................................................................................. 35
3.2.2 Caso de Sucesso.......................................................................................................... 36
3.3 PENTAHO® ................................................................................................................. 37
3.3.1 Componentes .............................................................................................................. 37
3.3.2 Caso de Sucesso.......................................................................................................... 37
3.4 COMPARAÇÃO .......................................................................................................... 38
4 ESTUDO DE CASO ...................................................................................................... 40
4.1 DESCRIÇÃO ................................................................................................................ 40
4.2 PRÉ-PROCESSO.......................................................................................................... 41
4.3 PROJETO LÓGICO...................................................................................................... 42
4.4 FERRAMENTAS E SUAS CONFIGURAÇÕES .......................................................... 43
4.5 DESENVOLVIMENTO DO ESTUDO DE CASO ....................................................... 44
4.5.1 Atividade 1 - Criação da base de dados ....................................................................... 44
4.5.2 Atividade 2 - Gerar XML do modelo multidimensional............................................... 44
4.5.3 Atividade 3 - Extrair, transformar e carregar a base de dados ...................................... 49
4.6 POTENCIAL DE EXPANSÃO..................................................................................... 56
5 IREPORT ...................................................................................................................... 58
5.1 IREPORT E PENTAHO ............................................................................................... 58
5.2 DEFINIÇÕES ............................................................................................................... 59
5.2.1 JasperReports ............................................................................................................. 59
5.2.2 JDK ............................................................................................................................ 60
5.2.3 iReport ........................................................................................................................ 60
5.2.4 Jar .............................................................................................................................. 60
5.3 REQUISITOS PARA DESENVOLVIMENTO ............................................................. 61
5.4 O AMBIENTE IREPORT ............................................................................................. 61
5.4.1 Criando o Template..................................................................................................... 61
5.4.2 Conhecendo os componentes ...................................................................................... 64
5.4.3 A Aba Tools................................................................................................................ 66
5.4.4 Palheta de Componentes ............................................................................................. 66
5.4.5 Modelando o Relatório................................................................................................ 67
5.5 IMPLEMENTAÇÃO DO ESTUDO DE CASO ............................................................ 71
6 CONCLUSÃO ............................................................................................................... 76
7 TRABALHOS FUTUROS ............................................................................................ 78
REFERÊNCIAS ................................................................................................................. 79
APÊNDICE A - INSTALAÇÃO E CONFIGURAÇÃO DO IREPORT........................... 82
ANEXO B – DECLARAÇÃO DE CIENCIA.................................................................... 89
15
1 INTRODUÇÃO
1.1 OBJETIVOS
1.2 PROBLEMA
toda a sua essencialidade e diferenciação no mundo dos negócios. Dessa forma, este trabalho
pretende utilizar a tecnologia de Data Warehouse associada à ferramenta iReport para apoiar
a tomada de decisão.
2 DATA WAREHOUSE
Muitos se perguntam por que está havendo esse súbito interesse em conhecimento. E
duas afirmações colocam discussão ao tema. Primeira: não é um súbito interesse, uma vez que
a busca pelo conhecimento vem crescendo consideravelmente, mas hoje o apelo é digital e
aguçado em tecnologia; e a segunda é sustentada por Davenport & Prusak (1998, p.15):
“Numa economia global, o conhecimento pode ser a maior vantagem competitiva da
empresa”.
Pode-se, logicamente, atribuir essa busca acelerada por conhecimento às tecnologias,
que dão uma falsa visão de que aqueles que a dispõem sofisticadamente obtêm a melhor
informação. A tecnologia ajuda a juntar valores e transformar dados em informação, o que
não significa que um montante de dados armazenado será útil. É necessário que eles sejam
transformados em informação e esta em conhecimento. Percebe-se então que dados diferem
de informação, assim como informação difere-se de conhecimento.
Na definição de Davenport & Prusak (1998, p. 02), “Dados são um conjunto de fatos
distintos e objetivos, relativos a eventos. Num contexto organizacional, dados são
utilitariamente descritos como registros estruturados de transações.”
Analisando assim, percebe-se que apesar do gigantesco número de dados
armazenados nas organizações, eles não passam de espaço ocupado se não forem integrados
em um determinado conceito. Davenport & Prusak (1998, p. 03 apud Drucker) caracterizam
19
os dados como sendo dotados de relevância e propósito, o que dá uma dimensão de sua
importância se trabalhados da maneira correta. Como citam Davenport & Prusak (1998,
p.03), somente dados não fornecem sustentações para julgamentos, interpretações ou bases
para a tomada de decisão e ainda complementam afirmando que “Embora a matéria-prima do
processo decisório possa incluir dados, eles não podem dizer o que fazer”. Ou seja, os dados
são a base, a matéria-prima para a criação de informação, influenciando no julgamento e no
comportamento do usuário.
Trabalha-se com os conceitos de dados, informação e conhecimento em escala de
grau, isto é, dados são transformados em informação e a informação gera o conhecimento. O
conhecimento não é puro nem simples; é uma mistura de vários elementos. Sendo assim ele é
mais próximo da ação do que os dados ou a informação, considerando que deve ser avaliado
no momento da tomada de decisão.
1
Explícito, do latim explicitus, quando o conhecimento está declarado, mostrado, explicado, através de papeis, disquetes, cd-
rom.
2
Tácito, do latim tacitus, quando o conhecimento não pode ser exteriorizado por palavras; como: reuniões, eventos,
construção individual de conhecimento, valores, crenças e comportamento organizacional.
21
trabalha com esse tipo de base de dados, são os desenvolvedores do projeto, sejam eles
analistas ou programadores. Os bancos de dados analíticos registram a história da
organização, dando suporte aos administradores e gerentes no momento de tomada de decisão
e sendo pouco utilizados. Pode-se observar no Quadro 1, uma comparação entre esses bancos
de dados.
Os dados carregados no DW não podem mais ser alterados. Isso significa que o
DW tem duas operações: a carga dos dados e o acesso a esses dados (consultas), portanto
nada é alterado como em um Banco de Dados Transacional (onde são realizadas inclusões,
exclusões, alterações e consultas diárias).
2.5.4 Integração
Entidade
Objeto que existe no mundo real, definido como: pessoa, lugar ou evento de interesse,
classificadas por propriedades e características.
26
Relacionamentos
Relacionamento é traduzido por linhas entre as entidades em um ER, que representa
uma ação entre as mesmas, por meio de um verbo.
Atributos
Descrevem as características de uma entidade como, por exemplo, nome, cor,
tamanho, estado, altura.
Cardinalidade
Indica quantas ocorrências de uma Entidade participam do relacionamento, sendo que
o primeiro número representa a obrigatoriedade da ocorrência do elemento no
relacionamento podendo ser 0 para não obrigatório e 1 para obrigatório, e o segundo
número indica o número ocorrências da entidade, podendo ser 1 para exatamente uma
ocorrência e n para indefinido número de elementos.
Figura 3 - Herança
Fonte: Autoria Própria.
27
Figura 4 - Agregação
Fonte: Autoria Própria.
Fatos
Coleção de itens de dados composta de medidas. Implementado em tabelas
denominadas tabelas de fato (fact table) e representado por um valor aditivo, valores
numéricos denominados métricas ou medidas. Um fato é evolutivo e muda de acordo
com o tempo, e possui três características, segundo Machado(2004): varia ao longo do
tempo, possui valores numéricos de avaliação, seu histórico pode ser mantido e cresce
com o passar do tempo.
28
Dimensões
Para se obter as dimensões dos fatos, tem-se quatro elementos participantes: quando
foi realizada, onde foi realizada, quem realizou e o que foi. Obtendo essas respostas
realiza-se a análise dimensional. As dimensões podem ser compostas por membros
que podem conter hierarquias. Membros são as possíveis divisões ou classificações de
uma dimensão. Por exemplo, a dimensão tempo, pode ser dividida nos seguintes
membros: ano, trimestre e mês, e a dimensão localização em: cidade, estado e país;
Medidas
São os atributos numéricos que representam um fato, ou seja, representam o
desempenho de um indicador de negócios relativo às dimensões que participam desse
fato. Uma medida é determinada pela combinação das dimensões que participam de
um fato e estão localizados como atributos de um fato. Por exemplo, o valor em reais
das vendas, o número vendido de unidades de produtos e a quantidade em estoque.
Kimball (1998) aponta um conjunto de nove pontos fundamentais no projeto da
estrutura de um DW. São os chamados pontos de decisão, que constituem definições a serem
feitas e correspondem, de fato, a etapas de um projeto:
2.7 METADADOS
Metadados são considerados dados sobre dados, isto é, os dados sobre os sistemas
que operam com estes dados. Um repositório de metadados é uma ferramenta essencial para o
gerenciamento de um Data Warehouse no momento de converter dados em informações para
o negócio. Um repositório de metadados bem construído deve conter informações como a
origem dos dados, regras de transformação, nomes e apelidos e formatos de dados. Esse
dicionário deve conter informações que adicionem valor aos dados.
Pode-se considerá-los como índice do conteúdo de um DW. Através dos metadados o
usuário final compreende e analisa os dados, não sendo necessária uma busca baseada em
tentativas (SANTOS, 2003).
Barquin (1997) classificou as vantagens dos metadados como a redução da
possibilidade de erros, redução de complexidade, uma melhor captura do ambiente de dados
30
Data Mart (DM) é um subconjunto de DW, que contém dados para um setor
específico da empresa. Um DW é composto por DMs. Conforme Machado (2004), a principal
vantagem do seu emprego é o retorno rápido de informações, o que garante maior
comprometimento do usuário final, com a possibilidade de avaliar os benefícios extraídos de
seu investimento. É modelado em um esquema Estrela de acordo com as necessidades do
usuário final.
2.9 GRANULARIDADE
3.1 APRESENTAÇÃO
E para gerir todo esse sistema faz-se necessário a busca de ferramentas adequadas
para aplicação de DW, isto é, um conjunto de tecnologias que ofereçam suporte ao ambiente
de informação. Sabe-se que há no mercado atualmente, uma grande quantidade de
ferramentas que tem por papel o Business Intelligence e que a falta de conhecimento de
padronização estrutural e operacional dificulta a comparação.
A partir dessa informação e após um rápido estudo sobre as melhores ferramentas do
mercado, foram escolhidas duas ferramentas para serem analisadas e, posteriormente, uma
delas utilizada no desenvolvimento do estudo de caso. Serão apresentadas as ferramentas
Microsoft® SQL Server 2008 Express e Pentaho®.
Além dos testes realizados com as ferramentas, a análise do melhor programa para
ser utilizado no estudo de caso foi baseada nas doze (12) regras para avaliar uma ferramenta
OLAP, apresentadas por Rodrigues (2010, p.05 apud Codd e Salley,1993, p.12) – que podem
ser observadas no quadro 3.
34
CARACTERÍSTICA DESCRIÇÃO
Suportar modelo de visualização multidimensional,
Visão Conceitual Multidimensional possibilitar a manipulação dos dados por
administradores de forma fácil e intuitiva.
Ser transparente ao usuário e ter suporte a padrões
Transparência abertos de documentos para que o usuário possa
incorporar os dados onde ele precise.
Fazer análises com base em vários tipos de SGBD,
Interoperabilidade relacionais ou não relacionais, além de SGBDs
legados.
Prover recursos para rever as estratégias de
Desempenho Consistente de Relatórios
obtenção de dados para melhorar a performance.
Capacidade de funcionar em um ambiente
Arquitetura Cliente/Servidor
cliente/servidor.
Ajustar de acordo com a distribuição dos dados de
Manipulação dinâmica de dados esparsos forma a oferecer a máxima eficiência no
gerenciamento da memória.
Cada dimensão deve ser equivalente em estrutura
Dimensionalidade genérica
básica e recursos adicionais.
Capacidade de vários usuários trabalharem ao
Suporte multiusuário
mesmo tempo com a mesma análise.
Capacidade de refazer todos os cálculos de
Operações de dimensões cruzadas irrestritas fórmulas associadas sem que o usuário tenha que
redefinir explicitamente os cálculos.
A navegação entre as várias dimensões deve ser
feita através de ações diretas sobre os dados da
Manipulação intuitiva de dados
análise, sem exigir o uso de menus ou múltiplas
interações do usuário.
A disposição das colunas e a ordenação das linhas
Relatórios flexíveis do relatório devem ser livres de forma a facilitar a
comparação dos dados.
Gravar pelo menos 15 dimensões e preferivelmente
Níveis de dimensões e agregações ilimitados
20 dimensões.
Quadro 3 - Doze Regras do Ambiente OLAP
Fonte: Adaptado de Rodrigues (2010).
O Microsoft® SQL Server 2008 Express é uma edição gratuita do SQL Server, ideal
para o aprendizado, o desenvolvimento e a potencialização de aplicações pequenas de estação
de trabalho, web e servidor.
A ferramenta possui suporte a store procedure, trigger, function e view e armazena
todos os tipos de dados com suporte nativo a dados relacionais, XML, FILESTREAM e
espaciais. Além de ser vantajoso por apresentar um grande desempenho, usabilidade,
visualização e integração ao Microsoft 2007 Office System no SQL Server Reporting Services.
Possibilita a simplificação do desenvolvimento, potencializando as habilidades existentes em
T-SQL, ADO.NET Entity Framework e LINQ e é integrado ao Visual Studio e ao Visual Web
Developer.
35
3.2.1 Componentes
3
Manual disponível no sítio eletrônico < http://msdn.microsoft.com/pt-br/library/bb522607.aspx > .
36
Empresa
Trip Linhas Aéreas®
Situação
A Trip Linhas Aéreas® cresceu muito rapidamente e com o crescimento veio
também a necessidade de mudar o fornecedor de aviação para um que oferecesse solução de
aviação internacional além da nacional já existente.
Solução
Uma das soluções foi a utilização do SQL Server 2008 R2 em que a persistência dos
dados é viabilizada pelo Entity Framework, que proporcionou um grande ganho de
produtividade.
Todas as funcionalidades dos sistemas possuem testes automatizados de unidade e
funcionais, criados através do Visual Studio 2010 e executados nas compilações diárias
automatizadas. Foram desenvolvidos relatórios adicionais com o Reporting Services que
possibilitou uma visão mais personalizada das informações do processo, junto ao Team
Foundation. O Team Explorer foi utilizado em conjunto com a versão 2010 de Excel e
Project, para facilitar a visualização e planejamento dos itens de trabalho cadastrados. O
padrão de codificação e nível de qualidade são garantidos pela utilização do Code Analisys e
StyleCop de forma integrada aos check-ins.
Benefícios
Hoje a Trip Linhas Aéreas® em conjunto com o novo fornecedor de aviação
internacional e as novas soluções do portal, poderá aumentar a oferta de serviços para o
usuário final e está em igualdade competitiva com as maiores companhias de aviação
mundiais e, além disso, já chega com diferenciais em termos de facilidades de uso e
37
flexibilidade de escolha de vôos e de poltronas no novo portal, que ficou ainda mais fácil de
usar e com ótimo desempenho, reduzindo o tempo necessário para realizar as operações de
reservas ou compra de passagens.
3.3 PENTAHO®
3.3.1 Componentes
Empresa:
Dia % Brasil®
Visão geral de implantação:
A empresa buscava o desenvolvimento gratuito de um portal comercial de Business
Intelligence. Além disso, necessitava de um DW, para obter informações da matriz na
4
Manual disponível o sítio eletrônico <http://www.pentaho.com.br>.
38
3.4 COMPARAÇÃO
Baseada nas pesquisas de seleção das ferramentas, que mostrou suas funcionalidades,
componentes e recursos adicionais, encontrou-se um leque para comparações e escolha da
melhor ferramenta.
A arquitetura da suíte da Pentaho® é voltada pra web e construída em Java, sendo
isso um de seus principais diferenciais. Já a Microsoft® SQL Server 2008 Express é ideal para
desktop.
A Microsoft® SQL Server 2008 Express tem um maior suporte e conta com
atualizações frequentes, diferente do Pentaho que no lugar do suporte, possui fóruns e
comunidade da ferramenta.
Além disso, a Microsoft® SQL Server 2008 Express por estar estabilizada no
mercado e anos de atuação em empresas, tem maior credibilidade do que outras ferramentas
novas, como a Pentaho. No entanto, para o estudo de caso escolhido, será utilizada a
ferramenta Pentaho, tanto pelas vantagens já indicadas como pela valorização de uma
ferramenta nova no mercado e open source.
40
4 ESTUDO DE CASO
4.1 DESCRIÇÃO
4.2 PRÉ-PROCESSO
Para dar início ao projeto lógico foi realizada uma análise minuciosa do Modelo de
Entidade e Relacionamento do banco da empresa, conforme Anexo A, juntamente com as
questões citadas na seção 4.1 para definir assim, o Modelo Multidimensional ilustrado na
Figura 10. Foram definidas as seguintes dimensões: Cliente, Médico, Especialidade,
Componente, Produto, Venda e Tempo. E o fato foi definido como: Venda.
Foi escolhido o processo de modelagem departamental, ou seja, um Data Mart,
focando assim em um único problema da empresa. Diante das pesquisas, concluiu-se que o
departamento propício seria vendas, com foco no faturamento.
43
Figura 12 - Configuração do BD
Fonte: Autoria Própria.
juntamente com a carga dos dados na dimensão cliente. E a Figura 20, mostra a mensagem de
sucesso da carga.
para a carga da dimensão médico. O primeiro passo é selecionar da tabela de origem aqueles
campos que serão utilizados na tabela destino; no caso apresentado é o código do médico para
ser utilizado como o campo identificador e auto-incremento, o nome do médico, seu número
de registro e também seu código de especialidade. No Quadro 5 abaixo observa-se a
explicação de cada cláusula SQL utilizada.
SQL EXPLICAÇÃO
Na dimensão venda foi necessário acrescentar o mergejoin para unir duas tabelas
sendo elas: venda e itens_vendas. Nesse processo também foram ordenados os dados antes de
realizar o processo de carga, podendo ser visualizado na Figura 22.
53
correção da ferramenta aliando o próprio usuário que está dia a dia lidando com o software e
sabe a real dificuldade encontrada.
Portanto a Pentaho juntamente com iReport, trazem consigo um novo conceito,
representando a força da utilização de um Software Livre, deixando de lado um pouco crenças
e rigidez e sim descobrindo a flexibilidade e poder de expansão e modificação desse novo
modo de “pensar”.
58
5 IREPORT
5.2 DEFINIÇÕES
5.2.1 JasperReports
arquivo XML é compilado num arquivo com extensão .jasper, que é um formato binário, um
meio mais rápido que o XML para a execução dos relatórios. O arquivo .jasper contem um
arcabouço do relatório, porém destituído de dados. O arquivo código fonte em XML do
JasperReports é o .jrxml.
A biblioteca permite a visualização dos relatórios em tela ou em arquivo .PDF, que
junto com a facilidade de uso e sem qualquer custo das ferramentas, faz do JasperReports
uma biblioteca de geração de relatórios completa.
5.2.2 JDK
5.2.3 iReport
5.2.4 Jar
Java Archive (JAR) é um arquivo compactado usado para distribuir um conjunto de
classes Java. É usado para armazenar classes compiladas e metadados associados que podem
constituir um programa.
61
A tela de diálogo que aparece, seleciona a opção Report, escolhe-se Blank A4, como
mostra a Figura 29, e clica no botão Open this Template.
Após excluir as linhas que não serão utilizadas, a tela ficará como a Figura 33,
notando que as linhas que foram excluídas ficam desabilitadas na paleta Report Inspector.
Figura 34 - Palheta
Fonte: iReport.
As opções da aba Tools geralmente são utilizadas no Page Footer, como por
exemplo, o Current date e o Page X of Y, dependendo da necessidade do relatório.
Cada componente tem suas propriedades, como é o caso da data (Currente date), que
ao adicionar o campo escolhe-se o formato.
A opção Static text é utilizada para textos fixos, como títulos, cabeçalhos e rodapés.
Depois de adicionados os campos estáticos, criam-se os parâmetros. São eles os utilizados
para filtrar os dados do relatório e são aqueles na cláusula where da SQL. Adiciona-se
parâmetros na paleta Report Inspector, na opção Parameters, como mostra a Figura 36:
Quando se digita a SQL, existe um verificador que testa se a query está correta. Em
caso afirmativo, serão listados os fields, como mostrado na Figura 38. Caso ocorra algum
69
Figura 40 - Header
Fonte: Adaptado do iReport.
Figura 41 - Preview
Fonte: Adaptado do iReport.
Figura 42 - Relatório
Fonte: Adaptado do iReport.
71
Quando visualiza-se o relatório, é gerado o arquivo .jasper (no mesmo diretório onde
foi criado o relatório).
O primeiro relatório gerado, Figura 43, responde a primeira pergunta sobre qual é o
faturamento por médico nos anos de 2009, 2010, 2011.
O segundo relatório, representado pela Figura 44, demonstra o faturamento do cliente
nos anos de 2009, 2010, 2011.
O sexto relatório apresenta o total de faturamento nos anos de 2007, 2008, 2009,
2010 e 2011, indicado na Figura 48.
6 CONCLUSÃO
7 TRABALHOS FUTUROS
Para trabalhos futuros, pode ser mencionada a aplicação de Data Warehouse para
outros processos de negócio, já que o estudo desenvolvido neste trabalho foi relacionado
somente à venda. Além disso, pode-se utilizar outra ferramenta para desenvolvê-lo, o que
possibilita um trabalho de análise comparativa dos resultados obtidos entre as duas
ferramentas.
Sugere-se também realizar processo de mineração de dados, utilizando-se do recurso
de Data Mining, que procura buscar padrões em grandes quantidades de base de dados, como
é o caso da base histórica do Data Warehouse.
79
REFERÊNCIAS
BARQUIN, R.; EDELSTEIN, S. Planning and Designing the Data Warehouse. Prentice
Hall, 1997.
GRAY, P; WATSON, H. J. Decision Support in the Data Warehouse. New Jersey: Prentice
Hall, 1998.
KIMBALL, R. Data Warehouse Toolkit. Makron Books, Rio de Janeiro: Campus, 1998.
Após fazer o download do iReports 3.7.3, inicie a instalação. Será apresentada uma
tela como a mostrada na Figura 49.
Por ser a primeira vez que o iReport é executado, é necessário criar uma conexão
com o banco de dados, clicando no ícone Report Datasources, como mostra a Figura 56.
Será criada uma nova conexão, para isso clica-se no botão New, conforme a Figura
57 e será apresentada a seguinte tela, representada pelo Figura 58:
86
A tela inicial de conexões será apresentada. Caso não necessite de novas conexões,
poderá ser fechada.
88