Nothing Special   »   [go: up one dir, main page]

Chap 2 DATAWAREHOUSE

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 16

SYSTÈME D’INFORMATION

DECISIONNEL

Chapitre
02

3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 1
SOMMAIRE

1. Pourquoi un datawarehouse
2. Quel est le rôle d’un datawarehouse
3. Qu’est-ce qu’un datawarehouse
4. Les 4 caractéristiques d’un datawarehouse
5. Table de faits et tables de dimension

Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 2
POURQUOI UN DATAWAREHOUSE

Les décideurs des entreprises doivent pouvoir répondre à un certains nombres de questions
pour diriger leurs entreprises,
 Qui sont mes clients?
Pourquoi sont-ils mes clients?
Comment cibler ma clientèle?
Quel est l’évolution de tel produit?
Qui sont mes employés?
…

Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 3
POURQUOI UN DATAWAREHOUSE

Finance RH Facturation Fichiers

SOURCES DE DONNEES

CES SOURCES DE DONNEES SONT PEU ADAPTEES POUR UNE


ANALYSE DE PRISE A LA DECISION

Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 4
POURQUOI UN DATAWAREHOUSE

Les sources de données d’une entreprise proviennent essentiellement des bases de


production. Ces données sont éparpillées dans des systèmes multiples, pas
nécessairement compatibles entre eux. Ces bases sont conçues pour être efficaces
pour les fonctions sur lesquelles elles sont spécialistes. Elles sont donc peu structurées
pour l’analyse, avec souvent comme objectif principal de conserver l’information.
Comme bases de production elles sont focalisées sur les fonctions critiques de
l’entreprise, et doivent être en mesure de servir l’utilisateur avec un temps de réponse
rapide et structurées dans ce but.
Ces systèmes sont donc peu adaptés à la vision à long terme et donc à la prise de
décision. Le datawarehouse va avoir pour objectif d’agréger et de valoriser ces données
provenant de différentes sources. Il va permettre à l’utilisateur d’y accéder de manière
simple et ergonomique.

Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 5
QUEL EST LE RÔLE D’UN DATAWAREHOUSE
Définitions
Le Datawarehouse est une collection de données orientées sujet,
intégrées, non volatiles et historisées, organisées pour le support
d ’un processus d ’aide à la décision (Inmon, 94)
Le datawarehouse ou entrepôt de données est une base de
données utilisée pour collecter et stocker des informations
provenant d’autres bases de données dans le cadre de la prise de
décision.
Les bases de données opérationnelles (bases de données de la
production) sont collectées, transformées et chargées dans le
datawarehouse via l’outil ETL (Extract Transform Load ).

DATAWAREHOUSE

Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 6
QUEL EST LE RÔLE D’UN DATAWAREHOUSE
Définitions
Bien qu’un Infocentre peut être considéré comme un datawarehouse, il est l’ancêtre d’un
datawarehouse.
L’infocentre était une base de données utilisée pour des besoins décisionnels. Il contient
une copie de travail d’une partie de la base de production, mie à jour périodiquement.
L’infocentre était une première solution pour soulager le système de production des
requêtes complexes du décideur. Avec l’accroissement des besoins en matière de
décision, que ce soit en termes de quantité́ de données collectées ou en nombre
d’utilisateurs potentiels, l’infocentre se révéla bien insuffisant. Le Datawarehouse l’a
rapidement remplacé.
Un Datamart est un sous-ensemble logique d’un datawarehouse. Il est généralement
exploité en entreprise pour restituer des informations ciblées sur métier spécifique. Il
existe, par exemple, des datamart marketing ou commercial constitués de données
ciblées, organisées et regroupées.

Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 7
LES 4 CARACTÉRISTIQUES D’UN DATAWAREHOUSE

Un datawarehouse est une base de données organisée et structurée dans le cadre


décisionnel.
Elle n’est pas une copie des bases de production.
Un datawarehouse doit répondre aux quatre principes suivant selon, Bill Immon:

1. Orienté sujet
2. Intégré
3. Non volatile
4. Historisé

Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 8
LES 4 CARACTÉRISTIQUES D’UN DATAWAREHOUSE

1. Orienté sujet
Les bases de production sont, généralement, organisées par processus fonctionnels
(facturation, comptabilité, RH etc.). Au cœur du Datawarehouse, les données sont
organisées par thème. Les données propres à un thème, les ventes par exemple.

2. Intégré
Les données proviennent de plusieurs sources différentes. Avant d’être intégrées au sein
du datawarehouse elles doivent être mise en forme et unifiées afin d’en assurer la
cohérence. Cela nécessite une forte normalisation, de bénéficier d’un référentiel unique
et cohérent ainsi que de bonnes règles de gestion. Cette phase est très complexe et
représente une charge importante dans la mise en place d’un datawarehouse.

Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 9
LES 4 CARACTÉRISTIQUES D’UN DATAWAREHOUSE

3. Non volatile
Un datawarehouse veut conserver la traçabilité des informations et des décisions
prises. Les données ne sont ni modifiées ni supprimées. Une requête émise sur les
mêmes données à plusieurs mois d’intervalles doit donner le même résultat..

4. Historisé
Contrairement au système de production, les données ne sont jamais mises à jour.
Chaque nouvelle données est insérée. Un référentiel de temps doit être mis en place
afin de pouvoir identifier chaque donnée dans le temps.

Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 10
TABLE DE FAITS ET TABLE DIMENSION

La modélisation des bases de données relationnelles utilise les concepts d’entités et


de relations afin de construire des tables.
En BI, la modélisation d’un datawarehouse utilise les notions de table de faits et table
de dimension.

Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 11
TABLE DE FAITS ET TABLE DIMENSION

Table de faits
Une table de fait représente un sujet d’analyse (CA par client et par produit et par
période). C’est une table centrale du modèle dimensionnel. Elle est constituée de
plusieurs mesures, appelées aussi axes, relatives au sujet traité. Ces mesures sont
généralement numériques.
Mais rappelons que certaines tables de faits peuvent contenir aucun attribut et
représentent que des liaisons entre tables dimensionnelles.
Exemple de table de faits:
Table de faits de vente
idDate
idZone
idProduit
Montant
Quantite_vendue

Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 12
TABLE DE FAITS ET TABLE DIMENSION
Table de faits de vente
idDate
idZone AXES DE REPRESENTATION
idProduit
Montant
MESURES RELATIVES AU SUJET TRAITE
Quantite_vendue

 Une table de faits contient les clés associées aux dimensions. Il s’agit des clés
étrangères dans la table de faits;
 Une table de faits contient les valeurs numériques de ce qu’on désire mesurer;
En général une table de fait contient un petit nombre de colonnes;
Une table de fait contient plus d’enregistrements qu’une table de dimension;
Les informations dans une table de fait sont caractérisées par :
Elles sont numériques et sont utilisées pour faire des SUM, AVG…
Les données doivent être additives ou semi-additives;
Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 13
TABLE DE FAITS ET TABLE DIMENSION

Table de dimension
Une table dimension est une table qui contient les axes d’analyse (les dimensions) selon
lesquels on veut étudier des données observables (les faits) qui, soumises à une analyse
multidimensionnelle, donnent aux utilisateurs des renseignements nécessaires à la prise
de décision.
On appelle donc « dimension » un axe d’analyse. Il peut s’agir des clients ou des produits
d’une entreprise, d’une période de temps comme un exercice financier, des activités
menées au sein d’une société, etc.

Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 14
TABLE DE FAITS ET TABLE DIMENSION

Table de dimension
Une table de dimension est un critère suivant lequel on souhaite évaluer, quantifier,
qualifier un fait,
Exemple :
Quels sont les ventes par produits, par zone, par date?
1. Table de fait : Ventes
2. Tables de dimension : Produit, Zone, Date

Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 15
TABLE DE FAITS ET TABLE DIMENSION

Caractéristiques d’une table de dimension

 Une table de dimension contient le détail sur les faits;


 Une table de dimension contient les informations descriptives des valeurs numériques
de la table de faits;
 Une table de dimension contient un plus grand nombre de colonnes : Vu que les
données dans la table de dimensions sont normalisées;
 Une table de dimension contient en général beaucoup moins d’enregistrement qu’une
table de faits;
 Les attributs d’une table de dimension sont souvent utilisés comme « Lignes » et
« Colonne » dans un rapport ou résultat de requête. Par exemple, les attributs textuels
d’un rapport proviennent souvent d’une dimension

Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 16

Vous aimerez peut-être aussi