Chap 2 DATAWAREHOUSE
Chap 2 DATAWAREHOUSE
Chap 2 DATAWAREHOUSE
DECISIONNEL
Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 1
SOMMAIRE
1. Pourquoi un datawarehouse
2. Quel est le rôle d’un datawarehouse
3. Qu’est-ce qu’un datawarehouse
4. Les 4 caractéristiques d’un datawarehouse
5. Table de faits et tables de dimension
Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 2
POURQUOI UN DATAWAREHOUSE
Les décideurs des entreprises doivent pouvoir répondre à un certains nombres de questions
pour diriger leurs entreprises,
Qui sont mes clients?
Pourquoi sont-ils mes clients?
Comment cibler ma clientèle?
Quel est l’évolution de tel produit?
Qui sont mes employés?
…
Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 3
POURQUOI UN DATAWAREHOUSE
SOURCES DE DONNEES
Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 4
POURQUOI UN DATAWAREHOUSE
Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 5
QUEL EST LE RÔLE D’UN DATAWAREHOUSE
Définitions
Le Datawarehouse est une collection de données orientées sujet,
intégrées, non volatiles et historisées, organisées pour le support
d ’un processus d ’aide à la décision (Inmon, 94)
Le datawarehouse ou entrepôt de données est une base de
données utilisée pour collecter et stocker des informations
provenant d’autres bases de données dans le cadre de la prise de
décision.
Les bases de données opérationnelles (bases de données de la
production) sont collectées, transformées et chargées dans le
datawarehouse via l’outil ETL (Extract Transform Load ).
DATAWAREHOUSE
Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 6
QUEL EST LE RÔLE D’UN DATAWAREHOUSE
Définitions
Bien qu’un Infocentre peut être considéré comme un datawarehouse, il est l’ancêtre d’un
datawarehouse.
L’infocentre était une base de données utilisée pour des besoins décisionnels. Il contient
une copie de travail d’une partie de la base de production, mie à jour périodiquement.
L’infocentre était une première solution pour soulager le système de production des
requêtes complexes du décideur. Avec l’accroissement des besoins en matière de
décision, que ce soit en termes de quantité́ de données collectées ou en nombre
d’utilisateurs potentiels, l’infocentre se révéla bien insuffisant. Le Datawarehouse l’a
rapidement remplacé.
Un Datamart est un sous-ensemble logique d’un datawarehouse. Il est généralement
exploité en entreprise pour restituer des informations ciblées sur métier spécifique. Il
existe, par exemple, des datamart marketing ou commercial constitués de données
ciblées, organisées et regroupées.
Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 7
LES 4 CARACTÉRISTIQUES D’UN DATAWAREHOUSE
1. Orienté sujet
2. Intégré
3. Non volatile
4. Historisé
Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 8
LES 4 CARACTÉRISTIQUES D’UN DATAWAREHOUSE
1. Orienté sujet
Les bases de production sont, généralement, organisées par processus fonctionnels
(facturation, comptabilité, RH etc.). Au cœur du Datawarehouse, les données sont
organisées par thème. Les données propres à un thème, les ventes par exemple.
2. Intégré
Les données proviennent de plusieurs sources différentes. Avant d’être intégrées au sein
du datawarehouse elles doivent être mise en forme et unifiées afin d’en assurer la
cohérence. Cela nécessite une forte normalisation, de bénéficier d’un référentiel unique
et cohérent ainsi que de bonnes règles de gestion. Cette phase est très complexe et
représente une charge importante dans la mise en place d’un datawarehouse.
Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 9
LES 4 CARACTÉRISTIQUES D’UN DATAWAREHOUSE
3. Non volatile
Un datawarehouse veut conserver la traçabilité des informations et des décisions
prises. Les données ne sont ni modifiées ni supprimées. Une requête émise sur les
mêmes données à plusieurs mois d’intervalles doit donner le même résultat..
4. Historisé
Contrairement au système de production, les données ne sont jamais mises à jour.
Chaque nouvelle données est insérée. Un référentiel de temps doit être mis en place
afin de pouvoir identifier chaque donnée dans le temps.
Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 10
TABLE DE FAITS ET TABLE DIMENSION
Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 11
TABLE DE FAITS ET TABLE DIMENSION
Table de faits
Une table de fait représente un sujet d’analyse (CA par client et par produit et par
période). C’est une table centrale du modèle dimensionnel. Elle est constituée de
plusieurs mesures, appelées aussi axes, relatives au sujet traité. Ces mesures sont
généralement numériques.
Mais rappelons que certaines tables de faits peuvent contenir aucun attribut et
représentent que des liaisons entre tables dimensionnelles.
Exemple de table de faits:
Table de faits de vente
idDate
idZone
idProduit
Montant
Quantite_vendue
Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 12
TABLE DE FAITS ET TABLE DIMENSION
Table de faits de vente
idDate
idZone AXES DE REPRESENTATION
idProduit
Montant
MESURES RELATIVES AU SUJET TRAITE
Quantite_vendue
Une table de faits contient les clés associées aux dimensions. Il s’agit des clés
étrangères dans la table de faits;
Une table de faits contient les valeurs numériques de ce qu’on désire mesurer;
En général une table de fait contient un petit nombre de colonnes;
Une table de fait contient plus d’enregistrements qu’une table de dimension;
Les informations dans une table de fait sont caractérisées par :
Elles sont numériques et sont utilisées pour faire des SUM, AVG…
Les données doivent être additives ou semi-additives;
Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 13
TABLE DE FAITS ET TABLE DIMENSION
Table de dimension
Une table dimension est une table qui contient les axes d’analyse (les dimensions) selon
lesquels on veut étudier des données observables (les faits) qui, soumises à une analyse
multidimensionnelle, donnent aux utilisateurs des renseignements nécessaires à la prise
de décision.
On appelle donc « dimension » un axe d’analyse. Il peut s’agir des clients ou des produits
d’une entreprise, d’une période de temps comme un exercice financier, des activités
menées au sein d’une société, etc.
Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 14
TABLE DE FAITS ET TABLE DIMENSION
Table de dimension
Une table de dimension est un critère suivant lequel on souhaite évaluer, quantifier,
qualifier un fait,
Exemple :
Quels sont les ventes par produits, par zone, par date?
1. Table de fait : Ventes
2. Tables de dimension : Produit, Zone, Date
Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 15
TABLE DE FAITS ET TABLE DIMENSION
Chapitre
02
3iAC
CS2I 5 M. ONDAPHE CHRISTIAN ARTHUR 16