Chapitre 1 Analyse de Données
Chapitre 1 Analyse de Données
Chapitre 1 Analyse de Données
Université de JIJEL
Faculté des Sciences Exactes et Informatique
Département d’Informatique
Analyse de Données
http://elearning.univ-jijel.dz/course/view.php?id=4762
Collecter Analyser
Décrire les
les les
données
données données
Tirer des
conclusions
4
Les deux types d'études statistiques
5
La statistique descriptive
• La statistique descriptive (ou statistique
déductive) s'occupe de la description des
données: tableau, graphique,
pourcentage, ...
6
La statistique descriptive
• Exemple:
7
La statistique inférentielle
8
Les deux types d'études statistiques
nombre d'individus
constituant la population.
10
Population et individus
Individu ou unité
statistique: une unité
distincte chez laquelle
on peut observer une
ou plusieurs
caractéristiques
données.
11
Population et individus
13
Échantillon
Sous-groupe d’une population donnée.
(Une observation par individu)
1 k
Données groupées pour caractère discret x nixi
n i 1
18
Indicateurs statistiques
1. Indicateurs de position
La moyenne arithmétique
- Facile à calculer
- La somme des écarts à la moyenne est nulle:
n
(xi x ) 0
i 1
n i1 n i1
1 k 1 k
Données groupées discrètes n i (x i x) n i x i2 x 2
2 2
n i 1 n i 1
20
Indicateurs statistiques
2. Indicateurs de dispersion
L’écart-type
21
Indicateurs statistiques
Exemple
22
Indicateurs statistiques
Exemple
23
Limite de la statistique descriptive
En statistique descriptive, on s’intéresse aux
caractéristiques de tendance centrale, de dispersion,
de forme, les liaisons entre deux variables.
24
Limite de la statistique descriptive
Par exemple:
o Les variables qui sont liées, les individus qui se
ressemblent.
o Regrouper les individus suivant leur proximité
au vue des variables.
25
Limite de la statistique descriptive
26
2. Analyse de données
multidimensionnelles
27
Analyses de données
multidimensionnelles
Définition : statistiques descriptives
multidimensionnelles (beaucoup de
dimensions)
Objectif : extraire l’information principale d’un
tableau à double
entrée, y compris quand il est très grand
Méthode : consentir une perte d’information
pour gagner en efficacité
28
Domaines d’application
29
Principe général d’ADD
• Si n individus et seulement 2 variables X et
Y, il est facile de représenter l’ensemble des
données sur un graphique plan : chaque
individu i est un point de coordonnées Xi et
Yj nuage
• L’allure du nuage renseigne sur l’intensité
et la nature de la relation entre X et Y.
• Si plus de 3 variables, il faut trouver de
« bonnes » approximations du nuage pour
30
l’appréhender dans sa globalité.
Principe général d’ADD
Exemple:
On dispose de deux variables:
revenu et consommation sur MENAGE REVENU CONSOMMATION
13 ménages. 1 10 9
2 25 20
3 12 10
4 7 5
5 26 17
6 5 5
7 30 30
8 24 14
9 10 4
10 8 6
11 15 8
12 12 8
13 17 12
31
Principe général d’ADD
o Si nous avons trois variables : Revenu,
consommation et nombre personnes dans le
ménage.
On peut faire un graphique à trois dimensions.
32
Principe général de l’ADD
(numériques)
Les principales techniques factorielles