Nothing Special   »   [go: up one dir, main page]

Wa0000.

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 16

9782100760473-lim.

qxd 27/01/17 8:41 Page I

Maurice LETHIELLEUX
Ancien maître de conférence
à l’université Paris II – Panthéon – Assas

Céline CHEVALIER
Maître de conférence
à l’université Paris II – Panthéon – Assas

Exercices
de statistique
et probabilités

3e édition
9782100760473-lim.qxd 27/01/17 8:41 Page II

© Dunod, 2017
11 rue Paul Bert, 92240 Malakoff
ISBN 978-2-10-076047-3
9782100760473-tdm.qxd 25/01/17 12:00 Page III

Sommaire

Fiche 1 Généralités et représentations graphiques


des séries à un caractère 1
Fiche 2 Caractéristiques de tendance centrale et de dispersion.
Concentration 9
Fiche 3 Indices de prix – Indices en volume –
Indices en valeur 26
Fiche 4 Séries statistiques à deux variables :
ajustement par les moindres carrés 34
Fiche 5 Les séries chronologiques 47
Fiche 6 Principes du calcul des probabilités 57
Fiche 7 Loi de probabilité d’une variable aléatoire discrète 67
© Dunod – Toute reproduction non autorisée est un délit.

Fiche 8 Variables aléatoires continues et lois de probabilités


continues usuelles 83
Fiche 9 Convergences et approximation par la loi de Poisson
ou la loi normale 99
Fiche 10 Échantillons et simulations 112
Fiche 11 Estimation ponctuelle 121
Fiche 12 Estimation par intervalles de confiance 136
Tables Normale, Student, Chi-deux... 148
Annexe Niveau de difficulté des exercices 156

Sommaire III
9782100760473-tdm.qxd 25/01/17 12:00 Page IV
9782100760473-F01.qxd 16/01/17 11:03 Page 1

Généralités FICHE 1
et représentations
graphiques des séries
à un caractère

I Rappels de cours
• Population : en statistique descriptive, c’est un ensemble d’individus. Chaque
individu est décrit selon une ou plusieurs caractéristiques désignées par variable
ou caractère.
• Unité statistique : c’est une autre façon de désigner un individu.
• Modalités : ce sont les différentes caractéristiques d’une variable. Chaque indivi-
du présente une et une seule modalité à la fois (exhaustivité et disjonctivité).
• Variable quantitative : les modalités sont mesurables ou repérables. Lorsque ces
modalités sont des nombres isolés, cette variable est quantitative discrète ; sinon
cette variable est quantitative continue.
© Dunod – Toute reproduction non autorisée est un délit.

• Variable qualitative : les différentes modalités ne sont pas mesurables ou repé-


rables.
• Variable qualitative ordinale : on peut établir une hiérarchie entre les modalités.
• Sondage : l’information est recueillie sur une partie de la population qui constitue
un échantillon.
• Série statistique : suite de données (ou de variables) recueillies concernant des
individus.
Sur une population ou un échantillon de n individus, chaque individu présente l’une
des p modalités de la variable. Ces modalités sont notées M1 , M2 ,..., Mi ,..., M p .
n 1, n 2,..., n i ,..., n p sont les effectifs ou fréquences absolues des différentes modalités.
ni
f i = , f 1, f 2,..., f i ,...f p, sont les fréquences relatives des diverses modalités.
n
Les fréquences peuvent être exprimées en pourcentage.

FICHE 1 – Généralités et représentations graphiques… 1


9782100760473-F01.qxd 16/01/17 11:03 Page 2

La distribution statistique d’une variable selon ses modalités est présentée dans un
tableau.
Modalités Effectifs n i Fréquences f i Fréquences en %
M1 n1 f1 f 1 × 100
M2 n2 f2 f 2 × 100
... ... ... ...
M1 ni fi f i × 100
... ... ... ...

Mp np fp f p × 100

Total n 1 100

Pour une variable quantitative continue, les données sont regroupées en classes.
• L’amplitude, ou longueur de la classe, est la différence entre l’extrémité et l’ori-
gine de la classe.
• Fonction de répartition (variable quantitative) :
F(x) est la fréquence relative (ou les effectifs) des individus dont la valeur de la
variable est inférieure ou égale à x.
G(x) = 1 − F(x) est la fréquence relative (ou les effectifs) des individus dont la
valeur de la variable est supérieure à x.
• La courbe des fréquences cumulées croissantes est le graphe de la fonction F.
• La courbe des fréquences cumulées décroissantes est le graphe de la fonction G.
• Diagramme en bâtons : c’est la représentation graphique de la distribution d’une
variable quantitative discrète.
• Histogramme : c’est la représentation graphique sous forme de rectangles de la
distribution d’une variable quantitative continue après regroupement des données
en classes.

II Exercices
1. Représentations graphiques d’une variable
qualitative
Le tableau suivant donne la répartition des 500 salariés d’une entreprise selon le
mode de transport utilisé pour se rendre du domicile au lieu de travail.
Si un salarié utilise plusieurs modes de transport, celui retenu dans la classification
est celui de la distance parcourue la plus longue.

2 Exercices de statistique et probabilités


9782100760473-F01.qxd 16/01/17 11:03 Page 3

1
Mode de transport Symbole Effectifs Fréquences Fréquences en %
Voiture V 60 0,12 12
RER R 120 0,24 24
Métro M 160 0,32 32
Autobus A 80 0,16 16
Bicyclette B 80 0,16 16
Total 500 1 100

1. Les modalités d’une variable sont disjonctives et exhaustives, expliquez ce que


cela signifie.
2. Indiquer les difficultés à réaliser une classification pertinente pour les modalités de
la variable utilisée dans cet exercice.
3. Indiquer comment on obtient les 4e et 5e colonnes à partir de la 3e colonne.
4. Indiquer le principe essentiel pour faire un diagramme ou une représentation gra-
phique d’une distribution statistique d’une variable qualitative.
Représenter les données du tableau à l’aide d’un diagramme circulaire.
5. Indiquer d’autres modes de représentations graphiques pour des variables qualita-
tives.

S o l u t i o n
1. Disjonctives signifie que les modalités ne se recouvrent pas afin qu’un même indi-
vidu ne puisse pas être classé dans plusieurs modalités.
Exhaustives signifie que chaque individu peut être classé selon les modalités exis-
tantes.
En résumé, chaque individu est classé selon une et une seule modalité de la variable,
ce qui explique que le total des individus répertoriés dans les diverses modalités fasse
© Dunod – Toute reproduction non autorisée est un délit.

500.
2. Cet exercice montre qu’il est difficile avec les données précédentes de trouver une
classification pertinente. En effet, les individus qui vont à pied à leur travail ou en deux
roues motorisées ne sont pas pris en compte dans cette classification. De plus, la clas-
sification qui s’appuie sur la distance parcourue la plus longue par les salariés utilisant
plusieurs modes de transport, n’est pas forcement la plus pertinente. Ceci n’est qu’un
exercice, mais avant de recueillir des données, il faut penser à la façon de les traiter.
n1 60 120
3. f 1 = = = 0,12 f 2 = = 0,24…
n 500 500
4. Le principe de base d’un diagramme représentant des données qualitatives est que
les différentes aires du diagramme sont proportionnelles aux effectifs ou fréquences.
Ainsi la modalité V (voiture) doit représenter 12 % de l’aire totale, R 24 %, etc. Le dia-
gramme le plus usuel est le diagramme circulaire, souvent désigné par « camembert ».

FICHE 1 – Généralités et représentations graphiques… 3


9782100760473-F01.qxd 16/01/17 11:03 Page 4

Les aires des secteurs étant proportionnelles aux angles qu’ils forment, les angles des
secteurs représentant les différentes modalités sont aussi proportionnels aux effectifs.

Bicyclette Voiture
16% 12%

Autobus RER
16% 24%

Métro
32%

5. Un autre type de graphique est le diagramme en barres ou en bandeaux ; chaque ban-


deau a une hauteur proportionnelle à l’effectif de la modalité qu’il représente. Les outils
informatiques permettent de réaliser une grande variété de représentations graphiques.

Diagramme à barres

Bicyclette 16 %

Autobus 16 %

Métro 32 %

RER 24 %

Voiture 12 %

4 Exercices de statistique et probabilités


9782100760473-F01.qxd 16/01/17 11:03 Page 5

1
2. Représentation graphique d’une variable
quantitative discrète
Le tableau suivant donne la distribution de 200 familles selon le nombre d’enfants.
Nombre d’enfants Effectifs Fréquences Fréquences Fréquences cumulées
relatives relatives en % croissantes en %
0 30 0,15 15 15
1 40 0,20 20 35
2 60 0,30 30 65
3 30 0,15 15 80
4 16 0,08 8 88
5 10 0,05 5 93
6 6 0,03 3 96
7 4 0,02 2 98
8 4 0,02 2 100
Total 200

1. Faire le diagramme en bâtons de cette distribution.


2. Comment obtenir la dernière colonne du tableau à partir de la précédente ?
3. Indiquer les propriétés de la fonction de répartition F.
4. Déterminer la fonction de répartition de cette distribution.
5. Tracer la courbe des fréquences cumulées croissantes, c’est-à-dire le graphe de F.

S o l u t i o n
1. On porte en abscisse les différentes modalités de la variable et en ordonnée les
effectifs ou les fréquences relatives. Comme l’énoncé ne le précise pas, on choisit
dans ce cas les fréquences relatives en pourcentage, c’est souvent la façon la plus
© Dunod – Toute reproduction non autorisée est un délit.

lisible de présenter des données.


35

30

25

Fréquences relatives en % 20

15

10

0
0 1 2 3 4 5 6 7 8
Nombre d'enfants par famille

FICHE 1 – Généralités et représentations graphiques… 5


9782100760473-F01.qxd 16/01/17 11:03 Page 6

2. 35 = 20 + 15 ; 65 = 15 + 20 + 30 = 35 + 30. Les lignes de la dernière colonne s’ob-


tiennent par sommation des lignes de la colonne précédente du haut vers le bas en s’ar-
rêtant à la ligne correspondant à un nombre donné d’enfants. Ainsi 35 % des familles
ont 0 ou 1 enfant ; 65 % des familles ont, au plus, deux enfants.
3. F(x) est la fréquence des individus dont la variable est inférieure ou égale à x. Il
en résulte : 0  F(x)  1.
F est croissante au sens large : b > a implique F(b)  F(a).
4. La fonction F pour une variable discrète est constante par morceaux, c’est une fonc-
tion en escalier.
Si : 0  x < 1 F(x) = 0,15
1  x < 2 F(x) = 0,35
2  x < 3 F(x) = 0,65
3  x < 4 F(x) = 0,80
4  x < 5 F(x) = 0,88
5  x < 6 F(x) = 0,93
6  x < 7 F(x) = 0,96
7  x < 8 F(x) = 0,98
x 8 F(x) = 1
5. Courbe des fréquences cumulées ascendantes.

y
1,1

0,9

0,8

0,7

0,6

0,5

0,4

0,3

0,2

0,1
0 x
0 1 2 3 4 5 6 7 8 9 10

6 Exercices de statistique et probabilités


9782100760473-F01.qxd 16/01/17 11:03 Page 7

1
3. Représentation graphique d’une variable continue
Une enquête a été réalisée auprès de 500 salariés d’une entreprise pour étudier la dis-
tribution des salaires nets mensuels en euros.
Salaire mensuel Effectifs n i Fréquences Effectifs cumulés Fréquences Fréquences Fréquences
(milliers d’euros) relatives f i croissants cumulées cumulées cumulées dé-
croissantes croissantes en % croissantes en %
[1,2 à 1,6[ 100 0,20
[1,6 à 2,0[ 150 0,30
[2,0 à 2,8[ 100 0,20
[2,8 à 3,6[ 80 0,16
[3,6 à 4,4[ 50 0,10
[4,4 à 6,0[ 20 0,04
Total 500

1. Compléter le tableau précédent.


2. Indiquer comment on construit un histogramme et tracer l’histogramme de cette
distribution.
3. Tracer la courbe des fréquences cumulées croissantes (en %) et la courbe des fré-
quences cumulées décroissantes (en %).

S o l u t i o n
1. Tableau complété
Salaire mensuel Effectifs n i Fréquences Effectifs cumulés Fréquences Fréquences Fréquences
(milliers d’euros) relatives f i croissants cumulées cumulées cumulées dé-
croissantes croissantes en % croissantes en %
© Dunod – Toute reproduction non autorisée est un délit.

[1,2 à 1,6[ 100 0,20 100 0,20 20 100


[1,6 à 2,0[ 150 0,30 250 0,50 50 80
[2,0 à 2,8[ 100 0,20 350 0,70 70 50
[2,8 à 3,6[ 80 0,16 430 0,86 86 30
[3,6 à 4,4[ 50 0,10 480 0,96 96 14
[4,4 à 6,0[ 20 0,04 500 1,00 100 4
Total 500 1

2. Construction de l’histogramme
En ordonnée, on porte les fréquences par classe d’amplitude 400 euros ce qui corres-
pond aux deux premières classes. La classe suivante qui va de 2 000 à 2 800 euros a
une amplitude de 800 euros et une fréquence de 20 %. Ceci revient à répartir 10 % des
effectifs dans une classe fictive d’amplitude 400 euros qui s’étend de 2 000 à

FICHE 1 – Généralités et représentations graphiques… 7


9782100760473-F01.qxd 16/01/17 11:03 Page 8

2 400 euros et 10 % dans une classe qui s’étend de 2 400 euros à 2 800 euros. On porte
donc pour la classe qui s’étend de 2 000 à 2 800 euros une hauteur de 10 %. On rai-
sonne de cette façon pour terminer l’histogramme.

Histogramme des fréquences


35%

30%

25%

20%

15%

10%

5%

milliers d'euros
0%
1,2 1,6 2,0 2,8 3,6 4,4 6,0

3. Courbes des fréquences cumulées


Pour repérer les points qui figurent sur la courbe des fréquences cumulées croissantes,
on prend en abscisse l’extrémité des classes.
Pour repérer les points qui figurent sur la courbe des fréquences cumulées décrois-
santes, on prend en abscisse l’origine des classes.

Courbes des fréquences cumulées


100%

90%

80%

70%

60% fréquences cumulées


croissantes
50%
fréquences cumulées
40% décroissantes
30%

20%

10%

0%
1 2 3 4 5 6 7

8 Exercices de statistique et probabilités


9782100760473-F02.qxd 16/01/17 11:22 Page 9

Caractéristiques de FICHE 2
tendance centrale
et de dispersion.
Concentration

I Rappel de cours
• Une série statistique x1 ,x2 ,. . . ,xn est une suite d’observations d’une variable X.
Dans le cas où les observations xi sont observées avec les effectifs n i ou avec les
fréquences f i on présente les données sous forme de tableau.

Variable x1 xi xp Total

Effectif n1 ni np n
Fréquence f1 fi fp 1 ou 100 %
© Dunod – Toute reproduction non autorisée est un délit.

Caractéristiques de valeur centrale et de position


• La moyenne arithmétique :
1 1 p 1 
i=n i= p i= i= p
x= xi ou x = n i xi ou x = f i xi ou x = f i xi
n i=1 n i=1 i=1
100 i=1
Lorsque chaque modalité xi de la variable X est observée une seule fois, c’est la
première formule qui s’applique sinon c’est la deuxième. La troisième correspond
à des fréquences relatives exprimées entre 0 et 1 ; la dernière à des fréquences rela-
tives exprimées en pourcentage.
• La médiane se détermine de telle façon qu’il y ait autant d’observations supé-
rieures à la médiane que d’observations inférieures à la médiane.
• Le mode correspond à la valeur de la variable observée avec la plus grande fré-
quence ou le plus grand effectif. Sa détermination est un peu plus délicate pour une

FICHE 2 – Caractéristiques de tendance centrale et de dispersion 9


9782100760473-F02.qxd 16/01/17 11:22 Page 10

variable continue (on définit plutôt une classe modale). Il existe des distributions
à plusieurs modes.
• La moyenne géométrique : mg
 1
i=n  i=
p n  n
1
1 n n np 1
m g = (x1 x2 . . . xn ) n = xi ou m g = (x1 x2 . . . x p ) n =
n 1 2
xi i

i=1 i=1
• La moyenne harmonique : mh
 
1 1 1 1 1 1i=n
1
= + + ... + =
mh n x1 x2 xn n i=1 xi
 
1 1 n1 n2 np
ou = + + ... +
mh n x1 x2 xp
1
L’inverse de la moyenne harmonique est la moyenne arithmétique des quantités .
xi
• Les quartiles Q 1, Q 2, Q 3 correspondent à des effectifs de 25 %, 50 %, 75 % sur
des observations qui sont ordonnées par ordre croissant. Ainsi, 25 % des observa-
tions sont inférieures au premier quartile Q 1, 50 % inférieures au deuxième quar-
tile (qui est égal à la médiane), 75 % inférieures au troisième quartile Q 3.
• Les déciles correspondent à des effectifs de 10 %, 20 %,..., 90 %. Il existe donc
9 déciles notés D1 , D2 ,... D9 . Ainsi, 10 % des observations sont inférieures à D1 .
• Les centiles ou percentiles correspondent à 1 %, 2 %,..., 99 %.

Caractéristiques de dispersion
• L’étendue est la différence entre la plus grande et la plus petite des observations.
• L’écart entre les quartiles Q 3-Q 1, ou entre les déciles D9 -D1 .
• La variance V.
Simple
1 n
1 n
V = (xi − x)2 = x 2 − x 2 = moyenne des x 2 – (moyenne des x)2
n i=1 n i=1 i
Pondérée
1 1  
p p p p
V = n i (xi − x)2 = n i xi2 − x 2 = f i (xi − x)2 = f i xi2 − x 2
n i=1 n i=1 i=1 i=1
• L’écart type σ est la racine carrée de la variance V.

La concentration
• La notion de concentration permet de mesurer les inégalités dans la répartition
d’unités statistiques (individus) distribuées selon la taille. La concentration est

10 Exercices de statistique et probabilités


9782100760473-F02.qxd 16/01/17 11:22 Page 11

2
forte si un petit nombre d’individus se partagent une part importante de la masse
de la variable (exemple masse des salaires).
• La médiale : les individus dont la variable (caractère) est inférieure à la médiale se
partagent la moitié de la masse totale.
• La concentration s’observe visuellement sur la courbe de Lorentz et se mesure
par l’indice de Gini ou par l’écart entre la médiale et la médiane. (Voir exercice.)

Moments centrés et non centrés, asymétrie


et aplatissement
1
• Moments non centrés d’ordre r : m r = n i xir
n i
1
• Moments centrés d’ordre r : µr = n i (xi − x)2
n i
µ3
• L’asymétrie est mesurée par le coefficient γ1 de Fisher : γ1 =
σ3
µ4
• L’aplatissement est mesuré par le coefficient γ2 de Fisher : γ2 = 2 − 3
µ2

II Exercices
1. Calculs élémentaires sur des séries statistiques
Les notes obtenues à un test dans deux groupes de 7 personnes sont les suivantes :
– groupe 1 : 16 ; 08 ; 10 ; 12 ; 14 ; 11 ; 13.
© Dunod – Toute reproduction non autorisée est un délit.

– groupe 2 : 08 ; 20 ; 12 ; 06 ; 16 ; 18 ; 04.
1. Calculer les moyennes m 1 et m 2 des notes dans les groupes 1 et 2 en donnant les
formules algébriques.
Calculer les variances V1 et V2 puis les écarts types σ1 et σ2 en utilisant successive-
ment les deux formules différentes pour le calcul.
Commenter les résultats obtenus et indiquer s’ils sont conformes à ce que l’on pour-
rait attendre.
2. Calculer les médianes et les étendues des deux séries.
3. Démontrer le résultat suivant :
1 n
1 n
(xi − x)2 = x2 − x2
n i=1 n i=1 i

FICHE 2 – Caractéristiques de tendance centrale et de dispersion 11


9782100760473-F02.qxd 16/01/17 11:22 Page 12

4. Démontrer le résultat suivant :


 n 
n 
n
Ea = (xi − a)2 = (xi − x)2 + (x − a)2
i=1 i=1 i=1
En déduire que E a est minimale pour a = x .

S o l u t i o n

i=n  
i=7 
1 1 1
1. m 1 = xi = xi = (x1 + x2 + . . . + x7 )
n i=1
7 i=1 7
1
= (16 + 8 + 10 + 12 + 14 + 11 + 13) = 12
7
 i=n   i=7 
1  1  1
m2 = yi = yi = (y1 + y2 + . . . + y7 )
n i=1 7 i=1 7
1
= (8 + 20 + 12 + 6 + 16 + 18 + 14) = 12
7
La i ème observation de la série 1 est notée xi (on pourrait aussi la noter x1i ).
La j ème observation de la série 2 est notée y j (on pourrait aussi la noter x2 j ).
Calcul de la variance de la première série en utilisant la première formule.
 n 
1 
V1 = (xi − m 1 )2
n i=1
1 
= (16 − 12)2 + (8 − 12)2 + (10 − 12)2 + . . . + (13 − 12)2 = 6
7
Calcul de la variance de la première série en utilisant la seconde formule.
1 n
1
V1 = x 2 − m 21 = (162 + 82 + . . . + 112 + 132 ) − 122
n i=1 i 7
1 050
= − 144 = 150 − 144 = 6
7
Calcul de la variance de la deuxième série.
 n 
1 
V2 = (yi − m 2 )2
n i=1
1 
= (8 − 12)2 + (20 − 12)2 + . . . + (4 − 12)2 = 33,14
7 √
√ √ √
σ1 = V1 = 6 = 2,45 σ2 = V2 = 33,14 = 5,76

12 Exercices de statistique et probabilités

Vous aimerez peut-être aussi