E0052 Mini Manuel Statistiques & Probabilites en Economie-Gestion (Dunod) Avec DRM
E0052 Mini Manuel Statistiques & Probabilites en Economie-Gestion (Dunod) Avec DRM
E0052 Mini Manuel Statistiques & Probabilites en Economie-Gestion (Dunod) Avec DRM
Statistiques
et probabilités
en économie-gestion
2e édition
L’essentiel du cours
Exercices corrigés
Étude de cas
Benjamin Legros
Collain B., Déjean F., Le Theule M.-A., Mini Manuel de Comptabilité générale,
2e ed., 2014
Legros B., Mini Manuel de Finance d’entreprise, 2e éd., 2014
Legros B., Mini Manuel de Mathématiques financières, 2e éd., 2016
Kruger A, Carpentier L., Ferrandi J.-M., Ingarao A., et al., Mini Manuel de Mar-
keting, 2e éd., 2015
Partie 1
Statistiques
3 Séries chronologiques 59
3.1 Techniques de lissage 61
3.2 Résistance et support 64
3.3 Coefficients saisonniers 66
3.4 Phénomène de retracement 69
3.5 Indicateurs de puissance 70
Points clés 72
Exercices 73
Solutions 75
Partie 2
Probabilités
Le cours ×
Les rubriques
Un peu de méthode
Les exercices
Ils sont proposés en fin de chapitre,
avec leur solution, pour se tester tout
au long de l’année.
σ
−σ
9782100745302-legros-part1.qxd 26/04/16 10:48 Page 1
1
PARTIE
Statistiques
1
CHAPITRE
Statistiques
à une variable
coefficient de variation.
➤ Savoir calculer des moyennes arithmétiques, géométriques et harmo-
niques.
➤ Savoir calculer des pourcentages d'augmentation ou de diminution.
➤ Utiliser la moyenne géométrique pour des variations.
➤ Connaître les indices de Laspeyres, Paasche et Fisher pour un ensemble
de produits.
a) Vocabulaire de l’étude
L’analyse statistique consiste à extraire une information utile et synthé-
tique d’un ensemble d’observations. L’étude doit se limiter à une popu-
lation qui, pour le gestionnaire, sera par exemple la production d’une
9782100745302-legros-C01.qxd 26/04/16 11:47 Page 4
b) La fréquence
Les statistiques sont un vecteur majeur de communication. L’actualité
des entreprises regorge de données statistiques diverses qui par leurs pré-
sentations informent (ou désinforment).
Le premier élément de communication est la fréquence : on exprime
l’importance d’une donnée sous forme de pourcentage.
Exemple. Pour l’usine A, l’effectif considéré est 34, l’effectif total est
457. Avec la formule précédente on retrouve donc 7,44 %.
9782100745302-legros-C01.qxd 26/04/16 11:47 Page 5
Statistiques
c) Modes de représentation
Comment représenter au mieux une série statistique ? La réponse dépend
du type de la série étudiée ainsi que de l’information que l’on souhaite
rendre visible. Il n’y a pas de règles absolues pour représenter une
série : dans la littérature, on constate l’utilisation de tous types de dia-
grammes pour tous types de séries. Cependant, pour éviter d’induire de
1
fausses informations, certains diagrammes semblent plus adaptés que
d’autres.
Un caractère quantitatif discret
Notes 0 1 2 3 4 5
Effectif 10 15 10 35 25 5
Il s’agit dans cet exemple de représenter la gradation des notes – 0 moins
bon que 1 lui même moins bon que 2 ... – et l’importance de la représen-
tation de chaque note donnée par l’effectif.
Pour figurer une série discrète, le mode de représentation le plus simple
à produire et à interpréter est le diagramme en bâton.
Mode de construction
Dans un diagramme en bâton, on représente les notes par des bâtons
© Dunod. Toute reproduction non autorisée est un délit.
Effectif
40
35
30
25
20
15
10
Notes
1 2 3 4 5
Ne pas choisir la hauteur des rectangles égale à l’effectif ; cela conduit à une sur-
représentation des intervalles de grandes longueurs qui vont avoir un rectangle
de grande superficie alors qu’ils ne représentent pas nécessairement un grand
effectif.
Statistiques
Effectif
40
35
30
1
25
20
15
10
2 4 6 8 10 12 14 16 18 20
Distance en km
Figure 1-2 Histogramme
Un caractère qualitatif
Jaune
Roug e V er t
Noir
Statistiques
Chaque mois a la même importance ; si on cherche à calculer une moyen-
ne de la production mensuelle, on ajoute les différentes productions pour
les diviser par le nombre de mois :
10 000 + 50 000 + 20 000 + 30 000 + 30 000 + 40 000
Moyenne =
6
= 30 000
1
En notant x1 , x2 , · · · , xn les valeurs de la série et x la moyenne, on a la
formule générale d’une moyenne simple :
n
xi
x1 + x2 + · · · + xn i=1
x= =
n n
0 × 10 + 1 × 15 + 2 × 10 + 3 × 35 + 4 × 25 + 5 × 5
Moyenne =
100
= 2,65
Moyenne pour un caractère continu
Il se pose le problème du choix de la valeur à considérer pour appliquer
la formule précédente. La solution la plus pratique est de retenir les
milieux de chacune des classes comme valeurs. Dans l’exemple du
Tableau 1-2, on trouve :
1 × 80 + 3,5 × 90 + 7,5 × 100 + 15 × 100 + 35 × 90
Moyenne =
80 + 90 + 100 + 100 + 90
≈ 12,60 km
9782100745302-legros-C01.qxd 26/04/16 11:47 Page 10
Moyenne harmonique
Exemple. Considérons un investissement de 1 000 € pour acheter des
actions un premier jour lorsque leur cours est à 5. Supposons qu’un
second investissement de 1 000 € est réalisé 20 jours plus tard lorsque le
cours de cette action est passé à 4 €. On peut alors calculer le cours
moyen du portefeuille de cet individu pour ce titre. Le premier jour l’in-
1 000
dividu a acheté = 200 actions et le 20ième jour il a acheté
5
1 000
= 250 actions. Il a réalisé en tout un investissement de 2000 €.
4
1 000 + 1 000
Ainsi le cours moyen de son portefeuille est de 1 000 1 000
5 + 4
9782100745302-legros-C01.qxd 26/04/16 11:47 Page 11
Statistiques
2
= = 4,44. Il s’agit de la moyenne harmonique des valeurs
1
5+ 1
4
4 et 5.
En notant les valeurs d’une série et la moyenne, on a la formule géné-
rale d’une moyenne harmonique :
n n
1
x= = .
1 1 1
n
1
+ + ... +
x1 x2 xn xi
i=1
b) Médiane
On considère la suite de notes suivantes : 7 ; 8 ; 9 ; 20. La moyenne de
cette série est 11. Il s’agit bien du milieu de ces 4 notes ; pour autant
75 % de ces notes sont en dessous de 10 et la moyenne semble donner
une indication positive à savoir 11. La moyenne est en effet très influen-
cée par les valeurs extrêmes, ici le 20.
Il est donc utile de s’intéresser à un autre indicateur de tendance centra-
le qui est la médiane.
Définition : la médiane est la valeur de la série pour laquelle 50 %
de la population a ses valeurs en dessous et 50 % a ses valeurs au
dessus.
Ici, la médiane est entre 8 et 9, elle est de 8,5. Cette valeur de 8,5 indique
bien le fait que 3 notes sur 4 sont en dessous de 10 et que l’évaluation
n’est pas aussi positive que semblait l’indiquer la moyenne.
© Dunod. Toute reproduction non autorisée est un délit.
Exemple.
Série a : – 1 ; 3 ; 6 ; 8 ; 9
Les valeurs sont classées par ordre croissant, il y a 5 valeurs. La valeur qui
sépare la série en deux sous-séries de même taille est 6. Ainsi la médiane
est 6.
9782100745302-legros-C01.qxd 26/04/16 11:47 Page 12
Série b : 4 ; 24 ; 32 ; 50
Il y a ici 4 valeurs dans l’ordre croissant. Aucune de ces valeurs ne sépa-
re la série en deux. La médiane se situe entre les deux valeurs du milieu ;
entre 24 et 32. La médiane est donc 28.
Statistiques
La dernière ligne du tableau indique que 170 personnes vivent entre 0 et
5 km de leur lieu de travail et 270 personnes vivent entre 0 et 10 km de
leur lieu de travail. La médiane est donc dans l’intervalle [5 ; 10[ et cor-
respond à un effectif cumulé de 230.
On peut représenter schématiquement la position de la médiane M
ainsi :
1
5 M 10
170 230 270
En supposant une répartition parfaitement homogène de la population
dans chaque intervalle, on a :
M −5 10 − 5
=
230 − 170 270 − 170
M −5 5 60 × 5
ainsi : = et M − 5 = d’où M = 5 + 3 = 8 km
60 100 100
Cette méthode est reproductible. On retrouvera ce résultat à l’aide du
diagramme des effectifs cumulés.
c) Mode
Dans le cas d’une série discrète, le mode est la valeur ayant le plus grand
effectif. Dans l’exemple du Tableau 1-1, il s’agit de 3.
Dans le cas d’une série continue, on parle de classe modale pour évo-
quer la classe ayant le plus grand effectif ; le mode est le milieu de cette
classe.
La notion de mode n’a d’intérêt que pour les séries pour lesquelles une
© Dunod. Toute reproduction non autorisée est un délit.
valeur se détache des autres par l’importance de son effectif. Dans le cas
du Tableau 1-2, la recherche du mode ne présente pas d’intérêt, l’en-
semble des classes ayant des effectifs proches.
a) Écart-moyen
L’écart-moyen est la mesure de dispersion la plus intuitive. Il se définit
comme la moyenne des écarts à la moyenne de la série (les écarts étant
toujours comptés positivement).
En notant m la moyenne de la série ; e1 , e2 , · · · , en les effectifs associés
aux valeurs x1 , x2 , · · · , xn , on a la formule suivante :
Écart-moyen
10×|0−2,65|+15×|1−2,65|+10×|2−2,65|+35×|3−2,65|+25×|4−2,65|+5×|5−2,65|
=
100
≈ 1,16
b) Écart-type
L’écart-type est l’élément le plus utilisé pour mesurer la dispersion d’une
série.
9782100745302-legros-C01.qxd 26/04/16 11:47 Page 15
Statistiques
Voici la formule définissant l’écart-type : notons σ l’écart-type, m la
moyenne et e1 , e2 , · · · , en les effectifs associés aux valeurs
x1 , x2 , · · · , xn .
e1 (x1 − m)2 + e2 (x2 − m)2 + · · · + en (xn − m)2
σ =
e1 + e2 + · · · + en
n
1
ei (xi − m)2
i=1
=
n
ei
i=1
Voyons à partir du Tableau 1-2, comment utiliser cette formule pour cal-
culer l’écart-type de la série.
1. Calcul de la moyenne des carrés :
80 × 12 + 90 × 3,52 + 100 × 7,5 + 100 × 152 + 90 × 352
≈ 303,39
80 + 90 + 100 + 100 + 90
2. Calcul de la moyenne au carré :
La moyenne a déjà été calculée au § 2.1.1
On a donc 12,62 = 158,76
© Dunod. Toute reproduction non autorisée est un délit.
3. Calcul de l’écart-type :
√
On trouve donc σ = 303,39 − 158,76 = 12,03
c) Quartiles
Les quartiles sont des valeurs qui permettent de couper une population
en quatre sous-populations de même taille. Le premier quartile cor-
respond au premier quart de la population. On le note Q 1. Le second
quartile correspond au second quart de la population, il s’agit donc de la
médiane. Le troisième quartile correspond au troisième quart. On le note
Q 3. Ils se répartissent schématiquement ainsi :
Min Q1 M Q3 Max
25% 25% 25% 25%
9782100745302-legros-C01.qxd 26/04/16 11:47 Page 16
2. On place les points dont les coordonnées sont les extrémités des inter-
valles avec l’effectif cumulé associé.
3. On relie les points par des segments de droite.
Effectif
480
420
360
300
240
180
120
60
Q1 M Q3 Distance en km
2 4 6 8 10 12 14 16 18 20
Statistiques
Méthode pour retrouver la médiane et les quartiles
1. On calcule l’effectif cumulé correspondant à chacun de ces paramètres. Ici
l’effectif total est 460, la médiane correspond donc à un effectif cumulé de
460 460
230 , le premier quartile de 115 et le troisième de
2 4
3 × 460
345 .
1
4
2. On place ces valeurs sur l’axe des ordonnées.
3. On trouve à l’aide du graphe l’abscisse correspondant à ces valeurs d’ordon-
nées ; ce qui permet de mesurer avec la précision du graphique : Q1 ≈ 3 ;
M ≈ 8 et Q3 ≈ 17,5
Par une méthode calculatoire, on trouve avec précision : Q1 = 3,17 ; M = 8
et Q3 = 17,5
Ainsi la méthode graphique permet avec moins de précision (mais aussi moins
de calculs) de trouver les valeurs de Q1 , Q3 et M.
m
où σ est l’écart-type et m est la moyenne. Ainsi, une valeur importante
de C V indique une dispersion importante relativement à la moyenne.
b) Intervalles significatifs
– L’intervalle interquartile est l’intervalle [Q 1 ; Q 3 ]. Cet intervalle
contient 50 % de la population. Il sert à déterminer la moitié centrale
de la population.
– L’intervalle de confiance [m − σ ; m + σ ] contient, dans une réparti-
tion normale, 68 % de la population. Il peut s’avérer utile de comparer
la série à une distribution normale.
9782100745302-legros-C01.qxd 26/04/16 11:47 Page 18
Valeurs 1 2 3 Asymétrie
Effectif (série 1) 1 3 5 –1,01
Effectif (série 2) 5 3 1 1,01
b) Kurtosis
Le Kurtosis caractérise la forme de pic ou l’aplatissement relatif d’une
distribution comparée à une distribution normale. Un Kurtosis positif
indique une distribution relativement pointue, tandis qu’un Kurtosis
négatif signale une distribution relativement aplatie.
Le Kurtosis d’une série se définit comme :
n
n(n − 1) xi − x 4 3(n − 1)2
−
(n − 1)(n − 2)(n − 3) i=1 σ (n − 2)(n − 3)
1.6 • Indices 19
Statistiques
Valeurs 1 2 3 Kurtosis
Effectif (série 1) 1 10 1 11
Effectif (série 2) 2 2 2 –1,875
1.6 INDICES
1
Les cours boursiers, l’évolution des prix ou encore la production indus-
trielle sont mesurés par des indices. Ces indices informent de manière
synthétique. Leur seule donnée indique une progression ou une régres-
sion dans un secteur. Nous allons nous intéresser à la manière dont ils se
calculent.
a) Pourcentage d’évolution
L’année 0, un objet a un prix de 5 euros. L’année 1, son prix passe à
6 euros. L’augmentation de ce prix est donc de 1 euro. Que peut-on en
conclure pour un produit d’une valeur de 8 euros l’année 0 ? Rien a prio-
ri, car si le premier produit représente l’augmentation des prix du mar-
ché, son augmentation de 1 euro ne va pas s’appliquer à l’ensemble des
prix. Le second produit ne sera pas à 9 euros en année 1.
Considérons l’augmentation relative du prix au moyen de la formule :
Prix période 1 − Prix période 0
Prix période 0
L’augmentation relative du prix est de 20 %. Cette donnée – si elle
représente l’évolution du marché – est utile pour conjecturer l’augmen-
tation de n’importe quel prix.
© Dunod. Toute reproduction non autorisée est un délit.
1.6 • Indices 21
Statistiques
Moyenne des indices pondérés
La moyenne des indices pondérés consiste à faire une moyenne des
indices élémentaires de chaque produit pondéré par les quantités.
3
L’indice élémentaire de A est : I1/0 = × 100 = 150
2
6
L’indice élémentaire de B est : I1/0 = × 100 = 120
1
5
4
L’indice élémentaire de C est : I1/0 = × 100 = 200
2
Ainsi la moyenne des indices pondérés est :
150 × 200 + 120 × 100 + 200 × 50
I1/0 = = 148,57
200 + 100 + 50
Cette valeur indique une augmentation des prix de 48,57 %.
Généralisons cet exemple avec la formule de la moyenne des indi-
ces pondérés :
Notations :
Q i : quantité associée au produit i
Pi, j : prix du produit i à la période j
P1,1 P2,1 Pn,1
Q1 + Q2 + · · · + Qn
P1,0 P2,0 Pn,0
I1/0 = × 100
Q1 + Q2 + · · · + Qn
n
Pi,1
Qi
i=1
Pi,0
= × 100
n
© Dunod. Toute reproduction non autorisée est un délit.
Qi
i=1
d) Quantités et prix
L’exemple précédent ne prend pas en compte la variation éventuelle des
quantités entre la période 0 et la période 1.
1.6 • Indices 23
Statistiques
d’indices de Laspeyres ; soit à la période actuelle (période 1), on parle
alors d’indices de Paasche.
Voyons les différents calculs possibles de l’indice des moyennes pon-
dérées :
• Indice de Laspeyres des prix :
2,5 × 150 + 6 × 100 + 3 × 50
× 100 = 125
2 × 150 + 5 × 100 + 2 × 50
1
Soit une augmentation des prix de 25 %.
• Indice de Paasche des prix :
2,5 × 100 + 6 × 80 + 3 × 45
× 100 = 125,36
2 × 100 + 5 × 80 + 2 × 45
Soit une augmentation des prix de 25,36 %.
• Indice de Laspeyres des quantités :
2 × 100 + 5 × 80 + 2 × 45
× 100 = 76,67
2 × 150 + 5 × 100 + 2 × 50
Soit une baisse de 23,33 %.
• Indice de Paasche des quantités :
2,5 × 100 + 6 × 80 + 3 × 45
× 100 = 76,89
2,5 × 150 + 6 × 100 + 3 × 50
Soit une baisse de 23,11 %.
Résumons les formules utiles à ces calculs ainsi :
Notation : Q i, j : quantité du produit i à la période j et Pi, j : prix du
produit i à la période j.
Tableau 1-7 Formules de Paasche et de Laspeyres
© Dunod. Toute reproduction non autorisée est un délit.
n
n
Q i,1 Pi,1 Q i,1 Pi,1
i=1 i=1
Indice de Paasche × 100 × 100
n n
Q i,0 Pi,1 Q i,1 Pi,0
i=1 i=1
9782100745302-legros-C01.qxd 26/04/16 11:47 Page 24
c) Exemples d’indices
– L’indice des prix à la consommation (IPC) mesure le niveau moyen
des prix des biens et services consommés par les ménages. Il se calcule
sur un ensemble de 200 000 prix par la méthode de Laspeyres avec
l’année 2000 pour référence. Il permet de mesurer l’inflation.
– L’indice de la production industrielle (IPI) mesure les variations des
quantités produites du secteur secondaire, l’industrie, y compris des
industries agricoles et alimentaires, de l’énergie et de la construction.
Il s’agit d’un indice de Laspeyres des quantités, base 100 en 2005.
– Les indices annuels de la construction dans l’Union européenne,
sont des indices Laspeyres de base 100 en 2005 qui évaluent dans
chaque pays les évolutions des entrées de commande, des permis de
construire et du prix des nouveaux bâtiments résidentiels.
– L’indice des prix de gros alimentaire mesure l’évolution des prix
payés par les détaillants de la région parisienne. Il s’agit d’un indice de
Laspeyres de base 100 en 2005.
– Le CAC40 est l’indice de la bourse de Paris, il est composé des 40 plus
grandes capitalisations à la bourse de Paris. Il s’agit d’un indice de
base 1 000 créé le 31 décembre 1987. L’inflation est prise en compte
ainsi que la quantité de titres réellement sur les marchés (depuis 2003).
– Le Dow Jones et le Nikkei 225 sont les indices des bourses de New-
York et de Tokyo. Ils ont la particularité d’être pondérés sur la valeur
des actions les composant et non sur leur capitalisation boursière. Cela
explique des difficultés d’utilisation de ces indices.
9782100745302-legros-C01.qxd 26/04/16 11:47 Page 25
Points clés 25
Statistiques
POINTS CLÉS
1
correspondant
➤ Calcul de moyenne
– Prendre en compte la pondération par les effectifs lorsqu’il y a en a.
– Choisir le milieu des classes pour les séries à caractère continu.
➤ Écart-type
Pour une plus grande rapidité des calculs : calculer la moyenne des
carrés, puis la moyenne au carré et prendre la racine carrée de la diffé-
rence de ces deux valeurs.
➤ Médiane et quartiles
– Pour une série à caractère discret, différencier les cas selon la parité
de l’effectif total.
– Pour une série à caractère continu, utiliser les effectifs cumulés pour
© Dunod. Toute reproduction non autorisée est un délit.
➤ Mesure de variations :
Variation Opération
+10 % ×1, 1
−10 % ×0, 9
+1 % ×1, 01
−1 % ×0, 99
+t % ×(1 + t %)
−t % ×(1 − t %)
Exercices 27
Statistiques
EXERCICES
1.1 Application du cours
Voici les notes comprises entre 0 et 10 lors d’une enquête de satisfaction
à la sortie d’un magasin :
1 2 1 5 7 8 10 10 8 7 8 6
1
2 5 5 3 5 8 8 3 2 1 0 1
Effectif 37 25 22 8 6 2
boursiers :
Jours 1 2 3 4 5
Action A 5,1 5,4 5,8 4,7 4,2
Action B 12,3 12,9 12,8 12 11,1
Nombre de jours 5 8 12 3 2
a) Représenter graphiquement cette série.
b) Etablir un diagnostic de la situation de l’usine en calculant la moyen-
ne et l’écart-type de la production pendant le mois.
c) Un manager propose une augmentation de la production journalière
de 350 unités. Cette proposition est-elle satisfaisante ? Quelle proposi-
tion pourriez-vous formuler ?
1.6 Moyenne
Un objet voit son prix augmenter de 3 % par ans pendant 5 ans, puis de
60 % en 10 ans et passe ensuite en 5 ans de l’indice 135 à l’indice 178,
pour baisser ensuite de 2 % par ans pendant 4 ans.
Quel est le taux moyen annuel d’évolution de ce prix ?
Exercices 29
Statistiques
pour les années 2006, 2008 et 2010. Quel produit a subi la plus forte pro-
gression ?
b) En déduire le pourcentage d’augmentation annuel moyen pour cha-
cun de ces deux produits.
1.8 Immobilier
On achète un bien immobilier de 100 000 euros dans trois pays diffé-
1
rents. Dix ans plus tard, on souhaite revendre ces biens. Le prix de reven-
te dans le premier pays est de 95 000 euros, dans le second de 100 000
euros, et dans le dernier de 120 000 euros. Sachant qu’entre l’achat et la
vente, l’inflation a été de –10 % dans le premier pays, de 15 % dans le
second et de 20 % dans le dernier. Quelle opération vous semble la plus
intéressante ?
1.9 Investissement
Une entreprise achète en 2010 un appareil dont le prix est 9 700 euros.
Le même modèle avait pour valeur 8 900 euros en 2006.
a) Déterminer I2010/2006 l’indice élémentaire de ce prix en base 100 en
2006.
b) En déduire la valeur du même modèle en 2014 en supposant que
I2010/2006 = I2014/2010
SOLUTIONS
Exercice 1.1
La moyenne, l’écart-type, l’asymétrie et le Kurtosis se calculent par
application des formules. On trouve une moyenne de 4,83 ce qui
indique globalement une insatisfaction des clients, un écart-type de
3,14 d’où un étalement important des réponses, une asymétrie de
0,05 d’où un étalement légèrement plus important au-delà de la
moyenne et un Kurtosis de –1,35 d’où une série relativement plate.
Pour la médiane et les quartiles il est important dans un premier
temps de réordonner les éléments de cette série, ce qui donne :
Notes 0 1 2 3 4 5 6 7 8 9 10
Effectif 1 4 3 2 0 4 1 2 5 0 2
Exercice 1.2
a) On ajoute au tableau une ligne pour les effectifs cumulés :
Temps d’attente [0;1[ [1;2[ [2;3[ [3;5[ [5;10[ 10 et plus
en minutes
Effectif 37 25 22 8 6 2
Éléments Q1 M Q3
Effectif cumulé 25 50 75
0 Q1 1 1 M 2 2 Q3 3
Schéma
0 25 37 37 50 62 62 75 84
25
Solution Q1 = ≈ 0,67 min = 41s M = 1,52 min = 1 min 31 s Q 3 = 2,59 min = 2 min 35 s
37
9782100745302-legros-C01.qxd 26/04/16 11:47 Page 31
Solutions 31
Statistiques
b) Notons x la borne supérieure du dernier intervalle. Le milieu du der-
10 + x
nier intervalle est donc .
2
La moyenne est de 2 minutes et 6 secondes, soit 2,10 minutes.
37×0,5+25×1,5+22×2,5+8×4+6×7,5+2× 10+x
Ainsi : 2,10 = 100
2
1
188 + 10 + x
d’où 2,10 = et 210 = 198 + x, soit x = 12 min.
100
Le dernier intervalle est donc l’intervalle [10 ; 12[.
c) L’écart-type
On calcule la moyenne des carrés :
37×0,52 +25×1,52 +22×2,52 +8×42 +6×7,52 +2×112
100 = 9,105
La moyenne au carré : 2,12 = 4,41
√
Ainsi, on a σ = 9,105 − 4,41 = 2,16 minutes = 2 minutes et 10
secondes.
Exercice 1.3
a) Pour la moyenne et l’écart-type, une erreur à ne pas commettre est de
pondérer les cours par le jour. Cela n’a aucun sens, car cela reviendrait à
donner une importance plus grande au dernier jour qu’au premier. Ce
n’est pas l’intention ici.
On fait donc une moyenne simple :
5,1 + 5,4 + 5,8 + 4,7 + 4,2
Pour A : = 5,04
5
12,3 + 12,9 + 12,8 + 12 + 11,1
© Dunod. Toute reproduction non autorisée est un délit.
et pour B : = 12,22
5
On trouve l’écart-type de A :
5,12 + 5,42 + 5,82 + 4,72 + 4,22
σA = − 5,042 ≈ 0,553
5
et l’écart-type de B :
12,32 + 12,92 + 12,82 + 122 + 11,12
σB = − 12,222 ≈ 0,649
5
b) L’intervalle [m – σ ; m + σ]
Pour l’action A : [5,04 – 0,55 ; 5,04 + 0,55 ] = [4,49 ; 5,59]
Pour l’action B : [12,22 – 0,65 ; 12,22 + 0,65 ] = [11,57 ; 12,87]
9782100745302-legros-C01.qxd 26/04/16 11:47 Page 32
,1 +
tées en fin de semaine sera : 15000 + + +
1 000 1 000 1 000 1 000
5,4 5,8 4,7 4,2
. Le tout
pour un montant total de 5 000 €. On cherche maintenant un coût uni-
taire d’achat des titres. Pour cela il suffit de faire le rapport suivant :
1 000 1 000 1 000 1 000 1 000 ≈ 4,977 . Un titre A a coûté en moyenne à
5 000
5,1 + 5,4 + 5,8 + 4,7 + 4,2
l’investisseur 4,977 €.
Remarque : La moyenne ici n’est pas une moyenne arithmétique sim-
ple. Il s’agit d’une moyenne harmonique.
9782100745302-legros-C01.qxd 26/04/16 11:47 Page 33
Solutions 33
Statistiques
Exercice 1.4
a) On détermine les hauteurs des rectangles qui permettent de représen-
ter les effectifs.
Voici les résultats sous forme de tableau :
Intervalle Longueur de l’intervalle Effectif Hauteur
1
[200 ; 500[ 300 8 0,027
[500 ; 1 000[ 500 12 0,024
[1 000 ; 1 500[ 500 3 0,006
[1 500 ; 2 000[ 500 2 0,004
0,03
0,025
0,02
0,015
0,01
0,005
© Dunod. Toute reproduction non autorisée est un délit.
Production
200 400 600 800 1000 1200 1400 1600 1800 2000
b) On calcule la moyenne :
5 × 100 + 8 × 350 + 12 × 750 + 3 × 1 250 + 2 × 1 750
m=
30
= 651,67
L’écart-type :
Solutions 35
Statistiques
Ainsi la précédente inégalité devient :
x1 + x2 + . . . + xn 1
≥ e n (x1 ×x2 ×...×xn ) .
n
Cette inégalité est équivalente à :
x1 + x2 + . . . + xn 1
≥ (x1 × x2 × . . . × xn ) n .
n
1
Ceci prouve que la moyenne arithmétique est supérieure ou égale à la
moyenne géométrique.
La fonction inverse est une fonction convexe ainsi :
n
1
x1 + 1
x2 + ... + 1
xn
≤ .
x1 + x2 + . . . + xn n
Cette inégalité induit directement que la moyenne arithmétique est supé-
rieure à la moyenne harmonique.
Exercice 1.6
Notons P le prix initial, il subit une augmentation de 3 % par ans pen-
dant 5 ans. Ainsi dans 5 ans son prix sera de 1,035 P. Ensuite, en dix ans,
il augmente de 60 %. Dans 15 ans, son prix sera donc de 1,6 × 1,035 P.
Le prix passe ensuite de l’indice 135 à 178 en 5 ans. Il s’agit d’une aug-
178 − 135
mentation de = 31,85 % . Le prix dans 20 ans est donc de
135
178
× 1,6 × 1,035 P. Il baisse encore de 2 % par ans pendant 4 ans.
135
178
Le prix passe donc à 0,984 × × 1,6 × 1,035 P en 24 ans.
© Dunod. Toute reproduction non autorisée est un délit.
135
Le taux moyen annuel est donné par :
178 1
(0,984 × × 1,6 × 1,035 ) 24 = 1,03448
135
Soit une augmentation moyenne de 3,45 % par an.
Exercice 1.7
a) Présentons sous forme de tableau les indices élémentaires correspon-
dant aux deux produits pour comparer les évolutions :
2004 2006 2008 2010
Exercice 1.9
a) On a :
9 700
I2010/2006 = × 100 = 108,99
8 900
b) On a :
Prix en 2014
I2014/2010 = × 100
Prix en 2010
Or,
I2014/2010 = I2010/2006 = 108,99
Donc,
Prix en 2014
× 100 = 108,99
9700
Ainsi,
108,99 × 9700
Prix en 2014 = = 10571,91 euros
100
9782100745302-legros-C01.qxd 03/05/16 7:34 Page 37
Solutions 37
Statistiques
Exercice 1.10
Résultats sous forme de tableau :
Indice Indice
des prix des quantités
5 030×1 500+10 910×800+6 820×5 000 2 100×1 000+3 900×990+2 800×4 400
Indice de 2 100×1 500+3 900×800+2 800×5 000
× 100 2 100×1 500+3 900×800+2 800×5 000
× 100
1
Laspeyres = 248,51 = 90,19
5 030×1 000+10 910×990+6 820×4 400 5 030×1 000+10 910×990+6 820×4 400
Indice de 2 100×1 000+3 900×990+2 800×4 400
× 100 5 030×1 500+10 910×800+6 820×5 000
× 100
Paasche = 250,75 = 91,00
√ √
Indice 248,51 × 250,75 = 249,63 90,19 × 91,00 = 90,59
de Fisher
© Dunod. Toute reproduction non autorisée est un délit.
9782100745302-legros-C01.qxd 26/04/16 11:47 Page 38
9782100745302-legros-C02.qxd 26/04/16 11:10 Page 39
2
CHAPITRE
Statistiques
à deux variables
2.1 Covariance
PLAN
2.1 COVARIANCE
Le mode de représentation d’une série à deux variables est le nuage de
points. Le choix de la grandeur en abscisse et de la grandeur en ordon-
née est a priori arbitraire sauf lorsqu’il est possible de préjuger d’un lien
de cause à effet. Si la quantité vendue est la conséquence du prix de
vente, on choisira de placer le prix de vente en abscisse et la quantité
vendue en ordonnée.
La covariance est l’outil de mesure du lien entre deux grandeurs.
Mode de calcul
n
n
n
xi × yi − xi × yi
i=1 i=1 i=1
Cov(X , Y ) =
n2
délit
Le nombre de points n n’est pas le nombre de valeurs de X ajoutées au nombre de
valeurs de Y mais uniquement le nombre de valeurs de X ou le nombre de valeurs
t
de Y .
t i é
2.1 • Covariance 41
Statistiques
Voyons sur des exemples le calcul et l’interprétation de la covariance :
Exemple.
Tableau 2-1
xi 1 1 2 3 4
yi 2 3 1 3 2
1
3
1 2 3 4
Figure 2-1
Calcul de covariance
Cov(x,y) = 1×2+1×3+2×1+3×3+4×2
5 − 1+1+2+3+4
5 × 2+3+1+3+2
5 = −0,04
On ne constate aucun lien graphique et une valeur quasi nulle de la cova-
riance.
© Dunod. Toute reproduction non autorisée est un délit.
Exemple.
Tableau 2-2
xi 1 1,5 2 3,5 4
yi 1 2 2 2,5 3
Calcul de covariance
Cov(x,y) = 1×1+1,5×2+2×2+3,5×2,5+4×3
5 − 1+1,5+2+3,5+4 1+2+2+2,5+3
5 × 5 = 0,71
1 2 3 4
Figure 2-2
Exemple.
Tableau 2-3
xi 1 2 2,5 3 4
yi 3 2,5 2 1 0,5
1 délit
t
t i é
1 2 3 4
Figure 2-3
Calcul de covariance
ti
Cov(x,y)=
5 5 5
= −0,9
t
d T
Statistiques
Bilan
– Une covariance non nulle indique que les deux variables sont dépendantes.
– Si la covariance est positive, les variables évoluent dans le même sens.
– Si la covariance est négative, les variables évoluent en sens contraire.
1
permet pas de dire si cette dépendance est linéaire, exponentielle ou
autre.
Remarque : dans la pratique, on ne rencontre jamais ou presque de cova-
riance nulle, mais des covariances quasi nulles. On considère qu’une
covariance est quasi nulle si son ordre de grandeur est très faible devant
l’ordre de grandeur des valeurs des variables. Ainsi une covariance de 100
sera quasi nulle si les valeurs de X et de Y sont de l’ordre du million.
Tableau 2-4
xi 1 2 3 4 5 6
1 2 4 2 4 4
© Dunod. Toute reproduction non autorisée est un délit.
yi
✧
✧
✧
✧
✧
✧
✧
✧
✧
✧
✧
✧
✧
✧
✧
✧
✧
✧
✧
Figure 2-4
3 2
Ainsi 1 = × 1 + b donc b =
t i é
5 5
3 2
L’équation de la droite est donc y = x + . On peut prévoir que si
5 5
3 2 23
x = 7, alors y = ×7+ = = 4,6
ti
5 5 5
d
Remarque : cette méthode est la plus simple mais elle est imparfaite.
t
Dans une observation, les points extrêmes peuvent être non représenta-
d T
Statistiques
b) Droite de Mayer
La droite de Mayer – encore appelée droite des points moyens – apporte
une amélioration par rapport à la droite précédente car elle prend en
compte l’ensemble des points de la série.
Méthode : on sépare la série en deux sous-séries ayant le même nom-
bre de points. On détermine le point moyen de chacune des sous-séries
1
et on détermine l’équation de la droite passant par ces deux points.
Sous-série 1
4
G2
3 G
G1
2
Sous-série 2
1
1 2 3 4 5 6
Figure 2-5
7
nées de G 1 sont ; = 2;
3 3 3
4+5+6 2+4+4 10
Les coordonnées de G 2 sont ; = 5;
3 3 3
10 7
−
Le coefficient de la droite est donc 3 3 = 1
5−2 3
L’équation réduite d’une droite affine est y = ax + b
1 7
Ici a = et la doite passe par G 1 2 ;
3 3
7 1 5
Ainsi = × 2 + b, donc b =
3 3 3
9782100745302-legros-C02.qxd 26/04/16 11:10 Page 46
1 5
L’équation de la droite de Mayer est y = x + . On peut prévoir
3 3
1 5
ainsi que si x = 7, alors y = ×7+ = 4.
3 3
Remarques :
– La droite de Mayer passe par le point moyen G(3,5 ; 2,83) de l’en-
semble de la série.
– La série contient six points donc chacune des sous-séries a trois points.
Le problème se pose si le nombre de points de la série est impair. Dans
ce cas, il existe un point au centre de la série qui pourra aussi bien être
dans la première sous-série que dans la seconde. On choisit de couper ce
point en deux. Dans une série de 3 points, chacune des deux sous séries
va contenir 1,5 points. Pour déterminer les coordonnées des points
moyens, on devra pondérer les coordonnées du point au centre par 0,5.
∂a
+ . . . + 2xn (axn + b − yn ) = 0 , et
∂d 2
= 2(ax1 + b − y1 ) + 2(ax2 + b − y2 )
∂b
ti
+ . . . + 2(axn + b − yn ) = 0
d
= x1 y1 + x2 y2 + . . . + xn yn ,
©D
a(x1 + x2 + . . . + xn ) + bn = y1 + y2 + . . . + yn
9782100745302-legros-C02.qxd 26/04/16 11:10 Page 47
Statistiques
La seconde équation est équivalente à en remplaçant cette expression de
b dans la première équation induit :
1
a= . On en déduit une méthode générale pour calculer
Var(X)
l’équation de la droite des moindres carrés.
(X,Y )
Méthode : l’équation de cette droite est y = ax + b avec a = Cov
Var(X)
et b = yG − ax G , en notant Cov(X,Y ) la covariance de X et Y,
Var(X) la variance de X (ou l’écart-type de X au carré) et (x G ; yG )
les coordonnées du point moyen de la série.
© Dunod. Toute reproduction non autorisée est un délit.
Figure 2-6
19
Cov(X,Y ) 12 19
On a : = =
Var(X) 35 35
12
7 17 17 19 7 14
On a : G ; d’où b = − × =
2 6 6 35 2 15
19 14
L’équation de la droite des moindres carrés est donc y =
x+
35 15
19 14
On peut prévoir ainsi que si x = 7 alors y = ×7+ ≈ 4,73
35 15
Propriétés :
1. Si r > 0 (respectivement r < 0), la régression linéaire par la droite
des moindres carrés conduit à une droite croissante (respectivement
décroissante).
2. On a : −1 ≤ r ≤ 1
3. Si r = 1 ou r = −1, les points sont alignés. Ainsi, plus r est proche délit
de 1 ou de – 1, plus la régression linéaire est appropriée.
t
Cov(X,Y )
est y = a1 x1 + a2 + x2 + . . . + an xn + b où a = Var(X)
et
b = y − a1 x 1 − a2 x 2 − . . . − an x n .
ti
autres types de régressions. Dans chaque cas, il sera utile de revenir par
une éventuelle transformation au cas de la régression linéaire. Ainsi la
©D
recherche d’une droite des moindres carrés, justifiée par une bonne
9782100745302-legros-C02.qxd 26/04/16 11:10 Page 49
Statistiques
valeur du coefficient de corrélation r, va permettre de trouver et de jus-
tifier de nouveaux types d’ajustements. Voici plusieurs exemples :
a) Ajustement exponentiel
1
Considérons l’exemple suivant :
Exemple.
Tableau 2-5
xi 0,5 1 2 3 4
yi 0,5 0,5 0,75 1,5 3,5
r
r r
Figure 2-7
© Dunod. Toute reproduction non autorisée est un délit.
xi 0,5 1 2 3 4
yi – 0,69 – 0,69 – 0,29 0,41 1,25
9782100745302-legros-C02.qxd 26/04/16 11:10 Page 50
b) Ajustement logarithme
L’ajustement logarithme est de la forme y = a ln(x) + b.
délit
1
t
t i é
1 2 3 4
Figure 2-8
Points clés 51
Statistiques
c) Ajustement puissance
1
des moindres carrés pour ln(x) et ln(y).
POINTS CLÉS
passe au plus proche de tous les points est la droite des moindres
carrés : y = ax + b avec a = Cov(X ,Y ) et b = yG − a × xG
Var(X )
➤ Il existe d’autres régressions qui peuvent se justifier par des calculs de
correlations linéaires entre deux grandeurs.Voici quelques exemples :
Tableau 2-8
Type de régression Formule de définition Calcul de corrélation
Linéaire y = ax + b Entre X et Y
EXERCICES
2.2. CAC40
Le tableau suivant indique les rentabilités journalières en pourcentage du
CAC40 et de l’action Alcatel-Lucent sur une période de 5 jours du
10 novembre 2015 au 15 novembre 2015 à 13h30 (jours du week-end
non comptés).
CAC40 0,02% 0,82% –1,94% –1,00% 0,10%
Alcatel-Lucent –2,25% 1,49% – 0,27% –2,59% 0,82%
40
t i é
ces deux actions sont sans lien. Pour autant le lien sous-jacent de ces
d
Exercices 53
Statistiques
a) Représenter graphiquement cette série.
b) Déterminer la droite de Mayer de la rentabilité de Carrefour en fonc-
tion de celle d’Arcelor-Mittal.
c) En déduire selon ce modèle une prévision pour la rentabilité de
Carrefour si Arcelor-Mittal progresse de 3 %.
1
On s’intéresse à la quantité vendue d’un produit dans un magasin en
fonction de son prix. On a constaté les résultats suivants :
Prix de vente 5 10 15 25 35 45
Quantité vendue 140 000 35 000 15 500 5 500 3 000 1 500
SOLUTIONS
Exercice 2.1
On s’intéresse à la grandeur qui a la plus forte corrélation avec les coûts
du centre. Le calcul à réaliser est donc un coefficient de corrélation entre
le coût du centre et l’une des deux grandeurs :
© Dunod. Toute reproduction non autorisée est un délit.
= 2 886,75
100+150+380+400+300+600 2
σMOD = 1002 +1502 +3802 +4002 +3002 +6002
6
− 6
= 166,38
Cov(Coût,MOD) 153 333,33
Ainsi on a : r = = = 0,3192
σCoût × σMOD 2 886,75 × 166,38
9782100745302-legros-C02.qxd 26/04/16 11:10 Page 54
Pour l’heure-machine :
Cov(Coût, Machine) =
17 000×600+19 000×1 800+25 000×3 600+22 000×3 000+24 000×3 000+19 000×1 200
6
− 17 000+19 000+25 000+6 22 000+24 000+19 000 × 600+1 800+3 600+63 000+3 000+1 200
= 3 000 000
σCoût = 2 886,75
σMachine =
600+1 800+3 600+3 000+3 000+1 200 2
6002 +1 8002 +3 6002 +3 0002 +3 0002 +1 2002
6
− 6
= 1 077,03
Ainsi on a :
Cov(Coût, Machine) 3 000 000
r= = = 0,9649
σCoût × σ Machine 2 886,75 × 1 077,03
La corrélation entre le nombre d’heures-machines et les coûts du centre
est supérieure à la corrélation entre le nombre d’heures de MOD et les
coûts du centre. On retient donc l’heure-machine comme unité d’œuvre.
Exercice 2.2
a) La représentation graphique sous forme de nuage de points de cette
série est la suivante :
2.00%
Alcatel-Lucent
1.50%
1.00% délit
0.50%
t
0.00% CAC40
t i é
-2.00%
d
-2.50%
t
-3.00%
d T
©D
9782100745302-legros-C02.qxd 26/04/16 11:10 Page 55
Solutions 55
Statistiques
b) Le coefficient de corrélation linéaire se calcule comme le rapport de
la covariance sur le produit des écart-types. On trouve ici une corréla-
tion de 0,4158. Cette corrélation est positive ce qui indique que les deux
grandeurs évoluent dans le même sens, par contre cette valeur est faible
ce qui indique un lien faible. Il faut toutefois noter que ce calcul n’a été
fait sur 5 valeurs ce qui est très peu pour faire des conclusions.
c) Le coefficient β est le coefficient directeur de la droite des moind-
1
res carrés pour cette série. La droite des moindres carrés est position-
née sur le graphique avec son équation. On trouve un coefficient
β = 0,7. Ce résultat indique que sur cette période l’action et le CAC
40 évoluent dans le même sens comme β > 0. Pour autant, l’action a
tendance à atténuer les variations du marché comme β < 1.
Exercice 2.3
a) La représentation graphique de cette série est la suivante.
1,00% Carrefour
0,50%
Arcelor-Mittal 0,00%
-7,00% -6,00% -5,00% -4,00% -3,00% -2,00% -1,00% 0.00% 1,00% 2,00%
-0,50%
-1,00%
-1,50%
-2,00%
-2,50%
© Dunod. Toute reproduction non autorisée est un délit.
-3,00%
Solutions 56
−6,24% − 3,34% − 1,82% × 0,5 −1,80% + 0,48% − 2,88% × 0,5
;
2,5 2,5
= (−4,20%; −1,10%)
Le point moyen de la seconde sous-série est :
−1,82% × 0,5 + 1,11% + 1,88% −2,88% × 0,5 + 0,52% + 0,21%
;
2,5 2,5
= (0,83%; −0,28%)
Le coefficient directeur de la droite de Mayer est ainsi
−0,28 % − (−1,10 %)
a= = 0,1631.
0,83 % − (−4,20 %)
Le point moyen de cette série est
−6,24 % − 3,34 % − 1,82 % + 1,11 % + 1,88 % −1,80 % + 0,48 % − 2,88 % + 0,52 % + 0,21 %
;
2,5 2,5
= (0,83 %; −0,28 %)
L’ordonnée à l’origine est ainsi b = −0,69 % − 0,1631 × (−1,68 %)
= −0,4197 %
L’équation de la droite de Mayer est ainsi y = 0,1631x − 0,0042 .
Si Arcelor-Mittal passe à + 3 % alors le cours de Carrefour, selon ce
modèle, devrait passer à 0,1631 × 0,3 − 0,0042 = 0,07 %
Exercice 2.4
a) Représentation graphique
Quantités vendues
120 000
t
t i é
100 000
80 000
ti
60 000
d
40 000
t
d T
20 000
©D
5 10 15 20 25 30 35 40 45 Prix
9782100745302-legros-C02.qxd 26/04/16 11:10 Page 57
Solutions 57
Statistiques
b) Dans un premier temps, calculons le coefficient de corrélation
linéaire entre les deux grandeurs :
140 000×5+35 000×10+15 500×15+5 500×25+3 000×35+1 500×45
On a Cov(Q,P) = 6
140 000+35 000+15 500+5 500+3 000+1 500 5+10+15+25+35+45
− 6
× 6
= −486 458,33
La covariance est négative : les deux grandeurs évoluent en sens inverse.
σQ =
1
140 000+35 000+15 500+5 500+3 000+1 500 2
140 0002 +35 0002 +15 5002 +5 5002 +3 0002 +1 5002
6
− 6
= 49 001,2
2
σ P = 5 +10 +15 +625 +35 +45 − 5+10+15+625+35+45 = 14,07
2 2 2 2 2 2
−486 458,33
On a donc r = 49 001,2×14,07
= −0,7056 . La corrélation linéaire est donc
moyenne.
Voyons maintenant l’opportunité d’une régression puissance. Pour cela,
on doit déterminer le coefficient de corrélation linéaire entre les loga-
rithmes des grandeurs :
Cov(ln(Q), ln(P)) =
11,8494×1,60944+10,4631×2,30259+9,64860×2,70805+8,61250×3,21888+8,00637×3,55535+7,31322×3,80666
6
σln (Q)
11,8494+10,4631+9,64860+8,61250+8,00637+7,31322 2
11,84942 +10,46312 +9,648602 +8,612502 +8,006372 +7,313222
= 6
− 6
= 1,5311
σln(P)
1,60944+2,30259+2,70805+3,21888+3,55535+3,80666 2
1,609442 +2,302592 +2,708052 +3,218882 +3,555352 +3,806662
= 6
− 6
= 0,7534
−1,1529
On a donc r = 1,5311×0,7534
= −0,9994
La corrélation est donc très forte. La régression puissance semble donc
significativement meilleure que la régression linéaire pour cette série.
9782100745302-legros-C02.qxd 26/04/16 11:10 Page 58
délit
t
t i é
ti
d
t
d T
©D
9782100745302-legros-C03.qxd 26/04/16 11:13 Page 59
3
CHAPITRE
Séries chronologiques
Exemple.
Tableau 3-1 Cours de clôture d’une action
Jour 0 1 2 3 4 5 6
Cours
3,0
2,9
2,8
2,7
2,6
1 2 3 4 5 6 Jour
Figure 3-1
Modélisons cette série par une régression linéaire (droite des moindres
carrés, en pointillés). Cette droite indique une évolution globale crois-
sante. Cette droite sera appelée tendance ou trend pour une série chro-
nologique. On constate que des variations positives ou négatives existent
autour de la tendance. Il s’agit d’un phénomène dit saisonnier. La cour-
be des cours semble rebondir sur une droite imaginaire, cette droite est
appelée support (droite en rose) et semble limitée en hauteur par une
droite imaginaire appelée résistance (droite en rouge). La connaissan-
ce de la tendance, du support, de la résistance et du phénomène saison-
nier va permettre de comprendre une évolution et de faire des prévisions. délit
Comment déterminer la tendance ? La droite des moindres carrés est une
possibilité d’après l’exemple du Tableau 3-1. Les ajustements du chapi-
t
geable dans certains cas. Comment justifier ces choix ? Les variations
saisonnières diminuent la valeur du coefficient de corrélation linéaire.
Son calcul est donc peu pertinent. On se limitera alors à une observation
graphique pour choisir le bon ajustement.
ti
d
Statistiques
3.1 TECHNIQUES DE LISSAGE
a) Moyennes mobiles
Les moyennes mobiles servent à déterminer une tendance centrale dans
une série chronologique. Les moyennes mobiles se calculent en effec-
tuant la moyenne des valeurs autour du point considéré. Le nombre de
valeurs prises en considération pour réaliser cette moyenne est la période.
1
Dans l’exemple suivant, on effectue le calcul des moyennes mobiles
pour yi avec différentes périodes.
Exemple.
Tableau 3-2 Moyennes mobiles
xi 0 1 2 3 4 5 6
yi 1 0 3 1 3 2 5
MM2 1 1,75 2 2,25 3 3
MM3 1,33 1,33 2,33 2 3,33 2,33
MM5 1,6 1,8 2,8 2,2 2,8
➥
xi 7 8 9 10 11 12 13
yi 0 4 5 2 3 0 2
MM2 2,25 3,25 4 3 2 1,25
MM3 3 3 3,67 3,33 1,67 1,67
MM5 3,2 3,2 2,8 2,8 2,4
© Dunod. Toute reproduction non autorisée est un délit.
Mode de calcul
– Pour la période 3 : la première valeur ne peut pas être calculée car
on ne dispose pas d’un chiffre à sa gauche. On calcule donc la sui-
vante. Les trois valeurs sont 1 ; 0 et 3, la moyenne mobile associée
1+0+3
est donc = 1,33 . Pour le calcul suivant, on coulisse la
3
sélection des trois valeurs d’un cran, les valeurs à considérer sont
donc : 0 ; 3 ; 1 et la moyenne mobile est 1,33 à nouveau. On conti-
nue ainsi de suite.
– Pour la période 5 : les deux premières valeurs ne sont pas calculables
car il manque deux valeurs à gauche. La troisième valeur se calcule
en effectuant la moyenne de 1 ; 0 ; 3 ; 1 ; 3. On trouve
9782100745302-legros-C03.qxd 26/04/16 11:13 Page 62
1+0+3+1+3
= 1,6 . Pour la suivante on considère les cinq
5
valeurs qui suivent en décalant d’un cran : 0 ; 3 ; 1 ; 3 ; 2. D’où une
moyenne de 1,8. On continue ainsi de suite.
– Pour la période 2 : le problème va se poser plus généralement
lorsque la période est paire. Pour centrer autour de la valeur considé-
rée, on coupe les valeurs limites en deux. Par exemple, pour le pre-
mier calcul les valeurs considérées sont 1 ; 0 et 3. La valeur centrale
est 0, on la compte donc une fois, par contre les deux valeurs limites
1 et 3 seront comptés une demi fois de manière à avoir un total de 2
0,5 × 1 + 0 + 0,5 × 3
points. Le calcul est donc : =1
2
MM 2
5
MM 3
MM 4
4
1 2 3 4 5 6 7 8 9 10 11 12 13
On constate que plus la période est grande, moins les moyennes mobi-
t
sage souhaité :
– Période trop petite ⇒ Prise en compte trop importante des évolu-
t
Statistiques
Remarque : les moyennes mobiles permettent de lisser une courbe et
donc d’en simplifier la lecture par contre, à l’inverse des régressions du
chapitre précédent, elles ne permettent pas de faire des prévisions.
b) Lissage exponentiel
Les moyennes mobiles, bien qu’elles soient d’un usage important pré-
1
sentent plusieurs inconvénients. Elles se calculent pour un nombre arbi-
traire de valeurs. Ce nombre est difficile à déterminer en pratique
comme il dépend du nombre de valeurs significatives du passé pour
représenter le futur. Une autre insuffisance des moyennes mobiles est
qu’elles accordent exactement le même poids à chacune des valeurs
considérées or plus la valeur d’une série est lointaine dans le passé moins
cette valeur semble faire sens quand il s’agit de lisser une série.
Le lissage exponentiel permet de répondre en partie à ces imperfec-
tions des moyennes mobiles. On considère un paramètre de lissage a
avec 0 < a < 1. Ce paramètre permet de pondérer les valeurs passées
d’une série par le coefficient a n . Ce coefficient étant décroissant avec
n, une importance décroissante est associée aux valeurs en fonction de
leur éloignement dans le passé. À l’instant t, le lissage exponentiel se
définit ainsi comme :
X t + a X t−1 + a 2 X t−2 + . . . + a n X t−n + . . .
Lt =
1 + a + a2 + . . . + an + . . .
1
Comme 1 + a + a 2 + . . . + a n = , on a :
1−a
L t = (1 − a)(X t + a X t−1 + a 2 X t−2 + . . . + a n X t−n + . . .)
© Dunod. Toute reproduction non autorisée est un délit.
Ainsi,
L t = (1 − a)X t + a (1 − a)(X t−1 + a X t−2 + . . . + a n−1 X t−n + . . .)
Par conséquent,
L t = (1 − a)X t + a L t−1 .
Cette dernière relation est une relation de récurrence. En pratique on
peut fixer le premier terme du lissage égal au premier terme de la série
(L 0 = X 0 ).
Remarque : Le coefficient a représente l’importance accordée au passé.
Plus le coefficient est grand plus le poids relatif du dernier lissage est
important relativement à la nouvelle valeur.
9782100745302-legros-C03.qxd 26/04/16 11:13 Page 64
160
Cours boursier
140 Lissage a = 0,5
120 Lissage a = 0,9
100
80
60
40
20
Temps
0
0 20 40 60 80 100
[BC]. La parallèle à cette droite passant par B est la résistance (en rouge) et la
parallèle à cette droite passant par C est le support (en rose).
©D
9782100745302-legros-C03.qxd 26/04/16 11:13 Page 65
Statistiques
4
B
3
C
2
1
1
A
1 2 3 4 5 6
Figure 3-3
Modèle multiplicatif
4
2
Modèle additif
1
Modèle multiplicatif
1 2 3 4 5 6 7 8 9 10 11 12 13
Exemple.
Tableau 3-3
xi 0 1 2 3 4 5
yi 3 4 2,5 3,5 1,5 2,5
4
délit
3
t
t i é
1
ti
d
1 2 3 4 5 6
t
Figure 3-5
d T
©D
9782100745302-legros-C03.qxd 26/04/16 11:13 Page 67
Statistiques
Tableau 3-4 Écart entre tendance et valeurs
xi yi ti yi − ti
0 3 3,4762 – 0,4762
1 4 3,2191 0,7809
2 2,5 2,962 – 0,462
1
3 3,5 2,7049 0,7951
4 1,5 2,4478 – 0,9478
5 2,5 2,1907 0,3093
Le Tableau 3-4 renseigne sur l’écart entre la tendance et les valeurs réel-
les de la série. On constate que cette série a deux saisons caractérisées
alternativement par un écart à la tendance positif et un écart à la tendan-
ce négatif. On peut supposer que cette habitude de la série va se pour-
suivre. Pour réaliser une prévision, il serait bon de déterminer un écart
moyen entre la tendance et les valeurs selon la saison.
– Pour la saison positive l’écart moyen est de :
0,7809 + 0,7951 + 0,3093
= 0,6284
3
– Pour la saison négative l’écart moyen est de :
−0,4762 − 0,462 − 0,9478
= −0,6287
3
Ces deux valeurs seront admises comme coefficients saisonniers : si .
© Dunod. Toute reproduction non autorisée est un délit.
xi 1 2 3 4 5 6
yi 0,5 2 0,5 2,5 1 4
1 2 3 4 5 6
Figure 3-6
La droite des moindres carrés de cette série est : y = 0,4714 × x + 0,1 délit
Cette droite est la tendance ti .
t
yi
xi yi ti
ti
1 0,5 0,5714 0,8750
ti
2 2 1,0428 1,9179
d
5 1 2,457 0,407
6 4 2,9284 1,3659
©D
9782100745302-legros-C03.qxd 26/04/16 11:13 Page 69
Statistiques
De la même manière que dans la série précédente, on constate alternati-
vement une saison positive suivie d’une saison négative.
– Pour la saison positive, le coefficient saisonnier moyen est :
1,9179 + 1,2591 + 1,3659
= 1,5143
3
– Pour la saison négative, le coefficient saisonnier moyen est :
1
0,8750 + 0,3302 + 0,407
= 0,5374
3
Remarque : la somme des coefficients moyens est proche de 2. De
manière générale, la somme des coefficients saisonniers sera proche du
nombre de saisons.
Prévisons :
– Pour xi = 7 : on a ti = 0,4714 × 7 + 0,1 = 3,3998 d’après la droi-
te des moindres carrés. La période 6 était positive par conséquent la
suivante sera négative, ainsi si = 0,5374. La prévision est donc :
yi = 3,3998 × 0,5374 = 1,8271
– Pour xi = 8 : on a ti = 0,4714 × 8 + 0,1 = 3,8712 d’après la droi-
te des moindres carrés. La période 7 était négative par conséquent la
suivante sera positive, ainsi si = 1,5143. La prévision est donc :
yi = 3,8712 × 1,5143 = 5,8622
Exemple.
Tableau 3-7
xi 0 1 2 3 4 5 6
yi 3,5 3,7 3,7 3,9 4 4,4 4,5
Ici le dernier cours est 4,5, l’amplitude est 4,5 – 3,5 = 1. Les différents
retracements envisageables sont :
– Pour un ratio de 38 % : 4,5 − 0,38 × 1 = 4,12
– Pour un ratio de 50 % : 4,5 − 0,5 × 1 = 4
– Pour un ratio de 62 % : 4,5 − 0,62 × 1 = 3,88
a) Le Momentum
Le Momentum mesure la variation entre des cours observés distants de
n observations. On a : délit
Mt = X t − X t−n .
t
t i é
Statistiques
Ht
RS I = 100
Ht + Bt
1
c) Oscillateur et MACD
La tendance générale d’une série peut être déterminée par le calcul des
moyennes mobiles ou des lissages exponentiels. On peut mettre en évi-
dence des variations de tendance en comparant deux moyennes cons-
truites des durées différentes. L’oscillateur est la mesure de différence
entre la moyenne courte et la moyenne longue :
Ot = MCt − M L t
Les changements de signe de l’oscillateur indiquent des changements de
tendance. Le MACD est un indicateur similaire construit entre un lissa-
ge exponentiel court terme et un lissage exponentiel long terme.
d) Autocorrélation
Un moyen pour évaluer le lien qui existe entre une période et une autre
période est de calculer l’autocorrélation qui est la corrélation d’une série
de valeur avec cette même série mais avec un décalage des valeurs dans
le temps. On appelle période de l’autocorrélation le décalage de temps
entre la série et la série décalée.
© Dunod. Toute reproduction non autorisée est un délit.
POINTS CLÉS
➤ Momentum :
t i é
Mt = X t − X t−n
➤ RSI :
Ht
ti
RS I = 100
Ht + Bt
d
➤ Oscillateur/MACD :
t
Ot = MCt − M L t
d T
©D
9782100745302-legros-C03.qxd 26/04/16 11:13 Page 73
Exercices 73
Statistiques
EXERCICES
1
2006 2007 2008 2009
Trimestre 1 30 35 38 40
Trimestre 2 45 50 52 56
Trimestre 3 150 160 165 180
Trimestre 4 80 90 95 100
Semaine 2 31 34 36 40 35
Semaine 3 32 36 39 50 42
3.3 Estimations
Voici le cours d’une action sur plusieurs jours :
Jour 1 2 3 4 5 6 7 8 9 10
t
Cours 101 101,3 100,8 101,6 102 101,8 100,9 102,5 103,2 101,8
t i é
➥
Jour 11 12 13 14 15 16 17 18 19 20
Cours 102,4 103,9 105 108 110 106,5 105,7 106 109,5 112
ti
Solutions 75
Statistiques
3.5 Indicateurs de puissance
On considère la série cours suivant :
Jour 0 1 2 3 4 5 6 7 8 9
Cours 100 93,24 100,44 100,27 94,15 112,91 121,51 115,74 130,19 136,49
➥
Jour 10 11 12 13 14 15 16 17 18 19
1
Cours 127,50 144,83 155,95 163,42 162,89 153,68 149,62 130,01 121,48 121,34
➥
Jour 20 21 22 23 24 25
Cours 113,31111,43 113,10 125,55 131,94 131,11
SOLUTIONS
Exercice 3.1
a)
190
170
© Dunod. Toute reproduction non autorisée est un délit.
150
130
110
90
70
50
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
res réalisé est sensiblement plus important dans les périodes de vacan-
ces. On peut supposer que ces écarts vont se maintenir en 2010.
©D
9782100745302-legros-C03.qxd 26/04/16 11:13 Page 77
Solutions 77
Statistiques
Exercice 3.2
a)
52
48
45
1
42
39
36
33
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
yi yi
xi yi ti xi yi ti
ti ti
1 30 29,8 1,0067 9 40 36,657 1,0912
2 32 30,657 1,0438 10 35 37,514 0,9330
3 33 31,514 1,0472 11 32 38,371 0,8340
4 35 32,371 1,0812 12 36 39,229 0,9177
5 32 33,229 0,9630 13 39 40,086 0,9729
6 31 34,086 0,9095 14 50 40,943 1,2212
7 34 34,943 0,9730 15 42 41,8 1,0048
8 36 35,8 1,0056
➥
9782100745302-legros-C03.qxd 26/04/16 11:13 Page 78
xi ti
t i é
Coefficient Estimation
16 42,657 0,9167 39,1037
17 43,514 0,9782 42,5654
ti
Solutions 79
Statistiques
Exercice 3.3
a)
A
10
C
9
1
8
7
B
1 2 3 4 5 6 7 8
b) On place les points A(1 ; 10), B(4 ; 7) et C(5 ; 9). Le milieu de [BC]
est de coordonnées (4,5 ; 8). La droite qui passe par A et le milieu de
8 − 10 4
[BC] a pour coefficient directeur : =− = −0,5714 .
4,5 − 1 7
La résistance est la parallèle à cette droite passant par C . Ainsi, le coef-
4
ficient directeur de la résistance est aussi − . L’ordonnée à l’origine
7
4 83
est : 9 − 5 × − = = 11,8571 . Ainsi, l’équation de la résis-
7 7
4 83
tance est y = − ×x+
7 7
© Dunod. Toute reproduction non autorisée est un délit.
Exercice 3.4
a) Calcul des moyennes mobiles :
Jour 1 2 3 4 5 6 7 8
Cours 101 101,3 100,8 101,6 102 101,8 100,9 102,5
MM4 101,18 101,43 101,55 101,58 101,8
MM8 101,49
➥
Jour 9 10 11 12 13 14 15 16
Cours 103,2 101,8 102,4 103,9 105 108 110 106,5
MM4 102,1 102,1 102,48 102,83 103,28 104,83 106,73 107,38
MM8 101,76 101,83 102,03 102,31 102,69 103,46 104,6 105,1
➥
Jour 17 18 19 20
Cours 105,7 106 109,5 112
MM4 107,55 107,05 106,93 108,3
MM8 105,41 105,94 106,93 107,84
On note que dans cet exercice les moyennes mobiles ne sont pas calcu-
lées comme dans le cours. Elles sont calculées soit avec les quatre délit
valeurs précédentes, soit avec les huit valeurs précédentes.
Par exemple, pour la première moyenne mobile de période 4, on trouve :
t
= 101,18
4
b) Utilisation des moyennes mobiles pour donner un conseil.
ti
Solutions 81
Statistiques
– Acheter le jour 12 à 103,9 euros.
– Vendre le jour 16 à 106,5 euros.
– Acheter le jour 19 à 109,5 euros.
Moyennes mobiles de période 8 :
– Vendre le jour 10 à 101,8 euros.
– Acheter le jour 11 à 102,4 euros.
1
Le choix de la période dans les moyennes mobiles est déterminant dans
le choix. Une période trop courte donne trop de signaux et induit trop de
mouvements, alors qu’une période trop longue n’en fournit pas assez.
Cette méthode n’est pas parfaite : on constate en effet qu’elle peut inci-
ter dans certains cas à prendre de mauvaises décisions.
Exercice 3.5
a) On calcule les moyennes mobiles à partir des valeurs passées et non
des valeurs futurs. Cela induit un effet de retard mais correspond à la pra-
tique (un jour donné on ne connait pas les évolutions à venir).
Jour 0 1 2 3 4 5 6 7 8 9
Cours 100 93,24 100,44 100,27 94,15 112,91 121,51 115,74 130,19 136,49
MM2 96,62 96,84 100,35 97,11 103,53 117,23 118,64 122,96 133,34
MMS 97,62 100,20 105,86 108,92 114,91 123,38
Oscillateur –0,41 3,33 11,37 9,72 8,05 9,96
➥
Jour 10 11 12 13 14 15 16 17 18 19
Cours 127,50 144,83 155,95 163,42 162,89 153,68 149,62 130,01 121,48 121,34
© Dunod. Toute reproduction non autorisée est un délit.
MM2 131,99 136,16 150,39 159,69 163,15 158,29 151,65 139,82 121,48 121,41
MMS 126,29 130,95 138,99 145,65 150,92 156,16 157,11 151,92 21,96 30,99
Oscillateur 5,70 5,22 11,40 14,05 12,24 2,13 –5,46 –12,11 99,52 90,42
➥
Jour 20 21 22 23 24 25
Cours 113,31 111,43 113,10 125,55 131,94 131,11
MM2 117,32 112,37 112,26 119,33 128,75 131,53
MMS 37,85 116,89 116,13 116,94 119,07 122,63
Oscillateur 79,47 –4,52 –3,87 2,38 9,68 8,90
170,00
Cours
160,00 MM2
150,00 MM5
140,00
130,00
120,00
110,00
100,00
90,00
80,00
0 5 10 15 20 25
Jours
Il est préconisé d’acheter lorsque l’oscillateur passe en positif et de ven-
dre dans le cas contraire. Ainsi dans cet exemple, il faudrait acheter aux
dates 5 et 23 et vendre à la date 16.
b) On s’intéresse maintenant aux lissages exponentiels de manière à cal-
culer un MACD. On trouve le résultat suivant avec la courbe associée
Jour 0 1 2 3 4 5 6 7 8 9
Cours 100 93,24 100,44 100,27 94,15 112,91 121,51 115,74 130,19 136,49
L0.15 100 98,99 99,20 99,36 98,58 100,73 103,85 105,64 109,32 113,39
L0.25 100 99,83 99,85 99,86 99,71 100,04 100,58 100,96 101,69 102,56
MACD 0,00 –0,85 –0,64 –0,49 –1,13 0,69 3,27 4,68 7,63 10,83
➥
délit
Jour 10 11 12 13 14 15 16 17 18 19
Cours 127,50 144,83 155,95 163,42 162,89 153,68 149,62 130,01 121,48 121,34
t
L0.15 115,51 119,91 125,32 131,03 135,81 138,49 140,16 138,64 136,06 133,85
t i é
L0.25 103,18 104,23 105,52 106,97 108,36 109,50 1110,50 110,99 111,25 111,50
MACD 12,33 15,68 19,80 24,06 27,45 28,99 29,66 27,65 24,81 22,35
➥
Jour 20 21 22 23 24 25
ti
d
Solutions 83
Statistiques
170,00
Cours
160,00
MM2
150,00
MM5
140,00
130,00
1
120,00
110,00
100,00
90,00
80,00
0 5 10 15 20 25
Jours
Jour 20 21 22 23 24 25
Cours 113,31 111,43 113,10 125,55 131,94 131,11
Hausse 1,67 12,45 6,39
Baisse 8,02 1,88 0,83
Ht 0,00 0,00 1,67 7,06 6,84 6,84
Bt 5,67 4,69 4,69 3,35 4,95 1,36
RSI 0,00 0,00 26,29 67,82 57,99 83,45
2
PARTIE
Probabilités
4
CHAPITRE
Notions de base
de probabilités
Probabilités
➤ Maîtriser les éléments du dénombrement (p-listes, arrangements et
combinaisons) .
➤ Savoir calculer la probabilité d'un événement.
OBJECTIFS
2
➤ Calculer l'espérance et l'écart-type d'une variable aléatoire.
➤ Représenter graphiquement une fonction de répartition.
4.1 Dénombrement
PLAN
4.1 DÉNOMBREMENT
L’outil du dénombrement est indispensable pour le calcul des probabili-
tés dans les cas finis discrets. On entend par « finis discrets » des cas
pour lesquels on peut compter (dénombrer) les issues possibles. Par
exemple, un lancé de dé est une expérience dont les résultats sont dans
l’ensemble {1,2,3,4,5,6}. Un contre-exemple est le temps d’attente à une
caisse, on ne peut a priori pas lister l’ensemble des résultats possibles.
Cette partie est une présentation des éléments les plus classiques du
dénombrement.
a) p-listes
Exemple. Une banque distribue à chacun de ses clients un identifiant de
connexion formé de six chiffres entre 0 et 9. Combien cette banque peut-
elle avoir de clients au maximum avec ce mode de connexion ?
Il est clair que deux clients ne peuvent pas avoir le même identifiant et que
chaque client a un unique identifiant. L’ordre des chiffres a une importan-
ce mais chaque chiffre peut être utilisé plusieurs fois. Ainsi, il y a dix pos-
sibilités pour le premier chiffre de l’identifiant, il y en a aussi dix pour le
second, et à chaque fois dix chiffres possibles pour chaque chiffre de
l’identifiant. Ainsi on a 10 × 10 × 10 × 10 × 10 × 10 = 106 = 1 000 000
identifiants possibles, par conséquent la banque peut avoir au plus
1 000 000 de clients avec ce mode de connexion.
4.1 • Dénombrement 89
b) Arrangements
Probabilités
Considérons l’exemple précédent avec la contrainte de n’utiliser qu’une
seule fois chaque chiffre, pour le premier chiffre du code, il y a 10 choix
possibles. Pour le second, il n’y en a plus que 9 : tous les chiffres
de 0 à 9 sauf celui utilisé en premier. Pour le troisième, il n’y en a
plus que 8. Ainsi le nombre de codes possible est
10 × 9 × 8 × 7 × 6 × 5 = 151 200 . Le nombre de clients possible est
alors 151 200.
2
Cet exemple est l’illustration de la formule de dénombrement des
arrangements :
n!
n × (n − 1) × (n − 2) × (n − 3) × · · · × (n − p + 1) =
(n − p)!
p
= An
où n représente le nombre d’éléments possible et p la longueur de
l’arrangement.
Rappel : n ! = 1 × 2 × 3 × 4 × · · · × n
© Dunod. Toute reproduction non autorisée est un délit.
c) Combinaisons
Exemple. On doit choisir deux salariés dans une équipe de cinq salariés
pour effectuer une mission spécifique. De combien de façon peut-on
choisir ces deux salariés ?
A priori tous les couples sont possibles, en notant les salariés A, B, C, D
et E les différents couples possibles sont (A,B) ; (A,C) ; (A,D) ; (A,E) ;
9782100745302-legros-C04.qxd 26/04/16 11:20 Page 90
(B,C) ; (B,D) ; (B,E) ; (C,D) ; (C,E) et (D,E) soit en tout dix couples pos-
sibles. On remarque que l’ordre n’a pas d’importance : le couple (A,B)
est le même que (B,A).
Exemple.
5 5! 5×4×3×2×1 5×4
• = = = = 10
2 2!(5 − 2)! 2×1×3×2×1 2
39 39!
• =
33 33!(39 − 33)!
39 × 38 × 37 × 36 × 35 × 34 × 33 × 32 · · · × 1
=
33 × 32 · · · × 1 × 6 × 5 × 4 × 3 × 2 × 1
39 × 38 × 37 × 36 × 35 × 34
= = 3 262 623
6×5×4×3×2×1
Propriétés
Certaines propriétés évitent de perdre du temps en calculs :
n n
1. = = 1 , ainsi
0 n
9782100745302-legros-C04.qxd 26/04/16 11:20 Page 91
4.1 • Dénombrement 91
n n 39
2. = = n, ainsi = 39
1 n−1 38
n n 5 5
3. = , ainsi = = 10
p n−p 2 3
Le triangle de Pascal
Le triangle de Pascal permet de calculer simplement les premières
n n−1 n−1 n
valeurs de grâce à la relation : + =
p p−1 p p
Probabilités
Tableau 4-1 Triangle de Pascal
0 1 2 3 4 5 6 7
0 1
1 1 1
2
2 1 2 1
3 1 3 3 1
4 1 4 6 4 1
5 1 5 10 10 5 1
6 1 6 15 20 15 6 1
7 1 7 21 35 35 21 7 1
Notons que les chiffres en gras dans la première ligne sont les valeurs de
p et les chiffres en gras dans le première colonne sont les valeurs de n.
© Dunod. Toute reproduction non autorisée est un délit.
Probabilités
Figure 4-1 Représentation schématique des événements
On a la relation suivante :
P(A ∪ B) = P(A) + P(B) − P(A ∩ B).
2
Si A et B sont incompatibles, autrement dit si A ∩ B = ∅, on a :
P(A ∪ B) = P(A) + P(B)
Exemple. Deux questions sont posées dans un questionnaire. 40 % des
personnes répondent oui aux deux questions, 56 % répondent oui à la pre-
mière question et 78 % répondent oui à l’une ou l’autre des deux ques-
tions. Quel pourcentage a répondu oui à la deuxième question ?
Il ne s’agit pas explicitement de probabilités mais le raisonnement est
identique. Notons O1 l’événement « répondre oui à la première ques-
tion » et O2 l’événement « répondre oui à la deuxième question ».
© Dunod. Toute reproduction non autorisée est un délit.
c) Le cas d’équiprobabilité
Exemple. Une usine a produit 346 pièces dont 23 sont défectueuses. On
prélève au hasard une pièce, quelle est la probabilité qu’elle soit défec-
tueuse ?
23
La réponse est évidente : = 6,65 % .
346
Nous sommes dans un cas d’équiprobabilité, chaque événement est
constitué d’éléments qui ont chacun la même probabilité d’apparition.
Dans l’exemple les éléments sont les pièces. Ces pièces ont chacune une
1
probabilité d’être prélevée. L’événement « être défectueuse » est
346
réalisé par 23 pièces sur 346.
d) Probabilités conditionnelles
Dépendance d’événements
Probabilités
par un arbre :
0,05 D
A
0,4 0,95 –
D
2
0,6
0,04 D
B
0,96 –
D
Figure 4-2 Arbre de probabilités
Méthode de calcul
– Sur une même branche, les probabilités se multiplient.
– Sur deux branches différentes, les probabilités s’ajoutent.
On trouve ainsi P(D) = 0,4 × 0,05 + 0,6 × 0,04 = 4,4 % .
Remarque : la schématisation par un arbre évite de formaliser le pro-
blème mais ne permet pas de répondre à la seconde question de l’exem-
ple.
Pour cela, introduisons la formule des probabilités conditionnelles.
Indépendance
Deux événements ne sont pas toujours dépendants. On dit que A et B sont
indépendant si PA (B) = P(B) ou PB (A) = P(A). Cela indique que la
réalisation de B n’a aucune incidence sur celle de A et réciproquement.
Une propriété est souvent utile pour montrer que deux événements sont
indépendants :
e) Partition d’événements
On dit que la famille d’événements E 1 , E 2 , E 3 , · · · , E n forme une par-
tition de l’ensemble des possibles si :
• E i ∩ E j = ∅ si i = j
• E1 ∪ E2 ∪ E3 · · · En =
Une partition d’événements peut servir à calculer la probabilité d’un
événement A par la formule :
Probabilités
le CAC40 ne soit pas en baisse : P( Ā ∩ B). On trouve ainsi la probabi-
lité que le cours de l’action EDF monte : P(B) en additionnant les deux
probabilités précédentes.
a) Variable discrète
2
Loi de probabilité
0 1 2
0 0 1 2
1 1 0 1
2 2 1 0
ei 0 1 2
3 4 2
pi
9 9 9
Espérance et variance
Espérance : la notion d’espérance en probabilités rejoint la notion de
moyenne en statistiques. L’espérance est un indicateur de tendance cen-
trale pour la variable aléatoire.
Formule de l’espérance :
E(X) = xi × pi
i∈
Formule de la variance :
2
V (X) = E(X ) − (E(X)) =
2 2
xi × pi −
2
xi × pi
i∈ i∈
Ainsi la formule de l’écart-type est :
√
σ (X) = V (X) = E(X 2 ) − (E(X))2
Probabilités
9 9 9 9 81
44
Ainsi σ (écart) = ≈ 0,737
81
2
ble aléatoire. On prendra comme exemple la variable aléatoire E.
On représente la distribution d’une variable aléatoire discrète par un
diagramme en bâton. Chaque bâton représente la probabilité
P(X = xi ) . L’interprétation de ce diagramme est très simple.
P (X = xi )
4
9
3
9
© Dunod. Toute reproduction non autorisée est un délit.
2
9
xi
0 1 2
Figure 4-3 Distribution de E
F (x)
9
9 [
[ [
6
9
3
9 [ [
xi
[
0 1 2
Figure 4-4 Fonction de répartition de E
b) Variable continue
Loi et représentation
Les variables continues sont des variables pour lesquelles toutes les
valeurs sont possibles dans un intervalle donné.
Exemple. Pour le temps d’attente à une caisse, on peut raisonnablement
admettre que ce temps est compris entre 0 et une heure et que tous les
temps d’attente sont envisageables entre 0 et 1 heure.
Probabilités
xi
2
On pourrait encore diviser les intervalles en une partition fine, au point
de ne plus avoir une succession de rectangles mais une courbe continue.
Cette courbe (en noir sur la figure) est la fonction de densité de la varia-
ble aléatoire.
La fonction de densité est une fonction f qui permet de définir la loi
d’une variable aléatoire X. Elle vérifie deux critères :
• f (x) ≥ 0 pour tout x dans .
• f (x)dx = 1 autrement dit la somme des probabilités est égale à 1.
© Dunod. Toute reproduction non autorisée est un délit.
Espérance et écart-type
La densité permet aussi de calculer l’espérance et la variance d’une
variable aléatoire. +∞
Formule de l’espérance : E(X) = x f (x)dx
−∞
La variance se calcule par la formule : V (X) = E(X 2 ) − (E(X))2 avec
+∞
E(X ) =
2
x 2 f (x)dx .
−∞
√
On trouve l’écart-type par la formule : σ (X) = V (X).
√ √ √
σ (X) + σ (Y ) , car mathématiquement a + b = a + b. Les pro-
priétés de l’écart-type se déduisent de celles de la variance par passa-
ge à la racine carrée.
Probabilités
activité de base en décroissance. Dans cette partie nous discuterons à
travers le modèle de Markovitz l'opportunité de la diversification. Ce
modèle est appliqué de manière similaire pour la diversification des
activités en entreprise.
2
tées par des variables aléatoires notées R1 et R2 . Ces actions sont
connues par leurs performances moyennes E(R1 ) et E(R2 ), et leurs
volatilités σ1 et σ2 . Le choix des deux actions se fait entre une action
moins rentable et moins risquée (action 1) avec une action plus renta-
ble et plus risquée (action 2). L'objectif est de déterminer la proportion
idéale de chaque action dans le portefeuille pour répondre à un pro-
blème de gestion du couple risque-rentabilité. Notons p la proportion
d'investissement dans l'action 1. La rentabilité globale du portefeuille
est donc R = p R1 + (1 − p)R2 . La performance moyenne du porte-
feuille est alors :
© Dunod. Toute reproduction non autorisée est un délit.
ainsi :
∂σ 2
= 0 = 2 pσ12 − 2(1 − p)σ22 + 2(1 − 2 p)σ2 ρ1,2 , (7)
∂p
σ22 − σ1 σ2 ρ1,2
p= . (8)
σ12 + σ22 − 2σ1 σ2 ρ1,2
Probabilités
Il est clair que cette formule ne peut être valable pour toute valeur de
la corrélation. Par exemple, pour une corrélation égale à 1 la relation
(9) indique une proportion minimisant le risque supérieure à 100 %.
Cela indique simplement qu'il n'est pas possible dans ce cas d'obtenir
une amélioration du risque par rapport à l'action la moins risquée et
que dans un but de simple minimisation du risque la diversification ne
2
présente alors pas d'intérêts.
Résumons les cas simples pour la formule (8) :
9%
Rentabilité 100 %
8% d'action 2
7% Corrélation
parfaitement
positive
6%
Corrélation
parfaitement
5%
négative
Corrélation nulle
4%
100 %
Volatilité
d'action 1
3%
0% 2% 4% 6% 8%
Probabilités
POINTS CLÉS
➤ Modes de dénombrement
2
p-liste Tirages successifs avec remise np
n! = Apn
Arrangements Tirages successifs sans remise
(n − p)!
n n!
Combinaisons Tirages simultanés =
p p!(n − p)!
née par PB (A) = P(A ∩ B) . Pour éviter une formalisation trop poussée
P(B)
on peut utiliser la représentation sous forme d’arbre de probabilités.
Dans le cas d’événements indépendants, on a P(A ∩ B) = P(A) × P(B) .
9782100745302-legros-C04.qxd 26/04/16 11:20 Page 108
➤ Lois de probabilités
– Dans le cas discret : la loi de probabilité d’une variable aléatoire
discrète est l’association des valeurs possibles de la variable et de
leurs probabilités associées. On peut donner la loi de probabilité
sous forme de tableau lorsque l’ensemble des possibles est fini ;
sinon on explicite la formule P(X = xi ) .
– Dans le cas continu : la donnée de la densité f suffit à définir la loi
de probabilité car elle permet le calcul de
b
P(a X b) = f (x)dx quels que soient a et b .
a
➤ Espérance et écart-type
– L’espérance est un indicateur de tendance centrale. Elle se calcule
par la formule xi × pi pour les variables discrètes et par la for-
i ∈Ω
+∞
mule xf (x)dx pour les variables continues.
−∞
– Propriétés :
E(aX + bY + c) = aE(X ) + bE(Y ) + c
V (aX + bY + c) = a2 V (X ) + b2 V (Y ) + 2abCov(X , Y )
➤ Composition d'un portefeuille à deux titres minimisant le risque
est :
σ22 − σ1 σ2 ρ1, 2
p1 =
σ21 + σ22 − 2σ1 σ2 ρ1, 2
9782100745302-legros-C04.qxd 26/04/16 11:20 Page 109
Exercices 109
EXERCICES
Probabilités
b) Quelle est la probabilité que chaque pays dispose d’un centre de
recherche ?
c) Quelle est la probabilité qu’un seul pays dispose de tous les centres de
recherche ?
d) Quelle est la probabilité que seulement deux pays disposent de
centres de recherche ?
2
4.2 Gestion de ressources humaines
Huit personnes postulent pour un poste, le responsable des ressources
humaines doit les faire passer successivement en entretien.
a) De combien de façons peut-il choisir de faire passer les différents pos-
tulants ?
b) Le responsable choisit préalablement de ne sélectionner que cinq pos-
tulants parmi les huit pour leur faire passer ensuite l’entretien. De com-
bien de façons ce responsable peut-il faire ces cinq entretiens ?
On remarque que les conseils des analystes financiers ont une influence
sur l’évolution des cours. Pour un titre donné, lorsque le conseil est à
l’achat, le cours monte dans 60 % des cas. Lorsque le cours monte, on
constate qu’un conseil d’achat a été donné dans 70 % des cas. On note
que pour 75 % des titres, le conseil est à l’achat.
a) Quelle est la probabilité que le cours d’un titre monte ?
b) Quelle est la probabilité qu’un cours baisse ou stagne si on a un
conseil d’achat ?
Progression Régression
des cours ou stagnation des cours
Journée ensoleillée 48 % 12 %
Journée sans soleil 32 % 8%
xi 0 1 2 3 4 5
pi 5% 6% 14 % 18 % 25 % 32 %
yi 0 1 2 3 4 5 6
pi 3% 7% 10 % 24 % 22 % 26 % 8%
Exercices 111
xi 5 6 7 8 9 10
pi 4% 12 % 20 % 30 % 12 % 22 %
Probabilités
b) Quelle est la probabilité d’avoir un écart de visites strictement supé-
rieur à 3 entre les deux commerciaux ?
c) Donner l’espérance et l’écart-type de Y.
2
4.8 Échantillon représentatif ?
Une usine fabrique des pièces dont 2 % sont défectueuses. On dispose
d’une production de 4 000 pièces. On prélève au hasard 3 pièces. On
note X le nombre de pièces défectueuses dans l’échantillon.
a) Déterminer la loi de X.
b) Quelle est la proportion moyenne de pièces défectueuses dans
l’échantillon ?
c) Un inspecteur teste la production jusqu’à trouver une pièce défec-
tueuse. Donner la loi de Y, le rang d’apparition de la première pièce
© Dunod. Toute reproduction non autorisée est un délit.
défectueuse sachant qu’une pièce testée n’est pas remise dans la pro-
duction.
SOLUTIONS
Exercice 4.1
a) Il y a en tout 19 sites de productions sur l’ensemble des trois pays. On
doit choisir de sélectionner trois sites parmi ces 19. Il s’agit d’un cas de
« tirage simultané ». Le nombre de choix possible est donc :
19 19! 19 × 18 × 17
= = = 969
3 3!(19 − 3)! 3×2
b) Pour que chaque pays dispose d’un centre de recherche, le choix d’un
site se fait séparément dans chaque pays. Dans le pays A, il y a 4 choix
possibles ; dans le pays B, 6 choix possibles ; et dans le pays C,
9 choix possibles. Au total, il y a 4 × 6 × 9 = 216 façons de choisir
les trois centres. Comme il s’agit d’un cas d’équiprobabilité
Nombre de cas favorables
la formule indique une probabilité
Nombre de cas possibles
216
P1 = ≈ 22,29 % .
969
c) Pour qu’un seul pays dispose de tous les centres de recherches, on
dispose soit tous les centres dans le pays A, soit tous les centres dans le
pays B, soit tous les centres dans le pays C.
4
Dans le pays A, il y a = 4 façons de choisir les trois centres.
3
6 6! 6×5×4
Dans le pays B, = = = 20
3 3!(6 − 3)! 3×2
9 9! 9×8×7
Dans le pays C, = = = 84
3 3!(9 − 3)! 3×2
9782100745302-legros-C04.qxd 26/04/16 11:20 Page 113
Solutions 113
Probabilités
216 108 215
P1 + P2 + P3 = 1 , d’où P3 = 1 − − = ≈ 66,56 % .
969 969 323
Exercice 4.2
a) Les huit postulants passent successivement. Pour le premier entretien
il y a donc huit choix possibles, pour le second il n’y en a plus que 7,
pour le troisième plus que 6 et ainsi de suite. On trouve donc en tout
8 × 7 × 6 × 5 × 4 × 3 × 2 × 1 = 8! = 40 320 façons de faire passer
2
les huit entretiens.
b) Le responsable sélectionne dans un premier temps cinq postulants
8
parmi les huit. Il y a façons de le faire. Ensuite, il fait
5
passer successivement les entretiens aux cinq postulants ; il y a donc
5! façons de le faire.
8 8! 8!
Il y a ainsi en tout × 5! = × 5! =
5 5! × (8 − 5)! (8 − 5)!
= 8 × 7 × 6 × 5 × 4 = 6 720
© Dunod. Toute reproduction non autorisée est un délit.
Soit 6 720 façons de faire passer ces cinq entretiens. On remarque qu’il
s’agit aussi du nombre d’arrangements à 5 éléments dans un ensemble à
8 éléments.
Exercice 4.3
a) Modélisons l’énoncé par des événements et des probabilités. Notons
A l’événement « le conseil est à l’achat » et M « le cours monte ». On a
alors PA (M) = 0,6 ; PM (A) = 0,7 et P(A) = 0,75 .
D’après la formule des probabilités conditionnelles, on a :
P(A ∩ M)
PA (M) =
P(A)
P(A ∩ M)
Ainsi 0,6 = , d’où P(A ∩ M) = 0,6 × 0,75
0,75
9782100745302-legros-C04.qxd 26/04/16 11:20 Page 114
Exercice 4.5
a) Dans un premier temps, déterminons l’ensemble des valeurs prises
par N. Dans le tableau suivant, la première ligne représente les valeurs
possibles de X et la première colonne les valeurs possibles de Y.
L’intérieur du tableau est l’ensemble des valeurs de N.
0 1 2 3 4 5
0 0 0 0 0 0 0
1 0 1 1 1 1 1
2 0 1 2 2 2 2
3 0 1 2 3 3 3
4 0 1 2 3 4 4
5 0 1 2 3 4 5
6 0 1 2 3 4 5
9782100745302-legros-C04.qxd 03/05/16 7:36 Page 115
Solutions 115
Probabilités
+P(X = 4) × P(Y = 6) + P(X = 5) × P(Y = 4)
= 0,25 × 0,22 + 0,25 × 0,26 + 0,25 × 0,08 + 0,32 × 0,22
= 21,04 %
• P(N = 3) = 0,18 × 0,24 + 0,18 × 0,22 + 0,18 × 0,26 + 0,18
×0,08 + 0,25 × 0,24 + 0,32 × 0,24 = 28,08 %
• P(N = 2) = 0,14 × 0,1 + 0,14 × 0,24 + 0,14 × 0,22 + 0,14 × 0,26
2
+ 0,14 × 0,08 + 0,18 × 0,1 + 0,25 × 0,1
+ 0,32 × 0,1 = 20,1 %
• P(N = 1) = 0,06 × 0,07 + 0,06 × 0,1 + 0,06 × 0,24 + 0,06
×0,22 + 0,06 × 0,26 + 0,06 × 0,08 + 0,14 × 0,07
+ 0,18 × 0,07 + 0,25 × 0,07 + 0,32 × 0,07 = 12,05 %
• P(N = 0) = 0,05 + 0,03 × (0,06 + 0,14 + 0,18 + 0,25 + 0,32)
= 7,85 %
On résume la loi de N ainsi :
xi 0 1 2 3 4 5
© Dunod. Toute reproduction non autorisée est un délit.
Exercice 4.6
a) Voyons dans un premier temps les valeurs possibles de l’écart Y entre
les deux commerciaux. Dans le tableau suivant, la première ligne est
donnée par le nombre de visites du premier commercial et la première
colonne est donnée par le nombre de visites du second commercial.
L’intérieur du tableau est constitué des valeurs de l’écart Y.
5 6 7 8 9 10
5 0 1 2 3 4 5
6 1 0 1 2 3 4
7 2 1 0 1 2 3
8 3 2 1 0 1 2
9 4 3 2 1 0 1
10 5 4 3 2 1 0
Solutions 117
Probabilités
+P(X = 9) × P(X = 10))
= 2 × (0,04 × 0,12 + 0,12 × 0,2 + 0,2 × 0,3
+ 0,3 × 0,12 + 0,12 × 0,22)
= 30,24 %
• P(Y = 0) = P(X = 5)2 + P(X = 6)2 + P(X = 7)2 + P(X = 8)2
+P(X = 9)2 + P(X = 10)2
= 0,04 + 0,12 + 0,2 + 0,32 + 0,122 + 0,222
2
2 2 2
= 20,88 %
yi 0 1 2 3 4 5
Exercice 4.7
On cherche à donner la loi de cette variable (notée X). Pour cela posons
x = P(X = −1), y = P(X = 0) et z = P(X = 2).
On a E(X) = 0 , donc −1 × x + 0 × y + 2 × z = 0 , soit −x + 2z = 0
9782100745302-legros-C04.qxd 26/04/16 11:20 Page 118
xi –1 0 2
Exercice 4.8
a) Il y a dans la production en tout 2 % × 4 000 = 80 pièces défectueu-
ses. Le nombre de façons de choisir au hasard 3 pièces dans
l’ensemble de la production est :
4 000 4 000! 4 000 × 3 999 × 3 998
= = = 10 658 668 000
3 3! ×(4 000 − 3)! 2×3
Car il s’agit d’un tirage simultané.
Dans l’échantillon de 3 pièces, il peut y avoir 0, 1, 2 ou 3 pièces défec-
tueuses. Voyons les différents cas :
• Pour P(X = 0), il n’y a aucune pièce défectueuse dans l’échantillon
donc l’échantillon a été prélevé parmi les 3 920 pièces non défectueu-
ses. Le nombre de façon de prélever 3 pièces non défectueuses est :
3 920 3 920! 3 920 × 3 919 × 3 918
= =
3 3! × (3 920 − 3)! 2×3
= 10 031 699 440
10 031 699 440
Ainsi P(X = 0) = ≈ 94,12 %
10 658 668 000
9782100745302-legros-C04.qxd 26/04/16 11:20 Page 119
Solutions 119
• Pour P(X = 1), on prélève deux pièces parmi les non défectueuses,
3 920 3 920! 3 920 × 3 919
soit = = = 7 681 240
2 2! × (3 920 − 2)! 2
choix possibles et une pièce parmi les défectueuses, soit 80 choix pos-
7 681 240 × 80
sibles. Ainsi P(X = 1) = ≈ 5,77 %
10 658 668 000
• Pour P(X = 2), on prélève une pièces parmi les non défectueuses, soit
3 920 choix possibles, et deux pièces parmi les défectueuses, soit
80 80! 80 × 79
Probabilités
= = = 3 160 choix possibles.
2 2! × (80 − 2)! 2
3 920 × 3 160
Ainsi P(X = 2) = ≈ 0,12 %
10 658 668 000
• Pour P(X = 3) on prélève 3 pièces parmi les défectueuses, soit
80 80! 80 × 79 × 78
= = = 82 160 .
3 3! × (80 − 3)! 2×3
2
82 160
Ainsi P(X = 3) = ≈ 7,7 × 10−6 ce qui est négli-
10 658 668 000
geable devant les autres probabilités.
On résume donc la loi X de façon approchée ainsi :
xi –1 0 2 3
Solutions 121
2
f
5
3
Probabilités
3
1
F
2
3
1
3
2
0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
Exercice 4.10
a) On détermine la distribution du couple (X,Y) en explicitant l'ensem-
ble des valeurs possibles de ce couple. Ainsi :
4
P(X = 1,Y = 1) = P(U = 1,V = 1) = ,
9
2
P(X = 1,Y = −1) = P(U = 1,V = −1) = ,
9
© Dunod. Toute reproduction non autorisée est un délit.
1
P(X = −1,Y = 1) = P(U = −1,V = −1) =
9
2
et P(X = −1,Y = −1) = P(U = −1) =
9
b) Les variables X et Y ne sont pas indépendantes. Il est possible de le
prouver en exhibant un contre-exemple. Comme,
2
P(X = 1) = P(U = 1) =
3
et P(Y = 1) = P(U = 1,V = 1) + P(U = −1,V = −1) ,
10
alors P(X = 1)P(Y = 1) = = P(X = 1,Y = 1).
27
Ainsi les deux variables ne sont pas indépendantes.
9782100745302-legros-C04.qxd 26/04/16 11:20 Page 122
5
CHAPITRE
Lois fondamentales
de probabilités
Probabilités
➤ Connaître la définition des principales lois discrètes : Binomiale,
Géométrique et de Poisson.
➤ Connaître la définition des principales lois continues : Exponentielle,
OBJECTIFS
Normale, Gamma.
➤ Connaître la définition des lois binomiale, de Poisson et normale.
➤ Savoir calculer des probabilités avec ces lois.
2
➤ Connaître les représentations graphiques des distributions de ces lois.
➤ Savoir utiliser les tables de la loi Normale centrée réduite.
➤ Connaître les approximations de lois.
Preuve :
1 n(n + 1) n+1
E(X) = (1 + 2 + 3 + . . . + n) = = ,
n 2n 2
1 2
et E(X 2 ) = (1 + 22 + . . . + n 2 ).
n
Notons que (k + 1)3 = k 3 + 3k 2 + 3k + 1, ainsi
23 + 33 + . . . + (n + 1)3 = 13 + 23 + . . . + n 3
+(12 + 22 + . . . + n 2 ) + 3(1 + 2 + . . . + n)
Par conséquent,
1 n(n + 1)
1 + 2 + ... + n =
2 2 2
(n + 1) − 1 − 3
3
−n
3 2
1
n(n + 1) n +
2
=
3
1
(n + 1) n +
2
et on trouve E(X 2 ) = ,
3
n2 − 1
on déduit que V (X) = .
12
9782100745302-legros-C05.qxd 26/04/16 11:29 Page 125
b) Loi binomiale
Propriété :
On a E(X) = np et V (X) = np(1 − p)
X = X 1 + X 2 + . . . + X n.
Probabilités
Par conséquent,
E(X) = E(X 1 + X 2 + . . . + X n )
= E(X 1 ) + E(X 2 ) + . . . + E(X n )
= p + p + . . . + p = np.
De même,
V (X) = V (X 1 + X 2 + . . . + X n )
2
= V (X 1 ) + V (X 2 ) + . . . + V (X n )
= p(1 − p) + p(1 − p) + . . . + p(1 − p)
= np(1 − p)
Loi binomiale
Ainsi, on vient de montrer que la somme des probabilités d’une loi bino-
miale est égale à 1.
Espérance : E(X) = np
√
Variance et écart-type : V (X) = np(1 − p) et σ (X) = np(1 − p).
Probabilités
c) Loi géométrique
La loi géométrique s'utilise pour les phénomènes de première apparition
d'un évènement donné.
Exemple. On lance une pièce et on cherche à déterminer la loi de pre-
mière apparition d'un 6. En supposant que le dé est bien équilibré on a à
chaque lancé une chance sur 6 de voir apparaitre un 6 ainsi la probabilité
2
de voir apparaitre un 6 au bout de exactement n lancés est la probabilité
de ne pas obtenir de 6 pendant n – 1 lancés et un 6 ensuite. Cette proba-
n−1
5 1
bilité est ainsi .
5 6
Pour généraliser l'exemple on peut noter que la loi géométrique ne
dépend que du paramètre de succès ; p.
Définition :
Une variable aléatoire X suit une loi géométrique de paramètre p si
© Dunod. Toute reproduction non autorisée est un délit.
Proposition :
1 1− p
E(X) = et V (X) =
p p2
9782100745302-legros-C05.qxd 26/04/16 11:29 Page 128
Preuve :
∞
∞
E(X) = k P(X = k) = k(1 − p)k−1 p
k=1 k=1
∞
1 1
=p k(1 − p)k−1 = p = .
k=1
( p)2 p
De même,
∞
∞
E(X 2 ) = k 2 P(X = k) = k 2 (1 − p)k−1 p .
k=1 k=1
d) Loi de Poisson
Une variable de Poisson prend ses valeurs dans l’ensemble N. La loi
de Poisson se définit à l’aide du seul paramètre λ selon la relation :
λk
P(X = k) = e−λ ×
k!
Cette loi sert de modèle à des expériences. On constate par exemple que
les phénomènes d’arrivée de clients dans un magasin ou le nombre de
clients à une caisse suivent généralement une loi de Poisson.
Remarque : on ne cherchera donc pas à construire une loi de Poisson à
partir des données d’un exercice mais plutôt à l’appliquer quand l’énoncé
indique que son utilisation est appropriée, c’est-à-dire si une expérience
conduit à constater que la moyenne statistique est proche de la variance.
9782100745302-legros-C05.qxd 26/04/16 11:29 Page 129
Probabilités
La méthode pour déterminer la somme de deux variables aléatoires indé-
pendantes est de sommer l'ensemble des possibilités pour obtenir une
somme égale à un entier n.
Ainsi si X 1 et X 2 sont deux variables aléatoires indépendantes on a
n
P(X 1 + X 2 = n) = P(X 1 = k ∩ X 2 = n − k) .
2
k=0
L'indépendance des variables aléatoires permet de transformer la proba-
bilité de l'intersection en produit des probabilités, ainsi
n
P(X 1 + X 2 = n) = P(X 1 = k)P(X 2 = n − k) .
k=0
Appliquons maintenant cette formule à certaines des lois précédentes.
Somme de deux lois binomiales de même probabilité p.
Pour déterminer la loi de la somme de deux lois binomiales X 1 et X 2 de
© Dunod. Toute reproduction non autorisée est un délit.
De même,
b
b t2 t3 b3 − a 3
E(X ) =
2
dt = =
a b−a 3(b − a) a 3(b − a)
(b − a)(b2 + ab + a 2 ) b2 + ab + a 2
= = .
3(b − a) 3
Ainsi,
b2 + ab + a 2 a+b 2
V (X) = −
Probabilités
3 2
4b + 4ab + 4a − 3a 2 − 6ab − 3b2
2 2 (b − a)2
= =
12 12
b) Loi exponentielle
La loi exponentielle est une des lois continues les plus simples. Elle ne
2
dépend que d'un paramètre noté λ. Elle est définit sur l'ensemble des
réels positifs et représente souvent des phénomènes liés à des durées ;
temps d'inter-arrivée entre des clients dans un magasin, temps de servi-
ce, temps d'abandon lors d'une attente, etc...
La densité de cette loi est f (t) = λe−λt pour t > 0. On a ainsi pour
fonction caractéristique :
x
F(x) = P(X < x) = λe−λt dt = 1 − e−λx
0
Remarque : Comme la loi géométrique dans le cas discret, la loi expo-
© Dunod. Toute reproduction non autorisée est un délit.
De même :
+∞ +∞
E(X 2 ) = λt 2 e−λt dt = [−t 2 e−λt ]+∞
0 + 2te−λt dt
0 0
2 2
= E(X) = 2 .
λ λ
1
On trouve ainsi V (X) = E(X 2 ) − E(X)2 = .
λ2
Remarque : une particularité de la loi exponentielle est que son coeffi-
cient de variabilité (cv) est égal à 1.
c) Loi normale
La loi normale est une loi continue sur R. Elle dépend de deux pa-
ramètres :
• m : sa moyenne (ou son espérance) ;
• σ : son écart-type.
Sa densité est :
x−m 2
1 −1 σ
f (x) = √ e 2
2πσ
Cette loi s’utilise dans la plupart des problèmes mettant en jeu des varia-
bles continues. On peut approximer de nombreuses lois discrètes ou
continues par la loi normale.
u 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.50000 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.52790 0.53188 0.53586
0.1 0.53983 0.54380 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.62930 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.65910 0.66276 0.66640 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.70540 0.70884 0.71226 0.71566 0.71904 0.72240
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.75490
Probabilités
0.7 0.75804 0.76115 0.76424 0.76730 0.77035 0.77337 0.77637 0.77935 0.78230 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
1.0 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.86650 0.86864 0.87076 0.87286 0.87493 0.87698 0.87900 0.88100 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.90320 0.90490 0.90658 0.90824 0.90988 0.91149 0.91309 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.92220 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
2
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.94520 0.94630 0.94738 0.94845 0.94950 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.96080 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.97320 0.97381 0.97441 0.97500 0.97558 0.97615 0.97670
2.0 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.98030 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.98300 0.98341 0.98382 0.98422 0.98461 0.98500 0.98537 0.98574
2.2 0.98610 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.98840 0.98870 0.98899
2.3 0.98928 0.98956 0.98983 0.99010 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.99180 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.99430 0.99446 0.99461 0.99477 0.99492 0.99506 0.99520
© Dunod. Toute reproduction non autorisée est un délit.
2.6 0.99534 0.99547 0.99560 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.99720 0.99728 0.99736
2.8 0.99744 0.99752 0.99760 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
3.0 0.99865 0.99869 0.99874 0.99878 0.99882 0.99886 0.99889 0.99893 0.99896 0.99900
3.1 0.99903 0.99906 0.99910 0.99913 0.99916 0.99918 0.99921 0.99924 0.99926 0.99929
3.2 0.99931 0.99934 0.99936 0.99938 0.99940 0.99942 0.99944 0.99946 0.99948 0.99950
3.3 0.99952 0.99953 0.99955 0.99957 0.99958 0.99960 0.99961 0.99962 0.99964 0.99965
3.4 0.99966 0.99968 0.99969 0.99970 0.99971 0.99972 0.99973 0.99974 0.99975 0.99976
3.5 0.99977 0.99978 0.99978 0.99979 0.99980 0.99981 0.99981 0.99982 0.99983 0.99983
3.6 0.99984 0.99985 0.99985 0.99986 0.99986 0.99987 0.99987 0.99988 0.99988 0.99989
3.7 0.99989 0.99990 0.99990 0.99990 0.99991 0.99991 0.99992 0.99992 0.99992 0.99992
3.8 0.99993 0.99993 0.99993 0.99994 0.99994 0.99994 0.99994 0.99995 0.99995 0.99995
3.9 0.99995 0.99995 0.99996 0.99996 0.99996 0.99996 0.99996 0.99996 0.99997 0.99997
9782100745302-legros-C05.qxd 26/04/16 11:30 Page 134
Probabilités
miers chiffres de la probabilité. La dernière ligne se lit de droite à gau-
che et indique le troisième chiffre de la probabilité. Par exemple, si on
cherche u tel que P(X < u) = 0,76 , on cherche 0,76 dans la dernière
colonne et 0,00 dans la dernière ligne. À l’intersection de la ligne et de
la colonne, on trouve u = 0,7192
• Si P(X < u) < 0,5
La première colonne se lit du haut vers le bas pour donner les deux
2
premiers chiffres de la probabilité. La première ligne se lit de gauche
à droite et indique le troisième chiffre de la probabilité. Comme la
courbe de la densité de la loi normale centrée réduite est symétrique
par rapport à l’axe des ordonnées, la valeur de u trouvée de le tableau
sera à compter négativement. Par exemple, si on cherche u tel que
P(X < u) = 0,216 , on cherche 0,21 dans la première colonne et
0,006 dans la première ligne. À l’intersection de la ligne et de la
colonne, on trouve u = −0,7858
la fonction à intégrer est non nulle si 0 < t < 1 et si 0 < x − t < 1 soit
x − 1 < t < x.
1er cas : 0 < x < 1. Les deux conditions deviennent alors ensemble
0 < t < x.
Par conséquent, f X+Y (x) = x.
2nd cas : 1 < x < 2. Les deux conditions deviennent alors ensemble
x − 1 < t < 1.
Par conséquent, f X+Y (x) = 2 − x .
La loi ainsi construite est une loi triangulaire.
– Somme de deux lois exponentielle de paramètre λ.
Les conditions pour intégrer les deux densités sont t > 0 et x − t > 0
soit t < x. Ainsi,
x
f X+Y (x) = λ2 e−λt e−λ(x−t) dλ = λxe−λx si x > 0.
0
La loi ainsi construite est une loi d'Erlang à deux étages.
Probabilités
0, 09 1, 3408 1, 3346 1, 3285 1, 3225 1, 3165 1, 3106 1, 3047 1, 2988 1, 1930 1, 2873 1, 2816 0, 90
0, 10 1, 2816 1, 2759 1, 2702 1, 2646 1, 2591 1, 2536 1, 2481 1, 2426 1, 2372 1, 2319 1, 2265 0, 89
0, 11 1, 2265 1, 2212 1, 2160 1, 2107 1, 2055 1, 2004 1, 1952 1, 1901 1, 1850 1, 1800 1, 1750 0, 88
0, 12 1, 1750 1, 1700 1, 1650 1, 1601 1, 1552 1, 1503 1, 1455 1, 1407 1, 1359 1, 1311 1, 1264 0, 87
0, 13 1, 1264 1, 1217 1, 1170 1, 1123 1, 1077 1, 1031 1, 0985 1, 0939 1, 0893 1, 0848 1, 0803 0, 86
0, 14 1, 0803 1, 0758 1, 0714 1, 0669 1, 0625 1, 0581 1, 0537 1, 0494 1, 0450 1, 0407 1, 0364 0, 85
0, 15 1, 0364 1, 0322 1, 0279 1, 0237 1, 0194 1, 0152 1, 0110 1, 0069 1, 0027 0, 9986 0, 9945 0, 84
0, 16 0, 9945 0, 9904 0, 9863 0, 9822 0, 9782 0, 9741 0, 9701 0, 9661 0, 9621 0, 9581 0, 9542 0, 83
0, 17 0, 9542 0, 9502 0, 9463 0, 9424 0, 9385 0, 9346 0, 9307 0, 9269 0, 9230 0, 9192 0, 9154 0, 82
2
0, 18 0, 9154 0, 9116 0, 9078 0, 9040 0, 9002 0, 8965 0, 8927 0, 8890 0, 8853 0, 8816 0, 8779 0, 81
0, 19 0, 8779 0, 8742 0, 8705 0, 8669 0, 8633 0, 8596 0, 8560 0, 8524 0, 8488 0, 8452 0, 8416 0, 80
0, 20 0, 8416 0, 8381 0, 8345 0, 8310 0, 8274 0, 8239 0, 8204 0, 8169 0, 8134 0, 8099 0, 8064 0, 79
0, 21 0, 8064 0, 8030 0, 7995 0, 7961 0, 7926 0, 7892 0, 7858 0, 7824 0, 7790 0, 7756 0, 7722 0, 78
0, 22 0, 7722 0, 7688 0, 7655 0, 7621 0, 7588 0, 7554 0, 7521 0, 7488 0, 7454 0, 7421 0, 7388 0, 77
0, 23 0, 7388 0, 7356 0, 7323 0, 7290 0, 7257 0, 7225 0, 7192 0, 7160 0, 7128 0, 7095 0, 7063 0, 76
0, 24 0, 7063 0, 7031 0, 6999 0, 6967 0, 6935 0, 6903 0, 6871 0, 6840 0, 6808 0, 6776 0, 6745 0, 75
0, 25 0, 6745 0, 6713 0, 6682 0, 6651 0, 6620 0, 6588 0, 6557 0, 6526 0, 6495 0, 6464 0, 6433 0, 74
0, 26 0, 6433 0, 6403 0, 6372 0, 6341 0, 6311 0, 6280 0, 6250 0, 6219 0, 6189 0, 6158 0, 6128 0, 73
0, 27 0, 6128 0, 6098 0, 6068 0, 6038 0, 6008 0, 5978 0, 5948 0, 5918 0, 5888 0, 5858 0, 5828 0, 72
0, 28 0, 5828 0, 5799 0, 5769 0, 5740 0, 5710 0, 5681 0, 5651 0, 5622 0, 5592 0, 5563 0, 5534 0, 71
0, 29 0, 5534 0, 5505 0, 5476 0, 5446 0, 5417 0, 5388 0, 5359 0, 5330 0, 5302 0, 5273 0, 5244 0, 70
0, 30 0, 5244 0, 5215 0, 5187 0, 5158 0, 5129 0, 5101 0, 5072 0, 5044 0, 5015 0, 4987 0, 4959 0, 69
0, 31 0, 4959 0, 4930 0, 4902 0, 4874 0, 4845 0, 4817 0, 4789 0, 4761 0, 4733 0, 4705 0, 4677 0, 68
© Dunod. Toute reproduction non autorisée est un délit.
0, 32 0, 4677 0, 4649 0, 4621 0, 4565 0, 4593 0, 4538 0, 4510 0, 4482 0, 4454 0, 4427 0, 4399 0, 67
0, 33 0, 4399 0, 4372 0, 4344 0, 4316 0, 4289 0, 4261 0, 4234 0, 4207 0, 4179 0, 4152 0, 4125 0, 66
0, 34 0, 4125 0, 4097 0, 4070 0, 4043 0, 4016 0, 3989 0, 3961 0, 3934 0, 3907 0, 3880 0, 3853 0, 65
0, 35 0, 3853 0, 3826 0, 3799 0, 3772 0, 3745 0, 3719 0, 3692 0, 3665 0, 3638 0, 3611 0, 3585 0, 64
0, 36 0, 3585 0, 3558 0, 3531 0, 3505 0, 3478 0, 3451 0, 3425 0, 3398 0, 3372 0, 3345 0, 3319 0, 63
0, 37 0, 3319 0, 3292 0, 3266 0, 3239 0, 3213 0, 3186 0, 3160 0, 3134 0, 3107 0, 3081 0, 3055 0, 62
0, 38 0, 3055 0, 3029 0, 3002 0, 2976 0, 2950 0, 2924 0, 2898 0, 2871 0, 2845 0, 2819 0, 2793 0, 61
0, 39 0, 2793 0, 2767 0, 2741 0, 2715 0, 2689 0, 2663 0, 2637 0, 2611 0, 2585 0, 2559 0, 2533 0, 60
0, 40 0, 2533 0, 2508 0, 2482 0, 2456 0, 2430 0, 2404 0, 2378 0, 2353 0, 2327 0, 2301 0, 2275 0, 59
0, 41 0, 2275 0, 2250 0, 2224 0, 2198 0, 2173 0, 2147 0, 2121 0, 2096 0, 2070 0, 2045 0, 2019 0, 58
0, 42 0, 2019 0, 1993 0, 1968 0, 1942 0, 1917 0, 1891 0, 1866 0, 1840 0, 1815 0, 1789 0, 1764 0, 57
0, 43 0, 1764 0, 1738 0, 1713 0, 1687 0, 1662 0, 1637 0, 1611 0, 1586 0, 1560 0, 1535 0, 1510 0, 56
0, 44 0, 1510 0, 1484 0, 1459 0, 1434 0, 1408 0, 1383 0, 1358 0, 1332 0, 1307 0, 1282 0, 1257 0, 55
0, 45 0, 1257 0, 1231 0, 1206 0, 1181 0, 1156 0, 1130 0, 1105 0, 1080 0, 1055 0, 1030 0, 1004 0, 54
0, 46 0, 1004 0, 0979 0, 0954 0, 0929 0, 0904 0, 0878 0, 0853 0, 0828 0, 0803 0, 0778 0, 0753 0, 53
0, 47 0, 0753 0, 0728 0, 0702 0, 0677 0, 0652 0, 0627 0, 0602 0, 0577 0, 0552 0, 0527 0, 0502 0, 52
0, 48 0, 0502 0, 0476 0, 0451 0, 0426 0, 0401 0, 0376 0, 0351 0, 0326 0, 0301 0, 0276 0, 0251 0, 51
0, 49 0, 0251 0, 0226 0, 0201 0, 0175 0, 0150 0, 0125 0, 0100 0, 0075 0, 0050 0, 0025 0, 0000 0, 50
0, 010 0, 009 0, 008 0, 007 0, 006 0, 005 0, 004 0, 003 0, 002 0, 001 0, 000 P
9782100745302-legros-C05.qxd 26/04/16 11:30 Page 138
En pratique, la condition :
n > 30
np < 5
ou :
n > 50
p < 0,1
k 0 1 2 3 4 5 6 7 8 9
Binomiale (%) 2,50 9,73 18,39 22,47 19,98 13,76 7,65 3,52 1,37 0,45
Poisson (%) 3,02 10,56 18,50 21,58 18,88 13,22 7,71 3,86 1,69 0,66
Écart (%) 0,52 0,83 0,11 0,89 1,1 0,54 0,06 0,34 0,32 0,21
Les valeurs suivantes de k ne sont pas données car P(X = k) est très
proche de 0 dans les deux lois.
Probabilités
On constate que l’écart entre les deux lois ne dépasse pas 1,1 %. À 1 %
près, on peut supposer que les deux lois sont équivalentes.
Remarque : dans l’approximation d’une loi binomiale par une loi de
Poisson, l’ensemble des possibles se dilate de l’ensemble {0,1,2,· · · ,n}
à l’ensemble N. Il y a un passage d’un ensemble fini à un ensemble infi-
ni. Dans la loi de Poisson approximée, on doit donc avoir
P(X = k) ≈ 0 si k > n pour être en cohérence avec la loi binomiale.
2
b) Approximation d’une loi de Poisson par une loi
normale
Une loi de Poisson de paramètre λ peut √ être approximée par une loi
normale de moyenne λ et d’écart-type λ si λ est grand. Dans la pra-
tique, la condition λ > 5 est suffisante.
Comment passer dans le calcul d’une loi discrète à une loi continue ?
Le problème se pose car P(0,3 < X < 0,7) est nulle pour une loi de
© Dunod. Toute reproduction non autorisée est un délit.
Poisson et est non nulle pour une loi normale qui prend ses valeurs dans
l’ensemble des réels. De plus, pour une loi normale P(X = k) = 0
quelque soit la valeur de k, alors que pour la loi de Poisson
P(X = k) = 0 si k est un entier naturel.
Règles de calcul
Notons B la variable de Poisson à approximer par la variable normale N
et notons f la densité de N.
• P(B < k) ≈ P(N < k) en calculant P(N < k) à l’aide de la table de
la loi normale.
• P(B = k) ≈ f (k) ≈ P(k − 0,5 < N < k + 0,5), ainsi la densité de
la loi normale permet d’approximer la loi de Poisson plus vite que
l’utilisation de la table de la loi normale.
9782100745302-legros-C05.qxd 26/04/16 11:30 Page 140
k 0 1 2 3 4 5
Poisson 0,01 0,11 0,5 1,50 3,37 6,07
f (k) 0,15 0,38 0,87 1,80 3,32 5,47
P( k − 12 ; k + 1
2
) 0,15 0,39 0,89 1,82 3,34 5,49
➥
k 6 7 8 9 10 11
Poisson 9,11 11,71 13,17 13,17 11,86 9,70
f (k) 8,07 10,65 12,58 13,30 12,58 10,65
P( k − 12 ; k + 1
2
) 8,07 10,62 12,53 13,24 12,53 10,62
9k
On rappelle les formules dans cet exemple : P(X = k) = e−9 ×
k!
9 2
1 −0,5 x−
pour la loi de Poisson et f (x) = √ e 3 pour la densité de
2π 3
la loi normale.
Les résultats du tableau indiquent qu’il est quasi équivalent de calculer f (k)
1 1
et P k − ; k + , par conséquent on se contentera d’un seul
2 2
des deux calculs dans les exercices. D’autre part, l’écart entre les valeurs
prises par la loi de Poisson et celles de la loi normale excède rarement
1 %. Cette observation confirme le bien-fondé de cette approximation.
k 0 1 2 3 4 5 6 7 8 9 10
Binomiale 0,10 0,98 4,40 11,72 20,51 24,62 20,51 11,72 4,40 0,98 0,10
Probabilités
f (k) 0,17 1,02 4,16 11,33 20,67 25,25 20,67 11,33 4,16 1,02 0,17
2
d) Théorème Centrale Limite
Les approximations présentées précédemment correspondent à des
situations où la loi à approximer est connue. En pratique, lors d'une
expérience aléatoire la loi sous-jacente n'est pas toujours connue. Dans
certaines circonstances, le Théorème Centrale Limite permet d'approxi-
mer n'importe quelle loi par une loi normale.
Le théorème se formule comme suit :
Soit X 1 ,X 2 ,. . . ,X n une suite de variables aléatoires indépendantes et de
X1 + X2 + . . . + Xn
© Dunod. Toute reproduction non autorisée est un délit.
Exemple. La somme des lancés d'un même dé 10 000 fois est égal à
35 487. Pensez-vous que le dé est équilibré ?
POINTS CLÉS
➤ Lois fondamentales
➤ Espérance et variance
Exercices 143
➤ Approximations de lois
Probabilités
EXERCICES
5.1 Questionnaire
Un questionnaire comporte dix questions. Pour chacune, il y a quatre
réponses possibles. Un individu répond au hasard à toutes ces questions.
2
a) Quelle est la probabilité qu’il réponde juste à toutes les questions ?
b) Quelle est la probabilité qu’il réponde juste à 5 questions ?
c) Quelle est la probabilité qu’il réponde juste à au moins 8 questions ?
d) En moyenne, à combien de questions va-t-il répondre juste ?
5.7 Bénéfices
Le seuil de rentabilité est atteint lorsque le bénéfice est positif. Une
entreprise fabrique un produit unique. Le coût variable unitaire est éva-
lué à 35 euros. Le prix de vente unitaire est 58 euros. Les charges de
structure de la période sont estimées à 50 000 euros. Les quantités ven-
dues suivent une loi normale de moyenne 4 000 unités et oscillent entre
3 500 et 4 500 unités dans 80 % des cas.
a) Calculer l’écart-type des quantités vendues.
b) Calculer la probabilité d’atteindre le seuil de rentabilité.
c) Calculer la probabilité d’atteindre un bénéfice supérieur à
30 000 euros.
9782100745302-legros-C05.qxd 26/04/16 11:30 Page 145
Exercices 145
Probabilités
5.9 Salaires
Le salaire mensuel d’un commercial suit une loi normale de moyenne
3 000 euros et d’écart-type 400 euros.
a) Déterminer la probabilité que le salaire trimestriel d’un commercial
dépasse 10 000 euros.
b) On s’intéresse à l’écart mensuel de salaire entre deux commerciaux.
2
Quelle est la probabilité que celui-ci dépasse 500 euros ?
SOLUTIONS
Exercice 5.1
Le nombre de réponses justes au questionnaire suit une loi binomiale de
paramètres n = 10, car il y a dix questions, et p = 0,25 , car pour chaque
question il y a une chance sur quatre de répondre juste. Notons X le
nombre de réponses justes.
a) P(X = 10) = 0,2510 = 9,53 × 10−7 . La probabilité de répondre
juste à toutes les questions est donc négligeable.
9782100745302-legros-C05.qxd 26/04/16 11:30 Page 147
Solutions 147
10!
b) P(X = 5) = 0,255 0,755
5! × (10 − 5)!
= 252 × 0,000977 × 0,237305 = 5,84 %
c) P(X ≥ 8) = P(X = 10) + P(X = 9) + P(X = 8)
= 9,53 × 10−7 + 9 × 0,259 × 0,75
.
10!
+ 0,25 × 0,75 = 0,0413 %
8 2
8! × 2!
d) Il s’agit de l’espérance de la loi binomiale :
Probabilités
10 × 0,25 = 2,5 réponses justes en moyenne.
Exercice 5.2
a) Le nombre de pannes en 20 jours, X, suit une loi binomiale de para-
mètres n = 20 et p = 1/500 . On cherche P(X ≥ 1). Le calcul direct est
trop long, on utilise donc :
499 20
P(X ≥ 1) = 1 − P(X = 0) = 1 − = 3,925 %
2
500
b) De même P(X > 1) = 1 − P(X = 0) − P(X = 1)
1 499 19
= 0,03925 − 20 × × = 0,074 %
500 500
Exercice 5.3
Déterminons la probabilité d’avoir un nombre de clients supérieur ou
égal à 4 à une caisse donnée. Notons X le nombre le clients à une caisse.
X suit une loi de Poisson de paramètre 3,2.
© Dunod. Toute reproduction non autorisée est un délit.
On a :
P(X ≥ 4) = 1 − P(X = 0) − P(X = 1) − P(X = 2) − P(X = 3)
3,20 3,21 3,22 3,23
= 1 − e−3,2 × − e−3,2 × − e−3,2 × − e−3,2 ×
0! 1! 2! 3!
= 39,75 %
Il y a 4 caisses dans ce magasin, on décide d’ouvrir une caisse supplé-
mentaire seulement si les quatre caisses ont plus de 4 clients. Notons Y,
le nombre de caisses ayant plus de quatre clients, Y suit une loi bino-
miale de paramètres n = 4 car il y a quatre caisses et p = 39,75 % .
P(Y = 4) = 0,39754 = 2,5 % . Ainsi il y a 2,5 % de chances d’ouvrir
une caisse supplémentaire.
9782100745302-legros-C05.qxd 26/04/16 11:30 Page 148
Exercice 5.4
a) Par la formule de la moyenne pondérée en statistiques, on trouve un
nombre moyen d’ordinateurs égal à
0 × 60 + 1 × 73 + 2 × 43 + 3 × 17 + 4 × 5 + 5 × 2
= 1,2
200
b) La variance de cette série est
02 × 60 + 12 × 73 + 22 × 43 + 32 × 17 + 42 × 5 + 52 × 2
− 1,22
200
= 1,2
Nombre d’ordinateurs 0 1 2 3 4 5 6 7
Loi de Poisson 30,12 % 36,14 % 21,69 % 8,67 % 2,60 % 0,63 % 0,125 % 0,02 %
Proportions 30 % 36,5 % 21,5 % 8,5 % 2,5 % 1% 0% 0%
Écart 0,12 % 0,36 % 0,19 % 0,17 % 0,1 % 0,37 % 0,125 % 0,02 %
Exercice 5.5
a)
• P(X < 0) = 50%
• P(X < 1,34) = 90,988%
• P(1 < X < 2) = P(X < 2) − P(X < 1) = 0,97725 − 0,84134
= 13,591%
• P(X > 3,45) = 1 − P(X < 3,45) = 1 − 0,99972 = 0,028 %
• P(X < −2,67) = P(X > 2,67) = 1 − P(X < 2,67) = 1 − 0,99621
= 0,379%
b)
• P(X < u) = 0,75 ⇔ u = 0,6745
• P(X < u) = 0,23 ⇔ u = −0,7388
9782100745302-legros-C05.qxd 26/04/16 11:30 Page 149
Solutions 149
• P(−u < X < u) = 0,1 ⇔ P(X < u) − P(X < −u) = 0,1
⇔ P(X < u) − P(X > u) = 0,1
⇔ P(X < u) − (1 − P(X < u)) = 0,1
⇔ 2 P(X < u) − 1 = 0,1
⇔ P(X < u) = 0,55
⇔ u = 0,1257
Exercice 5.6
Probabilités
À l’aide de la table de la loi normale, nous allons dans un premier temps
calculer la probabilité d’appartenir à un des intervalles de notes considé-
rés dans l’énoncé, ensuite il sera possible de faire une estimation du
nombre d’étudiants concernés par chaque intervalle.
– Proportion d’étudiants non admissibles : il s’agit de ceux ayant une
note inférieure à 7. Déterminons P(X < 7) où X représente une variable
2
normale de moyenne 9,5 et d’écart-type 4,5.
Exercice 5.7
a) Dans ce problème, on dispose d’une observation mais pas de l’écart-
type de la loi normale. On note Q la variable normale « quantité ven-
due ».
On a :
P(3 500 < Q < 4 500) = P(Q < 4 500) − P(Q < 3 500)
Q − 4 000 4 500 − 4 000
=P <
σ σ
Q − 4 000 3 500 − 4 000
−P <
σ σ
500 −500
=P U< −P U<
σ σ
500 500
=P U< −P U>
σ σ
500 500
=P U< − (1 − P U<
σ σ
500
=2× P U < −1
σ
500
Or P(3 500 < Q < 4 500) = 0,8 d’où 2 × P U < − 1 = 0,8
σ
500
ainsi P U < = 0,9 . À l’aide de la table inverse, on trouve :
σ
9782100745302-legros-C05.qxd 26/04/16 11:30 Page 151
Solutions 151
500
= 1,2816, ainsi σ ≈ 390.
σ
b) Notons B le bénéfice, on a B = (58 − 35)Q − 50 000 = 23 Q − 50 000
On cherche :
P(B > 0) = P(23 Q − 50 000 > 0) = P(23 Q > 50 000)
2 173,91 − 4 000
= P(Q > 2 173,91) = P U >
390
= P(U > −4,68) = P(U < 4,68) ≈ 1
Ainsi il est quasiment certain d’atteindre le seuil de rentabilité.
Probabilités
c) P(B > 30 000) = P(23 Q − 50 000 > 30 000) = P(Q > 3 478,26)
3 478,26 − 4 000
=P U>
390
= P(U > −1,34) = P(U < 1,34) ≈ 90,988%
Exercice 5.8
2
a) On ne dispose dans cet exercice ni de la moyenne ni de l’écart-type de
la loi normale considérée. Notons cette variable D.
21 300
On a P(D < 1,21) = = 0,213
100 000
D−m 1,21 − m
Ainsi P < = 0,213
σ σ
1,21 − m
D’où P U< = 0,213
σ
1,21 − m
D’après la table inverse, on trouve = −0,7961
© Dunod. Toute reproduction non autorisée est un délit.
σ
5 600
De plus, on a P(D > 1,32) = = 0,056 .
100 000
1,32 − m 1,32 − m
Ainsi 0,056 = P U > = P U <−
σ σ
1,32 − m
D’où − = −1,5893
σ
1,21 − m = −0,7961σ
On a donc
1,32 − m = 1,5893σ
En soustrayant la ligne 1 à la ligne 2, on trouve :
1,32 − 1,21 = (1,5893 + 0,7961)σ
d’où σ = 0,04611 mm et m = 1,32 − 1,5893 × 0,04611 = 1,2467 mm
9782100745302-legros-C05.qxd 26/04/16 11:30 Page 152
b) La médiane vérifie P(D < Médiane) = 0,5 ; ainsi dans le cas d’une
loi normale, on a une égalité entre la moyenne et la médiane. La médiane
est donc 1,2467 mm. Le premier quartile Q 1 vérifie P(D < Q 1 ) = 0,25
Q 1 − 1,2467
Ainsi P U < = 0,25 . D’après la table inverse, on
0,04611
Q 1 − 1,2467
trouve = −0,6745 , ainsi Q 1 = 1,2156 mm .
0,04611
La loi normale étant symétrique par rapport à la moyenne, le troisième
quartile Q 3 va se trouver à la même distance de la médiane que Q 1 mais
après la médiane. Ainsi Q 3 = 1,2467 +(1,2467 − 1,2156) = 1,2778 mm
Exercice 5.9
a) Pour répondre à cette question, il est nécessaire de supposer que les
salaires mensuels du commercial sont indépendants. Ainsi on peut s’inté-
resser au salaire trimestriel du commercial. Notons M1 le salaire mensuel
du mois 1, M2 le salaire mensuel du mois 2 et M3 le salaire mensuel du
mois 3 et T le salaire trimestriel, on a T = M1 + M2 + M3 comme il y a
trois mois dans un trimestre. Ainsi T suit une loi normale de moyenne :
E(T ) = E(M1 + M2 + M3 ) = E(M1 )+ E(M2 )+ E(M3 ) = 3 × 3 000 = 9 000
et de variance :
V (T ) = V (M1 + M2 + M3 ) = 3 × 4002 = 480 000
√
Ainsi l’écart-type de T est σ = 480 000 = 692,82
On cherche ensuite :
T − 9 000 10 000 − 9 000
P(T > 10 000) = P >
692,82 692,82
= P(U > 1,44) = 1 − P(U < 1,44) = 1 − 0,92507 = 7,49%
Remarque : une erreur à ne pas faire serait de supposer que T = 3 M ce
qui imposerait un même salaire durant les 3 mois. L’énoncé indique au
contraire un salaire variable.
b) Notons M1 le salaire mensuel du premier commercial et M2 le salaire
du second commercial. L’écart entre les deux salaires est |M1 − M2 |.
Comme M1 et M2 suivent la même loi, on cherche donc :
P(|M1 − M2 | > 500) = P(M1 − M2 > 500) + P(M2 − M1 > 500)
= 2 × P(M1 − M2 > 500).
Posons X = M1 − M2 , on a :
E(X) = E(M1 − M2 ) = E(M1 ) − E(M2 ) = 3 000 − 3 000 = 0
et V (M1 − M2 ) = V (M1 ) + V (M2 ) = 4002 +4002 = 320 000
9782100745302-legros-C05.qxd 03/05/16 7:37 Page 153
Solutions 153
√
320 000 = 565,69
Ainsi l’écart-type de X est
500 − 0
On a donc P(X > 500) = P U > = P(U > 0,88)
565,69
= 1 − P(U < 0,88) = 1 − 0,81057 = 0,18943
On a donc P(|M1 − M2 | > 500) = 2 × 0,18943 = 37,88%
Exercice 5.10
a) Notons X l’heure d’arrivée d’un passager. Il est nécessaire d’adopter
Probabilités
une unique unité de mesure pour X, soit la minute, soit l’heure.
Choisissons la minute : ainsi 3h50 = 230 minutes. On a :
230 − m
P(X < 230) = 0,1 d’où P U < = 0,1
σ
230 − m
Ainsi = −1,2816
σ
2
De même 5h = 300 minutes, ainsi P(X > 300) = 0,05
300 − m
D’où 1− P U < = 0,05
σ
300 − m
Soit P U< = 0,95
σ
300 − m
Ainsi = 1,6449
σ
230 − m = −1,2816σ
© Dunod. Toute reproduction non autorisée est un délit.
On a donc
300 − m = 1,6449σ
300 − 230
Ainsi σ = = 23,91
1,6449 + 1,2816
et m = 230 + 1,2816 × 23,91 = 260,66
310 − 260,66
P(X > 310) = P U > = P(U > 2,06)
23,91
= 1 − P(U < 2,06) = 1 − 0,9803 = 1,97%
Ainsi sur 211 réservations, il va y avoir seulement 4 passagers en retard.
Par conséquent 207 passagers vont pouvoir monter dans un avion de
200 places ; ce qui est impossible et va imposer à la compagnie de don-
ner une compensation à ces 7 passagers.
Exercice 5.11
Le calcul direct par une loi de Poisson est trop long, on a ici λ = 12 > 5 ,
on peut donc envisager une approximation de cette loi par une loi nor-
√
male de moyenne 12 et d’écart-type 12 ≈ 3,46 . On a donc :
20 − 12
P(X > 20) = P U > = P(U > 2,31)
3,46
= 1 − P(U < 2,31) = 1 − 0.98956 = 1,044%
Exercice 5.12
a) La loi binomiale est parfaitement adaptée pour cette étude car chaque
pièce a exactement 2 % de chance d’avoir un défaut et on dispose d’un
ensemble fini de pièces. Cependant son utilisation va conduire à des cal-
culs trop long.
b) On a n = 10 000 et p = 0,02 , vérifions les conditions d’approxima-
tion par la loi normale de moyenne 10 000 × 0,02 = 200 et d’écart-type
√
10 000 × 0,02 × (1 − 0,02) = 14 .
√
On a np − 3 np(1 − p) = 200 − 3 × 14 = 158 > 0
√
et np + 3 np(1 − p) = 242 < 10 000
Ainsi les conditions sont bien vérifiées. Dans un ensemble de 10 000 piè-
ces, 2,2 % de pièces défectueuses représentent 220 pièces. On cherche
donc :
220 − 200
P(X > 500) = P U > = P(U > 1,42857)
14
= 1 − P(U < 1,42857) = 1 − 0,92364 = 7,64 %
9782100745302-legros-C05.qxd 03/05/16 7:38 Page 155
Solutions 155
Exercice 5.13
a) On a :
P(X = n + k) p(1 − p)n+k−1
P(X = n + k|X > k) = =
P(X ≥ k)
∞
(1 − p)i−1 p
t=k+1
p(1 − p)n+k−1
= = p(1 − p)n−1 = P(X = n) .
(1 − p)k
p
Probabilités
p
On a ainsi prouvé la propriété sans mémoire de la loi géométrique.
b) On a :
P(X > s + t) e−λ(s+t)
P(X > s + t|X > s) = = = e−λs
P(X > s) e−λs
= e−λt = P(X > t)
2
On ainsi prouvé la propriété sans mémoire de la loi exponentielle.
Exercice 5.14
a) Une durée de 10 secondes correspond à un sixième de minutes. La
probabilité que deux clients au moins arrivent en 10 secondes est la pro-
babilité d'observer un temps d'inter-arrivée inférieur à 10 secondes. En
notant T le temps d'inter-arrivée, on a :
1
P T < = 1 − e−1/6 = 15,35 %.
6
© Dunod. Toute reproduction non autorisée est un délit.
Exercice 5.15
a) On a pour x ≥ 0.
FYn (x) = P(Yn < x) = P(max(X 1 ,X 2 ,. . . ,X n ) < x)
= P(X 1 < x,X 2 < x,. . . ,X n < x)
Comme les variables aléatoires X 1 ,X 2 ,. . . ,X n sont indépendantes, on a :
FYn (x) = P(X 1 < x)P(X 2 < x) . . . P(X n < x) = (1 − e−x )n .
Pour la variable Z n , il n'est pas possible d'obtenir directement la fonction
de répartition. Par contre, on peut retrouver cette fonction par la relation
9782100745302-legros-C05.qxd 26/04/16 11:30 Page 156
De même,
n−1
+∞
n−1
E(Yn2 ) = (−1) nk
x 2 e−(k+1)x dx
k 0
k=0
n−1
n (−1)k
=2
k+1 (k + 1)2
k=0
6
CHAPITRE
Estimateurs
et tests d’hypothèses
Probabilités
➤ Maîtriser la notion d'échantillon.
➤ Connaître les estimateurs de moyenne de proportion.
➤ Savoir associer à un risque α le coefficient t correspondant.
➤ Donner des estimations ponctuelles de moyenne ou de proportion.
➤ Construire des intervalles de confiance pour la moyenne comme pour
la proportion.
2
➤ Connaître les formules d'intervalles de confiance pour les différences de
OBJECTIFS
moyenne et de proportion.
➤ Énoncer un test d'hypothèse unilatéral ou bilatéral.
➤ Trouver une probabilité critique et une valeur critique de validité de
l'hypothèse nulle.
➤ Conclure quant à la pertinence d'une hypothèse.
➤ Connaître la formule et la méthode du χ 2 (khi-deux).
➤ Savoir calculer un nombre de degrés de libertés.
➤ Lire la table de la loi du χ 2 .
➤ Utiliser le χ 2 pour conclure quant à la validité d'une modélisation.
➤ Utiliser le χ 2 pour montrer que deux paramètres sont indépendants.
6.1 Échantillons
6.2 Estimation d’une moyenne
PLAN
6.1 ÉCHANTILLONS
Les sondages et les enquêtes d’opinions servent à extrapoler des obser-
vations sur une population. Comment un sondage sur 1 000 personnes
donne-t-il une idée du résultat d’une élection ? Comment les tests de plu-
sieurs voitures peuvent-t-il assurer la fiabilité de l’ensemble de la pro-
duction ? En résumé, comment des données sur une petite partie de la
population peuvent-elles renseigner sur la population entière ? La ques-
tion est importante car il est généralement impossible de tester l’ensem-
ble d’une population.
L’idée est d’extraire un échantillon pour cerner au mieux l’ensemble de
la population. On distingue deux types d’échantillons :
– les échantillons aléatoires pour lesquels le choix des individus est le
fait du hasard ;
– les échantillons représentatifs pour lesquels on retient une liste de
critères représentatifs de la population. Ce choix de critères peut être
la classe sociale, l’âge, le sexe ou le lieu de résidence pour une popu-
lation humaine. On cherche à reproduire dans l’échantillon les catégo-
ries de la population.
Aucun de ces deux modes de constitution d’un échantillon n’est idéal.
Le hasard n’est jamais parfait : selon le moment de constitution de
l’échantillon, une catégorie risque d’être plus représentée qu’une autre.
Par exemple, si l’échantillon est réalisé dans la journée par des appels
chez les individus, les personnes qui ne travaillent pas risquent d’être
surreprésentées par rapport à celles qui sont au travail.
La grille d’analyse de constitution de l’échantillon représentatif est
arbitraire et n’inclut jamais l’ensemble des critères existant, elle peut
ainsi induire un préjugé d’observation.
Le taille de l’échantillon est un critère important pour l’analyse des
résultats : plus la taille de l’échantillon est importante, plus les résultats
sont fiables. Pour autant, il est coûteux de réaliser des enquêtes sur des
échantillons de taille trop importante, il y a donc une taille minimale
d’échantillon à rechercher pour avoir suffisamment de précisions au
niveau de l’analyse.
La taille de la population de référence importe aussi. En effet, si la
taille de la population est faible, la façon de constituer l’échantillon va
influer sur les résultats. Si on réalise l’échantillon par tirages successifs
avec remises, les résultats vont différer de la réalisation d’un échantillon
9782100745302-legros-C06.qxd 26/04/16 11:34 Page 159
par tirages successifs sans remise. Dans un tirage avec remises, la pro-
babilité d’apparition d’un critère ne varie pas d’un tirage à l’autre alors
que, dans un tirage sans remise, cette probabilité évolue d’un tirage au
suivant.
Ces différents points sont à retenir pour la pertinence de l’interprétation
des résultats. Néanmoins, pour mettre en place des critères de choix
utiles nous allons retenir plusieurs hypothèses simplificatrices dans ce
chapitre :
– les échantillons sont aléatoires et de taille importante ;
Probabilités
– la population de référence est de taille très grande.
Ainsi, on écarte les questions du mode de constitution de l’échantillon
et du choix de sa taille.
2
a) Construction de l’estimateur de moyenne
On cherche dans cette partie à estimer la moyenne d’un paramètre dans
une population, ce paramètre peut être le diamètre d’un objet dans une
production ou la durée de vie moyenne d’un composant.
On suppose que chaque élément de l’échantillon de taille n est repré-
senté par une variable X i et on suppose de plus que chacune des varia-
bles X i suit une même loi normale de moyenne m et d’écart-type σ. Pour
avoir une idée de la moyenne de la population, il semble naturel de s’in-
téresser dans un premier temps à la moyenne de l’échantillon.
X1 + X2 + X3 + · · · + Xn
© Dunod. Toute reproduction non autorisée est un délit.
On pose alors X̄ =
n
X̄ est l’estimateur de la moyenne dans un échantillon. X̄ suit une loi
normale. Cherchons à en déterminer les paramètres :
X1 + X2 + X3 + · · · + Xn
Espérance : E( X̄) = E
n
E(X 1 ) + E(X 2 ) + E(X 3 ) + · · · + E(X n )
=
n
m + m + m + ··· + m n×m
= = =m
n n
9782100745302-legros-C06.qxd 26/04/16 11:34 Page 160
X1 + X2 + X3 + · · · + Xn
Variance : V ( X̄) = V
n
V (X 1 ) + V (X 2 ) + V (X 3 ) + · · · + V (X n )
=
n2
σ + σ + σ + ··· + σ2
2 2 2
n × σ2 σ2
= = =
n2 n2 n
σ
Écart-type : σ X̄ = √
n
σ
Conclusion : X̄ suit une loi normale de moyenne m et d’écart-type √
n
Ainsi, une estimation ponctuelle de la moyenne est l’espérance de X̄.
Remarque : l’écart-type de X̄ diminue quand n augmente, ce qui
indique que plus la taille de l’échantillon est grande, plus la précision est
grande sur l’estimation de la moyenne.
b) Intervalle de confiance
La donnée ponctuelle d’une moyenne d’échantillon n’est pas suffisante
pour tirer une conclusion sur la moyenne de la population. Un interval-
le de confiance est un intervalle centré autour de m dans lequel on a un
pourcentage de chance (la confiance) de trouver la moyenne de la popu-
lation. On souhaite que ce pourcentage soit le plus important possible.
X̄ − m
On note α le risque et 1 − α la confiance. On sait que U = σ suit
√
n
une loi normale centrée réduite, on va donc dans un premier temps cher-
cher un réel positif t tel que P(−t < U < t) = 1 − α.
La Figure 6-1 représente la loi normale centrée réduite avec une valeur
de t qui permet d’avoir P(−t < U < t) = 1 − α. Par symétrie de la
courbe, on en déduit que le risque α est séparé en deux à gauche et à
droite de l’intervalle.
On a :
P(−t < U < t) = P(U < t) − P(U < −t) = P(U < t) − P(U > t)
= P(U < t) − (1 − P(U < t)) = 2 P(U < t) − 1
Ainsi 2 P(U < t) − 1 = 1 − α
Soit 2 P(U < t) = 2 − α
α
D’où P(U < t) = 1 −
2
9782100745302-legros-C06.qxd 26/04/16 11:34 Page 161
0,4
0,3
0,2
α α
2 2
0,1
Probabilités
-3 -2.5 -2 -1.5 -1 -0.5 0 0,5 1 1,5 2 2,5 3
Figure 6-1 Intervalle de confiance
2
Tableau 6-1 Valeurs de t classiques
α
α 1− t
2
10 % 0,95 1,6449
5% 0,975 1,96
2% 0,99 2,3263
1% 0,995 2,5758
Comme P(−t < U < t) = 1 − α, on a P − t < X̄−m
<t = 1 − α,
© Dunod. Toute reproduction non autorisée est un délit.
√σ
n
d’où P −t √σn < X̄ − m < t √σn = 1 − α
soit P m − t √σn < X̄ < m + t √σn = 1 − α
Méthode
– Si on ne connaît pas m , on calcule la moyenne dans l’échantillon et on l’utilise
dans l’intervalle de confiance.
– Si on ne connaît pas σ , on utilise la valeur s à la place de σ . Cette valeur est une
estimation de l’écart-type de la population et se calcule par la formule :
n
s= (moyenne des carrés – moyenne au carré)
n−1
Remarques
n
– Dans la formule de s, si n est très grand le coefficient, tend vers
n−1
1 et on retrouve un calcul classique d’écart-type.
– La construction des intervalles de confiance pour la moyenne s’est
faite sur l’hypothèse d’une loi normale. Avec les approximations de
lois du chapitre précédent, il est envisageable d’élargir le cadre des
intervalles de confiance à d’autres lois.
Variance :
X1 + X2 + X3 + · · · + Xn
V (Y ) = V
n
V (X 1 ) + V (X 2 ) + V (X 3 ) + · · · + V (X n )
=
n2
p(1 − p) + p(1 − p) + p(1 − p) + · · · + p(1 − p)
=
n2
np(1 − p) p(1 − p)
= =
Probabilités
n2 n
p(1 − p)
Écart-type : σY =
n
On admet que la variable Y peut-être approximée par une loi Normale de
p(1 − p)
moyenne p et d’écart-type
n
2
Ainsi, une estimation ponctuelle de la proportion dans la population est
la proportion dans l’échantillon.
b) Intervalle de confiance
L’intervalle de confiance au risque α pour la proportion est donc
p(1 − p) p(1 − p)
p−t ; p+t où t est donné par la rela-
n n
α
tion P(U < t) = 1 −
© Dunod. Toute reproduction non autorisée est un délit.
2
Remarque : si on ne dispose pas de p dans la population, on calcule p
dans l’échantillon et on l’utilise pour réaliser l’intervalle de confiance.
σa2 σ2
Ainsi σ Z = + b
na nb
Ainsi l’intervalle de confiance au risque α pour Z est :
σ 2 σ 2
σ 2 σ 2
m a − m b − t a
+ b ; ma − mb + t a
+ b
na nb na nb
a) Test unilatéral
Exemple. Le nombre d’articles vendus par jour pendant l’année dans un
magasin suit une loi normale de moyenne 300 et d’écart-type 20. Pendant
les soldes qui durent 15 jours, le nombre moyen d’articles vendus par jour
est de 315. Les soldes induisent-elles une amélioration significative des
ventes ?
9782100745302-legros-C06.qxd 26/04/16 11:34 Page 165
Probabilités
m = 300 » ;
– l’hypothèse alternative : H1 « Les soldes amènent un progrès dans les
ventes : m > 300 ».
Il s’agit d’arbitrer entre ces deux hypothèses. Si l’hypothèse H0 est
vraie, quelle est la probabilité que la moyenne observée soit de 315 ou
plus ? Notons X̄ l’estimateur de moyenne dans l’échantillon ; il suit sous
20
H0 une loi normale de moyenne 300 et d’écart-type √ = 5,16398
2
15
Ainsi on a :
315 − 300
P( X̄ > 315) = P U > = P(U > 2,90)
5,16398
= 1 − P(U < 2,90) = 1 − 0,9981 = 0,19 %
Cette probabilité est la probabilité de crédibilité de l’hypothèse H0 . Ici
cette probabilité est très faible et l’hypothèse H0 peut-être rejetée sans
grand risque.
La probabilité 0,19 % est la probabilité critique de l’hypothèse H0 .
On peut prendre le problème à l’inverse et fixer un seuil d’acceptation
© Dunod. Toute reproduction non autorisée est un délit.
Méthode
1. On formule deux hypothèses : une hypothèse nulle de non changement par
rapport à la situation initiale et une hypothèse alternative d’augmentation (ou
de diminution de la moyenne).
2. Si on dispose d’une observation, on détermine la probabilité critique pour
laquelle cette observation est acceptable dans le cadre de l’hypothèse nulle.
Plus cette probabilité critique est faible, moins l’hypothèse nulle est crédible.
3. On fixe une probabilité critique en dessous de laquelle l’hypothèse nulle sera
rejetée et on calcule la valeur critique de la moyenne observée. Par comparai-
son entre cette valeur critique et notre observation, on rejette ou on accepte
l’hypothèse nulle.
Remarques
– Dans l’exemple, l’alternative à l’hypothèse nulle est l’augmentation de
la moyenne, on peut de façon symétrique envisager que le changement
soit une baisse de la moyenne.
– Ce qui vient d’être présenté pour une variation de moyenne est
transposable à une variation de proportion ou de différences de moyen-
nes ou de proportions.
b) Test bilatéral
À l’inverse du test unilatéral, l’alternative ne se trouve plus d’un seul
côté mais des deux cotés.
Exemple. Une machine à boisson remplie les verres selon une loi
Normale de moyenne 33 cl et d’écart-type 5 cl. Sur les dix derniers ver-
res, on constate une moyenne de contenance des verres de 30 cl. La
machine est-t-elle déréglée ?
Le dérèglement de la machine peut-être envisagé de deux façons, soit
uniquement par le fait que les verres ne semblent pas assez remplis, soit
par le fait que les verres soient trop remplis et débordent. On va prendre
en compte les deux possibilités ici. On formule ainsi deux hypothèses en
notant m le paramètre de la loi normale représentant la moyenne des dix
derniers verres remplis :
– l’hypothèse nulle H0 est « m = 33 » ;
– l’hypothèse alternative H1 est « m > 33 ou m < 33 ».
9782100745302-legros-C06.qxd 26/04/16 11:34 Page 167
Probabilités
loi normale est symétrique, la probabilité critique est
30 − 33
2 P( X̄ < 30) = 2 P U < = 2 P(U < −1,90)
1,58114
= 2 P(U > 1,9) = 2(1 − P(U < 1,9))
= 2(1 − 0,97128) = 5,74 %
La conclusion dépend du seuil d’acceptation que l’on choisit : si on
2
choisit un seuil d’acceptation de 5 %, l’hypothèse nulle est acceptable
car la probabilité critique est supérieure à 5 %. Par contre, si on choisit
un seuil d’acceptation à 10 %, l’hypothèse nulle n’est pas acceptable.
On peut chercher un intervalle de valeurs critiques pour lequel
l’hypothèse nulle est acceptable à 5 %. Il s’agit de l’intervalle
de confiance à 5 % pour la moyenne :
[33 − 1,96 × 1,58114 ; 33 + 1,96 × 1,58114] = [29,9 ; 36,099]
Ainsi l’hypothèse nulle est acceptable au seuil 5 % si l’observation est
comprise entre 29,9 cl et 36,1 cl ce qui est le cas ici.
Remarque : les tests bilatéraux s’effectuent aussi pour des proportions
© Dunod. Toute reproduction non autorisée est un délit.
6.6 TEST DU χ 2
L’observation d’un phénomène conduit à une recherche de modèle. On
a vu qu’une loi dont l’espérance est proche de la variance invite à une
modélisation par une loi de Poisson, une variable continue dont la den-
sité ressemble à une cloche invite à une modélisation par une loi nor-
male.
Le problème se pose ainsi :
1. On dispose d’une série d’observations.
2. On propose un modèle proche de notre observation.
3. On s’interroge sur la légitimité de notre modèle.
9782100745302-legros-C06.qxd 26/04/16 11:34 Page 168
Exemple. On réalise une enquête sur 200 personnes qui indiquent le nom-
bre d’ordinateurs chez eux :
Remarques.
La dernière case du modèle a été complétée de manière à ce que la
somme des cases soit égale à 200.
On regroupe les dernières cases de manière à avoir des effecfifs au moins
égaux à 5.
On observe des écarts qui semblent très faibles entre la théorie et l’ob-
servation. Mais est-ce suffisant pour conclure ? Non : il est nécessaire de
9782100745302-legros-C06.qxd 26/04/16 11:34 Page 169
mettre en place un test qui légitime avec un certain risque notre modèle.
Pour cela, on introduit une variable qui se nomme χ 2 et se calcule ainsi :
(Valeurs observées - Valeurs calculées)2
χ2 =
Valeurs calculées
Cette grandeur mesure des « écarts relatifs » entre l’observation et le
modèle.
Dans notre exemple, on trouve :
(60 − 60,24)2 (73 − 72,28)2 (43 − 43,38)2
Probabilités
χ2 = + +
60,24 72,28 43,38
(17 − 17,34)2
(7 − 6,76)2
+ + = 0,026644
17,34 6,76
Pour savoir si cette valeur est faible ou non, il faut la comparer à une
valeur de référence donnée par la table du χ 2 :
2
Tableau 6-4 Table du χ 2
Méthode
1. On calcule des effectifs théoriques à l’aide de la loi proposée dans le modèle et
on arrondit le dernier de manière à ce que la somme soit égale à l’effectif total.
2. On regroupe les valeurs adjacentes de manière à ce que les effectifs dans les
cases soit au moins de 5.
3. On calcule le c2 .
4. On choisit un risque et on calcule le degré de liberté.
5. On compare la valeur observée à la valeur de la table de manière à conclure si,
oui ou non, le modèle est légitime.
b) Test d’indépendance
Le test du χ 2 permet aussi de vérifier l’indépendance ou non de deux
facteurs.
Probabilités
Dans un premier temps, nous allons calculer ce qu’aurait été la réparti-
tion des employés si les deux événements étaient indépendants.
Pour cela, on utilise la formule :
Bout de la ligne × Bout de la colonne
Total des cases
2
Par exemple, pour la première case on trouve l’effectif théorique par :
103 × 138
= 63,74
223
On complète ainsi le tableau :
Tableau 6-6 Répartition théorique des salaires
POINTS CLÉS
Estimation
Estimateurs Loi Intervalle de confiance
ponctuelle
Normale
Moyenne σ
m; √n m m − t √σn ; m + t √σn
p(1−p)
Normale p−t n ;
p
Proportion p(1−p) p(1−p)
p; n p+t n
Normale ma − mb σ2a σ2b
(ma − mb ; ma − mb − t na + nb ;
Différence
de moyenne σ2a σ2b σ2a σ2b
na + nb ma − mb + t na + nb
[pa − pb
Normale pa − pb
pa (1−pa ) pb (1−pb )
Différence (pa − pb ; −t na + nb ;
de proportion pa (1−pa ) p (1−p ) pa − pb
na + b nb b pa (1−pa ) pb (1−pb )
+t na + nb
Points-clés 173
Probabilités
vation. Elle peut être unilatérale ou bilatérale.
➤ On teste l’hypothèse nulle par calcul d’une probabilité critique ou
d’une seuil d’acceptation de l’hypothèse nulle.
➤ La probabilité critique est la probabilité d’observée les conditions de
l’hypothèse alternative sous l’hypothèse nulle.
➤ Le seuil d’acceptation est la limite au dessus (ou en dessous) de
laquelle on doit rejeter l’hypothèse nulle avec un risque fixé.
2
➤ Le χ2 se calcule par la formule
EXERCICES
6.1 Recettes
Une usine produit deux objets A et B. La quantité d’objets A produite en
une journée suit une loi normale de moyenne 2 000 et d’écart-type 500.
La quantité d’objet B produite en une journée suit une loi normale de
moyenne 1 000 et d’écart-type 300. Un objet A est vendu 30 euros et un
objet B est vendu 50 euros. On suppose que tous les objets produits sont
vendus.
a) Donner la loi de R représentant la recette réalisée en une journée.
Donner sa moyenne et son écart-type.
b) Les dépenses liées à la production engendrent un coût fixe de 80 000
euros quelle que soit la production. Déterminer la probabilité que l’usi-
ne perde de l’argent en une journée.
c) On observe les recettes de cette usine sur un mois de 30 jours.
Donner un intervalle de confiance à 5 % de la recette moyenne sur ces
30 jours.
d) Expliquer comment évoluerait cet intervalle de confiance si le nom-
bre de jours d’observation augmentait.
6.3 Référendum
On effectue un sondage sur 100 personnes avant un référendum, 51 per-
sonnes affirment qu’elles vont voter oui.
a) Donner un intervalle de confiance au risque 5 % de la proportion de
personnes qui vont voter oui.
b) Peut-on affirmer que le oui va l’emporter ?
c) Pour quelle taille de population sondée, peut-on affirmer à 95 % que
le oui va l’emporter sachant que la proportion de « votant oui » demeu-
re constante dans l’échantillon ?
9782100745302-legros-C06.qxd 26/04/16 11:34 Page 175
Exercices 175
6.5 Électroménager
Un vendeur d’appareils électroménagers assure un remboursement de
l’appareil s’il tombe en panne avant 5 ans. Sur un échantillon de 120
Probabilités
appareils, on compte une durée de vie moyenne de 5 ans et demi avec un
écart-type de 2 ans. Quel est le risque pour le vendeur de voir ses appa-
reils tomber en panne en moyenne avant 5 ans ?
6.6 La crise
On compare les baisses du cours des actions réalisées au moment de la
crise grecque, le vendredi 14 avril 2010, par des entreprises américaines
du Dow Jones 30 et des entreprises françaises du CAC40.
2
Dow Jones 30 Variations CAC40 Variations
6.8 Sondage
Lors des dernières élections, le parti A a réalisé 52 % des suffrages. On
réalise un sondage sur 1 000 personnes et 49 % de ces personnes affir-
ment vouloir voter pour ce parti. On s’intéresse à cette baisse de pour-
centage
a) Poser les hypothèses d’un test unilatéral.
b) Déterminer la probabilité critique liée à l’observation.
c) Déterminer la valeur critique de proportion au risque 5 %.
d) Conclure.
Solutions 177
6.11 Jeu de dé
On lance un dé plusieurs fois et on dénombre les valeurs obtenues :
Valeurs 1 2 3 4 5 6
Nombre de lancers 10 21 15 12 23 19
Probabilités
À l’aide d’un test du χ2 au risque α = 5 %, déterminer si ce dé est équi-
libré ou non.
2
Limoges Brive Guéret Total
Radio1 20 17 10 47
Radio2 17 16 12 45
Radio3 39 24 12 75
Radio4 12 8 13 33
Total 88 65 47 200
Déterminer si l’appréciation d’une radio dépend ou non de la localisa-
© Dunod. Toute reproduction non autorisée est un délit.
tion géographique.
SOLUTIONS
Exercice 6.1
a) Notons X le nombre d’objets A vendus et Y le nombre d’objets B
vendus. La recette est R = 30 X + 50Y.
On a :
E(R) = E(30 X + 50Y ) = 30 E(X) + 50 E(Y )
= 30 × 2 000 + 50 × 1 000 = 110 000 euros
V (R) = V (30 X + 50Y ) = 302 V (X) + 502 V (Y )
= 302 × 5002 + 502 × 3002 = 450 000 000
9782100745302-legros-C06.qxd 26/04/16 11:34 Page 178
√
Ainsi l’écart-type de R est σ R = 450 000 000 = 21 213,2 euros.
R suit donc une loi normale de moyenne 110 000 et d’écart-type 21 213,2.
b) On cherche la probabilité :
80 000 − 110 000
P(R < 80 000) = P U < = P(U < −1,41)
21213,2
= P(U > 1,41) = 1 − P(U < 1,41) = 1 − 0,92073
= 7,927 %
c) L’intervalle de confiance est :
21 213,2 21 213,2
110 000 − 1,96 √ ; 110 000 + 1,96 √
30 30
= [102 408,95 ; 117 591,05]
d) Si le nombre de jours d’observations augmente, la valeur de n aug-
mente et par conséquent la largeur de l’intervalle diminue. Si on dispo-
se de plus d’observations, l’estimation de la moyenne sera plus précise.
Exercice 6.2
Il s’agit de faire un intervalle de confiance à 95 % pour la distance
moyenne à laquelle se trouve le tueur du lieu du crime. On a t = 1,96 ,
la moyenne est m = 23×6+2347+×4725++33×150 = 24,15 km, le coefficient
s = 2323++4747++3−3 1 23×6 +23
47×252 +3×1502
2
n = 23 + 47 + 3 = 73
Ainsi l’intervalle de confiance est :
27,67 27,67
24,15 − 1,96 √ ; 24,15 − 1,96 √ = [17,8 ; 30,5]
73 73
Les recherches vont pouvoir se concentrer dans un rayon d’au plus
30,5 km et d’au moins 17,8 km du lieu du crime.
Exercice 6.3
a) On a t = 1,96 , n = 100 et p = 0,51 ainsi l’intervalle de confiance est :
0,51(1 − 0,51) 0,51(1 − 0,51)
0,51 − 1,96 ; 0,51 + 1,96
100 100
= [41,2 % ; 60,8 %]
9782100745302-legros-C06.qxd 26/04/16 11:34 Page 179
Solutions 179
Probabilités
Soit 0,51 − 0,5 > 1,96
n
0,01 (0,51(1 − 0,51)
D’où >
1,96 n
0,01 2 (0,51(1 − 0,51)
Soit >
1,96 n
2
0,51(1 − 0,51)
Ainsi n > 2
0,01
1,96
Soit n > 9 600,16 . Il est donc nécessaire d’interroger au moins 9 601
personnes pour s’assurer au risque 5 % du résultat du vote.
Exercice 6.4
Il s’agit d’une application directe des intervalles de confiance pour une
30
proportion. La proportion dans l’échantillon est de = 0,075
© Dunod. Toute reproduction non autorisée est un délit.
400
– Au niveau 95 %, on a t = 1,96 ainsi :
p(1− p) p(1− p)
p−t n ; p+t n
0,075(1−0,075) 0,075(1−0,075)
= 0,075 − 1,96 400
; 0,075 + 1,96 400
= [0,049 ; 0,101]
– Au niveau 99 %, on a t = 2,5758 ainsi :
p(1− p) p(1− p)
p−t n ; p+t n
0,075(1−0,075) 0,075(1−0,075)
= 0,075 − 2,5758 400
; 0,075 + 2,5758 400
= [0,041 ; 0,108]
9782100745302-legros-C06.qxd 26/04/16 11:34 Page 180
Exercice 6.5
On cherche en réalité dans cet exercice un intervalle de confiance centré
sur 5,5 ans et dont la borne inférieure soit de 2 ans. On dispose de
l’écart-type et de la taille de l’échantillon, reste à déterminer la valeur de
t liée au risque pris par le vendeur :
2
5,5 − t √ =5
120
√
2 120
ainsi 5,5 − 5 = t √ soit t = 0,5 = 2,74
120 2
α
On rappelle que t est donné par la relation : P(U < t) = 1 −
2
D’après la table de la loi normale centrée réduite, on a :
P(U < 2,74) = 0,99693
α α
Ainsi 1 − = 0,99693 d’où = 0,00307
2 2
Le risque de voir ses appareils tomber en panne en moyenne avant 5 ans
est de 0,307 %, ce qui est très faible.
Exercice 6.6
a) Déterminons dans un premier temps la variation moyenne des entre-
prises américaines et la variation moyenne des entreprises françaises,
ainsi que le coefficient s de chacune.
Pour les entreprises américaines :
m a = −3,03−0,28−1,286−3,14−2,65−1,06 = −1,91 %
sa = 65 3,03 +0,28 +1,28 +6 3,14 +2,65 +1,06 − (−1,91)2 = 1,19 %
2 2 2 2 2 2
na nb na nb
9782100745302-legros-C06.qxd 26/04/16 11:34 Page 181
Solutions 181
1,192 1,172
= −1,91 − (−3,89) − 1,96 + ;
6 6
1,192 1,172
−1,91 − (−3,89) +1,96 +
6 6
= [0,64 % ; 3,32 %]
b) L’intervalle de confiance est positif, ainsi au risque d’erreur 5 % on
peut affirmer que l’écart entre les baisses des entreprises américaines et
les baisses des entreprises françaises est positif. On peut donc conclure
Probabilités
au vue de cet intervalle de confiance que les entreprises françaises ont
davantage souffert de la crise grecque.
c) Notons m a et m f les paramètres de moyenne des entreprises améri-
caines et françaises.
– L’hypothèse nulle H0 est « m a = m f ».
– L’hypothèse alternative H1 est « m a > m f ».
2
On s’intéresse à la loi de X¯a − X¯ f. On cherche un écart critique E c pour
lequel P( X¯a − X¯ f > E c ) = 0,01 . Si on suppose l’hypothèse H0 vrai,
X¯a − X¯ f suit une loi normale de moyenne 0 et d’écart-type
1,192 1,172
+ = 0,6813 . On peut ainsi « centrer réduire » la varia-
6 6
Ec − 0 Ec
ble : P U > = 0,01 , ainsi P U < = 0,99 .
0,6813 0,6813
À l’aide de la table de la loi normale inverse, on trouve :
Ec
© Dunod. Toute reproduction non autorisée est un délit.
= 2,3263
0,6813
Ainsi E c = 1,5849 % . L’écart moyen constaté est de
−1,91 − (−3,89) = 1,98 % . Cet écart est supérieur à l’écart critique, au
risque 1 % l’hypothèse nulle doit être rejetée.
d) Plusieurs limites se présentent à notre modèle, tout d’abord la taille de
l’échantillon qui est très petit (6 entreprises américaines et 6 entreprises
françaises), le choix des entreprises dans le Dow Jones ou le CAC 40
indique des entreprises de fortes capitalisations et donc non nécessairement
représentatives de l’ensemble de marché national. Le calcul de la moyenne
a donné un poids égal à chaque entreprises ; or, elles sont de tailles diffé-
rentes, il aurait fallu pondérer soit par la taille soit par le volume de titres
échangés. La construction d’un intervalle de confiance suppose des varia-
bles qui suivent une loi normale, rien n’assure que c’est le cas ici.
9782100745302-legros-C06.qxd 26/04/16 11:34 Page 182
Exercice 6.7
a) Il s’agit de l’intervalle de confiance d’une différence de deux proportions.
Le risque est 5 % ainsi t = 1,96 , on a n a = 400, pa = 2 % , n b = 350 et
pb = 1,5 % .L’intervalle de confiance est donné par la formule :
pa − pb −t pa (1n−a pa ) + pb (1n−b pb ) ; pa − pb +t pa (1n−a pa ) + pb (1− pb )
nb
= 0,02 − 0,015 − 1,96 0,02(400 1−0,02)
+ 0,015(350
1−0,015)
;
0,02 − 0,015 + 1,96 0,02(400
1−0,02)
+ 0,015(1−0,015)
350
= [−1,37 % ; 2,37 %]
b) Au risque 5 %, on ne peut rien conclure car l’intervalle de confiance
contient des valeurs positives et des valeurs négatives.
Exercice 6.8
a) On s’intéresse à la proportion dans le sondage. L’hypothèse nulle est
p = 52 % . L’hypothèse alternative est p < 52 % .
b) Sous l’hypothèse H0 , la proportion Y dans l’échantillon suit une loi
normale de moyenne 52 % et d’écart-type 0,521(1000
−0,52)
= 1,5799 % . La
probabilité critique est donc :
P(Y < 0,49) = P U < 00,49 −0,52
,015799 = P(U < −1,90) = P(U > 1,9)
Solutions 183
Exercice 6.9
a) Notons m le paramètre de la moyenne de l’estimateur de la moyen-
ne du chiffre d’affaires des 20 jours. On note H0 l’hypothèse nulle, on a
H0 : « m = 1 000 » ; et l’hypothèse alternative H1 : « m = 1 000 ».
L’intervalle critique au seuil 1 % n’est autre que l’intervalle de confian-
ce du chiffre d’affaire moyen qui suit sous l’hypothèse H0 une loi nor-
1 000
male de moyenne 1 000 et d’écart-type √ = 223,61 . L’intervalle de
20
confiance est :
Probabilités
[1 000 − 2,5758 × 223,61 ; 1 000 + 2,5759 × 223,61]
= [424,03 ; 1 575,99]
b) Un chiffre d’affaires moyen de 1 200 est dans l’intervalle critique, il
est d’ailleurs assez loin des extrémités, on peut donc conclure que l’hy-
pothèse H0 est acceptable.
Exercice 6.10
2
a) On calcule la moyenne et l’écart-type de la série :
La moyenne est :
10 × 900 + 40 × 1 100 + 100 × 1 350 + 110 × 1 650 + 30 × 2 150 + 8 × 2 750 + 2 × 3 500
3 00
= 1 543,33
L’écart-type est :
10 × 9002 + 40 × 1 1002 + 100 × 1 3502 + 110 × 1 6502 + 30 × 2 1502 + 8 × 2 7502 + 2 × 3 5002
− 1 543,332
300
= 397,23
© Dunod. Toute reproduction non autorisée est un délit.
Solutions 185
Exercice 6.11
On a réalisé 100 lancers ; si le dé était parfaitement équilibré, on devrait
100
trouver « théoriquement » = 16,67 fois chaque face du dé.
6
On calcule ensuite le χ 2 entre l’observation et la théorie :
Valeurs 1 2 3 4 5 6
Probabilités
Nombre de lancers 10 21 15 12 23 19
Théorie 16,67 16,67 16,67 16,67 16,67 16,65
χ 2
2,67 1,12 0,17 1,3 2,4 0,33
Remarque : la dernière valeur théorique est de 16,65 de manière à
atteindre un total de 100.
2
La χ 2 observé est donc 2,67 + 1,12 + 0,17 + 1,3 + 2,4 + 0,33 = 7,99
Le nombre de cases est 6, le nombre de paramètres est 0. Le nombre de
degrés de liberté est donc 5.
À 5 %, la table indique une valeur de χ 2 de 11,07
On a χ 2 observé < χ 2 de la table donc on peut admettre que le dé est
bien équilibré.
Exercice 6.12
Effectifs théoriques :
Limoges Brive Guéret Total
© Dunod. Toute reproduction non autorisée est un délit.
ÉTUDE Problème
DE CAS de synthèse
Jours Action A
Lundi 10,5
Mardi 10
Mercredi 9,9
Jeudi 10,7
Vendredi 11,4
4. Représenter graphiquement le cours de l'action A les semaines 1 et 2
(on ne prendra pas en compte les samedis et dimanches).
5. Déterminer la droite des moindres carrés de cette série.
6. Quel est le modèle de cette série ?
7. À l'aide de la méthode des coefficients saisonniers, donner une esti-
mation des cours de l'action A pour les jours de la semaine 3.
8. Un investisseur achète des actions le mercredi de la semaine 1 pour les reven-
dre le vendredi de la semaine 3. Quel serait (en pourcentage) son gain ?
9. Déterminer les moyennes mobiles de période 3 pour l'action A sur les
dix jours. Déterminer les jours pour lesquels le conseil est à l'achat et
les jours pour lesquels le conseil est à la vente, sachant qu'un conseil
à l'achat est donné quand la courbe coupe les moyennes mobiles du
bas vers le haut et qu'un conseil de vente est donné quand la courbe
coupe les moyennes mobiles du haut vers le bas.
Remarque : on calculera les moyennes mobiles sur les trois derniers
jours.
10. Quel retracement peut-t-on envisager avec un ratio de 50 % ?
11. Sur les 200 derniers jours les cours de l'action sont répartis ainsi :
Tableau 3
SOLUTIONS
1. Pour l'action A : le pourcentage d'augmentation est donné par
10,8
= 1,06931 . Ainsi le cours a progressé de 6,93 %. La variation
10,1
a lieu sur 5 jours mais il y a seulement 4 variations : du lundi au
mardi, du mardi au mercredi, du mercredi au jeudi et du jeudi au ven-
dredi. Le coefficient moyen de variation c est donné par :
9782100745302-legros-cas.qxd 21/04/16 13:53 Page 190
1
c4 = 1,06931 soit c = 1,06931 4 = 1,01689 . Le cours a ainsi aug-
menté en moyenne de 1,69 % par jour.
Pour l'action B : le pourcentage d'augmentation est donné par
5,4
= 1,01887 . Ainsi le cours a progressé de 1,89 %.
5,3
Le coefficient moyen de variation c est donné par : c4 = 1,01887 soit
1
c = 1,01887 4 = 1,00468 . Le cours a ainsi augmenté en moyenne de
0,47 % par jour.
Pour l'action C : le pourcentage d'augmentation est donné par
64,7
= 1,09106 . Ainsi le cours a progressé de 9,11 %. Le coefficient
59,3
moyen de variation c est donné par : c4 = 1,09106 soit
1
c = 1,09106 4 = 1,02203 . Le cours a ainsi augmenté en moyenne de
2,20 % par jour.
Pour l'action D : le pourcentage de diminution est donné par
11,2
= 0,72258 . Ainsi le cours a baissé de 27,74 %. Le coefficient
15,5
moyen de variation c est donné par : c4 = 0,72258 soit
1
c = 0,72258 4 = 0,92198 . Le cours a ainsi baissé en moyenne de
7,80 % par jour.
5,32 +5,32 +5,42 +5,32 +5,42
L'écart-type est 5
− 5,342 = 0,04899
0,04899
Ainsi le coefficient de variation est C VB = = 0,0092
5,34
Pour l'action C : la moyenne est
59,3 + 56,6 + 53 + 61,3 + 64,7
= 58,98
5
59,32 +56,62 +532 +61,32 +64,72
L'écart-type est 5
− 58,982 = 3,99
3,99
Ainsi le coefficient de variation est C VC = = 0,0677
58,98
Pour l'action D : la moyenne est
15,5 + 18,3 + 20,3 + 14,3 + 11,2
= 15,92
5
15,52 +18,32 +20,32 +14,32 +11,22
L'écart-type est 5
− 15,922 = 3,16
3,16
Ainsi le coefficient de variation est C VD = = 0,1985
15,92
On a C VD > C VC > C V A > C VB , ainsi les titres B sont les moins
risqués et les titres D sont les plus risqués. Des titres plus risqués peu-
vent éventuellement être aussi plus rentables.
11,3 Cours
11,1
10,9
10,7
10,5
10,3
10,1
9,9
Jours
1 2 3 4 5 6 7 8 9 10
Jours 1 2 3 4 5 6 7 8 9 10
Cours 10,1 9,8 9,7 10,2 10,8 10,5 10 9,9 10,7 11,4
MM3 - - 9,87 9,9 10,23 10,5 10,43 10,13 10,20 10,67
On réalise les calculs des moyennes mobiles sur les trois dernières
valeurs. Par exemple le premier calcul dans la troisième case est :
10,1 + 9,8 + 9,7
= 9,87
3
9782100745302-legros-cas.qxd 21/04/16 13:53 Page 194
11,3
Cours
11,1
10,9
10,7
10,5
10,3
MM3
10,1
9,9
Jours
1 2 3 4 5 6 7 8 9 10
M − 9,5 10 − 9,5
Ainsi : =
100 − 97 163 − 97
0,5
d'où M − 9,5 = 3 × , soit M = 9,5227
66
Le premier quartile correspond à un effectif cumulé de 50. On a la
répartition suivante :
9 Q1 9, 5
33 50 97
Q1 − 9 9,5 − 9
Ainsi : =
50 − 33 97 − 33
0,5
d'où Q 1 − 9 = 17 × , soit Q 1 = 9,1328
64
Le troisième quartile correspond à un effectif cumulé de 150. On a la
répartition suivante :
9, 5 Q3 10
97 150 163
Q 3 − 9,5 10 − 9,5
Ainsi : =
150 − 97 163 − 97
0,5
d'où Q 3 − 9,5 = 53 × , soit Q 3 = 9,9015
66
12. Une loi normale représentant cette série aurait la même moyenne et
le même écart-type que la série.
Moyenne
= 7,75×4+8,25×9+8,75×20+9,25×64+9,75× 66+10,25×22+10,75×8+11,25×5+11,75×2
200
= 9,535 .
Écart-type
7,752 ×4+8,252 ×9+8,752 ×20+9,252 ×64+9,752 ×66+10,252 ×22+10,752 ×8+11,252 ×5+11,752 ×2
= 200
− 9,5352
= 0,6919
9782100745302-legros-cas.qxd 21/04/16 13:53 Page 196