Nothing Special   »   [go: up one dir, main page]

0% ont trouvé ce document utile (0 vote)
123 vues4 pages

Exercice TP Statistique

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1/ 4

TP: Statistique inférentielle et modélisation

January 9, 2022

Objectifs
L’objectif de ce document est de présenter les principaux tests statistiques et commandes R
utilisés dans la pratique.

Exercice 1
Un producteur affirme qu’exactement 25% des haricots verts de sa récolte sont extra-fins.
Sur 400 haricots verts choisis au hasard dans la récolte, on en compte 118 extra-fins.

• Est-ce que l’on peut affirmer, au risque 5%, que le producteur a tort ?

Exercice 2
La société de Monsieur Labrador utilise deux machines, machine 1 et machine 2, pour rem-
plir automatiquement des paquets de cacao en poudre.

• On prélève un échantillon de 10 paquets remplis par la machine 1 et on les pèse. Les


résultats, en grammes, sont:
106.70 107.02 107.15 107.22 107.41 106.39 107.47 107.61 107.38 107.22

• On prélève un échantillon de 9 paquets remplis par la machine 2 et on les pèse. Les


résultats, en grammes, sont :
107.68 106.69 107.24 107.69 106.97 107.52 106.22 107.23 107.32

On suppose que le poids en grammes d’un paquet rempli par la machine 1 peut être mod-
élisé par une X 1 ∼ N (µ1 , 1.3) et celui avec la machine 2 peut être modélisé par une variable
X 2 ∼ N (µ2 , 0.9).

• Peut-on affirmer, au risque 5%, que les machines sont réglées de manière différente ?

1
Exercice 3
On considère deux lots de tasses et on souhaite comparer la solidité de ceux-ci. Pour chacun
des deux lots, on dispose d’un échantillon de 10 tasses et on mesure la résistance de chacune
d’entre eux. Les résultats sont :

• pour le premier échantillon :


31.70 31.98 32.24 32.35 31.18 32.19 32.63 31.19 31.54 31.89

• pour le deuxième échantillon :


31.61 31.10 31.20 31.11 32.66 31.15 31.71 31.22 31.16 31.21

La solidité d’une tasse du premier lot peut être modélisée par une var X 1 , et celle du tasse
du second lot peut être modélisée par une var X 2 . On suppose que X 1 et X 2 suivent des lois
normales de variances égales.
Peut-on affirmer que ces deux échantillons ne proviennent pas de la même production ?

Exercice 4
On dispose de deux lots de boîtes de sauce italienne conditionnées de la même manière
mais provenant de producteurs différents. On s’intéresse à la teneur en grammes de viande
dans celles-ci.

• On extrait 7 boîtes provenant du premier producteur et on mesure leur teneur de


viande. Les résultats, en grammes, sont :
12.12 12.03 13.58 13.38 11.81 15.92 13.65

• On extrait 6 boîtes provenant du deuxième producteur et on mesure leur teneur de


viande. Les résultats, en grammes, sont :
14.81 13.93 14.91 15.87 15.62 15.39

La teneur en grammes de viande dans une boîte provenant du premier producteur peut être
modélisée par une var X 1 , et celle dans une boîte provenant du deuxième producteur peut
être modélisée par une var X 2 . On suppose que X 1 et X 2 suivent des lois normales. Peut-on
affirmer qu’il y a une différence entre les producteurs quant à la teneur moyenne en viande
dans les boîtes ?

2
Exercice 5
Nous donnons les couples d’observations suivants :

xi 3 4 4 7 9 10 10 12 12 17 14 34 24 21 37

yi 40 46 53 58 65 70 76 82 88 94 101 106 111 117 123

Alors, dans l’exercice, on a seulement 15 observations de deux variables xet y. On souhaite


expliquer les variations de x par celles de y. Voici les données :

1. Tracer le diagramme de dispersion des couples (xi; yi). À la vue de ce diagramme,


pouvons-nous soupçonner une liaison linéaire entre ces deux variables?

2. Déterminer pour ces observations la droite des moindres carrés, c’est-à-dire donner
les coefficients de la droite des MC.

3. Représenter les valeurs estimées et celles observées sur un graphique

4. Calculer les résidus

5. Calculer le coefficient de détermination R 2 et conclure.

6. Vérifier les résultat obtenus avec la fonction 0 l m()0

Exercice 6
Les données que nous étudions présentent le taux de décès par attaque cardiaque chez les
hommes de 55 à 59 ans dans différents pays industrialisés. Les variables sont Y = 100 x
log(nbre de décès par crise cardiaque pour 100000 hommes)−2), X1 = 1000x téléphones par
habitants, X2 =calories grasses en pourcentage du total des calories et X3 =calories provenant
de protéines animales en pourcentage du total des calories.

3
Pays X1 X2 X3 Y

Australie 124 33 8 81

Autriche 49 31 6 55

Canada 181 38 8 80

Ceylan 4 17 2 24

Chili 22 20 4 78

Danemark 152 39 6 52

Finlande 75 30 7 88

France 54 29 7 45

Allemagne 43 35 6 50

Irlande 41 31 5 69

Maroc 17 23 4 66

Italie 22 21 3 45

Japon 16 8 3 24

Mexique 10 23 3 43

Pays-Bas 63 37 6 38

Nouvelle-Zélande 170 40 8 72

Norvège 15 38 6 41

Portugal 15 25 4 38

Suède 221 39 7 52

Suisse 171 33 7 52

Grande-Bretagne 97 38 6 66

Etats-Unis 254 39 8 89

Trouver l’équation de la régression multiple de Y sur X1, X2 et X3.

Vous aimerez peut-être aussi